(图片源于网络)
吴晨/文
在帮助决策者理解偏见的重要性之后,跨界心理学和经济学的诺奖经济学家卡尼曼又把关注点投射到“噪声”上。《噪声:人类判断的缺陷》是卡尼曼在畅销书《思考,快与慢》之后的又一巨著。选择噪声作为切入点,不仅因为这是导致决策偏颇甚至失误仅次于偏见的又一主要原因,也因为在“人加机器”的时代,人工智能与大数据为降低噪音,提升决策清晰度,提供了更多有效的工具。
什么是干扰决策的噪声?大致可以分为两类。
一类是针对同类型的问题,给出的答案却波动性非常大。保险是常见的例子,如果类似案例在受理过程中估算的保费有很大的波动,就可能因为噪声。法庭审案子是另一个例子,类似的案件,法官在量刑时给出的惩罚差别很大,也可能出于噪声。这类问题的出现,一方面有违公正性,法律面前人人平等,犯类似的错误也应该惩罚相当;另一方面则有可能给公司带来巨大的财务和商誉的风险,保费应该对未来风险有一个比较科学的评估,如果保费忽上忽下,过高的保费显然有压榨客户的嫌疑,过低的保费则可能带来亏损。
另一类则体现在对同一个人或者事物未来的预测,不同的人的评判有很大的波动性。如何考核一个人的工作?如何评价一个候选人的能力?不同人对同一位同事,同一个候选人给出差别很大的考核或者评价,很大原因是因为噪声的存在。同样,医生诊断过程中也可能存在噪声。病人被诊断出重病,通常都会找另一个医生再看一次,如果两个医生给出不同的诊断,至少一位医生是错的。
考核一个人的工作、评价一个候选人的能力,其实是在对未来做预测,员工是否称职甚至值得提升,候选人是否合适特定岗位,可以为未来发展助力,这些判断在未来会被检验。同样诊断的准确度在未来也会被验证。问题是,如果噪音导致最初的判断有偏差甚至失误,可能导致职业发展脱轨、任用非人,甚至病人有性命之虞。
那到底什么会导致噪声呢?
卡尼曼这本书的一大重要的意义就是让我们去审视一些我们经常忽略的问题,即人在做出判断的时候,常常会有很大的自由裁量的空间。
自由裁量本身没有好和坏。但是如果不同的人对自由裁量规则的理解和尺度的把握不同,就可能产生偏差。同样,人在做出判断的时候,也容易被先入为主的观念影响或者被不相干的信息误导,可能受到外部环境的影响,甚至被心情好坏左右。一个人在过度劳累的情况下也可能判断失去准头。大多数人通常不愿意承认类似问题的存在。卡尼曼和他的合作者恰恰在本书中点出了这些问题,而且一再强调,这样的问题貌似琐碎,却可能对决策带来巨大的扰动。
既然找到了问题,就得提出解决方案。《噪声》这本书本质上是一本研究如何让决策更科学的书。关于降噪,这本书提出了中肯的建议。
其中一个最主要的建议就是提出“决策卫生”的概念,非常具体又实用。
把复杂的问题分解成为几组相对简单的问题,然后再去行使个人的判断力,就是很实用的增强“决策卫生”,降低噪声的方法。医院里衡量一个新生儿是否健康,在把问题分解之前,完全取决于医生的整体判断,存在一定的误判率。当儿科医生把衡量新生儿健康的问题分解到五大因素,涵盖心率、体表颜色、反射程度、灵活度和呼吸时,就把判断健康的问题拆解了。其中一些因素可以直接用数据来衡量的,比如心率,而另一些主观判断也更简单客观。用单项打分加总后的总分数来评价新生儿是否健康,既容易又准确,因为这么做给出了细化的规则,降低了医生的自由裁量权,却仍然依赖医生对具体因素的判断。
另一个比较简单有效的降噪方法是把不同评价人的打分评价加总后平均。当然这么做的前提是要确保多位判断人能够各自独立地形成判断,而不是相互干扰。给出明确的决策指引和规则也很重要。同样的问题,每个人内心判断的尺度不同,有的人打分很松,另外一些人打分比较紧,明确的指引能够有效降低打分的偏差。
体育赛事中体操和跳水项目的打分就贯彻了降噪的原则。把对运动员表现的评价拆解成不同的部分。难度系数、连接和完成质量,都有具体的指引,分别让裁判打分,之后再加总,这样就可能尽量减少每个裁判决策时的噪音。同时在计算运动员总分的时候,通常要去掉一个最高分,去掉一个最低分,然后再平均,这样又把不同裁判打分过程中可能的偏见(偏袒某个运动员)和噪音进一步减少。
大数据和人工智能也能规避人类受情绪影响决策波动的问题。许多研究都证明,机器模型比人的判断更准确,而人工智能又优于机器模型,因为人工智能的数据量更大,更能从海量数据中找出相关性。
但有些时候保留一点噪声是有益的。
在大多数情况下,限制人的自由裁量权,引入流程和机器,甚至用人工智能替代人类做决策,的确能提高决策的科学度。但也有例外。
人类社会永远存在一组矛盾:规则的准确效率和人情的模糊变通之间的矛盾。明确的规则会尽可能压缩人的自由裁量权。但是给人变通的空间少了,一方面会让人觉得缺乏人情味,对于特定案例也没有融通的空间,在另一些场合下,甚至会让人觉得自己就是流水线上的螺丝钉,没有任何创新的空间,压抑人的价值。人情给了人更大的自由裁量空间,也会让人觉得决策是有温度的,被尊重,出了问题总能找人去评评理,面对的也不是冷冰冰执行规则的机器人。但做出这些判断可能费事费力,也可能带来不公,甚至引发“走后门”这样的猫腻。
不过,在一些情况下,的确可以保留一定的自由裁量权,让规则变得模糊一点,留下人判断的空间。
强调标准而不是具体的规则,可以避免给人钻空子的机会。比如税法如果条目太具体明确,就可能留下钻空子的空间,催生表面上合乎规定,但实质上违反法律精神的行为。同样,在学校里强调禁止学生抄袭的原则,但并不明确规定哪些行为属于抄袭行为,由老师来对具体事件是否涉嫌抄袭做判断,反而更会增加一分震慑力。
归根结底,噪声恰恰是混乱与秩序的差别。在一个行止有序的世界里,一切都按部就班,却让人觉得机械乏味。在一个相对混乱的世界里,虽然充斥着噪音,却也给了人更大创造性和试错的空间。
比如在一个算法统治的世界就可能有盲点,被专业人士称之为“摔断腿”问题。周五晚上有多少人会出去看电影,算法可以根据海量大数据中的各种变量做出预测。但如果一个人碰巧当天跌断了腿,他就一定不可能出去看电影。但是否“摔断腿”这一因素,如果没有纳入到机器分析模型的变量中去,就不可能被机器所考虑,去预测。相反,人的判断是不需要因为导入“摔断腿”这样的新因素而重新建模的。
在当下这样快速变化不断迭代的世界里,保持一定的模糊性,在决策过程的最终仍然保留人的判断,非常重要。很多因素仍然无法量化,比如价值观和潮流的变化飞速,如果不依赖人的直觉去判断就很可能“落伍”。
当然,这并不意味着人的判断力不需要训练。恰恰相反,降噪是避免坏的流程、环境和情绪引发的噪音干扰我们的决策,但好的决策力却取决于决策者是否有开放的心态、是否能放下执念,是否在新的事实面前用于否定昨天的自己,是否能吸纳新的信息之后更新自己的认知,终生学习,快速学习。
在剧变的时代,能够考虑那些与自己的观念有所冲突的事实,更愿意倾听自己反对者的观点,和“决策卫生”一样,都有助于我们更好地前瞻未来,拥抱改变。
京公网安备 11010802028547号