首页|档案|关于|登录|提交|通知|联系|搜索
ES回家>第2卷第1号2 >的艺术。

版权所有©1998韧性联盟

朱迪斯·安德森,1998。拥抱不确定性:贝叶斯统计和认知心理学的接口。保护生态(在线)2(1): 2。可从互联网上获得。URL: http://www.consecol.org/vol2/iss1/art2/

本文的一个版本,其中的文本、图、表和附录是单独的文件,可以通过以下命令找到链接


合成

拥抱不确定性:贝叶斯统计和认知心理学的界面

朱迪斯·l·安德森

西蒙菲莎大学资源与环境管理学院


摘要

从事保护和资源管理工作的生态学家正在发现使用贝叶斯分析方法来明确处理数据分析和决策中的不确定性的重要性。然而,贝叶斯过程的输入和输出需要一个对人脑有问题的想法:假设的概率(“单事件概率”)。我描述了几个与单一事件概率密切相关的认知概念,并讨论了它们在人类思维中的互换性如何导致“认知错觉”,即对不确定性推理的明显缺陷。在生态和资源管理中,使用单一事件概率的每一个认知错觉都隐含着特定的可能陷阱。然后,我将讨论认知心理学最近的一项研究,该研究表明,从人类认知的进化角度来看,简单的沟通策略有助于人们在阅读和谈论概率时更有效地处理不确定信息。此外,我认为,仔细考虑的方法标准和表示惯例也可能使贝叶斯分析更容易理解。

关键词:认知心理学;不确定性下的判断;认知错觉;贝叶斯统计分析;贝叶斯决策分析;概率;频率;概率的专家推导。


介绍

保护生态学家、资源管理者和政策制定者在分析生态过程时,正逐渐认识到明确包含不确定性的价值。虽然贝叶斯统计分析对许多应用生态学家来说并不熟悉,但它很适合这一目的。它直接分析了概率假设,允许科学家和管理者正式更新他们的信念在各种实验和非实验的情况下(埃里森1996)。为了提高人们对贝叶斯分析的认识,一些生态学家提出了强有力的论据,促进在保护和资源管理的背景下使用贝叶斯分析(Crome等人1996,Ellison 1996, Ludwig 1996, Taylor等人1996,Wolfson等人1996)。然而,尽管贝叶斯分析有它的优点,除非它的支持者使它更容易理解,否则它不太可能被非统计学家广泛接受。

在本文中,我简要介绍了贝叶斯分析,并描述了它如何在必须考虑不确定性的情况下补充“经典”统计。然后,我将展示应用生态学家对经典和贝叶斯统计的接受如何被视为文化进化的例子。这种解释导致了对理解和使用贝叶斯分析的两个可能障碍的讨论。首先,报告贝叶斯结果和估计先验概率的策略是高度可变的。其次,十进制概率对于大多数人来说很难理解和直观地处理。我将介绍认知心理学的一些观点和实验结果,它们可能有助于解释和改善这一困难。


贝叶斯方法处理不确定性

统计分析经常作为处理不确定性的独特的、匿名的和权威的方法出现在入门课程和教科书中。这种短视的观点掩盖了统计实践的丰富历史和多样性。例如,被称为“经典”或“频率主义者”的统计学,实际上是两种截然不同的假设检验方法的令人不适的混合体:R. a . Fisher的方法强调拒绝零假设,J. Neymann和E. S. Pearson的方法强调在两个相互排斥的假设之间做出决定(Sedlmeier和Gigerenzer 1989年,Gigerenzer 1991年)。统计学的典型课程对基于托马斯·贝叶斯牧师(Reverend Thomas Bayes) 1763年最初发表的工作的第三种分析传统的信息就更少了(李1989)。贝叶斯的方法专注于估计假设成立的概率,并随着数据的积累而更新这个概率。

所有统计分析的最终目标,都是帮助人们使用数据理性地更新他们对科学假设的信念。统计学的各种传统以不同的方式实现这一目标。fisher和Neymann-Pearson传统都假设数据是在高度结构化的实验设计中收集的,包括一个定义良好的统计零假设,该统计零假设遵循被检验的更一般的科学假设(或模型)。熟悉的Pvalue回答了这个问题,“如果统计零假设为真,我们在这类实验中观察到这些数据,或更极端数据的概率是多少?”因此,P价值是关于数据的陈述,而不是关于科学假设的陈述。尽管如此,按照惯例,如果观察到数据的概率足够小,就会做出关于统计零假设的决定:它被拒绝。

“拒绝”听起来像是一个关于统计假设的孤注一掷的结论。然而,在实践中,生态学家通常谨慎地解释从单个实验中得出的推论,将其视为与科学假设有关的一个证据。传统上,科学家依赖于一个独立的过程来更新科学假设中的信念:重复的、独立的实验和基本结构化的组合研究合成(Shadish 1989, Underwood 1990, Cooper and Hedges 1994)。

相比之下,贝叶斯分析显然是一个更新假设中的信念的过程。它将一个假设的概率定义为观察者对它的信心或信任程度,并解决了一个问题,“鉴于她之前的信念,她应该如何根据手头的数据修改分配给假设的概率?”

回答这个问题所需的实际计算在原则上是基本的,尽管在实践中通常很复杂。贝叶斯分析的输入是:(1)对“先验”概率的估计,即每个假设的置信程度之前数据可见;(2)数据的概率,如果每个假设都成立,数据被观察到的概率。使用贝叶斯定理将这些输入组合起来,产生“后验”概率估计,表示对考虑中的每个假设的最新信任程度(Lee 1989, Morgan and Henrion 1990, Ellison 1996)。一般的想法是,如果实验者基于过去的经验对一个特定的假设有高度的信任,并且她现在观察到在这个假设下可能发生的数据,她对这个假设的后验(数据之后)信心应该得到加强。

贝叶斯分析与单个实验的经典分析有几个深刻的不同之处。事实上,贝叶斯和古典统计学家有时会把自己分成对立的阵营。由于另一种方法的局限性和弱点(Lee 1989, Berry and Stangl 1996, Dennis 1996, Edwards 1996, Ellison 1996, Mayo 1996),双方都拒绝另一种方法。这些论证超出了本文的讨论范围,但有必要指出其中的一些差异。首先,贝叶斯分析需要先验概率估计。这些关于信仰或以往经验的量化陈述在古典分析中没有正式的地位。其次,贝叶斯分析可以为假设分配中等程度的信任或概率,不像“要么全有要么全无”的推理“拒绝/保留假设”。第三,贝叶斯分析既可以应用于离散的假设,也可以应用于连续的假设(Box and Tiao 1973)。最后,贝叶斯数据不需要来自一个完整的实验设计,尽管观察结果必须是结构化的,以便分析师能够估计在每个假设下观察到数据的概率。

只要人们理解并尊重贝叶斯分析的局限性,在保护生物学和应用生态学的某些典型情况下,贝叶斯分析应该是有用的。例如,它可以估计,在任何时候,每个假设应该有多大的可信度。这种灵活性是一个优势,当设计良好的实验是不可能的,或决策必须基于不完整的数据,例如,从长期监测项目。此外,贝叶斯统计分析赋予假设的概率可以直接输入贝叶斯决策分析:面对不确定性,理性分析、评估和比较一系列实际管理选项的过程(Raiffa 1968年,Parkhurst 1984年,Maguire 1986年,1988年,Morgan和Henrion 1990年,Maguire和Boiney 1994年)。


贝叶斯和经典分析:一个例子

让我们比较一下贝叶斯方法和经典方法对保护生态学中一个简单问题的分析。假设一位生态学家需要一个指标,以确定在温哥华岛西海岸的原始森林中是否存在繁殖的大理石小鹿。生态监测的指标应该是一个简单的观察有高概率这个生态系统很重要,但不容易观察到。在这种情况下,一个可能的候选者是存在合适的巢穴:大的,水平的树枝上有一层很好的苔藓和地衣。研究人员设计了一个快速、标准化的调查来检测这些树枝,并在1000个树桩上进行了试验,产生了表1所示的数据。


表1。marbered Murrelet示例的基本数据。


H1正确的:
鲻鱼在看台上筑巢
H2正确的:
海雀没有在看台上筑巢
边际
总计
调查数据:潜在的巢穴
没有见过
4
808
812
调查数据:潜在的巢穴
被认为
46
142
188
边际总
50
950
1000


贝叶斯分析

从贝叶斯的角度来看,问题是:在未来,如果生态学家在一个特定的林分进行标准化调查时观察到潜在的筑巢地点X,大理石海貂在看台上繁殖的概率是多少?

我们考虑的假设是

H1墨鱼正在树桩上筑巢X;

H2:墨鱼不在树桩上筑巢X。

“数据”将是“观察到的/未观察到的合适巢穴地点”。

从表1可以估计出贝叶斯分析的以下组成部分。

pH1的先验概率H1= 50/1000 = 0.05(即,在没有调查数据的情况下的概率X);

pH2的先验概率H2= 950/1000 = 0.95;

p(D |H1) =观察到数据(合适的巢穴地点)的概率H1是真的吗?(海龟在鸟巢筑巢?X) = 46/50 = 0.92;

p(D |H2) =观察到数据(合适的巢穴地点)的概率H2是真的吗?(海龟不是在鸟巢里筑巢吗?X) = 142/950 = 0.15;

pH1| D)=概率H1为真,给定数据;即,海鼠在林分筑巢的概率X,给出了对适宜筑巢地点的观察标准调查。这就是生态学家想知道的。为了计算它,他必须应用贝叶斯定理。

贝叶斯定理(针对两个假设):

方程1

方程2

贝叶斯分析表明,标准化调查并不是一个特别好的指标,以存在筑巢的大理石纹海雀。如果在一项标准的调查中,在一个林分中观察到潜在的筑巢点,那么海貂在那里筑巢的概率只有0.24。

古典分析

对这个问题的经典分析提出了一组略有不同的假设:

H0:观察合适的巢穴地点与有窝海鸭无关。

H一个:观察合适的筑巢地点与是否有海鸭筑巢有关。

对表1中数据的卡方分析证实了通过检查似乎显而易见的东西。非常显著的概率(P< 0.001),生态学家拒绝原假设。现在的问题是,这种关联有多强?Zar(1996)为分类数据列出了几个合适的相关性度量。对于表1中的数据,它们的值范围从0.430(克莱默phi2),至0.708 (Ives and Gibbon rn),至0.970 (Yule Q)。

分类相关系数之间不太一致。它们也没有解决与贝叶斯分析完全相同的问题,因为它们几乎没有提供关于的真值的直接信息H1.此外,如果相关系数被(错误地)解释为可信度的指标H1,它们通常会比贝叶斯分析对标准调查的效用给出更乐观的描述。


文化演化与贝叶斯分析

考虑到贝叶斯分析在应用和保护生态学中的潜在效用,贝叶斯分析相对罕见似乎令人惊讶。然而,逻辑和理论上的优点并不足以鼓励管理者和科学家使用它。一种新思想或新实践的传播是文化进化的一个例子(在这种情况下,是在科学界)。最好把它理解为一种社会和心理现象。

作为“模因”的科学思想和实践

成功的沟通是将好想法转化为广泛实践的关键。“如果不能转化为有效的政策,我们在保护生物学方面所做的许多工作本质上是毫无价值的”(Meffe and Viederman 1995: 327)。技术的成熟并不能取代良好的沟通,但事实上,它会加剧决策者未能理解重要信息所导致的问题(Walters 1986, Clark 1993)。此外,有效地使用信息需要提出的科学模型与决策者对问题的概念之间的一致性(Brunner和Clark 1997, Weeks和Packard 1997)。

即使涉及的事实或想法是抽象的,人类的交流也是一个生物过程,因为思维是自然选择的产物。例如,Brunner等人(1987)列出了四个过程,表明数据分析的结果已经传达给决策者或其他科学家:同化(将所呈现的信息与用户自己的知识进行协调);利用(后续应用中分析的语言、形式和内容);回忆;而且识别。从某种意义上说,这些过程是有机的。它们不仅取决于作者对材料的描述,还取决于它是否适合读者的思维,就像酶必须与它要修饰的分子的形状相匹配一样。

将生物学的隐喻进一步延伸,各种数据分析方法可以被解释为“模因”。一个meme是基因的文化类似物,是思想或行为模式的单位,它的存在依赖于人类的思维,并在传递给他人时准确地“复制”自己(道金斯1976年,帕森和克拉克1995年)。这个类比表明,模因通过被记住和“复制”从一个人传递到另一个人,通过社会互动,如教学、角色示范、说服等,“存活”下来。这些文化进化的过程,也就是文化中模因改变频率的过程,可以通过从种群遗传学中推导出的模型进行定量分析(Cavalli-Sforza和Feldman 1981, Boyd和Richerson 1985)。

生物学隐喻进一步表明,如果一个模因很容易被社区中使用普通语言的普通成员吸收和分享,那么它就“很好地适应”了它的主要宿主——人类大脑。例如,许多用于使计算机应用程序“用户友好”的策略可能是经过良好改编的模因。对于“数据分析模因”,Brunner等人(1987)的四个过程(同化、利用、回忆和识别)可以被解释为其适应性的衡量标准。他们强调了普通人类互动对于模因和它的主要宿主——人类思维之间的“共生”的重要性。数据分析模因可以在其他文化媒体(如科学杂志)中“存活”和“繁殖”,但这些是次要宿主。一个模因对二级宿主的依赖程度越高,它就越不容易被广泛传播或使用,因为它需要不同寻常的训练水平或专门的媒体才能准确传播。

经典统计实践:一个成功的模因?

经典统计实践取得了惊人的成功。正如m·g·肯德尔(M. G. Kendall)在1942年所描述的那样,“他们(统计学家)已经超越了每一个科学分支,其征服的速度只有阿提拉(Attila)、穆罕默德(Mohammed)和科罗拉多甲虫(Colorado beetle)才能与之相比”(Gigerenzer 1991: 258)。虽然经典统计实践促进了纯科学和应用科学的进步,但它确实如此尽管它的弱点。这包括由于fisher和Neymann-Pearson方法的混合而导致的内部不一致,由于忽视统计力量而导致的信息丢失,未能直接回答关于假设的真值的问题,以及许多从业者没有彻底理解它的事实(Sedlmeier和Gigerenzer 1989, Gigerenzer 1991, Ellison 1996)。因此,经典统计学的主导地位似乎并不被其逻辑或理论优点所证明。相反,经典统计学的巩固可能部分归因于一些因素,这些因素增强了其作为模因集合的有效性。

首先,文化进化理论认为,当模因很好地适应人类思维结构时,它们能更好地“生存”和“繁殖”。这一观点得到了来自社会科学的实证证据的支持。例如,人们最容易学习的数学概念和方法是那些映射到先天认知结构的计数(Dehaene 1997)。在经典统计的情况下,经验证据支持假设检验的想法和人们用来进行直觉推断的过程之间的对应关系。一个例子是“信号检测理论”(Tanner and Swets 1954),这是一个人类思维区分物体(“信号”)和“噪音”过程的模型。信号检测模型直接平行于内曼-皮尔逊假设检验(Gigerenzer and Murray 1987)。它假设大脑通过将传入的刺激与两种分布进行比较来决定它的感知,一种来自“噪音”(零假设),另一种来自“信号”(备择假设)。在实证研究中,这种认知模型的特征已被证明特别富有成效,它们记录了两种类型的错误(“虚惊”和“失误”)的存在,对应于第I类和第II类错误。此外,受试者表现出根据两种分布的差异调整决策过程的能力,对应内曼-皮尔逊效应量。虽然没有一个简单的模型可以捕捉人类认知的复杂性,但信号检测理论表明,假设检验可能对应于人类固有的认知过程。 Thus, the ideas of hypothesis-testing are relatively easy for people to understand and use.

其次,报告经典统计分析结果的惯例使作者和读者有共同的期望(例如,P值,样本大小)。这些惯例将大量的数据用普通语言总结成关于有限假设集的陈述(H0,零假设,和H一个,备择假设)。之所以能够进行此总结,是因为结果直接提供给一个标准化决策结构.决策规则是,“如果P< 0.05(临界α),证据支持H一个;如果P大于或等于0.05,证据支持H0“在模因类比中,可以用语言表达并符合一致模式的想法很可能存活(被记住)和复制(被准确地传达给他人)。”

传统的假设检验决策结构具有显著的鲁棒性。它具有直观的意义,使人们能够吸收分析的结果,即使他们不清楚其所有的逻辑含义。例如,对统计力量的忽视肯定导致了信息的丢失,并可能降低了基于经典统计推断的管理决策的质量(Peterman 1990, Fairweather 1991)。尽管如此,生态学家已经接受了经典统计学的方法,该领域在其范式下发展(Dennis 1996)。

最后,经典统计学的惯例最初具有足够的说服力,它们得到了科学界的主要成员:教授和期刊编辑的支持和执行(Sedlmeier和Gigerenzer 1989)。社会优势个体的模仿和说服是文化进化的重要机制(Boyd和Richerson 1985)。

我认为,作为模因的集合,经典统计学至少有三个独立的优势:它似乎很适合人类思维,报告的惯例用普通语言提供了一致的结果总结,科学界的主要成员鼓励使用它。在接下来的章节中,我认为这些特征可能是目前贝叶斯统计的弱点,它缺乏惯例,似乎很难适应人类思维。在每种情况下,我将讨论如何将这些不足转化为优势。最后,我将指出生态学界的领袖们如何利用他们的影响力来提高贝叶斯分析在保护和应用生态学中的效用。


贝叶斯分析能从标准化中受益吗?

报告的后验概率

与经典统计的报告惯例相比,贝叶斯分析似乎是完全不标准化的。贝叶斯分析的结果总是后概率估计,但它们以各种各样的术语和图形或表格格式呈现(例如,Thompson 1992, Hilborn等人1994,Stahl等人1994,Pascual和Hilborn 1995, Adkison和Peterman 1996, Crome等人1996,Edwards 1996)。即使是针对生态学家和保护生物学家的论文,作者也倾向于假设读者熟悉诸如概率密度等复杂的技术概念。

贝叶斯报告实践似乎也不符合科学惯例的有效数字。后验概率估计表通常涉及可比概率估计值之间的巨大差异。例如,Pascual和Hilborn(1995)的表(在表2中复制)包括低至0.00006的概率,要求表中的其他估计报告到5位有效数字。是否有任何生态数据可以证明这种精确度是值得怀疑的。


表2。概率格式的例子。此表报告了关于塞伦盖蒂角马种群(Pascual和Hilborn 1995: 475)的招募与旱季降雨量相关函数的参数(alpha和beta)的贝叶斯后概率。

α

低斜率:概率= 0.11
中等坡度:概率= 0.80
高斜率:概率= 0.09
β
0.0
0.002
0.004
0.006
0.008
0.010
0.012
0.014
0.016
0.018
0.020
0.040
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.055
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.00004
0.00026
0.070
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.00027
0.00324
0.00003
0.085
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.00097
0.01894
0.00014
0.0
0.100
0.0
0.0
0.0
0.0
0.0
0.0
0.00187
0.06498
0.00030
0.0
0.0
0.115
0.0
0.0
0.0
0.0
0.0
0.00169
0.18398
0.00037
0.0
0.0
0.0
0.130
0.0
0.0
0.0
0.0
0.00057
0.33649
0.00045
0.0
0.0
0.0
0.0
0.145
0.0
0.0
0.0
0.00006
0.27651
0.00027
0.0
0.0
0.0
0.0
0.0
0.160
0.0
0.0
0.0
0.09275
0.00006
0.0
0.0
0.0
0.0
0.0
0.0
0.175
0.0
0.0
0.01433
0.00001
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.190
0.0
0.00135
0.0
0.0
0.0
0.0
0.0
0.0
0.00.
0.0
0.0
0.205
0.00008
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.220
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0


贝叶斯分析在处理“细粒度”假设方面具有理论优势。贝叶斯分析可以计算一个参数的任意小范围的概率,例如总体均值,mu。尽管如此,贝叶斯分析经常牺牲这一优势,以支持更简单的表示,类似于那些经典统计,使结果可以用普通语言讨论。例如,贝叶斯分析师可能会将一个连续统划分为两个或三个区域,就像经典分析师测试两个粗略假设时所做的那样(例如H0:大于等于0,H一个: mu < 0)。

类似地,贝叶斯分析师有时试图简化他们的结果,将其输入决策分析,产生推论或比较管理选项(例如,Crome等人1996,Taylor等人1996,Wolfson等人1996)。在某些方面,这种简化策略类似于经典统计学中使用的推理决策模型。然而,与经典统计学中可预测的、简单的推理决策规则相比,这些分析都涉及一个复杂的、特殊的决策结构。例如,Crome等人(1996:1112)提出了一个决策结构,用于对8个关于效应大小的不同命题进行推理,如果分配给每个命题的概率是“不可信的”,则将其标记为“不可信的”<0.1或“极有可能”,如果它的概率是>0.9.一个样本命题(#7)是这样写的:“效果[大小]很可能在0.75到1.25之间;较大的正面或负面影响是不可信的,命题3和6被接受,如果P1<0.1和P3<0.1。”离开Crome等人(1996)的文本,读者不太可能记住关于八个命题的结论,也不可能准确地将它们传递给其他人,除非他将决策结构的所有细节和假设都牢记于心。

估计先验概率

在生态贝叶斯分析中,估计先验概率的方法也各不相同。例如,Wolfson等人(1996,研究2)和Taylor等人(1996)使用现有数据进行至少一些先前的估计。相比之下,Crome等人(1996)和Wolfson等人(1996,研究1)从专家那里引出了先验概率估计。他们都没有对评估程序的有效性和可靠性进行任何讨论。

在信息很少的情况下,先验的任意分配在方法和术语上也有很大的变化(例如,Box和Tiao 1973, Howson和Urbach1989, Press 1989, Hilborn等人1994,Walters和Ludwig 1994, Ludwig 1996, Taylor等人1996,Sainsbury等人1997)。通常很少或根本没有讨论任意先验的各种方法之间的区别,或者为什么选择特定的一种方法。

标准化的优点和缺点

对分配任意或引出的先验概率的方法进行明智的标准化可能会使大多数分析受益。设计不良的先验概率分布会导致结果严重失真(Adkison和Peterman 1996)。此外,与物理科学的数据不同,生态数据很少精确到足以克服这些扭曲(Ludwig 1996)。因此,读者通常应该确信已经考虑了以下问题:在什么情况下,任意先验分布是合适的?什么假设应该有非零先验?先验是否独立于当前数据?在什么情况下专家诱导是合适的?研究者是否达到了专家诱导的最低效度和可靠性标准?标准化的方法和描述它们的约定将允许作者简要地解决这些重要的问题。

报告贝叶斯结果的惯例的优势并不明显。贝叶斯分析方法具有很强的灵活性,适合于保护生态学和应用生态学中的许多问题。例如,一种简化策略,例如将后验概率估计的连续体划分为两个离散的区域,可能会提高因贝叶斯分析的新颖性和复杂性而受到挑战的读者的理解。然而,在某些研究中,它肯定会丢失必要的信息。

这个问题值得贝叶斯分析师、期刊编辑和认知科学家考虑,他们可以确定在哪些情况下可以以相对较低的成本发展和鼓励惯例。对于标准化问题较多的领域,可以尝试几种选择,监测读者的理解程度和调查人员的满意度。


将贝叶斯分析应用于人类思维:认知科学的指导方针

认知研究与贝叶斯在生态学中的应用直接相关

认知心理学家一直对人们是否是优秀的“直觉统计学家”很感兴趣。他们的兴趣隐含地解决了一个问题,“贝叶斯分析是一个改编良好的模因吗?”认知研究表明,答案是“不”。当人们被要求对概率(贝叶斯分析的基石)进行推理时,他们会犯可预测的严重错误。在本节中,我将描述这种无能的两种解释。然后,我将讨论几个与应用生态学相关的典型认知错误的例子,包括最近的研究,该研究表明如何构建贝叶斯分析来改善它们。

概率可以用两种方式解释(Gigerenzer 1994, Ellison 1996)。第一种将概率定义为一个事件(或假设被证明是正确的)发生的长期频率,在许多可能的实例中进行计算。第二种解释是“单事件概率”,它量化了观察者对某一特定事件将会发生的信心,或者对某一假设在特定情况下是正确的信心。通过贝叶斯分析计算出的假设概率为单事件概率。

不幸的是,人类的大脑不能有效地处理单个事件的概率。认知心理学悠久的实验传统表明,即使是有统计学经验的人,在对单事件概率进行推理时,也会经常出错。一个经典的例子是“琳达问题”。受试者阅读了一个名叫琳达的妇女的简短描述,说明她对政治问题感兴趣,关注人权,并活跃在当地社区。然后,他们为有关琳达可能的工作和爱好的陈述分配概率,包括“琳达是一名银行柜员”和“琳达是一名银行柜员,并积极参与女权运动”。大多数人错误地认为后一种说法的可能性更高(Gigerenzer和Hoffrage 1995)。根据概率论,一个女性同时是银行柜员和女权主义者的可能性要比仅仅是银行柜员的可能性小。

人们对概率所犯的错误是如此的可预测和不可纠正,以至于认知科学家传统上将其称为“认知错觉”,并将其视为人类不是直觉良好的统计学家的证据。Tversky和Kahneman (1974), Ayton和Wright (1994), Gigerenzer和Hoffrage(1995)总结了这个关于“不确定性下的判断”的研究项目。

这种认知局限性可能会影响生态学贝叶斯分析的实践和报告。首先,当从专家那里得到单个事件的概率作为贝叶斯分析的输入时,分析师必须理解并纠正专家的认知过程可能导致的任何偏差。其次,在撰写报告时,贝叶斯分析师必须意识到读者在努力遵循分析逻辑、保留结论并将其应用到其他地方时,单事件概率可能会遇到的困难。最后,因为即使是专家在推理单一事件概率时也经常出错,分析师可能需要仔细检查他是否建立和解释了正确的分析。

为什么人们很难处理单一事件的概率?

在认知科学中,已经发展出两种学派来解释人们对单一事件概率的困难。第一种学派以Tversky和Kahneman(1974)的方法为基础,认为概率推理中的每种错误都代表着人类认知能力的固有限制。人类的大脑被认为无法对复杂的不确定性做出准确的判断。相反,大脑依赖于任意的启发式或经验法则,产生有缺陷的判断和决定。用Stephen J. Gould(1992: 469)的话来说,“Tversky和Kahneman论证,我认为是正确的,我们的大脑(无论出于何种原因)并不是为了按照概率的规则工作的。”尽管由这些启发式导致的认知错误在各种情况下都可靠地发生,但大多数这类研究都要求受试者对涉及单个事件概率的十进制估计的问题进行推理。研究人员提出的经验方法似乎可以抵消某些情况下的错误,但它们不能将认知的不足纳入任何广泛的预测或解释模型。

第二派基于Gigerenzer和Hoffrage(1995)和Cosmides和Tooby(1996)的方法,基于进化假设提出了以下论点:

1)思维包括一些结构,这些结构帮助识字前的人对人类进化史上经常遇到的情况进行适应性推理,包括在不确定的情况下做出判断。

2)自然选择不太可能为这一目的产生一个严重不足的机制。

3)设计用于推理概率的认知结构将包括输入机制(获取环境中随机事件的信息)和定义良好的处理这些信息的算法。

鉴于这些假设,只有满足两个条件,在实验环境中的人类才能很好地推理不确定性:(1)输入必须是人类数据收集机制“期望”的格式(类似地,计算器“期望”输入的是十进制,而不是二进制和数字);(2)问题的结构必须能够激活解决特定问题的信息处理算法,通常是由实验者设计的概率论(如果按下“log”键,计算器不会提供平方根)。

Gigerenzer和他的同事认为,认知错觉是呈现形式的产物。人们犯错误,并不是因为他们的推理能力有缺陷,而是因为传统的实验未能为思维提供正确的推理条件。它们可能以不恰当的格式(即十进制概率)呈现信息,或者它们可能在大脑中激活一个算法,而该算法不是设计来以实验人员预期的方式处理概率信息的。我将详细讨论输入格式和算法的问题。

输入:单事件概率vs.频率

乍一看,单个事件的概率和频率似乎很容易互换。科学家通常使用频率信息来估计概率。例如,在生命表中,一个特定个体在未来一段时间内死亡的十进制概率来自于从一个时间段到下一个时间段的存活个体的计数。然而,这两个概念之间存在着深刻的差异(Gigerenzer 1994)。

频率是在一个定义良好的“参考类”中具有某种特定属性的个人或案例的计数:更大的兴趣组,包括不具有相关属性的案例。例如,我们可以描述一个参考类:“考虑100个在俄罗斯北极东部筑巢的眼镜凫种群,目前的种群数量小于500。”然后我们计算具有特定属性的案例:“46种将在未来10年内灭绝。”由于频率依赖于参考类别的界定,它不可避免地涉及文字和数量信息。

相比之下,单事件概率量化了单个事件或假设表达的可能性,表示为0到1.0之间的十进制数字。例如,单事件概率a特定的未来10年将灭绝的眼镜艾德的数量可能被简单地报告为“0.46”。所涉及的单个种群可能是无限多个参考类别的成员(例如,俄罗斯北极东部种群类别、当前种群数量<500的种群类别、每年滴滴涕摄入量为>500微克的种群类别、禁止狩猎的种群类别,等等),但十进制概率不包含有关感兴趣的参考类别或适当的泛化限度的信息。它只适用于个别情况。

频率和单事件概率在数学上是不同的。统计学家通过概率论的微积分来用数学方法处理概率。概率论起源于对机会博弈的研究,通常在数学教育的后期才教授。相比之下,频率与基本集合论有关,这是一种儿童很容易掌握的分类和计数练习(Dehaene, 1997)。

与频率处理相关的技能似乎有很长的进化历史。实验表明,人们从小就能很容易地对物体和事件进行分类(Cosmides和Tooby 1996),并在不知不觉中准确地随着时间和空间跟踪它们的频率(Hasher和Zacks 1979, Brase et al. 1998)。许多非人类动物似乎拥有类似的技能,使它们能够调整自己的行为以适应环境的不同方面(Cosmides和Tooby 1996, Dehaene 1997, Brase et al. 1998)。相反,没有理由用单一事件概率来假设技能的进化史很长。来自许多非工业化社会的证据表明,我们的原始人类祖先没有文化,可能只拥有基本的计数技能(Cosmides和Tooby 1996, Dehaene 1997)。考虑到这些差异,将概率转换为频率格式对大多数人来说有助于提高直观清晰度就不足为奇了。

频率格式在行动:大理石murret重新访问。

大多数人,包括熟悉单事件概率的科学家,发现即使是简单的贝叶斯问题,比如前面提到的Marbled Murrelet例子,也很难用十进制概率正确表述和解决贝叶斯和经典分析:一个例子).相反,当相同的数据被组织成频率时,贝叶斯问题对许多人来说变得更容易(Gigerenzer和Hoffrage 1995)。他们发现他们可以更容易地进行推理,因为他们可以描绘出参考类及其子集(图1)。


图1所示。两个假设的贝叶斯定理的频率格式解。以频率格式呈现的数据似乎鼓励了大脑的想象,并促进了对正确答案的估计。

GIF图像文件(26k)


算法:与概率相关的主观概念

对于大多数生态学家和统计学家来说,“概率”这个词似乎有一个明确的含义。然而,认知科学家认识到,它的主观意义可以根据上下文变化(Jardine和Hrudey, 1997)。Teigen(1994)将几个与概率和不确定性相关的概念分类(表3)。每个主观概念都隐含着自己对“概率”的计算,每个概念似乎都是由不同的认知机制处理的(Teigen 1994)。对于贝叶斯分析师来说,当他们在论文中提到“概率”或请专家进行概率估计时,意识到他们激活的是哪个想法是很重要的。


表3。与概率相关的主观概念分类(改编自Teigen 1994)。

概念

定义
机会
“概率”是指在一个真正随机过程的所有结果中,某一给定结果出现的概率或频率。
趋势
“概率”是一个特定结果发生的趋势,或它发生的“接近程度”。
知识
“概率”是在已知假设集合中分配的。
信心
“概率”是指人们对某一假设的相信程度。
控制
“概率”是对特定结果的控制程度。
合理性
“概率”是叙述或模型中细节的可信度、数量和质量。


机会(Teigen 1994)概率指的是观察者外部的独立随机事件,如掷硬币、生态变量的测量误差或个体在时间单位内的生存。数学上,这些事件是用概率论来分析的。如果分析师希望人们凭直觉推理概率,以符合概率论的方式,他需要在他们的头脑中激活这个概念。

趋势概率将概率描述为倾向和性格对观察者来说是外部现象。例如,一位生态学家可能会说,温哥华岛土拨鼠出现在500米以下的海拔是“不可能的”,这意味着该物种不适合生活在那个海拔。主观上,人们倾向于解读趋势概率作为特定结果的属性或属性,使他们根据结果发生的“容易程度”来估计结果的概率。例如,许多人站在悬崖边会感到不舒服;主观上,他们认为摔倒的可能性很高,因为摔倒“很容易”发生,即使他们的位置在现实中是安全的。同样,在生态环境中,如果灭绝似乎“容易”发生,或有关的种群有灭绝的“倾向”,那么分配给这一结果的主观概率可能超过随机(机会)灭绝概率。

知识概率适用于考虑的假设范围以及如何在它们之间分配信心。这种对概率的解释在应用生态学中很常见,就像在所有科学中一样,每当研究人员试图生成一份相互排斥的假设的详尽清单时。一个没有被想到的假设会自动被认为是主观的知识零的概率,即使这可能是正确的解释,在现实中。例如,森林管理人员在预测木材供应时使用生长潜力指标,即场地指数。几十年来,他们一直认为评估站点指数的标准方法是可靠的。然而,现在有证据表明,对于不列颠哥伦比亚省的某些森林类型,地点指数被低估了30 - 40% (Pedersen 1997),因此现在的收获预测包括了一个全新的生产力估计范围。以前,这些估计的概率为零。

信心概率指的是一个人对某一假设的相信程度。例如,她可能会决定把外套留在家里,这是基于她对天气会变暖的信心程度。同样,一个渔场经理可能会决定开一个孵化场,基于他的信心,生存到成年并不依赖于密度。信心概率本质上是主观的:对观察者来说是内在的,这是一个特征,使它与机会概率。

信心概率在这个讨论中特别重要。贝叶斯分析的中心假设是,概率应该被主观地解释为对假设的信心或相信程度(Morgan and Henrion 1990: 49)。尽管如此,贝叶斯分析使用了数学机会概率(概率论)操纵这些主观概率。我们有理由质疑量是否源自主观概念,信心,是否可以合理地用微积分来处理机会概率。事实上,实验表明,概率论在预测人们在不确定情况下对自己判断的信心方面表现得很差(Gigerenzer et al. 1991)。

控制概率描述了一个事件的评估概率在多大程度上不仅取决于其自身的随机特征,还取决于评估者为影响事件所做的事情,而不管其行为的有效性。例如,许多人觉得开车比坐车更安全(也就是说,他们评估发生事故的主观概率更低)。在保护生态学和资源管理中,当对资源施加控制的管理者估计有关该资源的假设的概率时,这个概念可能会引起问题。

合理性也许,概率在科学语境中应该没有什么相关性,但即使是科学的表述,如果它讲了一个好故事,也更容易被相信(即被赋予较高的主观概率)。生动的讨论,对个人经历的描述,巧妙的警句,以及对支持信息的巧妙编排,都是讲故事的要素,这些都可能在科学传播中发挥假想的合理性算法的作用。例如,天才作家理查德·道金斯(Richard Dawkins, 1976)的策略有助于说服读者相信他们的论点的合理性。

这些主观概率的变化对从专家那里得到概率估计的生态学家来说是一个挑战,或者希望他的听众跟随单事件概率的分析。当数据被不同的认知算法处理时,相同的信息模式会从相反的方向影响对“概率”的主观估计。例如,可以分配一个高知识一个假设的概率,因为所有其他已知的选择都被排除了,但仍然给它一个低信心概率,因为几乎没有证据支持它。

生态贝叶斯分析人士关注的特定认知陷阱

在下一节中,我将研究三种众所周知的认知错觉及其与生态学贝叶斯分析的相关性。在每一种情况下,我将展示所需算法的适当输入格式和激活(机会)可以提高人们处理概率的直觉能力。

高估单一事件的概率。

概率论要求一组穷尽的相互排斥的单事件概率总和必须为1.0。这显然是显而易见的分配约束,然而,在单事件概率的直观推理中,它经常被违背。例如,当被要求估计单个随机结果的单个事件概率时(例如,“在这所大学中随机选择的一个男生身高在175到180厘米之间的概率是多少?”),受试者倾向于高估每个概率,他们对整个结果范围的估计总和往往大大超过1.0 (Teigen 1974)b).在其他实验中,当假设集扩大时,被试者倾向于不修改他们分配给假设集的概率。例如,当受试者为虚构谋杀的嫌疑人列表分配有罪概率时,“容易”犯下谋杀的嫌疑人被分配了相同的高概率,而不管引入了多少其他嫌疑人(Teigen 1983, Robinson and Hastie 1985, Teigen 1988)。

在生态环境中,当来自不同专家的概率估计必须结合在一起时,过高估计可能特别麻烦。例如,一位经理可能会请一位火灾专家、一位昆虫学家和一位气象学家分别估计在未来50年里,一株树分别被火、昆虫或风摧毁的概率。如果每一个单独的估计都被高估了,那么在这段时间内,树桩被摧毁的总概率就会严重偏高。

Teigen(1994)将这种认知偏差归因于算法的激活趋势,评估的概率是一个个体结果或假设的属性。因此,它不受所考虑的一系列结果的限制。主观上,这种情况下的概率似乎是在无界的序数尺度上处理的;随着更多的结果被添加到集合中,总数可以无限制地增加(Robinson and Hastie 1985)。相比之下,概率论假设单事件概率占据一个有界比率尺度(0 - 1.0)。

缺乏对分布限制的直觉和明显的尺度不匹配应该是使用专家诱导的生态学家关注的问题。它会影响精度的个人估计和一致性估计集合(即,它们与概率论的一致性)。专家诱导应该包括讨论和对估计之间一致性的临时修正(Morgan和Henrion 1990, Ferrell 1994),但尚未研究这种做法可能产生的扭曲(Ferrell 1994)。无论是接触基本概率分布,还是在概率估计的特定方面进行训练,通常都没有提高专家引出的连贯性或准确性(Teigen 1974b,罗宾逊和哈斯蒂1985年,法雷尔1994年)。

由于分布的限制,单事件概率与生态学中的大多数其他变量有很大的不同。普通变量可以被认为是它们所适用的实体的属性,例如“总体”密度为每公里100只2“在适当小心的情况下,可以将这些变量从它们原来的上下文中取出,用于比较或在适当的模型中使用。相比之下,尽管它们表面上与其他科学数据相似,但贝叶斯分析得出的概率不能用于另一种情况。调整为连贯地适合一组假设或参数值范围的单事件概率估计是一种假说的属性。你不能说一个假设或结果Y单事件概率X,因为概率会在任何其他情况下发生变化,即使涉及到稍微不同的假设集或参数值范围。例如,假设贝叶斯分析师考虑两个人口模型,一个假设两个年龄阶层,另一个假设三个年龄阶层。他可以将它们分别分配为0.45和0.55的概率。如果他在分析中加入第三个包括四个年龄阶层的模型,原来的概率将不再有效。这些概率并不“属于”模型。这些关键约束可能会被掩盖,如果机会概率被主观地解释为趋势。

纠正高估。

幸运的是,实验证据表明,通过报告或将它们作为频率引出来,可以减少对概率估计的过高估计。频率格式显然使人们更喜欢处理信息机会概率,导致准确性和一致性的显著提高(Teigen 1974一个,Gigerenzer和Hoffrage 1995)。

令人惊讶的是,尽管存在许多改进概率估计的详细的、特别的策略(Morgan and Henrion 1990, Ferrell 1994, Chaloner 1996),但它们通常不包括频率格式的使用。专家启发式中的频率格式作为消除偏见的一种简单手段值得评价。例如,比较以下可能向专家提出的问题。

概率格式:"人口增长率的概率是多少r这只眼镜Eider的数量小于-0.05?
它在-0.05到0.0之间的概率是多少?
大于0.0的概率是多少?”

频格式:“如果有100个类似的眼镜艾德在俄罗斯北极东部筑巢,你预计会展示多少r小于-0.05吗?
有多少会展出r在-0.05到0.0之间?
有多少会展出r大于0.0 ?”

由于后一种方法的具体性质,评估人员更有可能知道他们的估计总数是否超过100。在调动专家的经验方面,激活心理意象似乎比抽象陈述更有效(Brunner et al. 1987)。

频率格式增加了人们对概率信息的直观轻松感,因为它将数学转化为集合论的简单运算(Gigerenzer and Hoffrage 1995, Cosmides and Tooby 1996)。在前面的例子中,为的范围提供“概率”的专家r必须在心里建立一个概率密度函数然后在每个范围内进行积分。相比之下,当他估计“每100个种群中有多少个”展出时r在每个范围内,他只需要将想象中的100个相似种群划分为三个子集,并估计每个子集中的种群数量。

此外,将假设的概率报告为频率可能有助于分析人员避免将估计不适当地应用于新环境的诱惑。这是因为我们只定义了一个特定参考群体的频率,例如,在俄罗斯北极东部筑巢的眼镜Eider种群。不像单事件概率被误解为趋势,频率(引用类中的子集的大小)适用于子集,而不是适用于子集中的任何个别情况。

最后,贝叶斯分析强调能够计算连续变量的概率密度函数的优势。然而,如果分析师要用普通语言讨论结果,将其表示为假设,或将其作为决策分析中的“自然状态”,他必须将连续变量划分为离散的范围。例如Taylor et al.(1996)对连续变量进行了分割r(人口增长率)分成三个离散的范围,用于贝叶斯决策分析。因为它需要定义一个参考类及其子集,频率格式自动鼓励分析人员为连续变量找到有意义的划分,在这些连续变量上计算贝叶斯概率。

结合谬误。

“合取”的概念是概率论的核心,似乎是显而易见的。如果两个假设同时为真,则称为“in connecting”或“conjoint”。概率论指出:假设A和B是独立假设,P(A + B) = P(A) * P(B)。因为概率永远不会大于1.0,它们的乘积将小于或等于单个概率。换句话说,两件事同时为真要比一件事为真难得多。

尽管所涉及的数学很简单,“合取谬误”可能是最熟悉和最普遍的认知错觉。当人们对两个假设的联合估计的概率比单独的任何一个假设都要高时,就会发生这种情况。前面描述的“琳达问题”就是一个很好的例子。

Teigen(1994)认为,连接谬误是由处理主观概率的认知算法操作产生的合理性(表3)。当添加更多的细节时,故事通常会变得更可信(因此被赋予更高的主观概率),即使每个细节都将构成一个单独的假设,如果故事是在机会概率。

在生态学中,当人们必须估计或理解一个事件的概率时(依赖于一系列之前的不确定事件),连接谬误就是一个问题(Ferrell 1994)。例如,森林火灾的发生取决于森林在特定区域和时间内达到阈值湿度水平、火源和最小风速。如果专家估计每个因素独立发生的概率为0.1,那么他估计的火灾概率应不大于0.001。然而,如果专家把这三个因素放在一起想象就会产生主观合理性算法激活,他可能会判断火灾的可能性很大。为了避免这种混淆,有必要仔细组织启发式面试。

当专家启发或贝叶斯分析涉及一个假设或模型加上一个或多个不确定参数时,关联的直观困难也是一个考虑因素。一个模型的概率是(1)模型结构的概率和(2)所有假设的概率的乘积。多概率的乘积一般小于少概率的乘积。尽管如此,当对几个模型进行比较时,连接谬误可能会导致一个指定了很多细节(假设参数值)的模型或假设比一个嵌套的更一般的假设或一个结构不同但假设较少的模型更容易被判断出来。例如,不列颠哥伦比亚的首席林务员比较了一系列预测长期收获水平预测的模型(Pedersen, 1997年)。这些模式包括越来越多的造林措施和生态系统管理活动。Pedersen(1997)提出了一长串被认为会影响收成预测的因素,作为最复杂模型有效性的证据。他的结论是,它的预测将是管理决策的良好基础。然而,如果听众被“那个模型一定是好的”这样的想法打消了疑虑,他们可能会被引入“合取谬论”。看来他们什么都想好了。” Probability theory suggests that the many assumptions should provoke skepticism, rather than reassurance, about the complex model. The model is true only if all of its assumptions are simultaneously true.

此外,由于连接违例难以直观地检测,计算复杂模型概率的贝叶斯分析对分析人员来说很难正确设置,也很难让读者理解和评估。例如,Walters和Ludwig(1994)提出了一种关于收获鱼类种群参数的贝叶斯分析。模型及其假设参数之间的联合关系是如此复杂,以至于即使是老练的读者也难以掌握它们的分析。类似地,Sainsbury(1988, 1991)使用贝叶斯分析估计了四种结构不同的种群相互作用模型的概率,该模型被用来解释澳大利亚多物种鱼类群落的动态。他结合一组参数值分析了每个模型(Sainsbury et al. 1997)。他将四个模型-参数集联结的后验概率增加到1.0,尽管每个模型都可以与许多其他参数集结合进行合理的分析。如果其他组合被纳入分析,四个选择的模型-参数集合的后验概率将比报告的要小得多。一个粗心的读者可能会对报告的后验概率为0.62的“模型”抱有很高的信心,而实际上,单个连接的概率被夸大了,以代表整个模型。

一起纠正违规行为。

与高估问题一样,当放在频率的背景下(Gigerenzer 1994, Gigerenzer和Hoffrage 1995),连接谬误就消失了。当被问到“像琳达这样的100个人中,有多少人是银行柜员?”和“像琳达这样的100个人中,有多少人是银行柜员并积极参与女权运动?”时,大多数被试都正确回答了后一个问题,而且回答的人数较少。频率格式显然有助于受试者避免合理性解释并生成一致的估计机会概率演算(G. Gigerenzer和R. Hertwig,未出版的手稿).

这一策略应易于应用于专家启发式。像下面这样的一系列问题很容易出现关联违例:“不列颠哥伦比亚省大教堂公园山羊数量下降的概率是多少?”它从边缘栖息地消失的可能性有多大?”在频率格式中,它可以这样写:“想象一下,在不列颠哥伦比亚省南部海拔1500米以上的地区,有100只山羊。有多少在下降?其中有多少正从边缘栖息地消失?”

贝叶斯分析人员可以为清晰报告模型及其参数的联合概率制定一致的标准。对于作者来说,用频率术语表达他们的结果可能是有帮助的,因为引用类的规范自动地暴露了参数和模型之间的连接。例如,表2和表4的比较显示了如何将Pascual和Hilborn(1995: 475)的后验概率转换为频率格式。


表4。频率格式示例,用于与表2进行比较,其中显示了反映与旱季降雨有关的招募函数的每一类参数(alpha和beta)的种群的预期频率。频率是基于100个假设的迁徙的塞伦盖蒂角马种群,它们的牛皮害虫水平低,食物有限,种群规模稳定在120万左右,受到偷猎的严重影响。

b埃塔

低坡度:α= 0.0到0.006

边际总数= 10

中坡:α= 0.008 ~ 0.012

边际总数= 81

高坡度:α= 0.014 ~ 0.020

边际总数= 9

0.040到0.070
0
0
0
0.085
0
0
2
0.100
0
0
7
0.115
0
19
0
0.130
0
34
0
0.145
0
28
0
0.160
9
0
0
0.175
1
0
0
0.190到0.220
0
0
0


表4中的具体表示提供了几个优点。首先,人们可以可视化的参考类大小的选择(通常在10到1000之间)设置了包含无穷小概率的合理限制。表4中选择100作为参考类大小给出了频率估计值两个重要数字,这是大多数生态分析的合理分辨率。帕斯夸尔和希尔伯恩将最初的13行数据报告给5个重要的数字,最后归结为只有7行包含非零频率。

第二,频率鼓励对联合结果进行批判性检查。考虑表4的左列:招聘函数斜率“低”的情况。在所有情况下,除了一组,截距beta在0.160到0.174之间。这种一致性的程度是否符合读者自己的直觉?在原始表中,要感知和计算这个结果要困难得多。

最后,以频率格式重新解释结果的练习可以向作者表明他们的结果是否会是成功的“模因”。如果分析是如此抽象和复杂,它的结果不能在明确的参考类别内以频率重申,作者应该怀疑可能没有发现错误,很少读者会理解或使用结论。

控制的错觉。

当面对一个纯随机的情况时,人们倾向于高估一个他们认为自己可以控制的有利结果的概率。一个经典的例子是兰格(1975)的演示,研究对象对自己选择的彩票的评价高于实验者给他们的彩票,即使他们知道两张彩票的期望值(实际中奖概率乘以奖金)是一样的。虽然它不影响赌博的结果,但选择的行为似乎激活了假设控制概率算法,增加主观估计的中奖概率。

当资源管理人员被要求对他们负责的结果做出概率判断时,这种认知错觉具有明显的相关性。例如,Wolfson等人(1996:图1)给出了由环境保护署官员估计的不同污染水平的先验概率图。概率在规定的阈值处急剧下降。

纠正控制幻觉:反复赌博。

控制的幻觉似乎是一种假象,它将概率判断框定为一次赌博或单事件概率。Koehler et al.(1994)证明,在赌博中被给予错误控制感的受试者,如Langer的实验,仍然提供准确的(机会)概率估计时,他们被鼓励考虑重复的随机结果。即使被试者被限制只进行一次赌博,只要他们能够,这种表现的改善也会持续下去可视化在做出概率判断之前,会有多个随机结果。

这些结果表明,在控制的幻觉可能导致偏差的情况下,分析师应该鼓励受访者想象多次重复的管理决策。比较向正在设计森林生态系统网络以维持流域生物多样性的规划者提出的可能问题。

概率格式:“你为这个流域规划了一个森林生态系统网络,40年后它将保留所有14种雀形目动物的概率是多少?”

频格式:“想象100个这样的分水岭。对于每一个,你都规划了一个类似的森林生态系统网络。有多少能在40年后保留所有14种雀形目?”

频率版本更容易想象景观管理计划可能产生不同的结果。这样做的效果可能不同,这取决于重复试验是同时发生还是连续发生。这方面需要研究。

其他相关认知问题。

与保护生态学相关的认知扭曲并不局限于对贝叶斯分析的推理。它们给环境经济分析技术带来困难,如效用估计(Kahneman和Tversky 1979)和条件估值(Knetsch 1990, Burton et al. 1992, Bjornstad和Kahn 1996, Garrod 1997)。在这两种情况下,频率格式似乎都是有益的(Keren and Wagenaar 1987, Keren 1991, Siegrist 1997)。对风险和风险可逆性的认知是生态风险分析中重要但有问题的变量,当受试者考虑重复结果时,风险和风险可逆性的认知似乎也会提高(Keren and Wagenaar 1987, Keren 1991)。

在设计图形显示时,贝叶斯分析人员将从理解人类视觉感知的各个方面受益。贝叶斯分析通常会在连续参数上生成概率密度函数或累积概率分布(例如,Crome et al. 1996, Ludwig 1996)。然而,除非目标受众接受过解释这些图表的训练,否则他们更可能对简单的直方图感到舒服(Ibrekk and Morgan 1987, Edwards 1996)。考虑到频率格式对精确处理概率信息的重要性,对直方图的偏好并不奇怪,因为它们将概率转换为频率。Wilkinson等人(1992)、Morgan和Henrion(1990)和Vose(1996)讨论了数据图形显示的其他感知考虑因素。尽管cliché上写着“一张图胜过千言万语”,但一张成功的图表所传达的信息应该是用普通语言表达出来的。只有这样,读者才能记住信息,并将其非正式地传递给他们的同事或感兴趣的人,而不是专家。


结论

贝叶斯分析在保护和应用生态学中的数量虽少,但却在不断增加,这带来了一个意想不到的新挑战:认知心理学专业知识的需求。特别是,涉及引出的概率估计的生态贝叶斯分析不可避免地是认知和社会科学的练习。为了选择概率引出的技术,贝叶斯分析者将不得不解决认知心理学中关于不确定性下判断的争议(Morgan和Henrion 1990年,Ferrell 1994年,Gigerenzer和Hoffrage 1995年)。为了严格评估这些方法的有效性和可靠性,编辑和审稿人还必须熟悉认知科学中的问题。

此外,对接受贝叶斯方法感兴趣的生态学家可能会发现,考虑那些似乎影响科学界其他思想和实践传播的因素是有用的。与正在进行的建立统计权力分析实践的努力(Sedlmeier和Gigerenzer 1989, Peterman 1990)相似的是,大学教师和期刊编辑都需要承担领导角色。他们可能需要鼓励(1)从定量数据中生成口头摘要的一致方法,(2)将单个事件概率转换为频率,并仔细定义参考类别,(3)注意对概率概念的不同认知解释,(4)图形显示的约定。有时,当这些策略用具体的图像和操作代替深奥的抽象时,它们可能显得头脑简单。这项工作的目标应该是确保贝叶斯分析及其结果将成为成功的模因,被保护生态学家和资源管理人员准确地吸收、回忆、识别和利用。


对本文的回应

欢迎对本文进行回复。如果被接受发表,您的回复将被超链接到文章。要提交评论,请关注这个链接.要阅读已接受的评论,请关注这个链接


致谢

该项目得到了英属哥伦比亚森林更新基金的拨款支持。兰德尔·彼得曼、布莱恩·佩珀、肯·勒兹曼和两位匿名审稿人对改进手稿提出了鼓舞人心和有益的建议。


文献引用

阿德金森,M.和R. M.彼得曼。1996.贝叶斯方法的结果取决于实现的细节:一个估计鲑鱼擒逃目标的例子。渔业研究25: 155 - 170。

艾顿,P.和G.赖特。1994.主观概率:我们应该相信什么?163 - 184页G.赖特和P.艾顿,编辑。主观概率。威利,纽约,纽约,美国。

贝里,d·A·斯坦格尔。1996.健康相关研究中的贝叶斯方法。3 - 66页贝瑞和斯坦格,编辑。贝叶斯生物统计学的案例研究。Marcel Dekker,纽约,纽约,美国。

比约恩斯塔德,D. J.和J. R.卡恩。1996.制定研究议程,评估环境价值。263 - 274页D. J.比约恩斯塔德和J. R.卡恩,编辑。环境资源的条件估价。爱德华·埃尔加,英国切尔滕纳姆。

Box, g.e.p和g.c.tiao。1973.统计分析中的贝叶斯推理。Addison-Wesley,雷丁,马萨诸塞州,美国。

博伊德,R,和p·理查森。1985.文化和进化过程。芝加哥大学出版社,美国伊利诺斯州芝加哥。

布拉斯,G. L.科斯米德斯和J.图比。1998.个性化、计数和统计推断:频率和整体对象表示在不确定性下的判断中的作用。实验心理学杂志:一般127(1): 3-21。

布鲁纳,r。D。和t。w。克拉克。1997.基于实践的生态系统管理方法。保护生物学11(1): 48-56。

布鲁纳,R. D., J. S.费奇,J.格拉西亚,L.凯瑟琳,K. R.哈蒙德。1987.提高数据利用率:具体情况下的备选方案。政策科学20.: 365 - 394。

伯顿,R. J., A. C. Balisky, L. P. Coward, S. G. Cumming和D. D. kneshaw。1992.生物多样性管理的价值。林业纪事报68: 225 - 234。

卡瓦利-斯福查,L. L.和M. W.费尔德曼。1981.文化传播与进化:一种定量方法。普林斯顿大学出版社,美国新泽西州普林斯顿。

查洛,k . M。1996.先验分布的推导。141 - 156页贝瑞和斯坦格,编辑。贝叶斯生物统计学的案例研究。Marcel Dekker,纽约,纽约,美国。

克拉克,t·W。1993.为物种和生态系统保护创造和使用知识:科学、组织和政策。生物学和医学的观点36(3): 497 - 525。

库珀,h。M。和l。v。赫奇斯。1994.研究综合手册。罗素·塞奇基金会,纽约,纽约,美国。

科斯米德斯,L.和J.图比。1996.人类到底是优秀的直觉统计学家吗?对文献中关于不确定性下判断的一些结论的反思。认知58: 1 - 73。

克罗姆,f·h·J, m·r·托马斯,l·a·摩尔。1996.一种新的贝叶斯方法来评估雨林砍伐的影响。生态应用程序6(4): 1104 - 1123。

道金斯,R。1976.自私的基因。牛津大学出版社,美国纽约。

Dehaene, S。1997.数字感:大脑如何创造数学。牛津大学出版社,英国牛津。

丹尼斯,B。1996.讨论:生态学家应该成为贝叶斯主义者吗?生态应用程序6(4): 1095 - 1103。

爱德华兹,D。1996.评论:第一个数据分析应该是新闻的。生态应用程序6(4): 1090 - 1094。

埃里森,a . M。1996.介绍生态研究和环境决策中的贝叶斯推理。生态应用程序6: 1036 - 1046。

费尔韦瑟,p . B。1991.环境监测的统计功率和设计要求。澳大利亚海洋和淡水研究杂志42: 555 - 567。

法瑞尔,w·R。1994.离散主观概率和决策分析:启发、校准和组合。411 - 451页G.赖特和P.艾顿,编辑。主观概率。威利,纽约,纽约,美国。

Garrod, g D。1997.提高森林生物多样性的非利用效益:一项偶然排名研究。生态经济学21: 45 - 61。

吉仁泽G。1991.从工具到理论:认知心理学的一种启发式发现。心理评估98(2): 254 - 267。

_________。1994.为什么单事件概率和频率之间的区别与心理学相关(反之亦然)。129 - 162页G.赖特和P.艾顿,编辑。主观概率。威利,纽约,纽约,美国。

吉吉伦泽,G.和R.赫特威格。1997.重新审视“合取谬误”:聪明的推论如何看起来像推理错误。MS提交出版。

Gigerenzer, G.和U. Hoffrage。1995.如何在没有指令的情况下改进贝叶斯推理:频率格式。心理评估102(4): 684 - 704。

Gigerenzer, G. U. Hoffrage和H. Kleinboelting。1991.概率心理模型:布伦斯威克自信理论。心理评估98: 506 - 528。

吉吉伦泽,G.和D. J.默里。1987.认知作为直观的统计。厄尔鲍姆,希尔斯代尔,美国新泽西州。

古尔德,美国J。1992.雷龙的恶霸:自然史的进一步反思。企鹅,伦敦,英国。

哈舍尔,L。和r。t。扎克斯。1979.内存中的自动和努力的过程。实验心理学杂志:一般108: 356 - 388。

希尔本,R. K.皮基奇和M. K.麦卡利斯特。1994.生物量调查数据年龄结构模型的贝叶斯估计与决策分析。渔业研究1719:相当于17 - 30。

豪森,C.和P.厄巴赫。1989.科学推理:贝叶斯方法。公开法庭,拉萨尔,伊利诺伊州,美国。

伊布雷克,H.和M. G.摩根。1987.对非技术人员的不确定量的图形通信。风险分析7(4): 519 - 529。

贾丁,c.g.和S. E.赫鲁迪。1997.风险沟通中的混杂信息。风险分析17(4): 489 - 498。

卡尼曼和特维斯基。1979.前景理论:风险下的决策分析。费雪47: 263 - 291。

克伦,G。1991.在独特和重复的条件下效用理论的额外检验。行为决策杂志4: 297 - 304。

克伦,G.和W. A.瓦格纳尔。1987.重复博弈中效用理论的违背。实验心理学杂志:学习、记忆和认知13(3): 387 - 391。

Knetsch, j·L。1990.支付意愿和补偿之间的差异对环境政策的影响要求衡量价值。环境经济与管理杂志18: 227 - 237。

克勒,J. J.吉布斯,R. M.贺加斯。1994.粉碎控制幻觉:多枪vs单枪赌博。行为决策杂志7: 183 - 191。

兰格,e . J。1975.控制的幻觉。人格与社会心理学杂志32: 311 - 328。

李,p . M。1989.贝叶斯统计:简介。牛津大学出版社,美国纽约。

路德维希,D。1996.不确定性和灭绝概率的评估。生态应用程序6(4): 1067 - 1076。

马奎尔,洛杉矶。1986.利用决策分析方法管理濒危物种种群。环境管理杂志22: 345 - 360。

_________。1988.决策分析:生态系统开发和恢复决策的综合方法。106 - 121页j .凯恩斯编辑器。修复受损的生态系统。卷2。CRC出版社,博卡拉顿,美国佛罗里达州。

马奎尔,洛杉矶,和l.g.博尼。1994.解决环境纠纷:一个包含决策分析和纠纷解决技术的框架。环境管理杂志42: 31-48。

梅奥·d·G。1996.错误与实验知识的增长。芝加哥大学出版社,美国伊利诺斯州芝加哥。

梅菲,G. K.和S.维德曼。1995.将保护生物学的科学和政策结合起来。野生动物协会公告23(3): 327 - 332。

摩根先生和亨利里翁先生。1990.不确定性:在定量风险和政策分析中处理不确定性的指南。剑桥大学出版社,英国剑桥。

潘克赫斯特,d F。1984.有毒废物排放决策分析。环境管理杂志18: 105 - 130。

帕森,E. A.和W. C.克拉克。1995.可持续发展作为社会学习:研究方案设计的理论视角和实践挑战。429 - 459页l·h·甘德森,c·s·霍林和s·s·莱特,编辑。生态系统和制度更新的障碍和桥梁。哥伦比亚大学出版社,美国纽约。

帕斯夸尔,文学硕士,希尔伯恩。1995.波动环境中收获种群的保护:以塞伦盖蒂角马为例。应用生态学杂志32: 468 - 480。

Pedersen L。1997.真相就在那里。北方林产品协会年会。乔治王子,英属哥伦比亚,加拿大。

渔夫,r . M。1990.统计权力分析可以改进渔业研究和管理。加拿大渔业和水产科学杂志47:男童。

出版社,美国J。1989.贝叶斯统计:原理、模型和应用。威利,多伦多,加拿大。

Raiffa, H。1968.决策分析:关于不确定性下的选择的介绍性讲座。唐米尔斯,安大略省,加拿大。

罗宾逊,L. B.和R.哈斯蒂。1985.当一个假设从考虑中被排除时,对信念的修正。实验心理学杂志:人类的知觉和表现11(4): 443 - 456。

Sainsbury, k . J。1988.多物种渔业的生态基础,以及热带澳大利亚底栖渔业的管理。349 - 382页j·a·古兰,编辑。鱼类种群动态。威利,纽约,纽约,美国。

_________。1991.应用实验方法管理动态高度不确定的热带多物种渔业。国际科学院海洋科学研讨会193: 301 - 320。

塞恩斯伯里,K. J., R. A.坎贝尔,R.林霍尔姆和A. W.怀特洛。1997.澳大利亚多物种渔业的实验管理:审查拖网引起的生境改变的可能性。105 - 112页皮基奇,于佩尔,西森瓦,编辑。全球趋势:渔业管理。20卷。美国渔业协会,马里兰州贝塞斯达,美国。

塞德梅尔,P.和G.吉仁泽。1989.统计力量的研究对研究的力量有影响吗?心理上的公告105(2): 309 - 316。

小沙迪什。1989.科学中对质量的感知和评价。383 - 428页Gholson, W. R. Shadish, Jr. R. A. Neimeyer和A. C. Houts,编辑。科学心理学:超科学的贡献。剑桥大学出版社,英国剑桥。

Siegrist, M。1997.沟通低风险级别:发生率表示为频率,发生率表示为概率。风险分析17(4): 507 - 510。

斯塔尔,G.卡尔松,L.邦德松。1994.确定最佳林分数据采集策略的方法。森林科学40(4): 630 - 649。

坦纳,w·p·J和J·a·斯威特。1954.视觉检测决策理论。心理评估61: 401 - 409。

泰勒,B. L., P. R.韦德,R. A.斯泰恩,J. F.科克伦。1996.用贝叶斯方法确定眼镜凫分类标准。生态应用程序6(4): 1077 - 1089。

Teigen, k . H。1974一个。高估主观概率。 15: 56 - 62。

_________。1974b。主观抽样分布和估计的可加性。斯堪的纳维亚心理学杂志15: 50 - 55。

_________。1983.主观概率研究3。选择的不重要。斯堪的纳维亚心理学杂志24: 97 - 105。

_________。1988.什么时候低概率事件被判定为“可能的”?结果集特征对言语概率判断的影响。Acta Psychologica67: 157 - 174。

_________。1994.主观概率的变体:概念、规范和偏见。211 - 238页G.赖特和P.艾顿,编辑。主观概率。威利,纽约,纽约,美国。

黄国文,G。1992.当股票招聘参数不确定时,管理建议的贝叶斯方法。渔业公告90: 561 - 573。

特维斯基,A.和D.卡尼曼。1974.不确定性下的判断:启发式和偏差。科学185: 1124 - 1131。

安德伍德,a·J。1990.生态学和管理学的实验:逻辑、功能和解释。澳大利亚生态学杂志15: 365 - 390。

沃斯,D。1996.定量风险分析:蒙特卡洛模拟建模指南。约翰·威利,加拿大多伦多。

沃尔特斯,c·J。1986.可再生资源的适应性管理。麦克米兰,纽约,纽约,美国。

沃尔特斯,C. J.路德维希。1994.关键种群参数的贝叶斯后验概率分布计算。加拿大渔业和水产科学杂志51: 713 - 722。

威克斯和j·m·帕卡德。1997.依赖自然资源的社区接受科学管理。保护生物学11(1): 236 - 245。

威尔金森,L., M. A.希尔,E.旺。1992.认知科学和平面设计。40 - 63页SYSTAT:图形。版本5.2版。Systat, Evanston,伊利诺伊州,美国。

沃尔夫森,L. J.卡丹,M. J.斯莫尔。1996.贝叶斯环境政策决策:两个案例研究。生态应用程序6(4): 1056 - 1066。

Zar, j . H。1996.Biostatistical分析。新世纪,多伦多,加拿大。


记者的地址:
朱迪斯·l·安德森
资源与环境管理学院“,
西蒙弗雷泽大学
加拿大不列颠哥伦比亚省本纳比V5A 1S6
电话:(604)526 - 4722
传真:(604)291 - 4968
janderso@sfu.ca

这篇文章的版权于2000年1月1日从美国生态协会转让给韧性联盟。

首页|档案|关于|登录|提交|通知|联系|搜索