为什么在现代法庭中使用概率和统计是件难事?

我们常常会看到DNA(脱氧核糖核酸)分析专家在罪案庭审中出庭做证,称在罪案现场所获取的DNA 样本与某犯罪嫌疑人的DNA 样本相匹配。这些匹配有多确定呢?在最开始引入DNA 证据时,不少专家证明说DNA 检验不可能存在假阳性。如今的DNA 专家一般认为,随机选一个人,其DNA 与罪案中的样本匹配的可能性,不到百万分之一或十亿分之一。。但是另外还有一个统计数据,这个数据通常是不会告知陪审团的,那就是整个实验操作过程中可能出错的数据。 在采集和使用样本时,样本无意间可能会被混到一起或颠倒了,或者实验结果被曲解,又或者结果报告出了错。这些错误都很少发生,却远非随机匹配那样罕见。例如费城犯罪实验室就承认,曾在一起强奸案中不慎对调了被告和受害人的参考样本,而基因检测公司Cellmark Diagnostics 也承认犯过类似的错误。 不幸的是,法庭出示的有关DNA 匹配的统计数据如此有力,以致尽管有11 名证人提供了不在场证据,俄克拉何马州的一个法庭仍将一位名叫蒂莫西·达拉谟的男子处以超过3 100 年的徒刑。后来才发现,在最初的分析中,实验室未能将强奸犯的DNA 和达拉谟的DNA 从被检液体中完全分离,当对两者的DNA 进行比较时,就得出阳性结果。这个错误后来在重检中被发现,达拉谟因此获释,但此时他已经在监狱中待了近4 年。 关于人为因素造成的错误率,不同的人给出的估计值也有所不同,但许多专家认为它大致是百分之一左右。不过,由于许多实验室的错误率从未被测量,因此法庭通常不会接受此类统计值作为证据。就算法庭接受了这些有关假阳性的证据,陪审员又会怎样评判它们的效力呢?多数陪审员都会假设,在给定了两类错误概率——十亿分之一的随机匹配概率和百分之一的因实验室误操作造成的匹配概率——后,总错误率应是两者之间的某个值,比如五百万分之一,对大多数陪审员而言,这个概率仍不足以让人合理质疑。不过,通过概率论的计算法则,却能得到一个非常不同的结果。 求解思路如下:既然两种错误都非常罕见,那么我们可以忽略随机匹配和实验室错误同时发生的可能性,只看发生其中一个或另一个错误的可能性。由加法法则可得,该可能性为实验室错误的概率(百分之一)+ 随机匹配的概率(十亿分之一)。由于前者比后者大1 000万倍,因此,我们可以用两者中较大的概率,即百分之一,来很好地近似表示这两个概率之和。也就是说,在给定这两种可能的错误源后,我们应当忽视那些自负的专家给出的那个随机匹配错误率,而将注意力集中在可能性大得多的实验室人为错误上。可这恰恰就是法庭通常不允许律师提供的那个数据!因此,那些被再三重复的DNA 检验是绝对可靠的说法,实际上是一种过分夸张的说法。 这并非孤例。最能展示概率在法律中的应用和误用的著名案例之一,就是1968 年在加利福尼亚州最高法院审理的“人民诉柯林斯”案。以下就是法庭在裁决时所掌握的有关本案的一些事实。 1964 年6 月18 日,大约上午11 :30,刚买完东西的胡安妮塔·布鲁克斯夫人,正沿着洛杉矶城圣佩德罗区的一条小巷回家。她当时拖着一个柳条筐小车,里面放着购买的杂货,钱包就放在购物袋顶上。她用一根藤条拖着小车。当弯腰去捡一个空硬纸盒时,她突然被人推倒在地。她既没有看见这个人,也没有听见其走近。她在摔倒时感到一阵晕眩和疼痛,但仍然挣扎着看到一名年轻女子正从现场跑开。根据布鲁克斯夫人的陈述,这名年轻女子看上去大约重145 磅 ,穿着“深色的什么衣服”,有着“介于暗金黄色和亮金黄色”的发色,但比被告珍妮特·柯林斯上庭时的发色要深。事情发生后,布鲁克斯夫人马上发现她装有35~40 美元现金的钱包不见了。 与劫案发生差不多同一时间,居住在小巷街尾的约翰·巴斯,正在屋前给草坪浇水。小巷中传来的“许多喊声和尖叫声”吸引了他的注意。当朝那个方向看过去时,他见到一名女子从巷子里跑出来,并跳上了街对面的一辆黄色汽车。他无法给出这辆汽车的车牌号和型号。汽车马上发动,绕了一大圈绕过另一辆停着的车,而在这条窄路上绕圈时,它一度离巴斯仅6 英尺远。巴斯看到开车的是一名黑人男子,留着大胡子和小胡子……其他证人则分别描述该车为黄色、黄色带灰白车顶和黄色带蛋壳白色车顶。该车据描述为中到大型车。 事情发生几天后,一名洛杉矶警官在柯林斯夫妇的家门前发现了一辆黄色带灰白车顶的林肯车,他与这对儿夫妻交谈,说明自己正在调查一起抢劫案。他注意到这对儿夫妻很符合目击者对那两个犯下罪行的男女的描述,只是现在这名男子没有大胡子,不过他承认他有时会留大胡子。当天晚些时候,洛杉矶警察逮捕了这两名犯罪嫌疑人——马尔科姆·柯林斯和他的妻子珍妮特。 指控夫妻俩的证据并不充分,因此,该案在很大程度上依赖于受害人与证人巴斯对犯罪嫌疑人的认定。对于检方而言很不幸的是,受害人与证人都算不上证人席上的模范。受害人无法认定珍妮特就是罪犯,也根本没见过那名开车的司机;巴斯没见过抢劫者,而且在警察局给出的一列待指认者中,也不能确认马尔科姆就是那名司机。这件案子看似无法进行下去了。 随后,本案的明星证人登场了。根据加利福尼亚州最高法院判决书中的描述,该证人不过是“一所州立大学的数学讲师”。据其证词,被告是“一名金发梳马尾辫的白人女子……(以及)一名留有大胡子的黑人男子”这一事实,就足以给法庭上的夫妻俩定罪了。为了说明这一观点,检方给出下面的表格,我从最高法院判决中逐字引用如下: 检方传唤的这名数学讲师,将乘法规则应用在这组数据中,由此得到的结论是,出现一对儿符合所有这些不同特征的夫妻,其概率是一千二百万分之一。证人据此认为,法庭上这对夫妻无辜的概率就是一千二百万分之一。检方随即指出,这些独立的概率都是估计值,并请陪审员用自己的估计值做做这道算术题。检察官称,他本人相信这些值都是相当保守的估计,如果用他自己的估计值,那么得到的概率更接近十亿分之一。陪审团接受了这一结果,认定夫妻俩罪名成立。 这个计算错在何处呢? 首先,正如我们已经看到的,要通过各组成概率相乘得到复合概率,这些组成概率对应的范畴应相互独立,而在本案中,所列特征明显不是相互独立的。例如,表中称看到一名“留大胡子的黑人男子”的可能性是1/10,而看到一名“留小胡子的男子”的机会是1/4,但大多数留大胡子的男子同样留小胡子。因此,如果你看到一名“留大胡子的黑人男子”,那么此人同时留着小胡子的可能性不再是1/4,而是远大于这个值。我们可以通过剔除“留大胡子的黑人男子”这个特征纠正上述问题,此时得到的概率乘积约为百万分之一。 法庭的分析还有一个错误:真正与案件有关的并不是上面所给的那个概率,即随机选出一对儿夫妻,他们符合对犯罪嫌疑人的描述的概率。真正相关的概率应该是,一对儿符合所有上述特征的夫妻,他们有罪的可能性到底是多少?前一个概率可能是百万分之一,但对后者而言,由于与案发地相邻的区域中有数百万人口,因此,我们可以合理地估计,这一地区有2~3 对儿夫妻符合上述描述。此时,如果仅根据前面的证据(这些证据差不多也就是检方掌握的所有材料了)判决符合描述的夫妻有罪,这个判决正确的可能性不过是1/2 或1/3。这样的概率根本不足以对犯罪嫌疑人合理质疑。由于这些原因,最高法院最终推翻了对柯林斯的定罪。 在现代法庭中使用概率和统计,这仍然是一个有争议的话题。在柯林斯案中,加利福尼亚州最高法院嘲弄了所谓的“数学审判”,却向更多“数学方法的恰当应用”敞开了大门。在其后的若干年里,法庭很少考虑数学论据。但即使律师与法官们没有显性地使用概率或数学定理,他们也确实经常采用这类推理,陪审员在判断证据的有力程度时的做法也一样。不仅如此,由于有必要对DNA 证据的效力进行评价,统计论据正变得越来越重要。不幸的是,这种不断增长的重要性,并未促使律师、法官或陪审团对概率的理解随之增长。如同在南加利福尼亚州大学教授概率与法律学的托马斯·里昂解释的那样:“没有几个学生会在法律课上使用概率,也没有几个律师觉得概率在其中应该占有一席之地。”如同在其他领域一样,在法律中,对随机性的理解可以揭示隐藏的真理,但这只是对那些掌握了这个真理发掘工具的人才成立。

本文整合自《醉汉的脚步》/pic/1_xOqVCChT2A3pKRu1e7LAbibYibHjAw.jpg

《醉汉的脚步》

有关随机、概率与逻辑的通识思维

有关运气、偶然与直觉的科学原理

被霍金誉为“理解随机性如何主宰生活的绝妙指南”

作者:列纳德·蒙洛迪诺

出版社:中信出版集团

福利时间:讲讲你在学习生活中应用概率思维解决实际问题的案例,10月25日前,点赞最多的三名读者,将获得本书包邮赠书。

movie2020-10-23 17:36:27

最经典的应该是赌徒算概率的方法了,比如猜正反,学过小学概率统计的都知道每一面朝上的概率是相等的1/2,但很多人不知道,只有扔的次数足够多,他们的概率才会趋近于相等,如果只扔几次则什么结果都有可能发生

流动小吃车2020-10-23 10:59:56

不谈精确概率。在看到一个未曾见过的人时,我们总会不自觉的对此人进行多次判断。性别往往容易些,从小时候单纯的以头发长短作为判据,到长大后更多且更为丰富判断方式(外表,步态,声音等)。我们做出精确判断的概率在不断提升,也就是所谓的“经验之谈”。思维的遗传延续变异进化,人类的奇妙之处不止于此。

王栋2020-10-23 08:39:52

留个言,增加获奖概率。

李树佳2020-10-23 07:55:46

这本书好像绝版了很久,终于再版啦~

90奶粑2020-10-23 15:48:34

努力挣钱!

錦2020-10-23 10:01:42

想要!

Lzq 2020-10-22 21:55:36

来,点赞,谢谢!