7、牵强附会的数字 我们看到的报告,有时候会列举一些数字,如果不细究,这些数字会给我们以震撼,令我们很自然相信某种结论。然而这些常常是精心挑选的、牵强附会的数字,目的就是误导我们。 药厂为了证明某种感冒药的神效,发布一个试验报告,宣称仅仅1/2英两的药物,就在11秒钟内杀死了试管中的31108个细菌。挑选一个有名的,或名字令人印象深刻的实验室,拍一个穿白大褂的医生模特的照片,印在报告边上。但是千万不要告诉公众,这种药物在咽喉中可能无效,也不要讲杀死的细菌是哪一类。报告里面列举的细菌,也许与引起感冒的某种东西,并无直接联系,谁知道呢。 有很多这样的花招。比如,吹嘘某种榨汁机能多榨出26%的果汁。然而比什么多榨26%?旧式的手摇榨汁机。这种榨汁机也许是市场上最差的。去年在飞行事故中丧生的人员远比1910年多,是不是现代飞机更不安全呢?根本不是,现在乘飞机的人是以前的千万倍。最近因铁路事故死亡的人达4721人,是不是铁路更不安全呢?不是。 很多数字和事件之间并无关联关系,把这两者列在一起,完全是牵强附会,就是为了误导。 《哈帕斯》杂志的读者为A&P商店辩解说,该店纯利润只占销售额的1.1%,谁会因这么低的利润率而受到谴责呢?实际上这里的骗人之处是混淆了投资收益和销售收益。例如,每天上午以0.99美元买入,下午以1.0美元卖出,赚的钱只是销售额的1%,然而却是一年投资额的365%。 1940年以前美国南方每年都有成千上万的疟疾病例,而现在却很少报告。原因是现在证明是疟疾的才会被记录下来,而以前南方很多地方口语中的感冒和伤风也被认为是疟疾。 美国和西班牙战争中海军的死亡率是9‰,而同一时期纽约市民死亡率是16‰。是不是战争更安全呢?海军士兵是健康的年轻人,而纽约市民包括从婴儿到老年人的广大范围。 8、死灰复燃的伪因果论 两个数字,似乎是有关联的,宣传者也极力将这个两个数字联系起来,让人觉得似乎这两者之间存在某种因果关系,然而事实并非如此。这种一种常见的花招,即将统计关联宣传为因果关联。 有人想弄清楚学生抽烟与成绩的关系。结果确实抽烟的学生成绩差些。于是要想成绩好就得戒烟。进一步的逻辑是抽烟使大脑麻木。然而实际情况可能相反,可能因为低分,没有去借酒消愁,而是吞云吐雾。 B事件是在A之后发生的,因此,A是B的原因。这不一定是事实。甚至还有一种可能,这两件事都是第三种因素的产物。 要避免上这种伪因果论的当,必须严格检查任何说明相互关系的材料。关于不同数字的相关性,实际上有好几种: 一种是偶然的相关。也许有一次,搜集的数字证明了相关性;但是再来一次,可能又证明不了相关性。人们往往会抛弃不想要的结果,并大量报道想要的结果。 还有一种普遍的协变关系,就是相关性确实存在,但是哪一个是原因,哪一个是结果,却不可能弄清。这里,因和果可以不时互换位置。 还有一种比较棘手的情况,两个变量中一种对另外一种具有明显的影响,然而它们之间确实存在着真实的相关。许多不光彩的勾当就利用了这一点。比如抽烟与成绩之间的关系,还有很多医学统计数字也是如此,相互关系被证明是真实的,但是因果性质仅仅是臆想。 9、怎样变统计戏法 利用统计资料可以向人们传递错误信息,可以说是利用统计进行操纵。 歪曲统计数据和为了某种目的而操纵统计数据的事,并不总是专业统计人员干的。统计人员手里的实事求是的数据一到商人、公共关系专家、新闻记者和广告商手上,就会扭曲、夸大,过分简单化,或在筛选过程中变形。 1949年美国普通家庭年收入是多少呢?美国普查局说是3100美元;拉塞尔·塞奇基金会说是5004美元。普查局的数据一般是中位数,塞奇基金会的数据可能是均值,即便如此,也不至于差距这么大。这是为什么呢?这是一个戏法。基金会将全美国的个人总收入除以全美人口数,然后乘以4(假定一家4口),就得到了5004美元。这种算法是完全错误的,四口之家的富裕程度决不是两口之家的2倍。 广告称现在购买圣诞礼物可以节省100%的钱,这不过是基数混乱,实际上是减价50%。 《标准石油公司史》说:“西南部的减价幅度……在14%至220%之间。”这是在倒贴吗? 上面说的这些花招似乎太陈旧、太露骨了,然而一直有人这么用。比如,每次发生罢工,就有人宣称罢工每天造成几百万美元的损失。这是将罢工时间乘以该时间的产出额。 有人宣称,对出版公司来说,由于各个环节成本上升,如车间成本提高了10-12%,原材料上涨了6-9%……,各项相加,总计成本上涨了33%,对小的出版商则是40%。然而即便每个环节都上涨了10%,总成本最多上涨了10%。这种各个环节百分比累加的逻辑纯粹是无稽之谈。 一个路边兔肉三明治小贩解释他的三明治为何如此便宜,他说,我不得不掺些马肉,我是对半掺的,一只兔子掺一匹马。这个小贩深得数字戏法真谛。 还有百分比和百分点的混淆。投资利润率从第一年的3%提高到第二年的6%,可以说是提高了3个百分点,似乎很小,然而这个数字还可以描绘为利润增加了100%。 尽管统计学是以数学为基础,但它既是科学,也是艺术。在规定的适当范围内变点戏法,甚至歪曲,都是可能的。 10、如何识别统计数字的真实性和有用性 面对统计数据,我们并不能用化学分析或金属纯度检验那样的方法进行检验,然而,可以用下面的5个问题试探一下。 (1)谁这么说的? 实验室为了支持某种理论,为了荣誉或金钱而证实某种东西,报纸为了耸人听闻的消息,工厂为了控制性命攸关的工资水平,这些都可能产生偏见。 这些偏见之下,可能会瞪着眼瞎说,也可能说一些含糊之词;可能会选择有利的数据,回避不利的数据;也可能改变计算的标准。 (2)他是怎么知道的? 要密切注意选择的样本:是由于选择不当,还是由于只选择迎合自己的样本,这个样本是否大到足以作出任何可靠的结论。 关于相关系数,也要问一下,是否大到足以说明问题,是否从足够多的实例得出,是否有一定的显著性。 (3)缺了什么东西? 要密切注意未加说明的中心值,任何情况下,均值和中位数可能有很大的差别。 (4)有人偷换概念了吗? 检验统计数字时,要注意在原始数字和结论之间某个环节上可能发生的变动,将一种东西报道成另外一种,这样的事太多了。 (5)这有意义吗? 每当听到以没有得到证实的假设为基础的长篇大论时,可以想一想,这有意义吗?这个问题可以使统计数字恢复它的本来面目。 许多统计资料一下就看出是假的,仅仅是由于数字的魔法镇住了常识,它才得以蒙混过关。 虽然这本书初版距今已经67年,这并不意味着这本书所介绍的统计花招已经过时,我们在媒体上依然能看到各种各样的欺骗性的统计数据。当然,时代在前进,新的花招也层出不穷。比如,如果某个统计数据很难看,怎么办?调整其中某项指标的权重即可。如果调整权重仍然难看呢?也很容易,将这几项指标直接踢出去。 有关部门或企业为什么要进行这种统计欺骗呢?当然是为了某些目的,这还用得着说吗? 英国前首相迪斯雷利说过,谎话有三种,谎言,弥天大谎和统计。我们要了解社会,当然离不开统计数据,然而我们要睁大眼睛,仔细分辨这些数据背后的真相,凡事要多问几个为什么。
|