红色中国网

 找回密码
 立即注册
搜索
查看: 3112|回复: 2

我们能相信统计数据吗? [复制链接]

Rank: 8Rank: 8

发表于 2021-8-31 05:37:45 |显示全部楼层
我们能相信统计数据吗?正经沙龙 · 2021-08-30 · 来源: 正经沙龙



[url=]收藏(0)[/url] 评论()字体: [url=]大[/url] / [url=]中[/url] / [url=]小[/url]
有关部门或企业为什么要进行这种统计欺骗呢?当然是为了某些目的,这还用得着说吗?

  一天深夜,一个社畜,忙完了一天的福报,踯躅在深圳的街头。就在距他100米的一个豪华酒店,人民富豪马总正在里面觥筹交错。就在这一刻,以这个社畜为圆心画一个100米的圆,在这个圆内所有人的平均财富,一定是一个非常高的数字。那么,这一刻这个社畜的幸福感和获得感是否会有提升呢?

  这个段子告诉我们两件事。一是,我们不能以个例来评价整个社会,比如这个社畜很疲惫,很沮丧,觉得没有前途,不代表所有人都是如此,至少马总不是,这时候我们需要统计数据;二是,统计数据也不一定靠谱,比如这个社畜的平均财富是如此之高,然而他的个人境遇并未因此有任何改变。

  统计是门大学问。一方面,我们能够通过统计数据看清社会的真实面目,另一方面,统计也能欺骗我们,我们往往会被刻意修饰过的统计数据所误导。

  美国作家达瑞尔·哈夫著《怎能利用统计撒谎》(初版于1954年),向我们揭示统计数据中的各种欺骗手法。书名直译过来应该是《如何利用统计撒谎》(How to Lie with Statistics)。

  这本书篇幅不长,也没有什么高深的专业理论。作者以幽默的语言,丰富的例证,向我们揭示了统计中的那些花招。全书共10个小节,下面我们跟随作者的思路,一起看看60多年前统计数据是怎么欺骗我们的。

  1、有偏性的样本

  当统计者向我们展示一些统计数据时,我们首先要问的是,统计样本是什么样的状况?有没有代表性?

  本书举了一个很简单的例子。《时代杂志》文章称,1924级的耶鲁大学毕业生一般年收入25111美元,这在1950年代是极高的收入了。

  问题来了。25年前的毕业生,有多少人还能找到呢?那些人生失意者会回答这个问卷吗?25年过去了,当年的毕业生,还会那么努力地回答问卷吗?并且一定会如实填写吗?如果答卷,有些人由于虚荣心或者过于乐观,会夸大自己的收入;还有一些人,由于税务等原因,会刻意缩小自己的收入。这两种情况分别占多大比例?

  如果想获得统计数据,因为调查成本的原因,或调查时限的原因,不可能调查所有人。这就需要抽样调查。统计数字的质量依赖于样本,也只能代表所调查样本的情况。

  毫无疑问,上面的数据来自这样一些样本,即当年全体毕业生中那些知道其住址,又肯提供答案的人,这些人可能是社会上的头面人物。这个数字,如果是真实的,也只能代表1924级中那些知道地址而又愿意站起来报告他们挣多少钱的人。即便如此,也要假定这些人说的都是实话。

  有杂志社想知道读者都喜欢什么杂志,于是进行逐户调查,结果显示读者喜欢《哈帕斯》而不是《真实的故事》,这与杂志社的发行量不符。问题在哪里呢?逐户调查未必能了解到真实情况,因为读者未必如实回答。更好的方法是到住户家中收购旧杂志。当然,这也只能知道读者有过什么,而不是他们现在喜欢什么。

  河水不会高于源头,抽样调查的结果不会比样本更好。抽样调查过程可以完全符合已获证明的数学原理,貌似很科学,然而只要精心选择样本,调查者总能得到自己想要的结果。

  2、选择得当的中心值

  当我们获知本地的人均年收入是X万元时,假定我们相信统计者没有作假的动机,数据真实可靠,那么这个年均收入对我们有多大参考意义?这个“平均”是哪种,算术平均,中位数,还是众数?

  一位地产商为了笼络顾客,告诉他本地住户“年均”收入1.5万美元,是一个较好的社区。一年后,同一个人,现在是纳税委员会成员,向当局申请降低税率,声称本地住户“年均”收入仅3500美元。这两个数字差别也太大了。哪个是准确的呢?可能都是。因为这两个数字都是统计汇总的中心值(原书使用“平均数”一词,不严谨,应为“中心值”,即数据的中心,一般有三种:均值——算数平均值,中位数,众数。以下均使用“中心值”。——笔者注)。

  我们经常会用到三种中心值:均值、中位数和众数。

  “年均”收入1.5万美元,可能是所有住户的年收入(算术)平均值,即所有收入累加并除以住户数。“年均”收入3500美元,可能是所有住户年收入的中位数,即一半的住户在这个数字之上,另一半在这个数字之下;还可能是众数,即最多的住户是这个水平。

  就是说,不加限定的“年均”可能是没有任何意义的。

  某些数据符合正态分布,在这种情况下,均值、中位数和众数三者差别不大。然而,就小区住户收入而言,可能并不如此。如果有某几家住户拥有高额财产,只是偶尔度假才在此居住,则可急剧拉高均值,然而并不会拉高中位数和众数。

  所以,当你获知某公司“年均”收入多少,或某地、某国“年均”收入多少,首先要问,这个“年均”收入是哪种中心值,是均值,中位数,还是众数?统计部门拥有详尽的数据,他们有能力得到某项数据的各种中心值。如果他们发布了一项指标,而不说明是均值、中位数还是众数,这值得你深思。

  回应本文开头的段子,如果计算以这个社畜为圆心的100米范围内人群的收入水平,中位数或众数更能反映真实情况。

(接下页)


使用道具 举报

Rank: 8Rank: 8

发表于 2021-8-31 05:39:48 |显示全部楼层

  3、没有透露的小数字

  偶尔,我们读到一份报告,告知我们一点很有意思的信息。然而,报告中常常会有一些小数字,告知我们一些更有意思的信息:样本数非常少,试验只做了很少几次,……,这往往是我们会忽略的。

  某公司广告称使用他们的牙膏可使蛀牙减少23%。是不是觉得很不错?然而,仔细阅读广告的小字说明,参加实验的用户只有12人。某牙粉广告宣称在治疗龋齿方面相当成功。然而这个实验只进行了6次,并且是先入为主的。医药界很多新药都是如此炮制出来的,即只进行了较少的实验。

  怎样识破这些花招呢?你并不需要成为统计专家。

  有一个简单易懂的显著性检验法,这不过是一种说明实验数据能够在多大程度上代表真实情况,而不是某种偶然出现假象的方法,这就是查一查那些没有透露的小数字。

  表示这种显著程度的最简单的方法,就是概率。

  对大多数用途来说,任何显著水平达到5%就够好了。而对某些用途来说,对显著水平的要求是1%。

  还有一种不公开的小数字,就是说明事物的范围,或者与给出的中心值之间的离差的数据。

  未透露的小数字的欺骗性在于它的失踪经常无人察觉。

  在《时代周刊》,1948年的一个电力公司的广告上说:“现在美国四分之三以上的农场可以获得电力……”。似乎很好。然而,这个“可以获得”可以随意解释,它并不意味着四分之三的农场已经获得电力。这可能是说电线经过他们的村庄,或者电线距他们不到10英里或100英里而已。

  4、无事空忙

  我们对数据进行比较时,如果两个数据相差很小,因为数据测量本身就存在误差,那么在统计意义上,这两个数据并没有实质区别,完全不能说较低的数据就代表着较差的表现。这是我们需要警惕的。

  比如,有两个孩子,智商测试表明,彼得智商是98分,琳达是 101分。能不能说明琳达比彼得更机灵呢?

  常用的智商测试的误差率是3%。所以彼得的智商应该表述为98±3;琳达则是101±3。也就是,彼得的智商在95-101之间,琳达在98-104之间。从这里可以看出,彼得的智商是有可能高于琳达的。

  对待这种情况的唯一办法是看它所表示的范围。将差别不大的数字比较是毫无意义的。

  《读者文摘》组织人对多种品牌的香烟进行分析,并公布了结果。人们发现危害成分排名,“老金”牌香烟排在最后。“老金”香烟的名声因之大噪,“老金”公司也趁机大做广告,但是删掉了排行中危害成分含量的差距微乎其微的内容。虽然后来“老金”厂商被命令停止宣传,但是他们已经从早期的宣传中捞到了足够的好处。

  5、惊人的曲线

  一图胜千言。有些情况下,数字、表格太枯燥,而文字说明又难以解释清楚时,这时,图是最适合的表现形式。然而,我们往往会被精心设计的图表严重误导。

  有多种方法让一个很平凡的数据产生强大的视觉冲击力。

  比如,一个折线图中,将纵坐标的起点取为某个较大的数值,而不是从0开始;将纵坐标的间隔取较小的数值,都能让实际变化较小的数据显示为比较陡峭的曲线。例如:

  销售额变化趋势图。本图是笔者本书作者原意重新绘制的

  这个图中的数据,销售额从1月20.03百万元到12月的20.1百万元,仅上升了0.35%,然而精心设定纵坐标的起点和间隔,却能显示为一条陡峭的折线。

  这并不是作者编造的。1951年《新闻周刊》就是这么干的,它显示的图形剪掉了下面的80个刻度,以显示“股票市场创21年来新高”。1952年哥伦比亚煤气公司在《时代周刊》的广告,从数据可以得知10年来生活费上涨60%,煤气费下跌约4%;然而通过精心选定的纵坐标起点,给人的视觉观感是生活费上涨了3倍,而煤气费降低了1/3。

  有很多公司和媒体每天使用这样的花招误导读者。

  6、平面图

  形象图经常用来对两个指标进行对比。形象图的前身是条形图或柱状图。条形图也可以通过精心选择纵坐标的起点以误导读者。

  而形象图就更容易做到这一点了。例如,比较两个人的工资,一个人周薪30美元,另一个人是60美元。用两个钱袋的形象图表示两者的对比,其中一个钱袋的高度是另一个高度的2倍。然而这完全是误导性的。因为右边钱袋的高度是左边的2倍,宽度也是2倍,视觉观感上右边钱袋的面积是第一个的4倍;这还不算完,读者会将这两个钱袋想象为立体图,这样右边钱袋的体积就是左边钱袋的8倍。

  《新闻周刊》就干过这样的事。他们绘制了一张图,用来吹嘘从30年代到40年代美国钢铁生产能力的进步。为了表示生产能力从30年代的1000万吨上升到40年代的1425万吨,绘制了一个高炉形象图,生产能力增加了42.5%,然而从图上看来,生产能力似乎提高了好几倍。

  这些问题也许可以认为是制图员的失误,然而就像超市柜员在找回零钱时的偶尔失误一样,如果每一次失误都有利于柜员,那么这个问题就值得深思。

 (接下页)


使用道具 举报

Rank: 8Rank: 8

发表于 2021-8-31 05:41:15 |显示全部楼层

 7、牵强附会的数字

  我们看到的报告,有时候会列举一些数字,如果不细究,这些数字会给我们以震撼,令我们很自然相信某种结论。然而这些常常是精心挑选的、牵强附会的数字,目的就是误导我们。

  药厂为了证明某种感冒药的神效,发布一个试验报告,宣称仅仅1/2英两的药物,就在11秒钟内杀死了试管中的31108个细菌。挑选一个有名的,或名字令人印象深刻的实验室,拍一个穿白大褂的医生模特的照片,印在报告边上。但是千万不要告诉公众,这种药物在咽喉中可能无效,也不要讲杀死的细菌是哪一类。报告里面列举的细菌,也许与引起感冒的某种东西,并无直接联系,谁知道呢。

  有很多这样的花招。比如,吹嘘某种榨汁机能多榨出26%的果汁。然而比什么多榨26%?旧式的手摇榨汁机。这种榨汁机也许是市场上最差的。去年在飞行事故中丧生的人员远比1910年多,是不是现代飞机更不安全呢?根本不是,现在乘飞机的人是以前的千万倍。最近因铁路事故死亡的人达4721人,是不是铁路更不安全呢?不是。

  很多数字和事件之间并无关联关系,把这两者列在一起,完全是牵强附会,就是为了误导。

  《哈帕斯》杂志的读者为A&P商店辩解说,该店纯利润只占销售额的1.1%,谁会因这么低的利润率而受到谴责呢?实际上这里的骗人之处是混淆了投资收益和销售收益。例如,每天上午以0.99美元买入,下午以1.0美元卖出,赚的钱只是销售额的1%,然而却是一年投资额的365%。

  1940年以前美国南方每年都有成千上万的疟疾病例,而现在却很少报告。原因是现在证明是疟疾的才会被记录下来,而以前南方很多地方口语中的感冒和伤风也被认为是疟疾。

  美国和西班牙战争中海军的死亡率是9‰,而同一时期纽约市民死亡率是16‰。是不是战争更安全呢?海军士兵是健康的年轻人,而纽约市民包括从婴儿到老年人的广大范围。

  8、死灰复燃的伪因果论

  两个数字,似乎是有关联的,宣传者也极力将这个两个数字联系起来,让人觉得似乎这两者之间存在某种因果关系,然而事实并非如此。这种一种常见的花招,即将统计关联宣传为因果关联。

  有人想弄清楚学生抽烟与成绩的关系。结果确实抽烟的学生成绩差些。于是要想成绩好就得戒烟。进一步的逻辑是抽烟使大脑麻木。然而实际情况可能相反,可能因为低分,没有去借酒消愁,而是吞云吐雾。

  B事件是在A之后发生的,因此,A是B的原因。这不一定是事实。甚至还有一种可能,这两件事都是第三种因素的产物。

  要避免上这种伪因果论的当,必须严格检查任何说明相互关系的材料。关于不同数字的相关性,实际上有好几种:

  一种是偶然的相关。也许有一次,搜集的数字证明了相关性;但是再来一次,可能又证明不了相关性。人们往往会抛弃不想要的结果,并大量报道想要的结果。

  还有一种普遍的协变关系,就是相关性确实存在,但是哪一个是原因,哪一个是结果,却不可能弄清。这里,因和果可以不时互换位置。

  还有一种比较棘手的情况,两个变量中一种对另外一种具有明显的影响,然而它们之间确实存在着真实的相关。许多不光彩的勾当就利用了这一点。比如抽烟与成绩之间的关系,还有很多医学统计数字也是如此,相互关系被证明是真实的,但是因果性质仅仅是臆想。

  9、怎样变统计戏法

  利用统计资料可以向人们传递错误信息,可以说是利用统计进行操纵。

  歪曲统计数据和为了某种目的而操纵统计数据的事,并不总是专业统计人员干的。统计人员手里的实事求是的数据一到商人、公共关系专家、新闻记者和广告商手上,就会扭曲、夸大,过分简单化,或在筛选过程中变形。

  1949年美国普通家庭年收入是多少呢?美国普查局说是3100美元;拉塞尔·塞奇基金会说是5004美元。普查局的数据一般是中位数,塞奇基金会的数据可能是均值,即便如此,也不至于差距这么大。这是为什么呢?这是一个戏法。基金会将全美国的个人总收入除以全美人口数,然后乘以4(假定一家4口),就得到了5004美元。这种算法是完全错误的,四口之家的富裕程度决不是两口之家的2倍。

  广告称现在购买圣诞礼物可以节省100%的钱,这不过是基数混乱,实际上是减价50%。

  《标准石油公司史》说:“西南部的减价幅度……在14%至220%之间。”这是在倒贴吗?

  上面说的这些花招似乎太陈旧、太露骨了,然而一直有人这么用。比如,每次发生罢工,就有人宣称罢工每天造成几百万美元的损失。这是将罢工时间乘以该时间的产出额。

  有人宣称,对出版公司来说,由于各个环节成本上升,如车间成本提高了10-12%,原材料上涨了6-9%……,各项相加,总计成本上涨了33%,对小的出版商则是40%。然而即便每个环节都上涨了10%,总成本最多上涨了10%。这种各个环节百分比累加的逻辑纯粹是无稽之谈。

  一个路边兔肉三明治小贩解释他的三明治为何如此便宜,他说,我不得不掺些马肉,我是对半掺的,一只兔子掺一匹马。这个小贩深得数字戏法真谛。

  还有百分比和百分点的混淆。投资利润率从第一年的3%提高到第二年的6%,可以说是提高了3个百分点,似乎很小,然而这个数字还可以描绘为利润增加了100%。

  尽管统计学是以数学为基础,但它既是科学,也是艺术。在规定的适当范围内变点戏法,甚至歪曲,都是可能的。

  10、如何识别统计数字的真实性和有用性

  面对统计数据,我们并不能用化学分析或金属纯度检验那样的方法进行检验,然而,可以用下面的5个问题试探一下。

  (1)谁这么说的?

  实验室为了支持某种理论,为了荣誉或金钱而证实某种东西,报纸为了耸人听闻的消息,工厂为了控制性命攸关的工资水平,这些都可能产生偏见。

  这些偏见之下,可能会瞪着眼瞎说,也可能说一些含糊之词;可能会选择有利的数据,回避不利的数据;也可能改变计算的标准。

  (2)他是怎么知道的?

  要密切注意选择的样本:是由于选择不当,还是由于只选择迎合自己的样本,这个样本是否大到足以作出任何可靠的结论。

  关于相关系数,也要问一下,是否大到足以说明问题,是否从足够多的实例得出,是否有一定的显著性。

  (3)缺了什么东西?

  要密切注意未加说明的中心值,任何情况下,均值和中位数可能有很大的差别。

  (4)有人偷换概念了吗?

  检验统计数字时,要注意在原始数字和结论之间某个环节上可能发生的变动,将一种东西报道成另外一种,这样的事太多了。

  (5)这有意义吗?

  每当听到以没有得到证实的假设为基础的长篇大论时,可以想一想,这有意义吗?这个问题可以使统计数字恢复它的本来面目。

  许多统计资料一下就看出是假的,仅仅是由于数字的魔法镇住了常识,它才得以蒙混过关。

  虽然这本书初版距今已经67年,这并不意味着这本书所介绍的统计花招已经过时,我们在媒体上依然能看到各种各样的欺骗性的统计数据。当然,时代在前进,新的花招也层出不穷。比如,如果某个统计数据很难看,怎么办?调整其中某项指标的权重即可。如果调整权重仍然难看呢?也很容易,将这几项指标直接踢出去。

  有关部门或企业为什么要进行这种统计欺骗呢?当然是为了某些目的,这还用得着说吗?

  英国前首相迪斯雷利说过,谎话有三种,谎言,弥天大谎和统计。我们要了解社会,当然离不开统计数据,然而我们要睁大眼睛,仔细分辨这些数据背后的真相,凡事要多问几个为什么。



使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

Archiver|红色中国网

GMT+8, 2024-3-29 04:25 , Processed in 0.019520 second(s), 10 queries .

E_mail: redchinacn@gmail.com

2010-2011http://redchinacn.net

回顶部