Top

知数据不知情况

Posted on Wednesday, May 9, 2007 at 11:35 am

洗手的频率是数据,死亡率高低是数据,医疗费多少是数据,但知道这些数据,并不表示知道这些数据背后的情况。同一个数据,既可表明一种情况,也可表明与之相反的情况。如果只知数据,不去了解情况,就会得出荒谬的臆测。

知数据不知情况

薛兆丰
2003年4月《新周刊》第156期

常洗手的人很干净吗?未必。假如他终日跟脏物打交道,即使常洗手也是脏。常洗手的人很肮脏吗?当然不是。假如他洗手是洁癖驱使,那么他的手比一般人干净。

死亡率高的地方不适合居住吗?未必。加州死亡率居全美之冠,是因为那里气候宜人,最适合养老。死亡率高的地方就适合居住吗?当然不是,在英国工业革命时期的矿区,死亡率很高,以今天的标准看,那不是人住的地方。

不花钱看病的人身体健康吗?未必。很多穷乡僻壤,几乎没有医生和药物,即使眼睛瞎了,牙齿蛀了,骨头折了,也得不到医治。花钱看病的人就体质孱弱吗?未必,发达国家的医疗费用占国民收入的比重越来越大,那里的人活得越来越健康,越来越长寿。

洗手的频率是数据,死亡率高低是数据,医疗费多少是数据,但知道这些数据,并不表示知道这些数据背后的情况。同一个数据,既可表明一种情况,也可表明与之相反的情况。如果只知数据,不去了解情况,就会得出荒谬的臆测。

最近,经济学教授韦森先生发表文章,讨论“社会进步”与“交易费用”的关系。韦森教授说,“减低交易费用会推动社会进步”这一观点错了,因为美国过去有一百年的经济史统计表明,交易费用占国民生产总值的比重从25%增加到45%,所以——韦森教授指出——社会进步总是伴随着交易费用的增加,交易费用不是“坏东西”,而是交易的“促进力量”。

按韦教授的逻辑,既然电话费、交通费、上网费占日常开支的比例,是随着社会的进步而增大的,那就表明,信息交流的障碍、运输和迁徙的困难,都不是“坏东西”,而是交易的“促进力量”了。言下之意是,若缺少了这些障碍和困难,即韦森教授所谓的“润滑剂”和“棘轮机制”,社会都不知道该朝哪个方向进步了。

如此怪诞的结论,出自经济学教授笔下,是“只看数据、不看情况”造成的。须知道,在没有电话的年代,异地通话的费用,不是零,而是无穷大!发明了电话,通信的费用是从无穷大急跌下来,而不是从零暴涨上去。

信息交流的障碍,运输迁徙的困难,从来不是什么好东西。人顶好生来就是顺风耳,顶好生来就是千里眼。那样,电话费永远是零,交通费永远是零。皆大欢喜。除了个别经济学教授,没有谁会感到社会缺少了什么“润滑剂”或“棘轮机制”。

美国的经济史统计,其实不难理解。从数据上看,交易费用(包括部分通信费用,部分交通费用,和所有用于警察、律师、经纪、银行家、文员、经理等职业的开支)在国民收入中的比重上升了。但这只是数据,数据本身不足以说明问题,因为它至少同时支持两种对立的情况。
 
一种情况是,某些领域的交易费用从无穷大降低到有限大,从而纳入了国民收入的统计范围——这种情况是好事,不管统计员如何点算,都有利于社会进步;另一种情况是,某些领域的效率下降了,人们得花更多的钱来办同样的事,从而使交易费用的统计数值上升了——这种情况是坏事,不管统计员如何点算,都会使经济倒退。

到底哪一种情况占上风呢?要谦虚地承认,我们得首先确认“美国那一百年的经济是进步的”,然后才能据此推断是第一种情况占了上风,即“交易费用比重上升”主要是由前一种情况造成的。我们只有先了解情况,才能据此理解数据的含义;反过来,我们则没有本事单纯从数据出发,去推知真实世界的情况。

想增强类似的推理能力,大家不妨找美国“教育考试机构(ETS)”设计的GRE或GMAT作文题来练练手。在美国,不管你想读哪一科的研究生,从数理化到文史哲,从工商管理到宗教神学,都得考个GRE或GMAT成绩。做那些题目不算掉架子。练过的朋友可能比较容易明白:为什么单纯从“破案数字上升”来推断“治安情况好转”或“治安情况恶化”都是武断的。

给作者留言(不公开):


Bottom