统计和概率 玩转统计学 数据处理入门指南 Mar 23rd 2013 |From the print edition 书名:《赤裸裸的统计学:剥开数据枯燥的外壳(Naked Statistics: Stripping the Dread From the Data)》 作者:Charles Wheelan 出版社:Norton,页数:282页,价格:26.95美元 Amazon.com, Amazon.co.uk 有售 当今世界,数据到处都是,然而要读懂数据却是个难题。于是就有了统计学,大学里这门课有不少人有意无意地翘过。达特茅斯大学教授Charles Wheelan(曾任《经济学人》驻芝加哥通讯员)做了一件别出心裁的事情,把统计学变得有趣又好玩。他以一本新书层层剥开繁复的外壳,让这个学科魅力毕现。 统计和概率学是处理信息的重要工具。利用统计学,能够将大量信息压缩成几个有意义的数字。利用概率学,人们就能量化不确定性,在信息不完整的情况下合理决策。不管是送卫星上天还是拦截垃圾邮件,都离不开这两个工具,它们可以说是现代社会的基石。人们发现,各行各业都越来越需要用上数据、统计方面的知识。可问题是,教这门课的大多是热爱统计学的人,而不是就只想了解、应用这个工具的人。“赤裸裸的统计学”有趣就有趣在它重点关注的是统计学的用途,而不是其内在的美感。此外,Wheelan先生特别的冷幽默风格(在他上一本书《赤裸裸的经济学》中有所介绍),让这本书更加轻松易读。 这本书指导效果非常好。读者从平均数、标准差和相关等概念开始学习,渐渐深入到中心极限定理这样的程度。中心极限定理就是说,如果抽样合理,那么样本应当遵循正态分布,而不应当与总体或者其他样本差别太大。这有什么意义呢?Wheelan先生是这样解释的。假设有一辆载满马拉松运动员(体重想必比一般人轻)的公交车不见了,结果找到一辆载满胖子(后来发现他们正要去参加吃烤肠比赛)的公交车。马拉松选手里面可能也有一两个略重的,但是满车都是胖子不大可能。利用中心极限定理,乘客们就可以从数据中发现端倪,知道他们可能找错了车子。 就这样,读者明白了为什么给不值钱的玩意投保是不值当的,又为什么买彩票是脱富致贫的捷径。此外,作者还解释了2011年的一项研究如何利用基本的统计学方法找到了儿童大脑体积与自闭症之间的关系。这本书里到处都是妙趣横生的统计实例。比如,2011年9月11日之后,不愿乘飞机、改乘汽车的人增多了,所以在之后的三个月中,有一千人因此丧生。 每讲一步,Wheelan先生都会解释一下统计学概念与人们对世间现象的直觉感知有何关联。(有时他也会告诉读者如何用统计结果来弥补直觉的差错,合理做出决策。)书的主体部分提纲挈领,盘根错节的细部信息和数学方程式都在章节末尾的附录中做了补充。 Wheelan先生对“大数据”(超大型数据库)心存疑虑,因为大量的信息往往会导致伪相关——有些关联看似蹊跷,其实纯属巧合。(统计学界的神童Nate Silver在他的新书《信号和噪音》中也谈到了这种担心。)不过遗憾的是,虽然大数据问题已经实实在在地摆在了我们的面前,《赤裸裸的统计学》一书中对这个问题的解决之道却语焉不详。 该书结尾对具体困境阐释略多,没有高屋建瓴地讨论统计数据处理技术的局限性、反思人类对这些技术日益严重的依赖。不过这属于笔者吹毛求疵了。《赤裸裸的统计学》深入浅出地揭示了统计学最基础、核心的知识。 From the print edition: Books and arts |
|小黑屋|手机版|网站地图|关于我们|ECO中文网 ( 京ICP备06039041号 )
GMT+8, 2024-11-22 07:16 , Processed in 0.093949 second(s), 27 queries .
Powered by Discuz! X3.3
© 2001-2017 Comsenz Inc.