前不久给Sammi大人写了“年我最喜欢的书”。她没要求一定是艺术类的,因此我趁机推荐了一套英国侦探小说。没想到刚刚迈入年,俺就读到了“年我最喜欢的书”:《TheArtofStatistics:HowtoLearnfromData》。标题和封面很适合假装艺术类暗度陈仓,其实内容是统计学,更确切地说,统计学思维和表达方式。去年9月出版的新书,后半部分与时俱进,主要关于大数据和机器学习如何运用统计学。最早是在《纽约客》书评上看到的,发现本地图书馆居然能借到Kindle版,于是很贱地不想掏钱了。翻了几页觉得特别好,加之里面包含了不少图表,Kindle版实在不适合前后翻来翻去,必须自己买一本。大亚麻上大家都给出了5星,居然有一个人给了1星。呵呵,特立独行的牛人不少,不过更大概率是傻逼。这个人说,“作者根本不懂统计学,基本概念都是错的,百分比怎么能相加?!看了几页就扔废纸篓了。”大亚麻无可取代的优势之一就是产品评论社区。这一条吸引了14条评论,一致骂给1星的傻逼。有人说,没明白为啥给1星,特地用预览功能看了第一章第一个表格,作者没错,给1星的人傻逼无疑。俺愿意出邮费,请把扔到废纸篓的书寄给我。作者居然跳出来怼了:考察对象相同的情况下,百分比是可以相加的:比如抓来个人,其中40个人喜欢吃咸豆腐脑,40个人喜欢吃甜的,20个人不喜欢吃豆腐脑。40%+40%=80%的人喜欢吃豆腐脑,没毛病。对了,那个给1星的人真的是傻逼,居然在评论里加了签名档:加州大学戴维斯分校,人类学家。表演型人格吧。我一向认为真正的牛人能够用简单明了的方式讲明白复杂的事情。如果没做到,要么是故弄玄虚,要么是自己一脑子浆糊,更经常的情况是两者兼而有之,为了掩盖自己的糊涂有意故弄玄虚。这本书的作者DavidSpiegelhalter牛津毕业,伦敦大学学院的博士,剑桥大学的统计学教授,写出来的书却是高中生读起来也毫无困难,更何况包含了英国人骨子里贱嗖嗖的幽默感。比尔·盖兹走进屋子里,一下子提升了屋子里大伙儿的收入平均水平。这是一个老梗,作者还是用了,不过有所发挥:“WarrentBeatty或者比尔·盖兹的存在大大提升了平均值(我要补充一句,分别是性伴侣的数量和收入水平)。”作者说自己发现年纪大的人耳朵更大,而且有日本和英国的统计数字可以证明。于是设想了几条原因,严肃地加了一条脚注:Sadly,我也不知道确切原因是什么,因为没人会掏钱资助这种研究项目。我大概看完了三分之一,虽然书中提到的统计概念都是大学时学过的,但是作者提出的一些东西倒是有意思。比如,他说新时代更应该注重如何呈现结果。美国使用死亡率,但英国倾向于使用存活率。与存活率97%相比,死亡率3%显得吓人一些,尽管两者在数学意义上并无差别。统计取样也有类似的问题。英国脱欧公投的时候附加了其他问题,比如,“赞成给予16岁和17岁的人投票权吗?”52%的人赞成,41%的人反对。然而换一个说法,“赞成把有权投票的年龄从18岁降低到16岁吗?”37%的人赞成,56%的人反对。其实两种说法在逻辑上是一致的。必须提一下大部分人都会搞错的“相关”和“因果”。根据统计数据,年到年,美国的莫泽雷勒干酪的消费量与土木工程博士学位的授予数量极为相关(相关系数0.96)。难道说,多吃莫泽雷勒干酪有助于拿到土木工程博士学位?