李迅雷
虽然大数据比个案更有说服力,但大数据同样存在失真、变异、滞后甚至被操纵的可能性
在17世纪之前,欧洲人都认为天鹅都是白的,因为他们所见到的各大洲(欧洲、亚洲、非洲)及各个地方的天鹅,无一例外地都是白色的——这就是用归纳法对大数据处理所得出的结论。一直到人们在澳洲发现第一只黑天鹅之后,天鹅都是白色的结论就被推翻。
从此之后。人们就把意想不到事件的发生,称之为黑天鹅事件。这说明大数据的缺陷所在——样本不能被穷尽,因此,大数据可以用来“证伪”,却不能用采证明。
例如,外星球究竟有没有生命的问题,大部分科学家都认为肯定有生命'其逻辑就是概率分布,因为茫茫宇宙中的星球不计其数,难道只有唯一一个地球上有生命?但概率只是代表可能性,观察的样本数量再大,也无法找到一个例证来证明外星球上确有生命。
而大数据的运用,大部分采用归纳法——人类思维中90%以上的几率都在使用归纳法,因为归纳法不需要运用太多的知识;不像演绎法。先要掌握不少知识或定理,然后再据此去推理。
事实上,西方在基础研究领域的巨大成就,大部分都是在17世纪之后取得的,远没有跨入大数据时代,且大部分没有采取实验室研究的方式,但至今大部分成果都被广泛应用到社会经济、科技生产的各个领域。也就是说。17世纪之后。西方抽象思维得到极大发展,建立了数学、物理的科学体系,进而又推动了科技进步,从而拉大了中西方在科技领域的差距。
相比之下,从中国历史上所取得的科学成果看,能体现抽象思维的东西比较少,形式逻辑在中国没有充分发展。春秋战国时代,形式逻辑也曾有过发展,但最终却演变成了“诡辩术”,如公孙龙就提出了“白马非马”之说。因此,中国历朝历代的思维还是见长于归纳法和辩证法。
南宋数学家杨辉在1261年所著的《详解九章算法》一书中,展现了二项式系数在三角形中的一种几何排列,因此,“杨辉三角”实质上是把二项式系数图形化,把组合数内在的一些代数直观地从图形中体现出来。但他并没有在其著作中给出具体推导过程,所以,我们只能认为“杨辉三角”是通过归纳总结发现的,未能把它进一步抽象为“二项式定理”。而牛顿就给出了二项式定理的一般公式和推导过程。
形式逻辑、演绎法在中国五千年的漫长历史中没有得到充分发展.这才是导致我国近代科技发展迟缓的根本原因,而不是所谓的制度因素。为什么哲学、宗教、文化乃至醫学等都有中西方之分,但数理化就没有“中国数理化”而是照搬西方的呢?因为这些学科都不能通过经验(或称大数据归纳)、传承或辩证法来创设。
3年前,我提出要相信逻辑,不要相信奇迹(个案)。如今进入了大数据时代,我仍然提倡:在大数据面前,更要相信逻辑。虽然大数据比个案更有说服力,但大数据同样存在失真、变异、滞后甚至被操纵的可能性。
社会经济的发展,看似千姿百态。但也有其共性。比如,二战之后的今天,市场经济最终成为全球几乎所有国家的共同体制,说明这个体制合乎经济可持续增长的逻辑。这正如价值投资成为全球绝大部分资本市场的共同理念一样,唯有如此,才能获得较大的回报。
逻辑产生的作用可能会迟到,但不会缺席。