大数据方法与中国哲学思维的关系及其影响*

2016-12-14 08:52余志为
现代传播-中国传媒大学学报 2016年7期
关键词:思维方法

■ 余志为



大数据方法与中国哲学思维的关系及其影响*

■ 余志为

本研究旨在理解大数据的内涵及其影响,将中西哲学文化比较和麦克卢汉新媒介研究方法纳入大数据的讨论范围,文章从大数据的特点、方法、价值以及相关质疑等深入理解大数据,结合舍恩伯格提出的大数据思维方法的三大转变,即强调整体而非细节、重视事物的模糊性价值以及“相关关系”先于因果关系,分析它与美国哲学家安乐哲和郝大维提出的中国传统思维的动态宇宙观和“关联思维”的关系,试图将大数据与中国思维放在思维方式的层面进行考察。本文认为大数据时代可以从中国传统智慧中发掘更多可利用的经验和方法,从中预见大数据未来发展可能出现的机遇、问题以及对策。

哲学思维;比较哲学;大数据;数据流

一、媒介即讯息:大数据方法沟通东方智慧的起点

之所以将大数据与东方思维进行沟通,是因为电子媒介时代带来了一个总的趋势:即东西方认知思维模式的互通互融。通过观察西方艺术在形式表达上的转变以及电子媒介给人类感知带来的潜在影响,麦克卢汉发现:西方人正在“通过转向内心而走向东方”,这一转变过程在电子媒介刚出现的西方社会来说是一种“难以察觉的外部环境”。

和文字文化与视觉文化老套的距离说相比,电路的深刻参与说有许多独特效果,其中之一是西方世界日益东方化。我们把自己19世纪的技术大量向东方倾泻,与此同时我们又在走向东方。我们通过转向内心而转向东方。东方人走向西方的趋势是一望可知的,然而我们转向内心的趋势却很难察觉,因为这个转向成为我们的外部环境,这是难以察觉的外部环境。①

在电力时代刚开始的年代,在报纸与广播、电视新兴的年代,当时这些新媒体带来的效应,是不被意识到的感知模式的转变的开始,是麦克卢汉说的像乌龟没有意识到它背上长出的美丽的花纹一样,线性感知方法被打断。报纸的非线性排版方式、广播敲响的部落鼓,电视不再与我们的思想对话,而是与我们的身体对话,这些正在生长出西方工业社会以来形成的分割的社会所无法意识到的新的纹理:对环境逐渐开始采取“狩猎人”和侦探的方法,“把整个环境当作统一场来探索”②。大数据是每一个人在互联网新媒体上生长出来的花纹,大数据方法就是探测花纹生长规律的方法,在感知方式上,是一种超脱的具有东方色彩的整体感知方法,而非科学思维所坚持的卷入的线性因果关系至上的认知方式。

大数据作为一种方法和思维,是指相对于西方主导的因果思维而言的相关思维转向。它与传统东方在知识、道德、行为模式上体现的感知世界的方式一致,美国比较哲学家安乐哲与郝大维教授提出,与西方“因果式思维”相对应,中国人的思维方式传统上是偏向“互系式”或“关联”思维。③大数据特点和思维方法与“关联思维”及其所代表的东方哲学存在密切关联,尤其是两者都将世界理解为流动的观念。因此,从思维方式相通这个意义上,我们可以认为大数据是西方人从内心走向东方的外化表现形式。即麦克卢汉所说的“东方价值”。

本文将中西哲学文化比较和麦克卢汉新媒介研究方法纳入大数据讨论范围,开展关于大数据理论的跨学科分析。大数据是一场变革,是关于“生活、工作与思维的大变革”④。大数据的重要特点在于它是“数据流”的概念,而中国思维方式正是基于直觉体悟的“一切皆流”的宇宙观理念,大数据与中国思维方式两者之间存在重要关联。本文将两种思维方法作对照分析以发现其关联所在,从中国传统智慧中发掘更多可利用的方法,发现问题,深入理解大数据及其对中国新媒体社会形成的影响。

二、作为一种思维方式的大数据与中国思维的关联

大数据可以理解为是对科学思维的一种补充和修正,虽然大数据并没全盘摒弃科学方法,但是数据驱动的科学在认识论上已经发生了变化。Kitchin在《大数据,新认识论和范式转移》一文中认为“大数据催生了一种新的认识论路径:寻找‘产生于数据’(born from the data)中的洞见”⑤。即先用归纳的方法使数据呈现意义模式,再用科学的方法对数据进行分析和解读。数据驱动的科学作为新范式,将会引导发现超出传统科学认识范围的新价值。数据中产生的模式以相关关系呈现出有意义的聚合体,即相关关系纳入科学认识论的视野。在这个视野里,大数据可以与重视相关关系的中国思维相沟通。

大数据与小数据相比具有明显的特征。通过综合分析国内外相关文献对于大数据特点的讨论,我们认为大数据具有四个方面的特点:大(big),动态性(dynamic),交互性(interactive),耦合性(coupling)。从这些特性可以看出,数据量大即意味着互联网的影响形成的分析所有数据的可能性。大数据的动态性体现在动态的数据流模式,这说明了它的共时的、非序列的特征。交互性则表明,大数据的研究对于科学研究方法之“主-客体模式”的改变。耦合性构成大数据之有机生态系统性的特点。这四大特征共同表明,大数据在研究思维上发生了根本转变。在舍恩伯格看来,这种“重大的思维转变”体现在以下既相互联系又相互作用的三个方面:首先,要分析与某事物相关的所有数据,而不是依靠分析少量的数据样本;其次,我们乐于接受数据的纷繁复杂,而不再追求精确性;最后,我们的思想发生了转变,不再探求难以捉摸的因果关系,转而关注事物的相关关系。

如下三个思维方式的转变可以与中国智慧中的思维方法作类比,两者之间具有共同的思维基础,因此在大数据处理时可以从中国思维中借鉴方法、经验并发现错误。

1.重整体而非细节,重过程多于因果

首先,相对于过去研究事物所采用的小样本方法,大数据重视总体数据。“大”不仅体现为数据容量大,更为重要的是数据类型丰富。科技专家⑥指出,数据多样性在大数据挖掘中相当重要。新的数据来源和新的数据种类在不断增加。大数据的内涵表现为所有数据都是有价值的,过去认为无关的和无用的信息在大数据时代都可以被利用,来发现潜藏于背后的关系。另外,“所有数据”的意义在于发现那些被归入某些类别而不在整体上发生作用的信息。

大数据之所以重视认识事物的整体性,即认为万事万物的存在都有意义,并且互相关联。今天我们将整个环境当作“统一场”来探索,而不再是分割的方式。这是麦克卢汉对新媒体影响的判断。新媒体不仅仅是人探索世界的工具,它已经通过改变人的认知方式潜移默化地成为新的环境。“今天,我们生活在信息和传播的时代,因为电力媒介迅速而经常地造成一个相互作用的事件的整体场,所有的人都必须参与其间。”⑦正是互动特性的电子媒介使得人的中枢神经系统通过新媒介结成网络,互为延伸,形成新的“自然”,才使大数据之全体数据成为有价值的研究目标。这与中国传统思维中的整体观相一致。在中国人的世界里,世界是流动的,万事万物交织而相互影响、互相牵制,世界的意义也是多义的,正像被李约瑟解释为“宇宙归档系统”的《易经》中所呈现的世界,万物的关联性与多义性就是世界的奥秘之处。阴与阳互相牵制,是相对和变动的元素。世间万物的存在都有意义,中国传统思维体系中的归档系统将万物以分类的形式纳入整套归档系统,将世界看作互相联系的整体。

其次,动态性是大数据的特点之一,大数据下将数据看作“数据流”(data flow)的模式。数据流模式不再将数据看作一堆静止的数据,而是看作连续的过程。“对于数据的分析开始于感知到数据的那一时刻。”⑧大数据的功能在于描述和预测。在需要实时反馈结果的应用中,一旦拥有数据就要做出预测,否则时间已经经过,预测也就失去了意义。多个数据源产生巨大而实时的数据流和历史数据,可以实时反馈并预测结果。达文波特⑨指出,这种“数据流”的看法与过去将数据看作仓库中一个静止的库存有本质上区别。大数据时代,很多数据都产生了原先没有预想到的创新用途。数据在不同坐标和不同时间点上的意义均有所不同,数据在不断产生新的数据的环境中流动,形成不同的价值和意义。“流”表明一种动态,非预定的充满活力和创新的过程。

中国传统思维特性表现为对具有特殊性的过程的重视,即安乐哲与郝大维教授所谓“一切皆流”的直觉⑩。与逻辑相对应的事物的特殊性,通过关联性的语言即类的语言来“获得对事物之流的新鲜的、直接的感觉”。如大数据的动态数据流,是一个时时刻刻变化的有机生态体系。这样的思维特征下,内在的感觉世界都具有特殊性,是流动万变的。如中国古典绘画观念中的人站在任何一个位置,他的感知世界都是以他自己为中心的宇宙世界,世界以他为起点形成,远山近水环绕,皆在“我”心中。中国人的“宇宙”就是时空以及其中的天地万物,无始无终,万物处于混沌之中。

在电子时代,计算机成为人的中枢神经与自然的中介。因此,对于世界的把握可以通过计算机进行,这使得大数据在理论和实践上具有可行性。发现大数据的“数据流”的动态模式是大数据价值的核心,也是最难于把握的方面,是大数据技术研究的热点。它是动态的秩序,没有既定的模式,在中国人的智慧中,事物变化的动力在宇宙中,是混沌的秩序。它时时更新变化,就像互联网上的信息,以及处于各个特定系统中的日常数据。把握它的方式是通过关联性的分类系统,如五行和《易经》分类系统。相对而言,互联网上的信息,以及通过人类行为在新媒介系统里发生的记录,只要达成一定的计算条件,则可以通过大数据的分析方法加以透明化,从而发现其中的模式,实现对未来模式的有效预测。

这种动态的非线性的模式的发现与跟踪,已经在科学史上有过成功的经验。它运用于气象学研究非线性系统的多样性和多尺度性,并发展为一种被称为“混沌理论(Chaos theory)”的“兼具质性思考与量化分析的方法,用以探讨动态系统中(如人口移动、化学反应、气象变化、社会行为等)无法用单一的数据关系,而必须用整体、连续的数据关系才能加以解释及预测之行为。”(维基百科)著名的“蝴蝶效应”就是一例,一只小小的蝴蝶在某地扇动翅膀,可能引发一段时间以后另一个遥远地方的一场暴风雨。说明微小条件下的改变能带动长期巨大的一系列连锁反应。

2.重视事物的模糊性价值

模糊(fuzzy)理论在美国和日本商业化产品的开发应用,模糊理论抛开偏见反而重视以往被认为缺乏科学精神的近似推理,这种方法也属于东方哲理中的重要内容。美国加州大学伯克利分校的扎德教授最早于1965年提出的模糊集合理论,于1974年和1980年英国与丹麦科学家的成功应用而推广,主要包括模糊集合理论、模糊逻辑和模糊控制等方面的内容。建立一组量化的模糊语言集作为控制条件,控制物件或过程。人类自然语言的模糊性,以及不同文化尤其是东方文化中的模糊性的意义,应用在特定环境中,模糊的描述是有效力的,这是较早时对于模糊逻辑的理解。它的主要精神是模棱两可,差不多就好,根据并不精确的信息,通过差不多的推论过程而获得有效的结果。

3.相关关系作为第一方法论

大数据还具有耦合性的特点,即不同的人和方法可以运用于大数据的分析和解释,数据耦合作用于分析的最终结果上。这些因素构成一个信息生态系统。它类似于生物生态系统,这个系统的各种因素混合在一起,相互影响,系统拥有了交互、耦合、动态的特点。秩序不是外部强加的,而是存在于自身的过程,原因不是外在的,并不能完全区分谁者为因谁者为果。大数据模式抛开既定秩序和特别的标准,试图发现过去处于事物背景中的数据价值。

这就是说,大数据可以在根本上理解为一种思维方法,认识事物相关关系的方法论。虽然相关关系在小数据时期已经被提倡,但是,直到大数据时代相关关系才被发现是数据挖掘与分析的最有效方法。不仅执着于探究“为什么”而重视“是什么”,相关关系可以帮助我们更好地了解世界。大数据的编程技术需要去发现事物之间的非线性关系,有针对性研发出解决数据挖掘的相关工具。发现非因果关系的能力在于采取类比的方法,就好比毕加索从多个角度同时观察人物和场景,一些软件已经在这方面找到了方法。将不同范畴的模式作为同一组意象进行考察,可以显示出连续时间或因果序列上所无法呈现的信息。建立特征向量本质上是在建立一种编码的模型,通过向量特征来归纳事物,综合使用分类与模式识别的方法,即因果关系与相关关系并重,在归类方法上,相关关系优先于因果关系。在小数据时代,对于世界如何运作的探索建立于假设之上,通过收集和分析数据来论证这些假设,这是近代以来实验科学的基础,也是西方基本的认知论。但是,网络世界大数据将在最大范围发生作用,我们将不必再受限于这些假想。

大数据时代,数据之大和动态复杂性已经将普遍可能的实体泛化为背景。因果概念由于它的线性思维模式而排除了其它与事物相关联的原因,将事物与其背景抽离开来。在人类产生的数据达到一种无法用单个关系去描述的程度时,大数据对于全体数据的实时而动态的分析就体现为对于背景的关注,注意到世间万物之间的联系。在分析式因果式思维时代以概念的关联性作为背景,当特定对象变得模糊,退至背景而使前景呈现为背景,关联思维就必定出现于前景。

三、关联思维的影响

伏羲用以画图来表示天气。下雨用“2、1、2”来表示,这就是数字化时代的开始,它是前文字时代的智慧,是部落时代的无字天书。我们今天的计算机正是以巧合的方式延续了这样的思维方式。从相关关系的引入,这是西方文化转型的思维模式领域的挑战。这也代表了麦克卢汉所说的电子技术时代“西方的东方化”的事实,虽然这是一个对于西方人来说难以察觉的外部环境的转向,即“转向内心”。因果关系代表了典型的西方文艺复兴以来的思维方式,相关关系正是中国传统思维体系下的思维方式。两者之间沟通的潜在价值将需要体现在人类思维模式和社会生态体系的平衡。因为,归根结底,人类自古至今的共同理想是一致的:中国人心中的“世界大同”与西方的和谐“共同体”和“地球村”。

大数据的效果已经影响到各行各业,那么,大数据方法是否可以替代专业团队?从“关联思维”模式中,我们可以推测出哪些方法和风险?

1.越过专业化时期的可能性

行业专家是一批掌握更多专业信息的人士,过去这部分人主要产生于各个专业领域以内,如经济分析师这个专业人士人员,是对财经动向和市场预测进行专业分析的拥有相关学识背景的人士,他们是大数据时代之前的掌握更多相关信息并进行分析评判的人士。但是随着大数据的开发,如彭博通讯社通过对于财经新闻信息的采集与分析,能够相对准确地预测行业发展前景,提醒市场的风险和资金的走向,这些信息将比专业人士的分析更加准确。西方社会在此方面有很多成功的案例,亚马逊用计算机系统推荐代替专家就是很好一例,由系统推荐的书的销量比起专家团队要高100倍,亚马逊因此而解散了此前为其竞争优势的专业书评家和编辑团队。

对比中国社会,中国社会直接从农业时期的“部落式”社会急促过度,专业化分工的工业发展时期并没有得到充分发展,当前又进入信息时代的后工业社会与工业社会相交杂的时期,因此发展中的专业化问题始终存在。大数据提供了帮助我们解决专业化问题的更多样的方法,即在发展专业化的同时,充分利用数据科学带来的分析预测优势,以弥补直觉方法不稳定的缺憾。

2.“关联思维”的动态特征带来不稳定因素

新媒体“同步共鸣性质的文化环境”给社会带来转变。电子时代的全球文化具有部落文化性质,从部落时代的整体感知到电子时代“重新部落化的”“超链接”社会,中国文化从对现实世界的部落感知模式到电子时代的整体感知模式,麦克卢汉所谓的“同步共鸣性质的文化环境”,使得当代中国在感知方式上通过新兴媒介接通传统中国智慧。在网状社会结构和交往模式里,大数据时代的相关思维和中国式“关联思维”的相通在方法论上具有指导意义。它在科学研究中的影响有可能出现不稳定的问题。稳定性构架是孕育理性的基础,对于人类社会的组织来说,缺乏理性将可能导致难以想象的灾难性的后果。

然而,在中国式“关联思维”主导的新媒介社会环境里,新的难题会出现。“关联思维”的滑动性与灵活性用在艺术文化等生活世界将产生无限的创造力,但是如果用于其它的社会系统,可能将导致一些问题。问题之一就是,由于深度参与和卷入大数据全球村的“整体场”,个人身份将可能丢失,隐私问题受到严重威胁。政府和商业公司很多利益化的操作,会危及大数据的制度基础,引起媒体使用者对于参与网络行为的信任方面的问题,从而带来数据偏误。

注释:

①② [加]马歇尔·麦克卢汉著,[加]斯蒂芬尼·麦克卢汉、[加]戴维·斯坦斯编:《麦克卢汉如是说—理解我》,何道宽译,中国人民大学出版社2006年版,第67、54页。

⑤ “国内外新闻与传播前沿问题跟踪研究”课题组:《大数据实践与研究:批判性反思与研究推动》,《新闻与传播研究》,2015年第8期。

⑥ Halevy,A.,Norvig,P.,& Pereira,F. (2009).TheUnreasonableEffectivenessofData. Intelligent Systems,IEEE,Vol.24,No.2,pp.8-12.

⑦ [加]马歇尔·麦克卢汉:《理解媒介——论人的延伸》,何道宽译,商务印书馆2000年版,第52页。

⑧ IBM,Zikopoulos,P.,& Eaton,C. (2011).UnderstandingBigData:AnalyticsforEnterpriseClassHadoopandStreamingData.McGraw-Hill Osborne Media.

⑨ Davenport,T. H.,Paul Barth,and Randy Bean. (2012).How'BigData'isDifferent. MIT Sloan Management Review,54,no. 1.

(作者系重庆大学美视电影学院研究员、博士生导师)

【责任编辑:张国涛】

*本文系国家社会科学基金西部项目“中西书写体系的认知效应研究”(项目编号:15XXW002)的研究成果。

猜你喜欢
思维方法
思维跳跳糖
思维跳跳糖
思维跳跳糖
思维跳跳糖
思维跳跳糖
思维跳跳糖
学习方法
用对方法才能瘦
四大方法 教你不再“坐以待病”!
赚钱方法