张 喻 王雪慧
(鲁东大学马克思主义学院 山东 烟台 264025)
当前,国内外学者对于大数据技术的概念尚未形成统一定论,但大致持以下两种观点 :第一种是互联网数据中心(简称IDC)对大数据技术的定义:“大数据技术是更经济地从高频率、大容量、不同结构和类型的数据中获取价值而设计的新一代信息架构和技术”[1];另一种观点则来自英国学者维克托在《大数据时代》中所归纳提出的大数据技术三个全新特点:“采用所有数据,而不再依赖于随机采样;强调数据的混合性,而不再热衷于追求精确度;寻找事物间的相关关系,而不再热衷对因果关系的分析挖掘”[2]。在这本书中,维克托提出,大数据技术与传统旧式的数据处理技术相比,不仅在处理数据的数量上发生了变化,而且在数据分析的结果上也有着明显变化。反复论证后,维克托认为传统的数据分析方法所产生的结果则更具有可信度。
鉴于此,综合上述两种观点,本文所论述的大数据技术的内涵是指在大数据时代,人类在经过对复杂、庞大的数据进行分析之后,总结得出的数据发展规律,进而能够对未来社会发展趋势和决策提供依据的复杂技术集群。
大数据技术是由若干单线大数据构成的多线架构,其中包括数据源产生、数据采集与存储、数据处理与集成、数据分析、数据解释五步。
大数据最重要的特征就是数据量巨大。一方面,物联网技术的广泛使用,必然催生许多有价值的数据,而将这些数据进行有效的采集分析就可以指导和促进社会的生产与发展。另一方面,随着网络技术在人类社会生活中的快速发展普及,每个人都能通过网络终端产生新数据,成为数据源头。
数据产生后也要通过采集实现自身价值。目前,数据的采集与存储,可以“依托传感器、射频识别、条形码技术及网络分类搜索引擎、移动智能终端等多种设备”[3]。
采集存储的数据里很有可能会掺杂一些与实际毫无联系的干扰性数据;因此,分析数据前就应对这些数据进行清洗和去噪。通过聚类或关联分析方法,可以剔除掉一些无用数据,然后将有用数据汇总、并更改为相同结构类型,建立专门数据库进行集成和二次存储。
大数据分析是数据分析的一种特殊形式,既可以运用传统的数据分析方法,也可以依托云计算技术及一系列分布式平台,及时地对海量数据进行快速的加工处理。
这一环节最能够体现大数据技术的自身价值。伴随着大数据技术的迅猛发展,还产生了一种新型的展示形式,即“数据可视化”。可视化分析方式能够更形象有效地展示大数据技术最后的分析结果,深化了人们对量化分析的接受与理解。
21世纪以来,一些新兴技术领域出现,“人们利用科学技术改造过、塑造过和实践过的对象物,或者人们利用科学技术创造出来的对象物,不但不是对实践主体和科技主体的本质力量及其过程的积极肯定,反过来成了压抑、束缚、报复和否定主体的本质力量是不利于人类生存和发展的一种异己性力量”[4]229。因此,大数据技术在一些方面也可能会出现异化现象。尤其在一切皆可数据化条件下,人的主体地位逐渐被作为客体的大数据技术所束缚和限制,这时的大数据技术已经不再是“为我”的,而是“反我”的。
1.大数据技术可能会阻碍人的发展
大数据时代,一切皆为数据。一方面,大数据技术可以将世间一切的理性事物量化成数据,数据逐渐成为人们多种行为活动的指向与标准;另一方面,人们的感性思维也可以进行数据化的分析,这时人的思想感情、人与人之间的社会关系都已经被量化成为标准化的数据形式。
2.大数据技术可能阻碍人的本质的“表现”和“确证”
人的本质的“表现”和“确证”就是人能全面“占有自己的全面本质”。大数据技术的利益相关者间的矛盾关系却表明作为新型劳动产品的数据,并不是被劳动者自身所占有使用,而是被区别于自身的其他主体所占有。这些利益主体可以通过大数据技术深度挖掘劳动者的私人需求从而指导社会的物质生产活动,满足他们对经济利益的无限追求。然而,在当下社会中,真正能够占有和享有大数据技术成果的人仍然是少数,绝大部分的人只能处于一种被动索取的状态。因此,人的本质在这时也就没有被充分而又全面地“表现”与“确证”。
3.大数据技术可能导致个人隐私的泄露
大数据技术背后的利益是巨大的。因此,大数据技术的利益既得者在数据管理的科学思维与争取利益最大化的利益思维的双重驱动下,将会深度挖掘、掌握大量私人的身份、行为、偏好信息,这也对个人的隐私安全产生了巨大的威胁。
1.私有制的无限度扩张
大数据技术作为人类社会集体的智慧结晶,与人类所生产的劳动产品一样,都是以满足人类的自身需求为导向的。因此,在生产劳动仍旧发生异化的年代,大数据技术作为一种新型的劳动产品所发生的异化是劳动异化在信息时代的最新表现。因而也可以说,大数据技术异化与劳动异化的产生根源都是由于私有制的无限度扩张。
2.大数据技术的独特性导致唯数据主义与数据独裁
大数据时代,如果人们的基本判定和决策都过于依赖数据,就很有可能走向了唯数据主义,甚至会导致数据独裁。人们逐渐形成固定僵化的量化思维。
3.法律失范和伦理滞后
21世纪以来,新兴信息技术产业的巨大变革带来了大数据技术的逐渐兴起。而我国本有的法律体系和道德伦理并不能立即适应大数据时代的要求。因此,法律失范与伦理滞后在一定程度上也会滋生大数据舆论谣言的传播。
4.功利主义盛行
大数据时代,有些人在追求利益最大化的过程中所产生的极端功利主义使他们更为关注大数据技术所带来的短期利益,漠视了大数据技术本身所具有的潜在的消极作用。
“全部哲学,特别是近代哲学的重大的基本问题,是思维与存在的关系问题。”[4]235马克思主义哲学所认为的本体并不仅仅局限于自然界的具体物质或人的绝对理性思维,而是将本体归纳为从世界万事万物中高度概括和抽象出来的物质,这时世界万事万物都有了一个共同的基本属性即客观实在性。
在大数据时代,由于在自然领域与社会领域都能够实现数据化分析,这也就形成了大数据时代独特的数据本体论。数据本体论将人看作唯数据主义的机器,因为“它不能把世界理解为一种过程,理解为一种处在不断的历史发展中的物质”,所以这是一种庸俗化的唯物主义。
大数据时代能够把人的本质及其社会关系当作标准化、机械化的人的数据形态,人的情感、意识、态度及所有行为都可以被归纳为数据,从而进行数据分析。这也是对人的本质的简单化、物化。马克思主义哲学总是从实践的角度去理解和剖析人的存在,从而进一步从人的存在的角度全方位把握理解人的本质及其社会关系。而实践是一种主体能动地自我改造、自我创造的活动,任何离开实践分析和理解人的本质的活动其本身就是对人的本质的异化。此外,大数据技术对人类隐私的侵犯,也使个人在生活中时刻可能处在被监控之中,毫无隐私可言,人类面临着丧失自由,甚至人的本质也被全面“异化”的风险。以马克思异化理论分析大数据技术对隐私的侵犯,意味着在当社会之中人的异化程度将空前提高,丧失了人类自身本来所具有自由与个性,也丧失了人类本来所具有的各种复杂多维的社会关系,从而成了马尔库塞意义上的“单向度的人”。
大数据作为21世纪取之不尽用之不竭的新兴信息资源,其中自然蕴藏着巨大的商业价值。而在现实社会中,大数据技术的高速发展也可能会导致大数据利益相关者间关系的日趋尖锐,具体表现为大数据的生产者与大数据的搜集者、大数据的利用者间相互对立的外部矛盾关系及大数据搜集者与大数据利用者间的内部矛盾关系。因此就这一层面来说,当前大数据技术的发展还不能真正地实现“大数据大价值”这一根本性的目标。
马克思主义认识论界定了认识的主体、客体与中介,人对某种客观事物的认识如果只能反映这一客体的某一方面而未能反映事物的整体,就不能成为关于该事物的绝对真理。受人的实践能力和特定历史时期的影响,人类个体的认知能力也是有限度的,人们所认识到真理只是在特定条件下或一定范围内才能够称之为的绝对真理,超出了这个限度就不再是绝对真理了。而人类社会在发展过程中所产生的数据却是无限的,大数据技术的无限性就表现在它可以随时随地收集人类社会所产生的最新的实时数据。人类认识能力的有限性与大数据技术的无限性间的矛盾关系表明人类对于大数据技术的认识也是有限度的。由于客观事物总是在不断地运动变化,真理也在这个过程中不断发展;因此,人类个体的认识能力永远也不能完全把握住大数据技术的一切方面、一切联系,人类依托大数据技术所做出预测或判断也始终是有限的。
辩证唯物主义把运动理解为一切物质所固有的根本属性,任何事物的存在和发展都是绝对运动与相对静止的统一。而大数据技术所产生的数量关系、分析预测,都只是为了应对当前社会发展所做出的相对静止的量化分析,而忽视了人类社会也是一个不断发展着的动态整体。大数据技术是以相对静止的数据去分析、预测绝对变化发展着的人类社会,这也使得大数据技术在分析、预测社会发展过程中不能总是以时间、地点、条件为转移,具有其自身无法克服与超越的局限性。
当前,大数据技术携带着现实或潜在的各种利益诉求已广泛应用于当代社会,尽管现在的它还用轻纱遮面,甚至还有点捉摸不透。而不管我们接受还是拒斥,大数据技术都已然存于我们的日常生活之中,也正因如此,我们在广泛利用它的同时,更应该时刻保持着理性,看清这些纷繁复杂的数据符号背后真正的本质内涵:数据符号仅具有表征性,本身并无太多实质性的意义,只有当数据能够如实地反映出事物的本来样貌,它的意义才能够真正地呈现出来。因此,大数据技术所构建的虚拟的数据世界不应该全部取代现实的人类社会,数据符号并不能完全替代感性的生命存在。