从大数据到大数据技术谈大数据的判断标准

2016-10-26 14:38曹德龙
现代经济信息 2016年22期
关键词:大数据

摘要:大数据伴随着技术的演化,一直影响着我们的生活。目前也是一个研究热点,但是大数据是什么?大数据能否称之为技术?我们将如何判断数据能否称为大数据?本文将大数据与技术的特征进行比较,尝试判断大数据即是大数据技术。同时对大数据与传统数据进行对比,确定大数据的基本判断标准。

关键词:大数据;技术;在线性

中图分类号:TP301 文献识别码:A 文章编号:1001-828X(2016)022-000-02

一、从大数据到大数据技术

伴随着时代的发展,大数据逐渐走入我们的生活并且保持具有自我隐藏、自我遮蔽的特性。使我们在不经意间就融入了它的怀抱,当我们停下脚步,立足反思的时候,我们可以清楚的发现,大数据给我们带来诸多改变的同时,大数据的本质及其一些哲学上思考渐渐被更多的学者所重视。

如果单纯从定义的角度,维基百科曾给出在现有工具软件的基础上,在可接受的时间范围内,无法对其记性捕捉、管理和处理的数据的集合,通过这样的定义,我们可以理解为大数据的实质是数据的集合,但我们清楚的知道在日常生活中对大数据进行收集整理的目的不是在于掌握庞大的数据资源作为资产的一部分,而是希望通过分析、捕捉、管理、处理等手段,对其进行专业化处理,使原本无意义的庞杂数据集合变得有意义。换言之,如果大数据是一种生产资料,那我们现在要讨论的就是如何将生产资料转化为产品的手段,我们能否将这种手段称之为“大数据技术”?

在判断某种生产活动能不能称之为技术之前,我们要首先了解何为技术。《史记·货殖列传》:“医方诸食技术之人,焦神极能,为重糈也。”宋代陆游《老学庵笔记》卷三:“忽有一道人,亦美风表,多技术……张若水介之来谒。”清朝的侯方域《再与贾三兄书》:“盖足下之性好新异,喜技术,作之不必果成,成之不必果用,然凡可以尝试为之者,莫不为之。”归结起来,我国古代认为技术是技艺、法术。

通过综合其他历史资料分析,技术在我国古代一直被冠以“奇技淫巧”,这也可能就是日本学者认为技术的本质是手段方法的历史渊源。在《辞海》中,技术被定义为是人为了满足自身的需求和愿望,遵循自然规律,在长期利用和改造自然的过程中,积累起来的知识、经验、技巧和手段,是人类利用自然的方法、技能和手段的总和[1]。现代技术演化,也遵循了这一定义,对方法、技能、手段无所不能及的开发、利用、革新,其代表就是技术革命带给我们的巨大好处。但以上都是日常生活中我们所谈到的对技术的定义,同时在日常生活中,人们习惯用一句话或“种加属差”的格式来为技术下定义。[2]归结起来,日常生活中人们认为技术是一种知识经验和手段,但我们依然不能清楚地了解数据的本质究竟为何。之所以会产生这样的状况,是因为人们将技术应用于生产实践的过程中,不需要弄清楚技术究竟是何物,因为不清楚什么是技术也不会妨碍他们的生产活动,不会影响他们利用、使用技术。作为研究者的我们就要探究一下,技术的本质究竟是什么?

在远德玉教授的《论技术》、《技术选择论》[3,4]中他提出,技术是一种过程。同时认为技术是一种动态过程,应把技术作为一个独立的对象,需要从不同角度开展技术论的研究。其与陈昌曙教授吃有同样的观点,不主张给技术下一个明确的定义,而更倾向于描述技术。陈昌曙教授在与陈红兵研究员《关于“技术是什么”的对话》中提出技术的三个基本特征,即第一,技术是物质、能量、信息的人工化转换。这是技术的功能特征,是技术的最基本的特征。第二个特征,即技术是人们为了满足自己的需要而进行的加工制作活动。这是技术的社会目的特征。第三个特征,即认为技术是实体性因素(工具、机器、设备等)、智能性因素(知识、经验、技能等)和协调性因素(工艺、流程等)组成的体系。[5]虽然上述的讨论未能就技术的本质给出定义,但已经大致勾勒出技术的特征,下面我们就其谈谈大数据是否符合以上特征。

技术是物质、能量、信息的人工转化。[5]这里我们要讨论的是大数据中是否存在人工化的物质、能量、信息。目前,面向大数据的研究多集中于存储、处理、分析、可视化等。多为研究分析处理数据的手段方法,这不禁让我们可以联想起纺纱机等一些列在技术生产中扮演重要角色的机械装置。工人为纺车提供原料,纺纱机产出人们想要的产品,而这个过程即物质、能量、信息经过人工化转换的过程。大数据同样拥有以上的过程,巨量的密集数据经过存储、处理、分析、可视化等手段加工后,成为人民需要的“产品”。人工化使原本杂乱、繁复的数据变得有意义,从而供下游使用。在这个过程中数据保持了原有的属性,同样被人们的实践行为和过程变得有新的意义。显然大数据符合这一基本特征。

技术是人们为了满足自己的需要而进行的加工过程。[5]大数据拥有庞大的数据,人们如何从浩如烟海的数据中,选取需要的数据则必须加入人的主观意识;例如,新兴互联网公司小橘科技,在完成“滴滴打车”这个产品之后,又为滴滴出行家族增添一员。新的产品名为滴滴巴士,同样是基于大数据平台的产品,用户前期只需提供乘车地址和目的地以及每周的乘车需求。技术人员就可以根据汇总之后的数据制定出合适的巴士路线。那么,如何在众多的用户请求中选取最合适的路线,则成为大数据加工过程中最难且最有价值的工作。线路规划人员在规划线路的过程中,要考虑乘车人数,乘车时间,线路是否拥堵,线路长度,车辆费用等等因素。从而综合多方因素制定出符合实际的巴士线路。举这个例子就是为了说明,大数据在应用的过程中,是为了满足自己的需要而进行的加工过程,单纯的加工时没有意义的。

技术是实体性因素、智能性因素和协调性因素组成的体系。[5]就目前的研究来看,人们关于大数据的研究往往集中于此,从其内部而言,人们考虑最多的就是如何储存更多的数据,人们无时不刻的创造数据,促使计算机生产厂商不断进行技术革新,摩尔的预测早已被超越,生产出能满足大数据需求的产品早已成为计算机厂商的共识。同时,大数据已经汇聚了一批高技能人才,且不限于计算机领域,这样才能满足大数据对智力的需求。协同创造乃至协同创新一直被大数据领域视为第一法则,用户的需求已经不再是简单的甲方提出,而是在整个流程中甲方参与。

简言之,大数据符合技术的基本特征,我们可以认为大数据在理论层面是技术,但在实际的日常应用过程中大数据也需要一系列的技术职称才能完成其既定的工作目标,因而我们也可以将大数据视为一系列技术的集合。因此,我认为大数据就是大数据技术。

二、大数据技术带来的变革

经过人类长期的历史实践,技术表现出在人类发展的过程中起决定性或基础性的作用。每一项重大的技术革新都影响人类的生产方式与生活方式,同时也将带来社会的变革与发展。同样,我们承认大数据做为一种技术,那么大数据技术将给人类带来怎样的一种变革?这种变革是否能影响人类对世界的看法,能否影响人类的生活方式?这些都是人们心中的疑虑,以下将从几方面对大数据技术发展带来的变革进行分析。

在人和人交往的层面,大数据技术对我们的信息交换方式提出了巨大挑战。大数据技术通过对庞杂且体量巨大的数据进行分析与挖掘,从何获得富含丰富价值,并通过对人们每天时刻生产出来的数据进行分析整理,可以得出社会舆情和金融动向等等内容,故此传统的政府与社会机构面临着巨大挑战。但也要值得注意的是,并不是单一的数据蕴藏很大价值,而是海量数据组成的数据集合,通过合理运用大数据技术手段进行分析整理才能被人们所利用。

在人的思维方面,大数据的时代背景使人们在寻求知识、发现世界和改造世界提供了新方法和新思路,使人们通过分析和挖据更大量的数据,获得人们想要的内容。传统人们往往是靠着预言和猜测来推动科技和社会的走向,这样准确率低且风险高,而利用大数据技术,通过对以往数据的分析和挖据,可以在现在数据的基础上给未来的发展和走向提供更多的参考依据,从而降低风险。

在人的经济活动之,传统商业通过占有生产资料,通过垄断等手段获取更多的经济利益,这些都是传统对有形资产的占有来获得利益,而信息和数据最多能够称作是交易的附属品,本身看不到价值。但在当今时代背景下,信息和数据往往要比那些有形的资产来的更加的珍贵,数据本身自带的价值属性日益凸显,由原本交易的对象变为只交易其价值。这样传统的商业生态在逐渐被打破,基于大数据技术的生态圈正在被建立,虽然有很多环节尚不完善,但在这个背景下的生态系统终将取代传统商业经历百年所建立起来的生态系统。

在人的认识方面,传统人们尝试通过抽象的符号系统对世界作出种种解释,比如莱布尼茨就通过他自己的符号系统对后人产生了深远影响,但传统的抽象符号已经不能满足人们当今对事物描述的需求。如何在大数据的时代背景下对事物进行更加准确的描述称为目前炙手可热的研究热区。从随机样本向全体样本的扩展使人们不能使用从一般到抽象的理论来解决一切问题,数据的繁杂程度越高,越能在使用的过程中反映出事物本身的特殊“气质”,我们已经从想知道它大概是什么的阶段,“进化”到我们要知道它到底是什么的程度。

三、大数据与传统数据之比较

我们讨论了大数据能称之为大数据技术,而人们也从其他角度讨论大数据的影响,但无非都是提出大数据的特征,即3Vs或4Vs[6]甚至更多。传统研究多认为大数据具有体量大(volume)、速度快(velocity)、模态多(variety)、难辨识(veracity)[7]等特点,较之传统数据并没有任何突破。我国拥有众多的人口数量,身份证件信息储存在公安部门的系统中,也可谓体量巨大,但是没有人会称其为大数据。每天全国的出生死亡信息更新速度也非常之快,但没人会称之为大数据。银行系统中金融数据模态众多,但我们很难将之称为大数据。每时每刻流塘在因特网上的数据一般人不加以专业技能的训练是无法进行辨识的,而专业人员也不会随意将其称之为大数据。那么我们如何在磅礴繁杂的数据海洋中识别哪些是大数据呢?则下面我们从技术的角度讨论下,大数据之所以能够快速发展,其与传统数据本质的区别在哪?我认为有以下几点区别。

第一,我认为大数据是一种在线的数据,并且是永远在线的,离开网络的支撑,大数据就没有它的使用价值。大数据的使用价值就在于其的实时在线的特性,否则与传统的被我们分散存储在各自磁盘中的数据并无它异。同时,作为数据的使用者,也更倾向于大数据的这种使用价值。

第二,能被称之为大数据的数据应具有及时性。我们在网络上经常用到的就是数据的检索功能,当我们输入相应的关键词进行数据检索时,数据必须反映迅速且及时,应尽快的将我们需要的检索内容呈现在人们的面前。假若要等上一个小时才会出现检索的内容,相比各位将不愿再检索。同理也可以应用在网络购物等应用上,能同时满足更多的人对数据的检索,并进行迅速反应,这样的数据我认为才能称之为“大数据”。

最后,全面性是大数据的一个明显的存在特征。大数据时代,人们应当抛弃传统的样本思维,组织建立完成的全面系统,故而大数据本身带有的全面性就显得尤为重要。在资本社会,资本家竭尽所能的占有更多的生产资料,而在大数据时代,我们将获取更加全面的数据做为“第一要务”。因为传统数据单一样本或者抽样已经不能反映实物的本质,我们能够利用大数据技术对事物的发展进行“数据画像”。因此,全面性是判断数据能否称之为大数据的标准之一。

四、结论

大数据技术的发展,给我们的生活带来了巨大的变革。通过比较,我认为大数据符合我国学者所认同的技术的理解,也就是说大数据是一种技术。同时,大数据技术也有其自身性质。与传统对数据的理解进行比较,若判断数据是否能被称为大数据,应该具有在线性、及时性以及全面性这三种性质。

参考文献:

[1]余在海.技术的本质与时代的命运——海德格尔《技术的追问》的解读[J].世界哲学,2009(5):153-161.

[2]聂馥玲.技术本质研究综述[J].内蒙古社会科学(汉文版),2003(S1):78-81.

[3]远德玉,陈昌曙.论技术[M].辽阳:辽宁科学技术出版社,1986.

[4]陈昌曙,远德玉.技术选择论[M].沈阳:辽宁人民出版社,1991.

[5]陈红兵,陈昌曙.关于“技术是什么”的对话[J].自然辩证法研究,2001(04):16-19.

[6]姜浩端.大数据的本质及其可能的影响[J].中国经济报告,2013(06):18-22.

[7]马建光,姜巍.大数据的概念、特征及其应用[J].国防科技,2013(02):10-17.

作者简介:曹德龙(1988-),男,黑龙江齐齐哈尔人,工程师,就读于北京化工大学马克思主义学院科学技术哲学专业,研究方向:技术哲学,科技评估。

项目基金:2016年度北京化工大学马克思主义学院研究生科研创新资助项目。

猜你喜欢
大数据
浅谈大数据在出版业的应用
“互联网+”对传统图书出版的影响和推动作用
大数据环境下基于移动客户端的传统媒体转型思路