大数据技术表征的维度

2015-08-15 00:50苏玉娟陈百强
中共太原市委党校学报 2015年1期
关键词:变革维度科学

苏玉娟 陈百强

(中共山西省委党校,山西太原 030006)

狭义的“表征”主要体现在认知维度,指一种经反映而被构造出来的、作为认知对象的替代物而存在于思维中被加工的形式。广义的表征包括历史、认知、科学、社会等多个维度,反映事物在历史、认知、科学、社会等维度中的脉络关系、活动过程和方式。对于大数据普遍的解释是“难以用常规的软件工具在容许的时间内对其内容进行抓取、管理和处理的数据集合。”大数据之大体现在全球新产生的数据年增40%,全球信息总量每两年可以翻番。大数据主要来源于社会的数据、传感器收集的物理空间和网络空间的数据,网络空间的数据包括自媒体数据、日志数据和富媒体数据。大数据技术的表征过程不仅包括认知的和科学的维度,而且包括历史的和社会的维度,是大数据技术在历史、认知、科学和社会等维度中用一定的符号或行为表示大数据技术的活动过程和方式。

一、大数据技术表征的维度结构

一个实体表征的过程就是这个实体在不同维度中被不同主体用不同符号所表示的过程,反映了实体与关联体的相互作用。大数据技术表征的过程就是大数据的意义、性质和功能在历史、认知、科学、社会等维度中被科学共同体、企业、政府和民众等不同主体用不同符号和行为表示的过程。

(一)历史维度:为大数据技术表征提供了动力基础。大数据技术历史维度的结构包括大数据技术发展过程中的社会问题和技术问题。大数据技术的社会需求主要来源于社会自媒体、日志数据背后价值的需求,正是社会需求推动科学技术不断进步,这成为大数据技术表征最直接的历史来源。“大数据现象的成因源于信息技术的发展”。正是云计算等信息技术在数据存储、计算等方面取得的重大突破,为大数据存储、计算和决策提供了技术支撑。从历史维度看,正是基于社会需求和信息技术的进步,大数据技术应运而生。

(二)认知维度:为大数据技术表征提供了可能空间。大数据技术认知维度的结构包括科学共同体认知、企业认知、政府认知和民众认知。科学共同体认知表征大数据技术在科学领域引起科学共同体认知范式的变革。企业认知表征大数据技术引起企业生产方式、管理模式等认知的变革。政府认知表征大数据技术对政府治理方式认知的变革。民众认知表征大数据技术对民众购物、旅游等生活方式认知的变革。大数据时代人类对自然和社会的认知来源于大数据背后的意义和价值。维克托.迈尔-舍恩伯格在他的《大数据》一书中,将大数据引起认知的变革概括为不是随机样本,而是全体数据;不是精确性而是混杂性;不是因果关系,而是相关关系。从认知维度看,大数据技术的表征引起不同主体对自然和社会认知方式的变革。

(三)科学维度:为大数据技术表征提供了科学支撑。广义的科学包括自然科学、技术和人文社会科学。大数据技术科学维度的结构包括信息科学、大数据技术和人文社会科学。大数据技术在科学维度的表征过程就是大数据技术在科学领域引起变革的过程。“有人将大数据称为继实验科学、理论科学和计算科学之后的第四种科学研究模式。”这种科学研究模式的表征强调数据的量和对数据的分析。大数据技术不仅产生了数据密集型科学,还产生涉及大数据存储、合并、转换和决策等技术科学。大数据技术应用于管理学、统计学和情报科学,引起这些学科管理模式、统计方式和情报数据分析模式的变革。从科学维度看,大数据技术的表征引起大数据技术在自然科学、技术、管理科学、统计学、情报科学、社会学等学科的变革。

(四)社会维度:为大数据技术表征提供了现实平台。大数据技术首先产生了“包括服务器、存储器、软件与服务”等在内的大数据产业。目前,大数据技术还被广泛应用于制造业、农业、商业、交通运输业、医疗卫生等领域,大数据技术在各行各业的应用,产生了更大的经济价值和社会价值。大数据技术在社会领域的应用还体现在改变企业和民众的生产方式和生活方式。大数据预测的结果成为企业进行生产方式变革的重要客观依据。自媒体数据、日志数据和富媒体数据成为民众做出决策的主要依据。从社会维度看,大数据技术的表征体现在产业结构、生产方式和生活方式的变革。

二、大数据技术表征的维度特征

从维度分析大数据技术的表征问题,彰显出大数据技术的客观性、历时性、相关性、社会性和预测性等特征。

(一)客观性。客观性反映事物的客观存在。大数据技术的表征过程就是大数据技术在历史维度、认知维度、科学维度和社会维度被不同主体以不同符号和行为再现的客观过程。大数据技术被广泛应用于各行各业,反映了大数据在这些领域运动的客观过程。正是基于客观性,才使得大数据技术表征的领域从科学技术走向社会。

(二)历时性。历时性反映事物纵向运动的特征。大数据技术的表征来源于事物运动过程留下的数据痕迹。可以说,无论是在历史维度、认知维度、科学维度和社会维度,大数据的表征都来源于对不同维度数据的记录与分析。因此,历时性是大数据技术表征的重要特征,如:人们在网上购物依靠纵向的日志特征来决策是否购买。监控大数据成为办案的重要依据,也是依靠大数据技术的历时性特征实现的。

(三)相关性。相关性反映事物之间的相互联系。大数据技术表征的过程就是通过海量的数据,反映一个事物与另一个事物的相关性。根据不同的分析目的,大数据可以分析出不同的相关结果。大数据技术表征彰显的相关性,体现在历史维度、认知维度、科学维度和社会维度中。从历史维度看,正是大数据技术与社会需求的相关性,才使得大数据技术被广泛应用于各个领域。从认知维度看,不同主体对大数据技术认知的差异,反映了大数据技术与不同主体相关性的差异。从科学维度看,大数据技术与信息科学、管理科学、经济学和社会学等学科具有相关性。从社会维度看,大数据技术价值体现在社会领域不同事物之间的相关性中,如:沃尔玛通过对消费者购物习惯的分析,发现了尿布与啤酒的相关性;淘宝网利用相关性分析,为消费者选择相关商品提供支撑。

(四)社会性。大数据技术不仅引起科学和技术革命,更重要的是引起一场社会革命。大数据技术表征最根本的意义在于促进社会的进步。大数据技术表征的社会性体现在它对经济和社会的变革力。麦肯锡公司预见开放数据将在全球教育、运输、消费产品、电力、油气、保健和消费者财务这7个领域释放3.2-5.4万亿美元的经济价值。事实上,大数据技术也有利于社会治理能力的提升。麦肯锡估计大数据技术对医疗和公共管理分别可获得年度收益数千亿美元。大数据技术的社会性特征又会成为大数据技术发展新的起点,形成历史维度-认知维度-科学维度-社会维度-新的历史维度的螺旋式上升的发展模式,促进大数据技术在历史维度、认知维度、科学维度等不同维度进一步的发展。

(五)预测性。传统技术往往根据历史经验和实验数据,采用归纳法和演绎法分析事物的客观实在性,是一种历史经验的总结。而大数据技术通过历时性和相关性分析,预测事物将来可能发展的趋势,这是大数据技术不同于其它技术最显著的特征。大数据技术的预测性体现在历史维度、认知维度、科学维度和社会维度中。从历史维度看,大数据通过数据追踪,可以预测事物可能发展的方向;从认知维度看,大数据可以预测不同群体关注的领域;从科学维度看,大数据技术可以预测其引起信息科学、管理科学等学科变革的方向;从社会维度看,大数据技术可预测事物可能发展的趋势,正是基于大数据技术的预测性,使其成为各行各业决策的重要依据。

三、大数据技术表征维度存在的问题

主要体现在历史、认知、科学和社会等维度中的大数据技术表征,从现实看,存在一些问题。

(一)从历史维度看,不同主体对大数据技术表征研究不深入。从目前的发展看,大数据技术对于非结构化或半结构化的数据潜力的挖掘不够,对无用或者价值比较低的数据删除速度低,大数据引起的能耗问题也比较明显。谷歌数据中心只有6~12%的电能被用来支撑大数据的分析处理,绝大部分电能用来支撑很多闲置状态的服务器。大数据空间维和时间维存在的历史问题,期待大数据技术进一步的创新。

(二)从认知维度看,网民的数量少和网民结构的不合理成为制约科学共同体、企业、政府和民众认知变革的主要瓶颈。大数据技术表征的数据主要来源于网络。而网民的数量和结构不仅决定了大数据技术表征是否具有全面性,而且决定了大数据技术表征的价值性。2014年7月《第34次中国互联网络发展状况统计报告》显示,截至2014年6月,我国网民规模达6.32亿,农村人口占比为28.2%。从学历看,中小学及以下学历人群占比为12.1%,而大专及以上人群占比20.6%;从年龄分布看,20-29岁年龄段网民比例最大为30.7%;从职业看,学生占比最大为25.1%,个体户及自由职业者占比第二为21.4%,企业及公司中管理人员占比为2.9%,党政机关事业单位一般职员占比为4.3%,党政机关事业单位领导干部占比仅为0.5%;从收入看,低收入人群和中等收入人群占多数。总体上,网民人数少、农村人口比例低、学历偏低、学生占多数、领导干部占比太少,影响了不同主体对大数据技术的认知。

(三)从科学维度看,科学共同体对大数据技术引起哲学、经济学和社会学等学科的变革研究不足。大数据技术作为一场新的科技革命,必然引领自然科学、技术科学和人文社会科学的变革。从目前的研究看,大数据技术研究主要集中于计算机科学、图书情报科学、管理科学、统计学。大数据技术引起的哲学、经济学、社会学变革的研究正处于起步阶段。不同学科对大数据技术反映程度的不同,一方面说明大数据技术的应用在不同学科中引起变革的程度是不同的,另一方面说明不同学科对大数据技术的应用反映程度是不同的。

(四)从社会维度看,大数据技术在社会领域存在不合理应用。大数据技术的科学维度解决能不能的问题,社会维度解决该不该的问题。技术上“行”,社会层面不见得“该”。目前,大数据技术在社会领域存在不合理应用主要体现在以下几个方面。一是安全问题。个人安全包括位置安全、标识符安全和连接关系安全等。大数据技术对用户数据的收集、存储、管理与使用均缺乏规范和监管。大数据技术的追踪功能可能侵犯民众的隐私而产生安全问题。二是质量问题。由于伪造或刻意制造数据、人工干预和版本更变等引起大数据的失信,最终导致大数据相关性分析的失真和决策的失误。三是协同问题。目前,大数据呈指数增长,但是由于部门之间缺乏协同性,使大量的数据分散于不同的部门,无法发挥大数据的价值。一方面,不同部门对同一个数据存在多方收集,浪费资源;另一方面,个人、企业和政府所拥有的各种数据源归不同主体使用,造成数据价值的浪费。四是数字鸿沟问题。由于不同主体对大数据认知、搜索和使用的差距,产生拥有数据、分析数据和使用数据的鸿沟问题。

四、提高大数据技术表征能力的策略

为了更好地促进大数据技术在不同维度的发展,我们必须做好以下几个方面工作。

(一)厘清大数据技术本身及其在应用过程中带来的问题。贝尔纳很重视科学发展的历史维度。他“认为要全面地看科学的功能,就应该把它放到尽可能广阔的历史背景上来考察”。历史维度是提高大数据技术表征能力的基础和前提。

为了进一步提升大数据技术的潜力,一方面我们需要厘清2010年以来大数据技术本身在记录、存储、分析、删除等环节产生的技术问题;另一方面我们需要厘清大数据在社会应用过程中产生的伦理和治理等问题。这些技术问题和社会问题为大数据技术进一步发展提供基础。

(二)提高不同主体对大数据技术的认知度。大数据应用范围和应用效率与科学共同体、企业、政府和民众等主体的认知水平紧密相关。为此,我们需要优化网民结构,提高不同主体的认知水平。

第一,提升政府对大数据技术的认知能力。“客观上大数据已经成为政府治理生态的关键要素。”政府对大数据技术认知水平决定了公共数据开放的程度,同时也决定了政府公共服务平台建设的程度。目前,党政机关事业单位一般职员和领导干部在网民中所占比例太低,客观反映了政府对于大数据技术认知度低,进一步影响了大数据公共服务平台的建设,不利于提升政府的治理能力,因此,政府应通过建立大数据公共服务平台,提升自身对大数据技术的认知能力。第二,进一步普及网络,开发新网民,优化网民结构。在大数据时代,大数据技术尊重事实,我们需要的是全体数据,即“样本=总体”。只有不断提高网民数量,才可能使我们的大数据更精确,更能反映社会情况,而不是某一个群体的情况。第三,加强培训,提升不同主体对大数据技术的认知水平。目前,从网民比例看,中小学及以下学历人群所占比例呈上升趋势,而这些人群对大数据包含的巨大经济价值和社会价值了解甚少,我们必须通过大数据公共服务平台及单位、社区、非政府组织开展的多种形式的培训和宣传教育,提高不同主体的认知水平。

(三)进一步加强大数据技术对多学科变革的研究。大数据技术重视全体数据和数据之间的相关性,而传统上我们重视随机样本和因果关系,这就打破了我们传统认识事物的方式。如对于哲学来讲,传统意义上我们关注事物的因果性,而大数据技术通过数据之间的相关性运动,彰显事物之间可能存在的因果关系,大数据技术重视相关性,并不否定因果性,而成为分析因果性的一种新的手段。

为进一步加强大数据技术对多学科变革的研究,我们必须:一是培养创新型人才。一方面我们需要培养具有专业化处理大数据的创新型人才。大数据技术的战略意义不在于掌握大数据本身,而在于对这些含有意义的数据进行专业化处理。“麦肯锡公司预测美国到2018年需要深度数据分析人才44-49万,缺口14-19万人;需要既熟悉本单位需求又了解大数据技术与应用的管理者150万,这方面的人才缺口更大。”大数据技术在我国的应用处于高速发展阶段,这方面的人才更缺乏。另一方面,加大综合型人才的培养力度,为其它学科研究大数据提供人才基础。二是加大研发经费的投入。大数据技术作为新鲜事物,对其它学科的影响需要依靠大数据技术来解决,而大数据分析的过程本身就需要设备、人才等要素的投入。因此,我们需要加大对大数据技术物质和人才等方面的投入。三是基于大数据技术形成不同学科新的研究范式。如果说大数据技术确实对其它学科引起了变革,我们就需要建立基于大数据的不同学科新的研究范式。

(四)进一步提升大数据应用的安全性、准确性、公共性和公平性。第一,平衡公共权力、企业权利与公民权利,有效保护公民的隐私安全。第二,培育数据文化,打造良好的信息生态。大数据文化从观念和制度等方面渗透到不同主体的行动中,为减少数据的失真性和提高数据的准确性提供文化支撑。第三,实现数据融合,提高数据应用的效率。我们须采用统一的数据格式,将人类物理空间数据、政府数据和网络数据融合在一起,建构统一的信息系统。第四,提高全民数据素养,减少数字鸿沟,提高大数据应用的公平性。

总之,大数据技术的表征过程是大数据技术在历史、认知、科学和社会等维度中通过科学共同体、企业、政府和民众等不同主体活动过程中符号和行为的再现,体现了大数据技术个体表征、集体表征和社会表征的统一性和渗透性。

[1]陈大刚.表征:认识论及审美[J].兰州学刊,2007(11).

[2]邬贺铨.大数据思维[J].科学与社会,2014(1).

[3]涂子沛.大数据及其成因[J].科学与社会,2014(1).

[4]刘维贵.“大数据”研究综述[J].办公自动化,2014(1).

[5]郭贵春.论语境[J].哲学研究,1997(04).

[6]任志锋,陶立业.论大数据背景下的政府“循数”治理[J].理论探索,2014(6).

[7]胡少甫.“大数据时代”给当今世界带来的变革与挑战[J].对外经贸实务,2013(12).

[8]郜书锴,白洪谭.理解大数据时代的数字鸿沟[J].新闻研究导刊,2014(1).

猜你喜欢
变革维度科学
理解“第三次理论飞跃”的三个维度
认识党性的五个重要维度
浅论诗中“史”识的四个维度
点击科学
科学大爆炸
变革开始了
科学拔牙
新媒体将带来六大变革
变革中的户籍制度
创新IT 赋能变革