大数据环境下信息分析工作的挑战与机遇

2019-05-22 10:30李涵霄
无线互联科技 2019年3期
关键词:大数据

李涵霄

摘 要:随着大数据时代的到来,信息分析工作越来越受到人们的重视。文章根据国内信息分析的研究状况,深入地分析了在大数据环境下,信息分析工作面临的来自市场需求和技术层面的机遇以及关于信息伦理问题的挑战,并提出具有针对性的解决措施,希望能够使信息分析人员在工作中规避错误,提高工作效率,同时丰富信息分析领域的研究成果,为今后学者的研究提供参考。

关键词:大数据;信息分析;信息伦理问题

大数据时代的到来,使得全球信息总量呈几何式增长,然而大数据所带来的影响远不止这些,依靠数据体量巨大(Volume)、数据种类繁多(Variety)、流动速度快(Velocity)、价值密度低(Value)的4V特性[1],大数据迅速颠覆了整个行业领域。从最基本的衣食住行到国家的国防军事,几乎所有事物都与数据相关,因此,如何对这些身边的数据进行详尽的分析成了每个人所面临的难题。在这样的背景下,大数据迫使信息分析领域的学者更多地关注于信息分析工作方式的创新层面,借以适应变化如此迅速的社会。

1 国内研究现状

以知网为检索工具,以“大数据”“大数据时代”“信息分析”“情报分析”等为关键词,对检索结果进行可视化分析,发现随着大数据热度的上升,文献数量不断增多,并且学者的研究重点大多数集中在如何将大数据与信息分析相结合这一方面。在国内,最早明确地提出将大数据与信息分析相结合的是《自然》杂志在2008年出版的一系列论文,在这其中主要分析讨论了大数据与情报分析之间的关系等内容[2],为今后国内对于大数据信息分析的研究奠定了坚实的基础。随后的几年时间里不断有学者提出新的观点,如陈铁勇[3]提出在大数据时代信息分析工作应该从多层面多视角展开,对获取的信息进行“降噪”;官思发等[2]提出大数据信息分析应该在改变原有的信息分析思维的同时应该建立起完整的信息资源保障体系。除此之外,信息分析同样涉及了其他诸多领域,并且研究成果丰富。这点主要体现在公安信息安全、情报分析方面,从算法周期方面,动态地讨论大数据信息分析在安全管理平台中的应用。然而从这些研究中,我们不难看出,由于我国大数据环境下的信息分析刚刚起步,虽然对于信息分析的工作方式、思维、工作模式已经有了一定的成果,但是缺乏深入的研究,不能够适应如今多变的社会环境。

2 大数据环境下信息分析工作的机遇与挑战

2.1 大数据环境下信息分析工作的机遇

2.1.1 旺盛的信息需求

即使是处于大数据环境之下,信息分析的对象依然是信息。但是与以往不同的是,此时信息的规模不断扩大,这一点可以从数据的单位看出,信息规模从最初的GB已经达到了PB,甚至会用到EB和ZB进行计数。然而这些数据种类繁多,每一种数据的处理方式各不相同,需要差别对待,并且这些数据并不都能够被人们所直接利用,需要经过一定的分析处理才能够发挥它原有的价值。根据麦肯锡预测,若把这些数据用于美国医疗保健,每年将产生3 000亿美元的潜在价值[4],然而信息是不能够主动地作用于社會生产活动之上的,需要通过人才将信息与生产生活相结合,也就是说在大数据环境之下,信息分析工作能够创造出更多的财富。这也就导致了各企业在追求更多利益的同时,将目光转向了专业的信息分析工作,希望能够在竞争中把握先机。

2.1.2 研究重点的转移

一个时代的到来必定会代替之前旧的时代,如果将两个时代进行对比,就能够很容易地发现新时代所带来的机遇与挑战。在大数据时代来临之前,小数据分析一直占据信息分析的半壁江山。小数据分析往往是在理论完美主义的指导下完成的,试图通过对历史数据进行深度分析之后,达到深刻理解自我或解释客观现象的目的,其侧重的是因果分析,即以解释型分析为主[5],这就需要对于信息进行全面细致的分析,理清逻辑脉络,而这样的做法必定会消耗大量的时间,在追求效率的时代主旋律下,因果分析显然有些不合时宜,虽然因果分析与相关分析的目的同样是实现信息数据的价值,但是相关分析摒弃了以往复杂的程序,选择了“从数据直接到价值”的捷径[2],更加注重信息之间的相关关系,能够帮助信息分析研究人员更好地预测未来即将发生的事情,从而获得实际的利益,缩短实现信息价值的周期,提高信息分析效率。

2.2 大数据环境下信息分析工作的挑战

2.2.1 过于追求经济利益,忽视科研价值

大数据环境下,节奏过快的社会生活使得人们一致朝“钱”看,大量的经济利益充斥着大数据环境,很多企业希望通过信息分析能够带来足够多的营业额,如eBay通过数据挖掘可精确计算出广告中的每一个关键字为公司带来的回报。通过对广告投放的优化,2007年以来eBay产品销售的广告费降低了99%,而顶级卖家占总销售额的百分比却上升至32%[6]。诚然,实现信息价值的途径之一就是将信息与商业活动相结合,发挥信息本身包含的经济价值,以一个最吸引人的因素来促使人们关注信息分析领域,从而推动其发展,完善信息分析工作,发展与之相关的科研工具。然而过度地追求经济利益,很容易导致人们在进行信息分析的过程中,忽视其本身所存在的科研价值,较少地进行对于信息的二次挖掘。虽然经济水平提升上去了,但这只是一种短暂的现象,由于缺乏对信息背后所隐藏的学术性研究,难以从根本上找到可以提升经济水平的方法,从而使得经济停滞不前,甚至后退。虽然在大数据来临之前,这种现象也曾存在,但是随着大数据深入我们的生产生活,这种问题显得越发严峻。如何平衡经济利益与科研价值,是今后各位学者面临的一项挑战。

2.2.2 数据庞杂,价值密度低

虽然数据总量在呈几何式的增长,但是隐藏在海量数据之下的有用信息却没有相应比例增长,反而使我们获取有用信息的难度加大。数据种类的丰富虽然能够使研究者涉及更加广阔的领域,但是同时也对研究人员的专业素养提出了要求,大数据的“4V”特征表明其不仅是数据海量,对于大数据的分析将更加复杂、更追求速度、更注重实效,这就对于现代信息分析工作提出了新的挑战,2005年以前,业界一直认为政府是信息资源的最大保有者(80%左右),信息机构(信息中心和图书馆等)是信息资源体系中的核心节点,而2011年麦肯锡公司的报告显示,政府拥有约848 PB数据,约占数字信息资源总量的12%左右,信息机构的数字信息资源总量更是远远低于信息服务商的数据总量[7],这就表明了,余下的80%左右的数据都分散在社会的各个层面,无法通过简单易行的方式获得,并且与政府所掌握的信息不同的是,这些信息具有高度的流动性,一条有价值的信息倘若在发现后没有对其进行跟踪处理,那么很可能会失去与这条信息的联系,再次搜寻可谓是海底捞针。

2.2.3 个人隐私问题突显

大数据种类繁杂,其中就包括个人隐私数据。随着信息技术的发展,信息可以被当作一种商品进行交换,个人产生的数据脱离了主体的控制范围,很可能在进行商品交换的同时,商家侵犯了个人的隐私。大数据时代,前所未有的数据挖掘与信息分析以及对于用户兴趣喜好的实时监控,在用户不知情的情况下,泄露的个人隐私信息被当作富有价值的信息进行深入分析,从而研究出用户群体的需求。然而由于国内法律体系的不健全等问题,这种侵犯个人隐私的行为并没有受到有效的限制,也就是说大数据环境中仍将保留着大量的个人隐私信息,在进行信息分析工作的同时,如果没有做好信息的脱敏或者是筛选,则很有可能在不知不觉中侵犯了个人的隐私问题,违反信息的伦理要求。

3 结语

随着大数据时代的发展,信息分析工作会越来越多地受到各方的关注,虽然目前国内对于这方面的研究才刚刚起步,但是如果能够把握好机遇,运用先进的计算机技术与网络技术,强化信息分析的处理能力,构建合适的关系网络,从定性研究转向定量研究,一定能够很好地迎接来自各方面的挑战。我们在要求提升信息分析研究人员的专业素养水平的同時,也应该注意到大数据环境中日趋增多的个人隐私信息,做好信息脱敏及筛选工作。就目前来说,结合国内信息分析领域的研究情况,未来国内信息分析领域的发展与互联网的关系将更为紧密,从而可以大幅度地提升信息分析工作的效率和水平。

[参考文献]

[1]陶雪娇,胡晓峰,刘洋.大数据研究综述[J].系统伪真学报,2013(1):142-146.

[2]官思发,朝乐门.大数据时代信息分析的关键问题、挑战与对策[J].图书情报工作,2015(3):12-18,34.

[3]陈铁勇.大数据时代核科技信息工作的思考—从信息分析与研究谈起[C].北京:中国核学会论文集,2013:76-79.

[4]陈飞.大数据时代信息经济发展趋势及对策建议[J].宏观经济管理,2014(3):61-62,84.

[5]王宜鸿,魏雪迎,叶鹰.大小数据集上的信息分析刍议[J].图书馆杂志,2018(12):14-19.

[6]李国杰,程学旗.大数据研究:未来科技及经济社会发展的重大战略领域—大数据的研究现状与科学思考[J].中国科学院院刊,2012(6):647-657.

[7]张斌,马费成.大数据环境下数字信息资源服务创新[J].情报理论与实践,2014(6):28-33.

猜你喜欢
大数据
浅谈大数据在出版业的应用
“互联网+”对传统图书出版的影响和推动作用
大数据环境下基于移动客户端的传统媒体转型思路