袁文丽,贡嘉阳
(山西大学 文学院,山西 太原 030006)
“大数据”概念最先兴起于生物学领域的基因研究,在麦肯锡研究所于2011年发布《大数据:下一个创新、竞争和生产率的前沿》的报告之后,各行业才将之视为巨大的挑战和重要的发展机遇,认为大数据带来了“产业的革命”,标志着“新的信息技术时代”的来临,是人们改变思维乃至生活方式的一个重要契机。随着“大数据”概念逐渐被引入中国,大数据开始融入国人的生活中,互联网金融的兴起和发展、社科领域的数据整合和预测分析等大数据应用的爆发性增长,使得2013年成为中国的“大数据元年”。毋庸置疑,追求价值最大化的大数据应用,已经显示出其对众多行业的强力影响与推动。但从互联网自身发展的角度看,大数据应用也不过是建立在丰富数据与技术发展基础上的互联网新应用,并非对所有行业都具有革命性意义,尤其对发展程度较低的传媒业来说,更需要客观认识和理性开发大数据应用,以确保在大数据浪潮之中不会迷失方向。
在大数据浪潮之下,相关行业必须应对的挑战与发展机遇是并存的,一个行业是因大数据的剧烈冲击而走向衰落,还是顺应大数据的发展方向,借势突破与提升,取决于这一行业与大数据之间是否存在契合点,这也是众多行业应用大数据实现自我发展的基础。
1.丰富的大数据信息拓宽了传媒业的信息来源
随着大数据概念的风行,关于大数据特征的探讨日渐增多,且由最初的三维特征增加到了其后的十余种,毫无疑问,体量大、种类多、速度快堪称大数据最为基本的三维特征,这也就意味着大数据带来的是巨量的、丰富的、与人有关的数据信息,而传媒业恰恰是以信息服务为主体的行业,应用大数据能够进一步拓宽其信息来源,丰富其产品内容,同时也辅助媒介经营。
从数据规模和种类来看,大数据数量巨大,其存储量和增量达到传统数据仓库的数十倍,已远远超出传统的数据储存和分析能力,其基于人们各种互联网使用行为的数据来源、多样且富有变化的数据类型等,使得大数据的价值远高于人们所能看到的表面部分,并且可以在不同行业之间交叉和重复使用。凡此种种,使得大数据成为传媒业的信息“矿藏”或“土壤”,为传媒业提供了更为丰富的巨量信息,拓宽了传媒业的信息来源,使得传媒业的信息服务和传媒营销能够紧随互联网应用的发展进程。而在“小数据”时代,传媒业的数据应用多是辅助性的,或为决策提供参考,或辅助、支撑相关信息内容。从数据的产生速度来看,大数据呈几何级数增长的速度是其资源不断更新的保证,大数据采集的关键在于“全方位”和“实时监控”,这种持续、实时的数据更新,一方面使信息始终保持最新状态,另一方面,在纵向上又反映了相关信息的发展过程及变化,这种全面而及时的信息,满足了传媒业的信息需求。就新闻媒体来说,大数据有助于记者及时发现新闻线索、挖掘隐藏的社会问题,“那些公开或隐蔽的数据,成为记者发现新闻选题、拓展新闻深度的重要资源。”[1]简言之,大数据前所未有的信息增长量、多样的信息组合方式、全方位的实时更新等特点,增强了传媒业信息服务的全面性、客观性和及时性。
2.大数据专属信息提高了传媒业的传播效率
大数据着眼于效率,关注市场需求和消费需求,以此来提高行业效率。对于传媒业来说,传播效率的提高与传播内容的丰富处于同等重要的地位,这就决定了受众这一信息接收端的重要性。对于传媒来说,了解受众的关注点、信息需求、消费状况,精确定位受众,不断增强与受众的互动等,是提高传播效率的必由之路,也是面对激烈的市场竞争所无法回避的问题。
大数据出现之前的传媒营销,技术水平和营销理念相对落后。虽然传媒业也能意识到人们的互联网使用行为、受众对媒介产品的反馈等相关信息的重要性,但却受限于这类信息相当高的采集难度,最终使这些对传媒营销有价值的信息因零星分散而变成“信息垃圾”。大数据抓取的恰恰就是人们“使用互联网的各种路径和形态时留下的海量信息和信息痕迹”[2],基于大数据技术和大数据思维的支持,受众浏览过的页面、浏览时间的长短、信息的点击量等等,都可以被有效而全面地收集整理,成为媒体分析市场需求和受众心理的重要依据。通过对大数据专属信息进行相应的数据分析,媒体可以精确地了解受众中每一个体的信息接收习惯和内容偏好,进行针对性营销,在适当的时机和位置向受众推送其所需要的信息,使传播效率迅速提高,实现传播效果最大化。同时,在营销过程中,还可以通过多次营销进行受众资料的矫正工作,最终精准定位受众,并为受众提供个性化的信息定制服务。
1.数据采集的全面性与传媒业依法保护相关权利主体的要求相冲突
法律关系中的权利主体是“指在法律关系中依法享有权利和承担义务的人或团体。”[3]传媒业依法需要保护的权利主体主要是自然人、法人和国家,大数据信息采集的全面性有可能侵犯个人隐私、泄露商业机密、危害国家安全。
从前,受限于信息流通缓慢与必要信息缺乏的常态,对数据一般进行有限样本采样分析,这种碎片化信息的发布对相关权利主体造成的侵害相对较小。但如今的状况令人担忧,据咨询公司IDC 公布的数据,每年生成的数据量已经呈指数级增长,在2012年达到2.8ZB,2015年还将翻一番,其中约3/4 的数据是在个人创造和移动数字文档时生成的,而几乎所有数据都携带着某人的数字指纹。[4]当前的数据收集与处理能力已超过了数据的生产量,在这样的前提下,全体样本取代了以随机性为主的抽样调查成为主流,“遍布全球各个角落的传感器等电子设备正在实时获取用户的行为轨迹,名目多样的各类云服务也在不经意间诱使用户主动上传信息”[5]。大数据要利用规模产生效益,而数据规模的不断扩大,又很难得到被采样人的一一授权,因此就造成对个人隐私的侵犯。虽然并非所有数据都会透露个人隐私,但几乎所有数据经过处理后都能反映出个人行为,如有关网络费用、上网偏好的数据,某种程度上反映出一个人的生活习惯,进一步分析,就有可能反映其性格特点,甚至直观地显示出涉及隐私的细节。另一方面,传媒在运用大数据服务受众时,所提供的相关信息可能会侵犯企业、组织或国家的利益。由于大数据的隐性价值和显性价值并存,很多看似覆盖大规模个体的数据信息,其中可能深藏着有关企业的商业机密或涉及国家安全的信息。以新闻媒介为例,在具体的新闻报道中,是应当秉承新闻真实性原则提供所有数据,还是应当依法保护相关权利主体,只给出无关大局的部分数据?显而易见,媒介面临着两难的选择。有人把匿名化视作脱困之法,认为可以通过最大限度地模糊报道主体的关键信息,如名称、生日、血型、经历等具有鲜明个人色彩的数据,以此来避免泄露个人隐私、商业机密或国家机密,同时达到大数据新闻报道的目的。然而,匿名化只适用于传统信息系统时期,在大数据时代,不同领域之间的数据交流早已使匿名者难以藏身。如2006年美国在线(AOL)将旧的搜索数据全部匿名化处理后予以公布,但《纽约时报》还是通过几条关键信息将某个代号的人精准地查找出来,引起了公众的不满。[6]198可见,匿名化并不能解决大数据应用于传媒业所产生的相关伦理问题或法律问题。
2.大数据注重的相关性与传媒业对因果关系的追求相冲突
大数据不是把关注点放在对因果关系的探究上,而是更多地挖掘相关关系,以此来预测用户行为并快速做出决策,与之相对的是概率性思考,巨量的数据因为相关性的发现而迅速转化为敏锐的商业洞察力。世界上最大的零售商沃尔玛公司是这方面的先行者,他们发现两样看似毫无关联的物品会同时出现在一个购物篮里的概率较高,于是就将这两件物品摆放在一起,成功提高了营业额。在这个过程中,沃尔玛不需要用科学手段证明两件物品摆放在一起的必然性或因果规律,而只需要从数据的相关关系中寻找商机。
表面上看,传媒业对效率的追求与大数据对相关性的关注并不矛盾,声称“了解每个市场的独特性以及每个客户的个别需求”的全球知名信息服务公司益博睿(Experian)便属于利用大数据相关关系服务用户的典型。值得一提的是,当传媒业尤其是新闻媒介以大数据为信息内容时,二者就容易出现不契合。以预测为例,建立在相关关系分析基础上的预测是大数据的核心,预测能够节约成本、最大限度地控制事物未来发展的方向。维克托·迈尔在《大数据时代》中提到大数据预测和预防犯罪的问题:如果通过大数据预测来预防犯罪,必然会对罪犯进行惩罚;如果仅据预测结果阻止犯罪而不施惩罚,则罪犯会因未付出成本而再次犯罪;但如果实施惩罚,却是对未发生的行为进行惩戒,有失公允。同样,一个负责任的媒体也不应该单纯利用大数据的预测进行报道,公众需要的是事件的真相而非媒体根据大数据做出的判断。新闻媒介的信息内容不仅要注重“是什么”,更要注重“为什么”和“怎么样”,如果只抓取相关关系而忽视因果关系,新闻报道就会更多地停留在表象,既不能发现问题,更不可能对相关问题进行深入思考。当然,如果是对时效性要求不高的稿件,可以在完成相关关系分析之后,继续探求因果关系。
3.大数据追求的商业价值取向与传媒业注重社会价值取向相冲突
大数据所带来的决策改变以及随之而来的利润是它最具有吸引力的一点,“数据能够优化生产和服务,甚至催生新的产业”[6]189,“对大数据的掌握程度可以转化为经济价值的来源”[6]15。在以盈利为目的的前提之下,从浩如烟海的数据中寻得商机,追求经济效益的最大化,是大数据应用的首要目标。也正因此,大数据应用不仅仅是一项枯燥的统计工作,它已经成为一种商业资本,能够转化为独到的商业洞察力,并通过一定的手段迅速带来实实在在的经济效益。
中国传媒业已经逐步建立起市场竞争机制,市场才是行业资源配置的手段,基本上除了公共传媒产品以外,普通传媒产品的消费早已全商品化,所以传媒业并不排斥商业价值。和其他行业一样,经济效益关乎传媒业的生存发展,因为拥有强大的经济实力,才能获取大量的资源、吸引更多优秀的专业人才,从而提升产品质量,有效提高市场竞争力。但是和大数据应用追求经济效益最大化不同,由于传媒业提供的是精神产品,既要满足人们不同的精神文化需求,又要影响人的思想和行为,所以必须兼顾经济价值和社会价值,而社会价值的公共性、社会性、创新性、社会责任等特征,要求传媒业必须根据自身的特点,对经济价值和社会价值予以平衡,甚至必须因其社会价值取向而不得不放弃暂时的经济利益,为整个社会树立正确的价值导向,充分发挥传媒的舆论引导作用。
当前,传媒业的大数据应用尚处于起步阶段,没有充分发挥出大数据的优势,甚至还存在一些应用误区。
对于任何行业来说,培养和使用专业人才是行业发展的基本前提。大数据是新的互联网应用,传媒业要发挥其强有力的推动作用,必须切实采用新方法和新技术,而其中占据主导地位的则是大数据人才的使用。因此,无论是传统传媒还是新媒体传媒,都必须依靠专业的大数据分析与预测人才来采集和处理大数据、操作和使用数据库,以便最大限度地保证数据的可信度,充分挖掘数据潜藏的价值。然而,很多媒体没有充分认识到大数据人才较强的专业性,一方面过分强调让媒体采编人员掌握大数据挖掘、分析与预测技能,并让这些精通传媒业务的人去从事数据库开发与管理工作。另一方面,有的传媒则过分强调让数据分析和信息管理方面的专业人才从事传媒业务工作。虽然跨领域思考对于大数据应用非常关键,需要将相关技术与行业业务结合,如传媒业务人才掌握相应的数据处理技能以进行专业的数据统计与分析,或大数据人才了解和熟悉传媒业务以便适应传媒需求进行数据开发和应用,对他们各自专业工作的拓展与提升意义重大。但如果忽视人才的专业优势,将传媒业务人才和大数据人才混用,便会影响各种专业人才优势的发挥,造成传媒业对大数据应用的适应不良。值得注意的是,传媒业务人才和大数据专业人才使用的不合理,会相应导致其他误区的出现。
数据新闻是“基于数据的抓取、挖掘、统计、分析和可视化呈现的新型新闻报道方式。”[7]数据新闻并非是大数据时代才出现的一种全新的新闻报道形式,它与精确新闻、计算机辅助报道之间具有密切的联系[8]。计算机辅助报道是在互联网和计算机技术发展的前提下,适应精确新闻报道的需要而出现的,被看作是数据新闻的源起或前身。继计算机辅助新闻后又出现了数据库新闻的概念,此类报道中的数据往往作为新闻报道文字内容的辅助说明,没有更深的价值挖掘。大数据的兴起,引发了人们对数据的敏感,也拓宽了信息生产的方式,传媒业对数据新闻的关注达到了空前的高度。数据新闻对数据的重视和开放,使得数据能够随时得以补充,它展现给受众的数据量已远非其他新闻可以企及,并且借助可视化技术,可以将符号和数据转化为图表、图像等表现形式,增强了数据新闻的直观性和互动性。在这样的情况之下,许多运用数据较多的新闻报道、涉及大数据的新闻、数据库新闻等都被冠以“大数据新闻”或“数据新闻”之名。2013年,国际调查记者联盟和46 个国家的86 名媒体人合作,运用高科技手段分析所得到的一批泄密文件,发布了关于离岸金融秘密的调查,这“其实是精确新闻在全球化和社交化背景下的自然延伸,但随即被当作大数据的典型案例。”[9]
大数据可以拓宽传媒业的信息来源,在丰富信息内容的同时也辅助媒介经营。无论何种用途,大数据应用都要围绕一个关键点,即注重数据的交叉复用,多方面挖掘数据价值。大数据可以形象地看作取之不尽、用之不竭的能源,不同领域的数据能够交融结合,故不能限于对数据的单一挖掘和使用。媒介常见的数据信息往往罗列大量具体数据,以此作为文字的补充,而这一系列冗杂难懂的数字显示出的是单一的数据分析方向,且多是数据所代表的最原始的方向,对于其他方面的价值拓展则相对不足。例如一则关注手机使用的新闻,可以列出一长串关于手机使用状况的数据,如手机使用者的年龄、职业、使用时段、手机品牌占比等,虽然基本能够满足受众的需求,但却不能停留于这种表层数据,而应结合早期数据以及其他领域的相关数据,对数据价值进行深入挖掘或关联性分析,以此来发挥大数据新闻所具有的描述、判断、预测、信息定制等功能[2]。归根结底,大数据应用要跳出以大数据之表行旧式传媒思维之实的僵局,否则传媒业终将与大数据无缘。
对于数据量的暴增,在“大数据”概念出现之前,还有所谓“infoglut(信息过剩)”或“information overload(信息超载)”之说,都指向“一种淹没在信息洪流中的感觉:我们囫囵吞枣,就像被强行填喂的鹅,我们用于消化知识的器官正在爆炸。”[10]应用大数据,必须接受大数据的不精确性,因为大数据追求概率并容忍不确定、不精确。毫无疑问,数据的指数式增长增加了结果的不准确,也带来了数据筛选和精简的难度。劣质数据是数据筛选的一大难题,因为在持续的数据采录中,系统可能没有从一开始就对所有用户进行验证,因而也无法避免错误输入等问题的出现。加之数据库很难避免使用老旧数据,错误数据便有可能进入数据库,降低了数据的可用性及价值。数据造假同样是一个严重的问题,其中又以商业领域的造假最为多见,我们所熟悉的电商购物平台,由于商品的质量、销量、浏览人气、交易信用度等会直接影响商家的收入,部分商家便会采用各种方式刷单、刷好评,用虚假的销量和信用吸引买家消费。而在政府数据中,虚假数据也有迹可循,如有的地方政府或部门为了政绩而上报虚假统计结果等,同样会对大数据预测造成不良影响。对于传媒业来说,数据来源多从相关大数据分析报告和其他服务平台终端提取,大数据自身难以避免的不精确及造假现象,同样会降低传媒信息的可信度。如果传媒业自身存在数据使用不当、信息失实、把关不严等问题,则会进一步加剧此类现象。
大数据时代,信息成为举足轻重的资源,数据似乎成为一切的核心,出现了对数据过度依赖的现象,数据的作用被高估,被视作绝对可靠的信息来源或决策依据,而其本身所具有的误导性则被忽视。对数据的尊崇必然导致“数据独裁”,即让数据统治我们[6]208。一方面,有些媒体的数据新闻把数据作为整篇报道的基本出发点,并在此基础上进行一系列的说明和延伸。这里要注意的是数据所具有的阶段性描述特点及与之相伴随的时效性,因为一个人的喜好、身体状况等每隔一段时间都会发生变化,某人的高考成绩也不能说明他在高中期间的平均水平。同样,一个区域的经济状况、科技水平、受教育程度、消费水平等也在不断地变化中,并非所有的社会现象都能够浓缩为一张张图表和一个个数字。此外,在不被惩戒的情况下,数据的提供者往往更乐于给媒体提供一些看起来有用或者漂亮的数据,因此媒体得到的数据往往是他们想要得到的,而非是需要得到的。
另一方面,媒体对于数据的过度信任会促使其得出不负责任的论断。当媒体习惯于用数据来反映社会问题时,便容易忽略数据之外的东西,比如在商业和公共事业领域,通过大数据可以预测很多事件的发生概率:某种科技成果给人们生活带来的改变,某种新药对人体的影响和副作用等等。这些研究结果往往会经由媒体向公众发布,如1995年英国医药安全委员会发布其研究结果,指出服用第三代口服避孕药的人患血栓症的概率较常人高100%,消息在世界范围内广泛传播,致使意外怀孕与妊娠人数激增。但事实上,即使按照绝对风险来计算,避孕药导致的血栓症风险远不及怀孕和流产所致的血栓症风险大[11]。由此可见,信息源如果是某一方面的单一数据,只能据此得出单方面的某种预测(仅仅是预测,尚不能成为结论),媒体在进行报道时,更需要在数据所呈现的预测之外,深入客观地进行分析和思考,以免误导受众,尤其是对专业性较强的相关数据,更不能由数据出发而先入为主地得出片面结论。
在探讨传媒业应如何与大数据结合之前,有必要弄明白一个问题,即数据需要达到什么样的标准才算达到大数据的应用标准,而非一般意义上的数据应用。
最初,人们在认识大数据时,认为它是“大型的、多样的、复杂的、纵向的和(或)分布式数据集生成的仪器。传感器、互联网交易、电子邮件、视频、点击流和(或)其他类型的数据资源(现在和未来的)”[12],这个说法并没有给出一个明确的应用标准。而维基百科则着重区分并对比了“大”和“巨大”的差异,指出“巨大”的数据只是相对于当前所拥有的数据计算能力来说的。这个说法看似有道理,其实在某种程度上误导了对大数据的认识。的确,“大”是一个相对的概念,如今的大数据确实是相对于当前的储存和计算能力而言的。但在相对的前提下,必须看到大数据的完整性及有用性,这比数量更为重要。假如要了解地球的生态系统,那么对于这个应用目标来说,“完整的地球生态系统”就是必需的样本,一山一水,一草一木,每一个微小的数据都是必不可少的。同时,当围绕“地球的生态系统”来使用大数据时,其余的不相关数据便应当被排除在外。可见,基于特定目标所需的数据群在全体数据中是数量相对较小的存在。正如地球虽处于银河系乃至宇宙之中,但相对于“地球的生态系统”这一目的,相关的数据才是最有价值的。换言之,“大数据的真正价值并不在于它的大,而是在于它的全——空间维度上的多角度、多层次信息的交叉复现,时间维度上的与人或社会有机体的活动相关联的信息的持续呈现”[13],因此,想要利用大数据,首先要解决的问题就是从巨量数据中获取有价值的信息,从而得到一个完整的数据系统,即数据要完整,且与自身的应用目的相关。
要让大数据真正成为一种资源,前提就是必须采集数量巨大的有价值的数据,并在此基础上建设自身适用的数据库。证券、投资、银行等金融领域以及商业领域、政府的数据采集都是最为便利的,因为公众的生活数据可以直接进入数据库,且相关数据是经由人们的行为直接呈现出来的,基本保证了数据的真实性,这些领域因而在大数据潮流中抢占了先机。传媒业要拥抱大数据,就必须提高自身的数据采集能力。由于数据来源众多,种类繁杂,采集既要全面准确,速度又要快,还必须及时进行数据质量监控与处理,以保证数据质量,这对传媒业尤其是传统传媒业的数据采集能力是一种巨大的挑战。完整的数据采集渠道建立在庞大信息来源的基础上,除了政府之外,只有规模足够大、拥有足够多的反馈群体的机构或组织才能支撑大数据库的信息来源。媒体单纯依托自身资源所建立的数据库,严格意义上说属于小数据库的范畴。此外,还有微博、微信、YouTube 等自媒体发布平台,以及数不胜数的独立用户所发出的信息,其数量超乎想象,对于传统传媒业来说,数据采集难度可想而知。
在数据采集与积累的基础上,可以进一步建设适用的数据库。虽然随着数据技术的进步,计算机处理能力和存储能力得以大幅提升,使得数据库建设的成本相应降低,但从其他机构获取大数据库仍有难度,因为拥有大数据库的机构尤其是数据专营公司往往看重数据带来的收益。对媒体而言,即便成功购买了数据库,也非一劳永逸,还需要核实数据,进一步更新和维护数据库,并根据自己的需求,不断地对数据进行开发和分析,以此作为信息服务或营销的依据。
数据库的建设远非一日之功,相较于其他行业,传媒业在数据获取方面有自己的路径,如果能采集完整的用户回馈信息,就可以通过积累首先建立自己的数据库,再通过数据交流与信息互换,逐步完善数据储备。当然,数据采集能力的提升和数据库建设的成效,有赖于传媒业所拥有的大数据人才,也需要传媒业在人才结构调整方面注重大数据人才的引进与储备。
大数据的意义并不在于数据规模之大,而在于用一系列新的方式对数据进行挖掘和分析,并给出相应的合理解释,而非凭借直觉和以往的经验进行解释和判断。媒体对大数据的分析,应基于对自身可利用资源、媒介产品定位和营销对象的认识之上。如今,数据的生成速度快,包含范围广,成本相对低廉,无论是在传统科技领域(如遗传学和医学、实验物理或神经科学)还是在新兴产业领域(如谷歌、脸书、亚马逊等),都有着丰富的数据资源。媒体可以根据自身需要建设适用的数据库,也可购买适合自己的数据库,但关键是要在这些数据中找到适用的、有用的数据资源,亦即核心数据。核心数据应具备这些特征:完整可靠的数据组;不相关信息少;能满足媒体的使用目的。
在人类信息呈指数级激增的今天,数据规模越来越大,种类越来越丰富,虽然计算机可以高效处理巨量数据,但在让人眼花缭乱的巨大的数据海洋中,数据暗流仍越来越多,大量无用的数据垃圾开始困扰我们。传媒要注重对可靠的核心数据的把握和分析,既丰富自己的信息产品,又有利于传播效率的提高。媒体要做好信息服务工作,势必要把最新的、时效性最强的信息呈现给公众,但不能因此忽略老旧数据,因为大数据分析和预测不可能单纯依靠最新数据来完成,数据的完整、可靠、有用是分析和预测发挥效力的前提。在大数据所代表的从科学到商业、从社会管理到公共政策的新的开放市场中,传媒业对核心数据的把握至关重要。
不可否认,众多行业采集大数据都有其特定的目的,数据最直接、最表层的价值显而易见。如前文所述,不少媒体在使用大数据方面与传统数据时期相似,往往注重对数据表层价值的使用与挖掘,数据用途单一,并且把大数据的价值等同于这种单一的、基本的用途,在使用之后就不再去挖掘和开发,导致数据资源的浪费,而长时间的搁置也易使数据价值降低。需要指出的是,大数据时代的数据价值已经从最基本的用途转变为未来无限的潜在用途,数据“可以为了同一目的而多次使用,也可以用于其他目的”。所以,传媒业必须加强对数据的重复使用,既注重数据首要的、直接的价值,也要充分挖掘其潜在的价值。数据的潜在价值有三种最为常见的释放方式:基本再利用、数据整合、数据可扩展使用。而数据的折旧值、数据废气和开放数据则是更为独特的释放方式。[6]128-156目前的传媒业在技术上远远达不到这种挖掘利用的要求,只有少数传媒勉强可以完成对大数据的处理和模型建构,在一种或两种方式之下利用数据的潜在价值。所以,除了转变数据利用观念,做到既要善于积累资源,也要善于开发资源外,还需要提升大数据应用技术,尽可能利用大数据可持续的潜在价值。
大数据进一步打破了行业之间的壁垒,对于传媒业来说,“拥有资源仅仅是基础,开放资源才可能获得机会”[14]。随着网络和移动电子设备的普及,传媒业获取数据的渠道愈加宽广,通过网页提供链接和公共信息平台免费使用等可以聚集到大量用户,在用户接受服务的过程中,媒体可以采集用户信息,从而建立自己的数据库。与小数据时代相同,掌握数据对传媒业至关重要,但在大数据时代,最有效率的数据使用方法是数据的开放与交流。一方面,数据源自互联网,只有秉承“开放、平等、协作、分享”的互联网精神,才能创造更多的价值。通过数据库共享的方式,可以让不同类型和不同来源的数据相互交叠、重组,不断产生新的价值,因为“只有开放和实现彼此连接,才是具有真正交流价值的平台”[13]。另一方面,行业数据自身的独特性也吸引了商业领域和金融机构的关注,他们会针对行业数据信息进行开发,发掘其潜在的价值,使其真正转化为实际的商业价值。在开放自有数据库的过程中,传媒业同样能够共享其他行业和领域的数据库资源,并针对自身需求进行开发,以提升信息服务质量与市场竞争力,最终赢得大数据带来的发展契机。
大数据应用让数据产生价值,表面上看,它为所有行业都提供了前所未有的机遇,但传媒业并没有像人们所憧憬的那样迎来翻天覆地的数据化变革。虽然大数据可以为传媒业提供用之不竭的数据资源,可以使传媒能够更加细致地了解市场和用户,提高营销效率和绩效,但不可否认,受限于传媒业总体技术水平低、数据库储备不足、核心理念冲突等诸多因素,传媒业的大数据应用远不像人们预期的那样乐观。基于这样的现实,传媒业不应迷信和神化大数据的力量,而应当理性地分析大数据所带来的机遇,并在现有条件下努力提升的大数据应用水平,以迎接未来大数据应用发展的无限可能。
[1]雷 英.新闻传媒业如何应对大数据时代的冲击[J].当代电视,2014(8):87.
[2]陈力丹,李熠祺,娜 佳.大数据与新闻报道[J].新闻记者,2015(2):49-55.
[3]肖金泉,邓正来.公民法律词典[M].北京:中国物资出版社,1993:26.
[4][美]帕特里克·塔克(Patrick Tucker).隐姓埋名再无可能[J].机电一体化,2013(11):9.
[5]常小兵.筑牢我国大数据管理的安全防线[J].求是,2014(24):55.
[6][英]维克托·迈尔-舍恩伯格(Viktor Mayer-Schönberger),肯尼斯·库克耶(Kenneth Cukier).大数据时代[M].杭州:浙江人民出版社,2013.
[7]方 洁,颜 东.全球视野下的“数据新闻”:理念与实践[J].国际新闻界,2013(6):76
[8]文卫华,李 冰.大数据时代的数据新闻报道——以英国《卫报》为例[J].现代传播,2013(5):139.
[9]王武斌.大数据浪潮中的传媒业——兼谈大数据讨论中的若干误区[J].新闻记者,2013(6):29.
[10]Luciano Floridi.Big Data and Their Epistemological Challenge[J].Philos Technol,2012(25):435-437.
[11]中云网.数据的局限:大数据分析不能告诉你什么[EB/OL].[2015-01-13].http://www.china-cloud.com/yunjishu/shujuzhongxin/20140821_41856.html.
[12]Core Techniques and Technologies for Advancing Big Data Science ﹠ Engineering(BIGDATA).NSF 12-499.转引自Luciano Floridi.Big Data and Their Epistemological Challenge[J].Philos Technol,2012(25):435-437.
[13]喻国明.大数据方法与新闻传播创新:从理论定义到操作路线[J].江淮论坛,2014(4):5-7.
[14]齐 峰.媒介融合认识误区与路径选择[J].中国业版,2015(2):8.