陈敏学
大数据与新媒体传播
陈敏学
现如今,数据量的大规模增长以及对数据越来越广泛的应用,都在表示着大数据的时代已经到来。大数据对我们生活的影响是在不断扩大并且不断深入的,在生活的方方面面都能体会到大数据的影响。媒体作为信息的收集者与传播者,无时无刻不在与信息打交道。但是就目前来看,媒体对于大数据的应用远远不足,媒体行业仍然在探讨如何更好地利用大数据以提升整个行业的水平。大数据的应用是必然的,作为媒体,要不断创新思维,改变固有观念,迎接大数据时代的挑战,发展自我;同时也不应在大数据的信息时代迷失自我,在信息爆炸的时代更应该提升专业化水平,坚守媒体的本质和精神。
大数据;媒体;个性化;互动;社会责任
[作者]陈敏学,复旦大学新闻学院。
近年来,随着信息技术的不断发展,数据量呈现爆发式增长,大数据的概念逐渐被越来越多的人所接受,其影响也渗入社会的方方面面。国际数据公司(IDC)预计,到2020年,50%的商业分析都将通过依托于认知计算技术的规范分析进行,并且在分析中,对分析有高价值的数据将翻倍,传递给决策者的数据将有60%具有可操作性。同时,IDC《中国大数据技术与服务市场2013—2017年预测与分析》研究报告显示,中国的大数据技术和服务市场将以年复合增长率38.7%的速度从2013年1亿6550万美元增长至2017年8亿5010万美元。在中国,大数据首先更多地被应用于拥有成熟的IT系统并且积累了足够多数据的或者以顾客为导向随时应对市场变化的部门。之后,更多的行业和部门开始对大数据进行理性运用,电信和银行根据需求进行了基于Hadoop的应用,政府和医疗也已经开始了他们的大数据计划。
大数据、云计算等前沿技术的蓬勃发展,对于社会发展的意义重大。大数据不断深入发展的趋势不能阻挡,虽然“大数据”一词在很多领域引起非常多的关注,但媒体很少提及大数据对自身的影响。如2014年2月,《纽约时报》发表了一篇名为《大数据时代》(The Age of Big Data)的文章,文中列举了很多案例说明大数据对社会多个部门产生的影响,却没谈及在当今形势下,新闻业乃至整个传媒业会受到怎样的影响[1]。毫无疑问,新闻行业不能将自身置于大数据时代之外,若不能很好地适应大数据的发展,不能将传统新闻报道与大数据相结合,随时会被整个时代所淘汰。传统的新闻行业有自身的局限性,如何更好地适应大数据的发展,是需要探讨的问题。
(一)大数据概念
在2008年《自然》期刊中,提到了现代科学面临最艰巨的挑战之一,就是如何应对正在产生的信息洪流。一千万亿字节就已经是很大的容量,但是事实上的需要远超于此,这些数据都是“大数据”的资本[2]。在这里,多次提到了“大数据”的概念。“大数据”的概念首先强调了“大”,表示了系统需要管理的数据规模极大,相对于之前的CPU和储存技术而言,这些规模过大的数据处理需要特别对待。从历史发展来看,超大规模在提出时表示的是GB级别的数据,海量数据提出时表示的是TB级别的数据,而大数据则是指PB(1015)及以上级别的数据[3]。
Gartner研究公司认为,“大数据是需要利用合理成本的新处理模式进行处理才能使其拥有者具有更强的洞察力和决策力的海量、髙增长率和多样化的信息资产”。在这里,强调更多的是大数据的“资产性”作用。
(二)大数据基本特征
在此之前,数据的产生与收集一直存在,但是大数据有独有的特征。随着互联网、物联网和云计算技术的迅猛发展,数据的数量不仅以指数形式递增,而且数据的结构越来越趋于复杂化。相对于以往普通“数据”,“大数据”具有更深层次的内涵。根据IBM商业价值研究院全球企业咨询服务部执行报告《分析:大数据在现实世界中的应用》,大数据具有四个主要特征,即数量(volume)、多样性(variety)、速度(velocity)以及精确性(veracity),简称为“4V”。“数量”主要是指数据规模迅速增长,数据量从TB上升至PB级;“多样性”指向数据的多种形式,结构化与非结构化相结合,从单一的文本形式转变为多媒体形式;“速度”强调数据的运动,要求分析流数据,数据运动的速度极快,这便要求在不到一秒内做出决策;“精确性”有两个层面的意义,一是原生数据的内生性和不精确性,二是在数据的管理上,可靠性和可预测性使大数据的分析结果有精确性。
(三)大数据发展现状
在国外尤其是西方发达国家,大数据的利用已经十分广泛且成熟。政治和经济领域中,很多决策基于数据分析而得出。在学术领域,美国麻省理工大学计算机科学与人工智能实验室建立了大数据科学技术中心。该技术中心主要致力于加速科学与医药发明、企业与行业计算,并着重推动在新的数据密集型应用领域的最终用户体验的设计创新。在产业领域,国外许多著名企业和组织都将大数据作为主要业务,如IBM、EMC、微软、戴尔、惠普等国际知名厂商都提出了各自的大数据解决方案或应用[4]。
国内的大数据产业也紧跟世界潮流不断发展。国内大数据已经应用在金融、电信、政务、医疗、文化等行业,并逐步扩展到其他行业扩展。如金融领域,蚂蚁金服大数据应用于蚂蚁信用,综合考虑个人用户的信用,构筑信用消费生态;交通运输领域,中国家庭中GPS的广泛使用;体育领域中专业球队的比赛也利用大数据进行分析,为球队制定可靠、有效的战术、战略提供有力的数据参考。
不论是国外还是国内,大数据的发展是十分迅速的,不仅是大数据的信息量,更是大数据的应用量,并且大数据的应用范围一直在不断扩大。
(一)应用现状与困境
著名的O'Reilly公司断言:数据是下一个英特尔,像“英特尔内置”一样,未来属于将数据转换成产品的公司和人们。有效的组织和使用大数据能够推动社会经济和科学研究的巨大发展,并带来前所未有的机遇。欧美等经济发达国家的一些出版传媒企业在大数据技术的应用上已走在前列,这些企业充分利用大数据技术挖掘企业的核心价值资源,建立新的商业模式。目前,国外出版传媒企业有关大数据应用主要集中在产品策划、产品营销、智能分析和可视化、数字化教育等方面[5]。
以产品营销为例,对媒体而言,广告主是直接的服务对象。而今用户大量的在线行为数据触手可及,有针对地投放广告成为可能,媒体就可以满足广告主对精准营销的需求。如美国卫星电视运营商DirectTV通过部署测试可寻址电视广告,使其营收中有10%的收入是可寻址广告带来。通过可寻址广告系统,广告主可以自主选定他们感兴趣的家庭类型,同时DirectTV会委托第三方数据提供商在其注册用户中寻找符合要求的家庭[6]。根据第三方提供的数据,从各个维度各个层面推断用户购买产品的意向,从而为广告主推荐最为优化的用户。如此一来,通过对大量信息的收集,优化其产品营销使广告主的投放更具有针对性,以一种和用户进行互动的形式,达到商业利益上的双赢。
同时,媒体应用可视化技术,对大数据进行分析应用,提升其信息传播的能力。大数据可视分析是指“在大数据自动分析挖掘方法的同时,利用支持信息可视化的用户界面以及支持分析过程的人机交互方式与技术,有效融合计算机的计算能力和人的认知能力,以获得对于大规模复杂数据集的洞察力”[7]。媒体向大众传递信息,可视化的展示尤为重要。通过可视化处理,大数据可以以一种更为生动有趣的形式传递到大众,提升了媒体信息传递的水平。
但由于媒体业在大数据的时代缺乏立足的根基,被技术公司远远落在后面。根基的先天不足加上发展开始时间晚,属于媒体业的想象空间并不多,大数据对媒体的价值非常有限。大多数媒体机构在大数据领域并不具备颠覆创新和业务转型的条件,原因是多层次的。首先最为本质的问题就是媒体业所掌握的数据资源有限,接下来关键的问题是,媒体业缺乏处理大数据的能力。媒体业自身生产的数据本身就十分有限,对于有限内容的数字化程度也不够。以纸媒为例,在新媒体的冲击下,传统媒体特别是纸质媒体所受的冲击首当其冲。国内的《新闻晚报》《上海壹周》等,国外的《纽约太阳报》、纸质版的《独立报》等也纷纷停刊,甚至有媒体人称“纸媒已死!”传统以版面为对象的生产方式,在开展新媒体业务时难以适应,需重新转化编码。而在内容数据库的建设方面,很多媒体甚至处于“零”的状态[8]。媒体业在大数据环境下该如何生存和发展,这是今天媒体人亟须解决的难题。
除了要解决技术方面存在的困难,媒体作为社会的“守夜人”,应该时刻注意内容至上。诚然,在大数据技术的支撑下,媒体可以根据用户受众的需求,推送其感兴趣的新闻内容,更具针对性。如“今日头条”能够分析出一些用户在不同的城市有规律的往返与切换,从而识别出潜在的目标受众,把相应的信息推荐给他们。2016年春运期间,中国铁路总公司与其下属的18个铁路局在“今日头条”上发布临客增开信息,单条资讯的阅读量达到了50万。但是,如果完全以用户为依据不加以专业引导,新闻会形成碎片,不利于完整性新闻的传播,更不利于媒体发挥舆论监督的“守夜人”作用。
(二)媒体在大数据时代的发展展望
首先在数据的获取方面,大数据应用获得成功的两个重要因素一是数据源的代表性;二是价值、良好的供给与需求的合作以及有广泛影响力的平台。数据搜集是数据新闻生产流程的第一个环节,也是最重要的一环,直接影响后续阶段的可信性和有效性。随着数据分析和数据挖掘技术的发展,数据新闻分析的数据量级远超传统新闻图表的数据规模[9]。媒体在处理传统新闻图表的数据时已捉襟见肘,在选取、管理及处理的过程中均有明显的滞后性[10],这就需要媒体运用更多的手段来处理新时代下的数据。同时,数据的共享性还需要更进一步的提升,媒体所获得的数据对于其提升远远不足,这就需要全社会共同的努力,将数据资源进一步社会化。
20世纪40年代美国学者提出的“社会责任论”是目前世界四个主导性新闻理论之一,其中一点便是将新闻界提供的信息流、思想流和感情流送达每一位社会成员,这是对新闻完整性的要求,以保证每个公民平等地分享信息。大数据分析下的个性化新闻在一定程度上会造成信息的碎片化,新闻的发布或许会根据数据分析因人而异。但是大数据的发展是不可阻挡的,并且大数据带来的发展机遇不可忽视,媒体处理好个性化与专业化的问题就显得尤为关键。媒体充当着社会记录者与信息传播者的角色,并将自身定位成社会解读者和分析预测者。深度解读和去伪存真本是媒体的重要职责。在大数据的环境下,媒体在大数据全面深刻的洞察功能和丰富的挖掘能力作用下,满足受众需求的同时,以专业的理论和强大的社会责任感处理整合信息,既不盲目跟风,亦不因噎废食,媒体的传播力、公信力和影响力将得到大大的提升。
大数据时代的产生得益于计算机与互联网等技术的迅猛发展及在各个领域的广泛应用。大数据对各行各业来说,既是机遇也是挑战。大数据这一概念从出现到现在,经过近几年的发展,已经在应用方面不断深入和发展。数据的量在不断地扩大,大数据的储存处理技术也在不断发展。反过来,从传统的数据储存发展到现如今的Hadoop等一系列海量数据储存技术,让数据的量得以不断扩大,大数据的应用也因此更具科学性。作为时代发展的趋势,如果能很好地应用大数据,无疑会给自身带来更大的发展。媒体行业也是如此。对于媒体行业来说,大数据仍然较为陌生,如何更好地利用大数据,仍然是值得媒体行业探讨的话题。以开放的思想和严谨的专业知识迎接大数据时代,是媒体行业在大数据时代的发展方向。
[1]官建文,刘扬,刘振兴.大数据时代对于传媒业意味着什么?[J].新闻战线,2013(2):18-22.
[2]Big data:Science in the petabyte era[J].2008,455:1-136.
[3]于艳华,宋美娜.大数据[J].中兴通讯技术,2013(1):57-60.
[4]李学龙,龚海刚.大数据系统综述[J].中国科学:信息科学,2015(45):1-44.
[5]吴仁群.大数据在出版传媒企业中的应用[J].科技与出版,2016(1):24-26.
[6]黄升民,吴殿义.大数据在媒体运营中的应用及思考[J].山西大学学报(哲学社会科学版),2015(2):73-78.
[7]任磊,杜一,马帅,张小龙,戴国忠.大数据可视分析综述[J].软件学报,2014(9):1909-1936.
[8]王武彬.大数据浪潮中的传媒业——兼谈大数据讨论的若干误区[J].新闻记者,2013(6):28-31.
[9]徐锐,万宏蕾.数据新闻:大数据时代新闻生产的核心竞争力[J].编辑之友,2013(12):71-74.
[10]吴文平,陈沁蓉.以大数据为支点推动转型[J].新闻战线,2014(1):53-55.