【摘 要】 “融合媒体是全媒体功能、传播手段乃至组织结构等核心要素的结合、汇聚和融合,是信息传输渠道多元化下的新型运作模式。”——《电视台融合媒体平台建设技术自皮书》这一概念是随着信息技术和通讯技术的发展、应用和普及从以前的“跨媒体”逐步衍生而成的。“融媒体”目前理解就是融合多种的跨界媒体,其所指并不是一个个体概念,而是一个集合概念。
在互联网与5G社会下,大数据与融媒体技术更加成熟,网络舆情逐渐受到各界的重视,社会舆论与网络舆情方方面面渗透到人们的生活中。社会治理需要这些技术和工具更好的了解民意、改善民生。
【关键词】 大数据 融媒体 网络舆情 社会治理
大数据如何产生
托马斯.H.达文波特:大数据之所以产生,是因为传感器和微型计算机处理器在人们日常生活中无处不在。
大数据的发展进程
1966年,摩尔定律提出,为大数据现象的形成奠定物理基础[1];1989年,数据挖掘技术产生,大数据有了大价值[2];2004年,社交媒体出现,全世界每个人都变成了潜在数据生成器[3]。
大数据的特点:1.大数据=传统的小数据+现代的大记录;2.大数据=结构化数据+非结构化数据;3.大数据=大价值+大容量。
因此用效率更高的算法优化对互联网信息的查阅搜索程序,提高对互联网信息的查阅搜索效率,这样的优化能够变成当前万物互联时代的研究方向。[4]
融媒体技术整合了云计算、大数据、互联网等新信息技术應用于传统媒体,加快了传统媒体生产流程再造,促进了媒体生产的集约化、数字化和智能化。[5]
融媒体的大数据思维
在当今竞争激烈的世界中,数据驱动的决策起着非常重要的作用。对处理大量数据以在各个领域中进行未来预测以获取竞争优势的需求不断增长。人们普遍认为“大数据”可以达到这一目的。互联网是一个社交媒体平台,每个人都可以通过互联网下的各种形式表达自己对不同主题的想法,观点或反馈。这些主题可以来自任何领域,例如政治,商业,医学,教育等。
新闻活动,信息是社交媒体在网站上的大量信息的广泛方面,在社会或互联网上发生的信息记忆,并且通过网站上的许多互联网页面进行陈述或讨论。例如:现在您意识到,货币去货币化可能是印度的巨大麻烦,而独特的新闻社交媒体会影响这一难题的每条新闻。每天有超过一千的消费者发布与此统计信息相关的新信息。每天都会添加互联网上的独特数据,并创建新的信息记录。现在,浏览和讨论新闻事件已成为日常生活中的平凡生活。因此,通过信息事件评估为公司和政府发现了丰富的宝贵信息。
互联网时代的网络舆情传播
网络舆情传播具有如下四个特性[6]:
1.跨时空性:信息突破了空间的限制,实现了信息的跨时空传播;
2.群体极化性:信息的倾向性对受众的思想形成一定的支配性,形成群体极化;
3.强制互动性:信息由单向传播变成双向互动,公众由接受者变为参与者和生产者;
4.及时性:即时编辑、及时发布、即时传播、即时互动、及时反馈。
网络舆情指数体系构建的基本原则:可行性、目标性、稳定性、明确性、全面性、动态性、科学性。应用了包括如下技术:互联网大数据挖掘技术、人工智能、现代统计学、数据库理论、机器学习等。
互联网大数据挖掘技术包含如下方面:
统计技术:对给定数据集合假设一个分布或者概率模型;
关联规则:目的是找出数据库中隐藏的关联网;
连接分析:从一些用户的行为中分析出一些模式,同时将产生的概念应用于更广的用户群体中;
概念描述:对某类对象的内涵进行描述,并概括其有关特征。
这些强大的功能运用于网络舆情的研究十分有价值,它们可以对舆情信息进行针对性的挖掘,把握处理危机事件的最佳时机。
网络舆情指数体系(IRI)
“网络舆情指数体系(IRI)”是由中国传媒大学网络舆情(口碑)研究所设计,该指数体系是国内第一个权威的、可量化的、科学的网络舆情指数体系,重点突出网络舆情指数的实时动态性以及可理解、可描述、可解释等特点。
网络舆情参与度:网民在某网站中针对某一主题发布的信息量、回复量和浏览量的综合统计。——集中参与水平。
网络舆情评价度:整体态度倾向的指标。
百度司南舆情系统指数
声量诊断:某话题/人物/商品/事件在互联网上是否引起了关注度,关注量级与趋势如何。
传播分析:舆情传播路径,识别传播节点。
总结与反思
大数据舆情能否代表社会民意?
要注意,不能轻易把网上的意见视为舆论。网民占全国人1/3,网民在网上发表意见的人数,只占所有网民的2%,经常发表意见的人数更少。因此,网民大都属于沉默的大多数,通过技术手段抓取关键词呈现出的意见状况会出现代表性偏差,与符合真实情况可能出现不一致。
信息源头的污染。网民享有了表达意见的自由,但网络信息却并非态度、意见和情绪的直接和客观的反映。网络的虚拟性使得网络言论往往出现情绪化和极端化的现象。其次是大量网络“水军”的存在,会影响到对事实情况的判断。
爱德华霍尔创建了“高语境”和“低语境”的概念。高语境是指对语境依赖程度较高的语言,如中文和日文。在中文传播环境中,语言信息呈现在语境之中,高度依附语境。
使用爬虫等技术手段抓取的网络信息是有噪声的,在进行回归分析与差异分析时,不能彻底摆脱高语境依赖,由此得出的分析结果并不能完整的解释其实际意义,进而也会干扰舆情判断。
“大数据”是原材料,“算法”是核心。大数据往往是TB甚至PB量级的,在舆情指数分析中的数据也只是大数据的冰山一角,并不是完全意义上的“大数据”。
大数据技术已经改变了社会舆论的治理方法。在大数据技术的支持下,舆论监督和预警已实现自动化。报纸行业使用大数据技术来实现两件事。一方面,它可以实时监视Internet信息动态,提供新闻主题选择的材料;另一方面,它可以进行舆论监视服务。例如,人民日报网开通了“人民舆论”频道[7]。以上这些都可以进行高效的舆论监督。
【参考文献】
[1] 中国社会科学院经济研究所.现代经济词典:[M].南京;南京:凤凰出版社;江苏人民出版社,2005
[2] 《中国电力百科全书》编辑委员会,《中国电力百科全书》编辑部.中国电力百科全书:电工技术基础卷[M].北京:中国电力出版社,2014
[3] 祝光耀,张塞.生态文明建设大辞典:第二册[M].南昌:江西科学技术出版社,2016
国家社科基金项目“舆情生态治理下的政务新媒体传播路径及效果研究”(16BXW023)和中国传媒大学中央高校基本科研业务费专项资金资助项目“新时代融媒体背景下语言智能服务开放平台建设”(CUC19ZD012)
作者简介:宋康(1996-),男,汉族,单位:中国传媒大学协同创新中心互联网信息研究院 国家语言资源监测与研究有声媒体中心 媒体融合与传播国家重点实验室 研究方向:媒体大数据,网络舆情,自然语言处理。