颜玉奎
【摘 要】新闻资料工作经历了四个阶段:手工剪报—数据库全文检索—网络化信息化—融合发展。本文通过梳理新闻资料工作进程,研究新闻资料工作在融媒体时代的转型发展。融媒体时代党报的新闻资料工作将承担更大的责任,新闻资料工作与信息技术和媒体业务更加紧密结合,数据中台是全媒体数据管理的发展方向,信息组织和检索依然是新闻资料工作的核心内容,要结合新闻业务和用户需求开发利用全媒体新闻资料数据库,把数据变成数据资产。
【關键词】新闻资料工作;融媒体;数据中台;信息组织;信息开发
随着媒体的深度融合、信息技术的发展,新闻资料工作的手段和方法也发生了深刻的变化。近十年来,传统媒体和新兴媒体深度融合,从中央媒体到县级媒体两极,拓展为央、省、市、县四级融合发展的全媒体传播体系,有的地方报纸与广播、电视台机构融合、资源重组,地市级媒体“深度融合”[1]。原有的新闻资料数据库无法涵盖融媒体多种类的新闻信息数据,需要升级换代,新闻资料工作亟须转型。本文结合广西日报传媒集团新闻资料信息工作的转型实践,探讨融媒体时代新闻资料工作的转型发展策略。
一、新闻资料工作的发展进程
《新闻资料学概论》将新闻资料工作定义为“新闻资料工作是指搜集、整理和利用新闻资料来为新闻活动和全社会服务的科学劳动。它包括信息的采集、整理、加工、保管、流通、检索、咨询等多个工作环节”。新闻资料工作既是整个新闻工作的重要组成部分,又是整个情报资料工作的重要组成部分。梳理新闻资料工作的发展历程,可以分成以下四个发展阶段。
(一)手工检索阶段
新闻资料工作的初期是手工检索阶段,图书、报纸、杂志、剪报是新闻资料界提供给报社、编辑、记者的所有信息源。很多报社在建社初期就成立了图书资料室,其主要的工作任务是:选购和管理图书杂志,收集和管理剪报资料。关于新闻资料方面,大陆出版有论文集《新闻资料漫谈》,台湾出版了台湾学者关于新闻资料的专业书籍《新闻资料研究》。
(二)全文检索阶段
1991年3月,北大方正推出激光照排系统,我国报纸出版告别了铅与火,新闻资料数据进入了全文检索阶段,业界开始探讨新闻信息数据库的元数据标准和分类标准,1993年出版了专业书籍《新闻资料学概论》,这是我国第一部系统论述新闻资料工作的论著。
(三)网络化信息化阶段
21世纪前10年,是新闻资料工作发展较好的阶段。其代表性的工作成果是报纸电子版网上发布和历年纸质报纸数字化,在学术成果方面,制定了新闻资料的国家分类标准《中文新闻信息分类与代码》,出版了《新闻资料工作理论与实践》等专业学术论著。
《人民日报》纸质历史报纸分别于1995年、2003年制作了两个版本的电子版;2002年,《文汇报》《四川日报》《深圳特区报》分别完成了历史报纸的数字化[2];2005年6月,广西日报社与湖南青苹果数据中心签约制作《广西日报》纸质历史报纸的电子版。各家报纸先后完成了历史报纸的数字化。
网络环境下的新闻资料工作与计算机技术为主体的现代技术的联系越来越紧密,2001年8月,中国新闻技术工作者联合会新闻资料委员会(简称“中国新闻资料委员会”)宣告成立。新闻资料界积极探讨网络环境下新闻资料工作的现代化、信息化,并变更新闻资料部门的称呼:人民日报社、上海报业集团、南方日报报业集团、四川日报报业集团、深圳报业集团将新闻资料部门名称改为“新闻信息中心”,重庆日报报业集团、湖北日报传媒集团将其称为“信息资料中心”,广西日报社将其更名为“信息服务部”。
(四)融合发展阶段
随着新技术和新兴媒体的出现,新闻资料工作与信息技术和媒体业务的联系更加紧密。由于都市报广告下滑,纸媒遇到危机,新闻资料工作也受到冲击。目前国内不少新闻单位取消了独立的新闻资料工作职能部门,将其归到新媒体部门或者技术部门,新闻资料工作与媒体融合发展。
二、新闻资料工作的转型策略
信息资源与物质形态的原材料资源、能量资源并列构成三大战略资源,信息资源的开发、利用、管理已经得到社会、国家的重点关注。2022年9月,一级学科“图书情报与档案管理”更名为“信息资源管理”[3]。一级学科更名后,新闻信息资源的管理成为“信息资源管理”的分支,在学科体系中明确其发展定位,在媒体深度融合发展中被赋予了新的时代使命。随着媒体融合的纵深发展,原有的新闻资料数据库无法涵盖融媒体多种类的新闻信息数据,新闻资料工作亟须转型发展。
(一)数据中台是全媒体数据管理的发展方向
当前,搭建技术中台、业务中台、数据中台、AI中台成为融媒体融合发展创新中的热门探索,以技术创新带动管理机制和管理思维的创新,构建全媒体驱动的中台战略[4]。融媒体新闻资料数据不仅涵盖传统媒体的报纸、广播、电视等传播产品,还包括网站、微博、微信、抖音、APP等新媒体的数据,包括文本、版面、图片、音频、视频,有微视频、小电影、H5、图文直播、动漫等多种新型的表现形式,新闻资料数据库的内容要全景覆盖这些数据,原有的全文数据检索系统已经无法适应,数据中台是全媒体数据管理的发展方向[5]。例如,新华社打造一站式智能全媒体数据中台,整合新华社传统媒体和新兴媒体多渠道数据资源,并通过数据可视化方式,实现对全社媒体资源动态掌控,南方报业传媒集团通过数据中台的建设,充分释放数据潜力,实现了数据到资产的增值,广西云融媒体平台建设了全媒体数据中台,整合了自治区各家媒体的资源优势,在项目数据部署和媒资支撑方面,除广西日报社的大力支持之外,广西广电网络公司提供了数据存储和算力支持,广西广播电视台则在视频媒资、传输能力方面进行协同研发。
(二)借助人工智能技术对新闻资料数据进行信息组织
信息组织依然是融媒体时代新闻资料工作的核心内容。信息组织包括信息选择、信息分析、信息描述和揭示、信息存储[6],其中,信息描述和揭示,主要是著录文献信息的形式特征(日期、版次、标题、作者、正文等)、标引文献信息内容特征的检索标识(关键词、体裁、类号、标题词、叙词、关键词、人名、地名等),是数据库建设的基础性工作。
分类组织法和主题组织法是数据库及网络的信息组织工具,随着计算机技术被大量应用于图书情报资料领域,信息组织不再完全属于图情专业的专有技术[7]。人工智能的自动标引技术可以快速、高效、实时地对信息资源进行处理,自动标引、自动分类技术广泛应用于新闻信息数据库和全媒体中台。如广西云全媒体数据中台,采用智能文本分析系统,基于深度学习+迁移学习方式和Transformer(转换器)模型,基于国家标准《中文新闻信息分类与代码》制定自动分类表,对汇入数据中台的文本数据进行自动分类,对文章中的地区命名实体、人物命名实体、机构命名实体、时间、专业术语等检索标志进行自动标引,给每一篇文章自动标注核心关键词,自动抽取新闻文本中涵盖内容主旨的关键信息,并生成指定长度的新闻摘要。在汇入图片、音频、视频数据时,会自动调用预设置的AI(人工智能)中台智能解析能力,将汇入的多媒体内容进行语音识别、人脸识别、字幕识别等解析操作,同时将对应的语音、字幕识别成文字,并根据内容标注人物的名称,标注涉及的地点、事件以及相关机构。
尽管自动分类、自动标引技术已经进入到智能标引阶段,但由于自动分类表比较简单,自动分类的输出结果较粗糙,查全率和查准率有一定的局限性,自动标引不能完全取代人工标引。实际应用中,一般仍会继续保留人工标引,自动标引与人工标引相结合,人工标引对自动分类标引的结果进行纠正,完善自动分类模型,提高自动分类的准确性,新闻资料工作者可以发挥信息组织方面的特长,人工标引原创、专题等重要数据,深度挖掘其数据价值。
(三)结合新闻业务和用户需求,开发利用全媒体新聞资料数据库
信息组织的目的是信息利用。媒体单位积累了大量的原创文章、图片、音视频等媒体数字资产,需要有效地管理和利用这些海量的数字资产。在全媒体时代,数据分析和应用成为媒体发展的重要支撑。通过数据分析和挖掘,可以为媒体提供多维度观察,帮助媒体企业了解受众喜好,提高广告收益、增加流量,同时通过数据分析和开发,实现数字资产交换、共享和销售,媒体单位积累的媒体数字资产是宝贵的财富,如《每日经济新闻》以智能媒资库为核心,通过智能标签和匹配算法的情感识别模块,成功实现“AI化+视频化”的战略转型[8]。
新闻资料部门要变被动服务为主动服务,当发生重大突发事件时,要快速反应及时提供相关背景资料,对于重大报道、重要会议,要提前介入,做好相关专题资料提供给新闻策划部门,结合新闻业务,充分发挥新闻资料数据库的作用,把数据变成数据资产,开展数据服务。全媒体新闻资料数据库的开发利用可从以下几点来考虑。
一是容易变现的专题信息。结合媒体业务部门和经营部门的工作开发容易变现的专题信息。
二是相对固定重大报道专题。提前介入每年相对固定重大报道,如自治区两会、全国两会、党代会、中国—东盟博览会等。
三是实体库(地区专题库、人物专题库、机构专题库)的建设。地区名称、人物名称、机构名称,数据中台可以自动标注,但有些也需要人工修正或进一步深度标引,比如人物专题库,可进一步标记不同类型的人物:典型人物、政治人物、敏感人物。在实践中,敏感人物库是非常实用的专题库。
四是利用剪报目录提取有价值的历史专题资料。剪报资料是从报纸和杂志上直接剪切下来的,保留了原来的版式,一目了然,很直观。历史纸质报纸完成数字化建成了全文数据库,依据原有的每册剪报分类或专题做成的剪报目录库,可以快速查找原来的剪报,也可以依据剪报目录在全文报纸数据库中提取有价值的历史专题资料,纸质资料依然发挥着独特的资料价值。
(四)新闻资料工作者的转型
在手工检索阶段,新闻资料部门是以收藏、整理纸质图书报刊资料为主的场所。有些人以为受过简单培训的人就可以胜任新闻资料工作。因此,新闻资料部门往往成为照顾家属,分流多余人员的场所。在网络化信息化阶段,“老弱病残”再也难于胜任夜班或早班的数字报工作。融合发展阶段,新闻资料与技术、与媒体的业务紧密结合,对新闻资料工作者提出了更高的要求,迫切需要熟悉新闻业务、懂得信息组织和检索、能充分利用信息技术进行数据分析的复合型人才,要求从业人员能够熟练运用计算机进行数据处理和数据分析,快速为新闻业务、为用户提供信息服务。新闻资料工作者可来自计算机应用、信息资源管理或者新闻学等专业,要有良好的政治思想素质,具有强烈的事业心和责任心,具有较好的学习能力,能掌握与自己岗位相适应的信息处理技术,有较好的业务素质和个人素质。
三、结语
新闻资料工作经历了手工剪报—数据库全文检索—网络化信息化—融合发展四个阶段。融媒体时代,新闻资料工作与信息技术和媒体业务更加紧密结合,数据中台是全媒体数据管理的发展方向,尽管新闻资料工作方法和部门设置有些变化,但信息组织和检索依然是新闻资料工作的核心内容,迫切需要熟悉新闻业务、懂得信息组织和检索、能充分利用信息技术进行数据分析的复合型人才。人工智能技术可以对新闻资料数据进行自动分类和自动标引,但不能完全取代人工标引,需要自动标引与人工标引相结合。结合新闻业务和用户需求,开发利用全媒体新闻资料数据库,把数据变成数据资产,全媒体新闻资料数据库也要通过服务社会来发展自身。一级学科“图书情报与档案管理”更名为“信息资源管理”,新闻资料工作者更容易找到自己专业研究的学科自信。新闻资料工作的归属部门可能有些变化,但是新闻资料工作不会消亡,报纸是公认的权威性信息总汇,党报的新闻资料工作将会承担更大的责任。
参考文献
[1]叶蓁蓁.2022—2023报业融合发展观察报告[J].传媒,2023.7,(上):9-12.
[2]杜官相.对人民日报等六家报社新闻资料数字化建设考察报告[C].中国管理科学文献,2008-12-01:1023-1025.
[3]毛太田,汤淦.守正创新:学科更名的思考[J].数字图书馆论坛,2022(11): 15-18.
[4]曾祥敏.我国媒体融合发展的十大创新探索[J].报林, 2022(04): 9-11.
[5]杨东,滕健.基于大数据技术的全媒体中台实践[J]. 中国传媒科技,2020(09):19-20.
[6]马费成.信息管理学基础(第三版)[M].武汉:武汉大学出版社,2023:8-30.
[7]冯瑾毅.大数据时代信息组织与分析面临的机遇与挑战[J].江苏科技信息,2023(9):31-34.
[8]刘学东.以智能媒资库为核心 实现“AI化+视频化”——每日经济新闻战略转型的思维之变与技术路径[J].中国记者,2023(7):59-65.