寇颖丹
摘 要:本文简要介绍了目前人工智能技术在新闻传媒行业自动写作场景下的应用,并分析了记者、编辑、决策者等不同角色的扩展使用需求,进而对未来人工智能技术与智能创作场景的深度结合进行了展望和功能设计。本文有助于新闻出版从业人员了解新技术应用趋势和行业需求。
随着人工智能及大数据技术的发展,新闻传媒业大力推进与科技的融合。智能写作技术作为人工智能技术在新闻信息领域中的具体应用,逐步为新闻传媒机构所关注和尝试。
从目前国内外智能写作的发展来看,以写稿机器人为代表的智能写作工具已在国内外一些新闻机构都有不同程度的应用,特别是在有大量格式化、规范化新闻信息的财经金融新闻信息领域、体育新闻、突发事件报道等方面。国内的产品基本上以自动写稿为核心功能,国外的产品则涵盖范围更广,不仅包含自动写稿,还有辅助传播工具、自动标引工具和内容审核工具等。
除了格式化、规范化新闻信息的自动写作之外,在更广泛的场景下,是否能够通过大数据、人工智能提供智能辅助创作技术,为内容创作提供更进一步的辅助支撑成为可以探究的问题。
一、智能辅助创作的演进分析
智能辅助创作主要为新闻传媒单位内部的编辑记者提供服务,按照不同角色对智能辅助创作的需求各有其侧重点,大致分为几类不同角色,其使用需求如下。
(一)记者对智能辅助创作的需求
记者的主要职责是发现选题和采访写作。在发现选题方面,除了传统的跑线和爆料之外,记者会通过互联网获取大量信息,包括政府相关部门官方网站、互联网门户的财经频道、一些专业和垂直领域的经济类网站及公众号、社交媒体及自媒体等,从这些信息中心挖掘潜在热点和有价值的新闻线索,因此信息的获取和归类整理、分析将会占用记者的相当一部分精力和时间。在这方面,希望智能辅助创作可以提供支撑,例如在采访写作方面,可以帮助记者获取创作灵感、发现写作角度。
(二)编辑对智能辅助创作的需求
编辑的主要职责是更好地呈现选题,他们对记者提供的稿件进行二次加工和内容把关,对稿件内容中的报道角度、引用的数据与观点、语法及描述、配图等方面进行审核,纠正错误,确保内容的高质量。在内容审核中,对数据和引用观点的核实可以借助智能辅助创作的數据抓取与分析能力,为编辑提供参考,减轻编辑人工查找信息的工作量。希望智能辅助创作可以为编辑提供信息收集、整合、分析、推送服务。
(三)采编部门领导对智能辅助创作的需求
采编部门领导(部门主任或副主任)通常直接负责本部门(板块)的选题决策、重大选题策划等工作。除了类似于记者和编辑的需求之外,部门领导还对信息的宏观把控和分析有需求,包括新闻的传播分析、本部门的选题分析等。
二、智能辅助创作的功能设计
根据对不同角色的需求分析,智能辅助创作的功能可以按照线索发现、选题策划、创作支撑工具三个阶段进行设计。
(一)线索发现
线索发现阶段主要为记者和编辑提供全网热点新闻的自动化呈现,并通过量化指标对其进行评估,从中挖掘潜在新闻线索。线索发现阶段的核心功能及业务流程包括线索抓取、热点发现、线索订阅与推送。
1.线索抓取
线索抓取功能主要包含三部分:第一,基于用户指定的抓取源(网站、微博、微信),自动定时及手动抓取信息,并实现信息的自动清洗、过滤、标引、分类、聚类、入库,可根据需要实现全量、增量的信息抓取,用户可自定义抓取源和抓取模板。第二,抓取的新闻线索信息,系统可实现自动标引,包括新闻标题、作者、来源、发表时间、新闻中的关键人物、地名、机构,该篇新闻的摘要信息,同时系统可对具有相同主题的新闻线索进行聚类。第三,用户可以基于线索内容或标题的关键字、地域、时间、分类等各种属性对新闻线索进行方便、快捷的检索,用户还可以针对新闻线索进行主题检索,按照“主题-线索”的方式组织和显示线索数据。
2.热点分析
热点分析功能包含两部分:第一,系统预设新闻热度模型,模型指标包括新闻的阅读量、转发量、评论量、点赞量、分享量,并且可对指标设定不同权重;基于预设的新闻热度模型,计算抓取的新闻热度值,生成热度排行榜(日、周、月),并展示给客户。第二.系统提供新闻热度计算的基本模型,包含阅读量、转发量、评论量、点赞量、分享量等多个指标,用户可基于基础指标进行热度模型的自定义设置,对不同指标设定相应权重,从而可以优化热度模型。
3.线索订阅与推送
编辑记者可根据自己的喜好,通过设定关键词或主题的方式进行订阅,定制关注的新闻线索分类(板块)。通过大数据舆情分析,将生成如下分析结果:事件概况、传播趋势、渠道信息、舆论聚合、人群画像、信息列表;同时,系统可按照最新、最热两个维度,将互联网热点信息(线索)实时推送给用户,用户在登录Web系统的状态可及时收到推送消息,并通过点击消息直接查看推送的新闻线索信息。
(二)选题策划
在选题策划阶段,智能辅助创作系统主要为记者编辑提供选题管理和支撑选题策划的背景信息参考服务。
1.选题日历
系统提供手工录入新闻选题功能,包含选题基本信息、选题预计时间、选题关键词等。系统以日历的方式展示一个月内每日的选题安排,点击某个选题后,可显示其详细信息,除了显示该选题的预设信息外,还可根据预设的关键词自动推送与其相关的当前热点新闻,供记者和编辑参考。对于快到期的选题,系统可提供自动提醒功能。
2.背景信息提供
对于给定的选题,系统可检索并呈现基于该选题的相关背景信息,如相关人物、相关机构、相关事件,以及与选题有关的其他新闻报道内容。
相关人物和相关机构的信息一方面可来源于新闻报道,另一方面可关联目前现有的媒资库系统,从媒资库系统中的人物库和机构库中获取数据。
相关事件可通过新闻主题聚类的方式,将与该选题有关联的其他新闻主题及详细新闻报道进行层次化的展示。层次划分为:给定选题-相关主题(事件)-相关新闻。相关人物和机构采用图形化呈现方式,相关事件与相关新闻报道之间存在关联关系,展示信息的同时也要将相互关联关系展示出来。
(三)创作支撑
内容生产阶段,智能辅助创作系统主要提供半自动成稿和模板成稿两个层面的支撑服务。
1.半自动成稿
可提供给定选题的相关新闻素材,内容包括文字片段和图片,相关人物、相关机构、相关事件,来源包括数据抓取源采集的各类网站和自媒体。
除了基本新闻内容素材推荐之外,系统还可以对以下几种新闻素材进行推荐:观点聚合类素材,对给定选题的相关新闻内容进行深度分析聚合,形成相同观点的新闻内容聚合素材;自动摘要类素材,系统可根据预先设定的新闻主题,自动对相关新闻内容进行精练概括,抽取核心内容,形成摘要素材;事件脉络类梳理素材,系统可根据预先设定的新闻主题,自动按照时间对相关新闻报道的演变发展进行梳理,形成新闻事件发展脉络素材。
2.模板成稿
对于具有相对固定格式的短消息类新闻,例如统计局公布月度CPI数据等,智能辅助创作系统可直接自动生成新闻稿件。自动生成稿件包含两个核心,新闻写作模板的梳理定义、新闻内容的自动套用模板与改写成稿。在建设中,一方面要通过大量同类新闻内容,借助深度学习能力不断自我总结与完善,抽取形成特定类型和用途的新闻写作模板,另一方面要通过内容自动摘要和改写技术实现对写作模板的调用和内容填充。
三、结语
智能辅助创作是新闻传媒机构适应互联网时代信息处理智能化趋势,是人工智能技术在新闻传媒领域的跨界融合与渗透。自动写作可为新闻信息采写创新注入新活力,其把记者从基础的、过程重复的新闻信息采写中解放出来,使他们有更多的时间采写鲜活灵动的内容,做有独立见解的深度分析、独到角度的调研,从总体上进一步促进了新闻信息的生产能力。
(作者单位系研究出版社)