□ 新华社“人工智能时代媒体变革与发展”课题组
技术的指数级增长意味着人工智能的无限可能。当前,人工智能与媒体各业务环节深度融合,实现了提质增效,但在智媒化发展进程中,仍面临不少问题与挑战。对于媒体而言,观念认知水平滞后于智能化发展趋势、传统媒体体制机制不能有效适应变革、技术基因先天不足等问题在国内外传媒界普遍存在。与此同时,每项科学技术的馈赠都有其黑暗面。早在上世纪,有专家就预测了数字化生存对知识产权、隐私权的侵犯,以及数据使用、文化破坏等问题。今天,随着人工智能技术的发展,其双刃剑效应愈加明显,特别是当人工智能技术越来越多介入新闻生产和传播实践,失序失范现象频现,一系列新问题新挑战接踵而至。
有效推动人工智能技术应用与媒体创新变革,理念必须先行。新华社“人工智能时代的媒体变革与发展”课题组问卷调查结果显示,59.7%的受访者认为,推进媒体智能化发展,首要的是全员刷新观念、提高认识水平。没有充分的思想认识和正确的思想观念,就难以有科学的发展战略和创新策略。目前,媒体应用人工智能最常见的观念和认知误区表现在三方面:
一是对运用人工智能加速媒体融合“雾里看花”,认识不充分、不到位。作为媒体深度融合发展的重要驱动力量,人工智能究竟会对传媒业态产生什么样的影响,应当如何运用人工智能加速媒体融合,不少传媒从业者对此认识还不够清晰,亟待认清形势、转变观念。有观点过于夸大人工智能的功能、作用,认为势必给传统媒体从业人员带来生存危机;有观点无视人工智能时代已经产生的媒体变革,认为智能技术的应用还很遥远……诸如此类的“人工智能万能论”“人工智能威胁论”“人工智能泡沫论”等,反映出人们对于人工智能助推融合发展前景的认识是分化的、模糊的。
二是对人工智能技术在新闻生产领域具体环节的应用效果,还存在“看不见”“看不起”“看不懂”的情况。人工智能技术有其自身特有的发展规律与创新路径,现阶段,技术本身及应用方式尚不成熟,“弱人工智能”不具备推理和解决问题的能力,不具备强人工智能那样的人类情感和思维方式。调研中我们了解到,不少媒体从业者仅看到技术的短期效果,而忽视其长期效果,强调目前人工智能在传媒业的落地应用体现不出“智能”,更多依赖于“人工”,以求全责备的态度看待人工智能技术和应用成果,忽视了技术发展的客观规律和潜能。
三是一些媒体机构不能与时俱进,对于人工智能重视程度不够。对于人工智能技术特征与发展趋势,不少媒体决策层强调媒体行业的特殊性,否认技术的普遍性和通用性,对人工智能技术渐进性的颠覆不重视、少行动。还有些媒体从业人员对人工智能的认识仅停留在技术发展表面和浅层次,认为人工智能就是机器人写作、语音识别,而不知人工智能技术在媒体行业有着很宽的适用面、多种多样的应用场景,忽视了媒体智能化的无限发展空间。这些滞后的观念认识影响人工智能发展决策的谋划和实施。
一是传统组织架构、业务流程的不适应。课题组问卷调查显示,63.9%的受访者认为,媒体应对人工智能的挑战必须注重改造传统采编发业务流程。近年来,一些媒体敢于先行先试,正在逐步探索改变原有的编辑部办公模式,在空间意义上完成了平台架构和新旧媒体融合,但更多仅仅停留在外部形态改造。传统的新闻生产主要在编辑部内部展开,是一个相对闭环的生产过程,所有生产环节依靠组织内部的力量即可完成,而在智能化新闻生产模式下,跨部门、跨行业、跨领域的开放共享、大规模协作成为必然,这就要求在实际生产运作中进一步理顺生产关系、重构新闻生产流程。
二是资金制约。对人工智能投入产出比的讨论是国内外传媒业热议的共同话题。人工智能相关软硬件的引进开发及数据库构建管理等,都需要较高资金实力。但在这样的成本之下,“机器人写稿、审稿是否真的有更高的准确率?”“把训练机器、更新数据库的成本用来聘用更多员工,会不会更划算?”……实践中存在不少类似疑问。特别是在当前传统媒体整体业绩下滑背景下,不少省市级媒体表示“有心无力”“没钱投入”。
三是人才队伍建设面临新课题。面对人工智能时代技术变革的新趋势,一些传统媒体人员队伍能力跟不上媒体智能化发展要求,不能熟练运用新技术、新手段,存在“本领恐慌”。与此同时,缺乏媒体智能化发展所需的复合型人才、创新性人才,特别是在技术、运营等部门,领军人才少之又少。传统媒体由于体制机制掣肘,大多存在人才“用不好”“留不住”“招不来”的难题,亟待优化考核激励机制,盘活人才资源,打造适应现代传播规律的选人用人新机制。
技术是媒体发展变革的第一生产力。从全球范围看,当前,不少传统媒体积极拥抱人工智能技术,努力转换角色,从内容生产者向平台运营者转化。然而,如何科学合理地研发、运用智能化技术,提高人工智能技术的本土化水平,开发满足市场需求的新场景、新模式,确保应用水平与技术本身的发展水平相匹配,始终是媒体智能化转型面临的一大挑战。调查显示,75.3%的受访者认为,应对人工智能挑战,媒体要高度重视增强采编队伍的技术储备和创新能力。技术基因缺乏是影响传统媒体人工智能应用程度与应用效果的重要因素,主要体现在三方面:
首先是技术基础设施不足。智媒化发展对于媒体装备要求越来越高,加之新技术新设备的更新换代周期不断缩短,给传统媒体的技术基础设施配备更新带来压力。调研中,不少媒体从业者认为所在媒体机构的智能化硬件投入有限、设施缺乏,对许多人工智能设备及应用“听说过,没见过”。
其次是核心技术团队力量不足。人工智能在具体应用场景的落地,需要具备一定的本土化开发能力。结合媒体行业自身的痛点难点提出需求,把技术转变为符合媒体特色的应用才是关键。在世界范围内,多数新闻机构的人工智能技术应用仍然相对滞后。美国国际记者中心的调研发现,新闻编辑室中技术人员比例仍然偏低,只有5%的职员有技术背景,2%的新闻编辑室会雇用技术人员。据调研,国内媒体当中,互联网技术人员占比也普遍不高,往往只发挥着运行维护作用,不具备创新研发能力。
第三,人工智能技术应用水平与创新能力有限。调查中,超四成的受访者认为目前国内传媒业对人工智能技术的应用程度一般。媒体行业运用人工智能,一方面必须依托核心技术,一方面则要充分考虑与传统媒体业务相结合,开发满足市场需求的新场景、新模式,确保应用水平与技术本身的发展水平相匹配。对于如何更好实现人工智能技术在媒体机构的落地应用,83.1%的受访者认为,媒体机构有必要与外部科技企业及机构合作研发人工智能技术;58.6%的受访者认为,媒体机构有必要自主研发人工智能技术。当前,底层人工智能技术大多由科技企业和研究机构掌握,无论是基于开源程序自主开发智能新闻生产技术工具,还是与第三方智能技术公司合作开发,媒体机构需根据各自资源禀赋选择适合的技术发展路径。
媒体机构与技术公司的合作当中也产生了一些待解的难题。人工智能的核心技术多由科技企业提供,媒体机构难以实现技术主导和自我迭代开发。此外,不少大型媒体机构依托自身数据资源,与科技公司合作培育出了具有较强可用性、适配性,符合媒体行业特定需求的智能化工具,经科技公司打造成熟后却广泛应用于其它市场,往往带来知识产权方面的问题。
数据是人工智能发展的基础。以“深度学习+大规模数据训练”为主要模式的人工智能系统,需要足量数据、足够的运算资源,才能不断优化性能,具备更加显著的问题解决能力,产生有意义的结果。数据的不完整直接影响算法准确性,因此,提高人工智能的应用水平,大规模、高质量的数据积累必不可少。这意味着人工智能在传媒业的发展水平与媒体机构的数据化程度密切相关,需要整个传媒行业乃至全社会达到一定的数据化水平,构建及维护海量内容的数据库,形成较大规模的数据支撑系统。
媒体机构在内容生产、用户服务的过程中会产生海量的新闻素材数据及用户行为数据,但大量的数据资源并不能直接用于人工智能的算法训练。对于人工智能来说,大部分是对于实际业务毫无意义的“脏数据”(Dirty data),必须要经过“清洗”,发现并纠正数据文件中可识别的错误,才能应用于算法训练。
“人工智能时代的媒体变革与发展”课题组调查数据显示,59.5%的受访者认为,面对人工智能的挑战,要高度重视内容数据化。目前,国内不少媒体已在这方面展开积极尝试,但海量的新闻稿、历史图片、视频数据等数据资源,需要事先进行“数据清洗”(Data cleaning)以及标框工作,才能生成高质量的信息化数据,而数据的清洗整理、加注标引、入库管理需要大量的人力及财力物力支撑。因此,对于大多数媒体而言,从“数字化”时代进入“数据化”时代,还有很长的路要走,媒体机构在布局人工智能战略之初,就必须注意到数据的重要性,着力构建完备的数据库、打造处理庞大数据系统的能力。
算法技术在新闻业的应用,无疑具有很大实用价值。当前,推荐算法是国内外大多数新闻APP 和社交媒体平台使用的主流,提升了新闻生产个性化和新闻推送准确率,带来优质用户体验,也拓展移动新闻资讯平台的渠道价值,改变着产业格局。然而,个性化推荐技术的深度介入与算法过滤,在将人从复杂的信息传播活动中解放出来的同时,也在一步步弱化传统媒体“把关人”的作用。曾经是编辑记者综合“想让你知道的”和“你可能想知道的”去筛选编排信息,如今,随着算法分发机制广泛应用,算法新闻平台上的日活量越来越大,许多媒体机构的新闻生产和分发模式严重依赖新媒体平台对用户相关数据的采集,通过机器学习,抓取和分析用户的年龄、性别、职业、文化水平、收入水平等个人信息,以及阅读时的接触时长、接触频率、接触动机等行为信息,实现对用户的精准画像,筛选推送“你想知道”的信息。
智能推荐基于用户精准画像筛选推送用户喜欢的内容,虽然内容符合个人偏好,却往往不是对客观世界真实完整的描述。这就使得用户陷入长期接收同质化信息的环境之中,不愿或难以获得多元化的信息,导致“信息窄化”,形成“信息孤岛”。长此以往,对整个社会而言,在智能生产、智能排序和智能推荐影响下,会减少不同声音之间的碰撞、不同观点之间的交锋,舆论趋于分化、极化、碎片化,导致形成社会共识、增强社会凝聚力的难度加大。
随着人工智能技术的发展,技术滥用误用成本不断降低,虚假文本及音视频成为“新型谣言”,并逐渐进入低成本、低技术知识阶段。基于深度学习、虚拟现实等的换脸技术、语音合成技术、视频生成技术大大发展,大量难辨真伪的信息出现。调查结果显示,半数以上(54.5%)受访者认为,假新闻的识别难度加大,是影响人工智能发展的重要问题。传统假新闻尚可通过多种渠道验证真伪,但在人工智能技术“黑箱化”趋势下,信息来源和真伪的判断难度加大。
“眼见为实”在几乎以假乱真的换脸技术面前变得不可靠,公众很容易认为换脸、变声后的虚假内容是真实的,从而造成谣言传播、误解产生、冲突加剧。2017年,美国社交网站Reddit开发的可以视频换脸的“深伪(Deep fake)”技术可以对被模仿者的面部建模,将一个人的脸嫁接到另一个人的身体上,来合成天衣无缝的伪造视频,利用这一技术,普通人经过简单的学习也能制作出真假难辨的换脸视频。在国内,2019年9月,一款名为“ZAO逢脸造戏”的应用软件将换脸技术的使用门槛大大降低,用户只需下载安装App,上传一张照片,就可以在视频模板中一键“换脸”,便捷地得到以任何人为主角的小视频。同时,“虚假视频+虚假音频”的融合对于目前的音视频鉴定技术也将是更大的考验。
基于广泛数据分析的人工智能技术大大增加了公民隐私受侵犯的风险,公共数据的开放能够促进内容生产与传播的便捷性,却也导致个人隐私信息得不到保障。2018年3月,美国社交巨头“脸书”(Facebook)爆发用户数据泄露事件,引发全球对信息安全的关注。由于人为操作,超5000万用户的资料数据被非法用于大数据心理分析,甚至被使用到政治活动中。“一切被记录,一切被分析”的数据化时代,在相关技术和设备支持下,数据的采集范围日渐广泛,采集方式日渐隐蔽,个人行为数据被实时采集储存,数据记录功能可以将个人的身份信息、行为信息、位置信息甚至信仰、观念、情感与社交关系等隐私信息永久记录、保存和呈现,对个人信息的非法使用和采集,对数据来源缺乏安全有效保护,易于造成隐私泄露,出现信息安全问题。
课题组问卷调查结果显示,半数受访者认为隐私保护难度加大,已成为人工智能在传媒业运用中存在的重要问题。在媒体智能化发展进程中,用户在与媒介接触的过程中生成了海量数据,在基于用户个人资料、行为数据提供更精准更优质服务的同时,保障数据安全、尊重用户隐私十分重要,必须时刻关注在保护用户数据方面是否存在漏洞,加强用户隐私保护,落实相应的数据安全策略。