王震
近年来,互联网技术快速发展,信息传播渠道不断丰富。然而,“人人拥有麦克风”的时代,信息传播门槛不断降低,也为谣言、虚假新闻插上了翅膀。如何通过技术手段实现快速、准确地识别虚假信息,让信息安全臻于“智”善?人民网“人机协作”内容风控提供了解决方案——在基础的内容审核上进一步升级,初步实现“智能鉴谣”。在当下海量信息场景的实际需求下,单纯依靠传统的人工审核机制,已經难以实现识别谣言效率最大化。而将人工审核的经验与人工智能、大数据相结合,打造“人机协作”的智能识谣平台,应用到新闻生产、内容风控等实际场景,不仅能够极大提高内容生产和审核的效率和准确性,更可以依托大数据深入研判分析,为内容企业提供决策参考、为平台优化提供引导作用。
“新闻识谣”融入采编过程,生成“可信度指数”
由人民网、内容传播认知国家重点实验室、中科睿鉴合作研发的“睿鉴AI识谣”系统,将人机结合的创新内容风控技术用于辅助提升新闻生产、内容审核等场景的工作效率。基于多模态检测、多层次表示、多角度判断,该系统能够自动发现可疑线索并进行认证,从而及时“揪出”可信度不高的信息。同时,基于数据驱动方法,系统能够不断挖掘出不同类别谣言的特性,实现对各种谣言的自动识别。
在“睿鉴AI识谣”系统中,打开一条新闻,能够自动生成一份AI识别报告,内容包括新闻热度、发展趋势、用户画像等,同时基于大数据、AI分析生成新闻的可信度指数。“睿鉴AI识谣”仅需1分钟就能对疑似谣言事件发出预警。目前,该系统已经应用在人民网的内容审核和新闻生产中。通过将“睿鉴AI识谣”智能接口融入采编后台,编辑即可通过系统随时获知指定新闻的可信度指数。
2020年底,人民网-中科睿鉴新闻可信度识别支撑系统成功入选国家新闻出版署“中国报业深度融合发展创新案例”,其核心技术“开放环境下数字伪造内容检测关键技术与服务平台建设”获得了2020年北京市科学技术进步奖一等奖。
此外,由人民日报社主管、人民网承建的内容传播认知国家重点实验室亦在内容风控领域取得研究进展。实验室利用自然语言处理、大数据和人工智能技术,开展了“涉政论述知识图谱”研究工作,参照《人民日报》的标准表述,开发完成智能审校辅助系统(暂名“智小助”),以满足规范表述及内容审校的需求。该系统可对表述内容进行四个层级的规范情况提示,包括规范表述、过期表述、错误表述、成语和用户自定义关键词等,辅助内容创作者、审核人员进行内容创作和把关。
“风控大脑”概念落地,“人机协作”成内容风控首选
打击网络谣言是保障互联网信息安全的重点,而其他隐藏于互联网上的内容问题同样不可忽视。在全媒体时代,无论是主流传媒平台还是商业平台,无论是自媒体还是普通网友,人人都可发布信息,这就给了一些别有用心者可乘之机。不良信息潜藏在海量信息中侵蚀着舆论,同网络谣言一样,威胁着网络安全、社会安全和国家意识形态安全。
如果说人工经验决定了内容风控的高度,那么技术就决定了内容风控的效率。在这样的背景下,“人机协作”模式成为内容风控的首选。它可以极大程度地减轻越到基层越难控的问题,更加适应海量内容和多变场景,适应有害内容组织性和对抗性增强的新特点、适应虚假内容隐蔽性增强的问题。
上述提到的“睿鉴AI识谣”系统,是人民网“人机协作型”内容风控系统的一部分。作为互联网内容风控的“旗舰”,人民网十年来深耕内容风控业务,在全国拥有四大审核基地,团队规模近千人。2019年,人民网首次提出人机协作型的“风控大脑”概念,旨在建设以人工智能技术为核心引擎,构建对海量全媒体数据的高通量感知、智能理解、深度挖掘、安全预警和全息展示的风控平台。
“内容风控大脑”的技术建设已基本完成,并初步形成了面向全网的内容风控能力,可对海量互联网内容如文本、图片、音频、视频等进行智能采集、智能理解和深度挖掘,并已对外提供服务。“内容风控大脑”的互动、感知、推理等核心模块均已投入使用。互动层实现了对境内外网站、APP、隐匿网络的数据采集,以及网络流量数据的实时还原;感知层完成了超过10000类的实体和场景识别算法;推理层采用多模态多标签技术,实现了高语义级别的推理能力。同时,“内容风控大脑”的全部技术组件都已完成国产化平台的移植,研发使用全国产化CPU、GPU的计算设备,实测性能超过国外主流产品。感知和推理算法在昇腾算力上实现了远超业界主流水平的处理速度,为未来大规模应用提供了低成本计算基础。
对外应用方面,“内容风控大脑”以SaaS等形式提供数据和计算服务,已经为政府、运营商提供从技术能力输出到专项服务的多种支持,并已为数百家互联网企业提供风控服务。接下来,将继续增加境内外的覆盖,逐步扩大“内容风控大脑”对社会平台的数据开放和技术输出,大规模拓展针对互联网企业的智能风控服务,并以技术、培训等形式为内容风控行业提供技术支撑。
探索“人工+AI”风控场景应用和跨领域融合
2020年,人社部增设“互联网信息审核员”的新职业,教育部也将“互联网内容风控”证书纳入“1+X”证书制度试点。一系列的动作显示,内容安全工作已成为维护网络安全工作中一项长期而重要的任务,是各行各业必须重视的重点工作之一。人民网信息技术有限公司总经理辛瑞佳表示,接下来将依托国家重点实验室和中科院自动化所的先进技术,不断创新“风控大脑”研究成果,在以下两个重点方面探索内容风控的新应用路径。
一是探索面向商业平台的内容巡查产品。随着信息技术发展,互联网内容体量呈现指数级增长。不少商业网站、公众号、APP、小程序等存在信息无力管理的问题,许多违法、不良内容进入公众视野,破坏网络生态。在信息激增与人力资源有限的背景下,开发具有“小、快、灵”特色、能够适合企业情况的风控系统至关重要。人民网“人机智能巡查”产品就是以此为场景的最新创新成果,包含日常内容巡查、节点预警、舆情分析、行业风险案例分析、综合研判报告五大功能,通过“监督视角”巡查方式,实现“一键接入、整体管控、贴合业务、有效防范”的智能化内容风险控制。同时,针对审核、巡查等手段发现的问题,结合舆情、政策层面信息,依托专业分析能力,对问题进行全维度研判,形成内容安全诊断报告,帮助企业系统性了解内容风险,并助力实现运营与风控相平衡。
二是积极探索跨领域合作,助力基层治理。人民网同济南网警试点打造了“枫桥式智慧社区平台”。一方面,通过不断深化以大数据智慧化应用为核心的新警务建设,及时发现社区网民的敏感信息、负面言论、案件事件和邻里纠纷,进而化解矛盾;另一方面,开发适合该地特点的智能巡查系统,如同现实中的维护辖区内治安秩序的巡警一样,智能巡查系统是维护网络信息安全的重要技术手段,它可以模拟实现“多人浏览平台内容”的场景,对移动应用APP和网站中的漏审内容、违法违规信息、恶意篡改行为、动态广告等进行自动采集、内容比对和违规巡查,极大程度节省人力成本、扩大巡查范围、降低内容安全风险。
互联网内容风控是一个庞大的、不断演进的管理体系。人民网为此做了具有开放性和包容性特征的前期探索性设计,未来将进一步在联动地方、联动媒体、联动互联网平台方面加大力度,推进风控服务长效管理,探索出一套方便高效的合作模式,建立一个行之有效的互联网安全共享共治机制。
作者单位 人民网经济民生部
【编辑:陈琦】