张烁
人工智能审核尚处在探索和尝试之中,有些功能还不完全智能。目前,人工智能对数字出版内容的审核仍存在亟待解决的地方,是“文图音视”形态领域内的通病。2017年4月,美国《Nature》杂志发表的一项研究成果表明,智能算法的原理是对人类所书写的文本内容进行分析处理和深度学习,那自然就会带有人类的习惯,难免会像人类那样存在带有偏见的刻板印象[1],因而算法就会产生一些歧视、错误等问题,比如“较高的误报率和漏检率”。由于一些词语存在多语义的情况,一句话相邻词语之间的链接容易造成误报,以及不法分子还可以通过一些文字变异手段轻松绕开关键词匹配。
1.误报误伤现象时有发生,应减少算法歧视
目前市场上有多种计算机校对软件,其中包括模式较为简单的校对模块,更有功能更加强大的专业校对软件。由于计算机智能审核的算法是基于对数据库的深度学习,那么它的学习样本必然是海量庞大的,为了尽最大程度用上所学,智能审核的算法会万分“谨慎”,有着较高的灵敏度就会导致误伤一些正确内容。
案例一:除去文字误伤,图片内容被误伤更为频繁。2015 年,谷歌研究并发布了一款自动图像标记软件,用以识别分类和审核,在识别一对黑人夫妇的图像时,由于肤色与“黑猩猩”特征相似,将其标记为“黑猩猩”,并将黑人照片自动上传[2],其实,许多其他公司研发的自动标记系统也都存在诸如此类的问题。这些程序形成的“低级错误”虽成为人们的玩笑谈资,但也警醒着人们,在实际应用中这种技术不成熟所导致的“低级错误”可能会形成更为严重的歧视结果。[3]
案例二:YouTube用户Jamison Go收到了一份平台的违规处理通知,平台方直接删除了他发布的机器人比赛格斗视频,算法检测到该视频涉及对虐待动物或迫使动物打斗。而视频中的真实情况却是机器人乔普正在和另一个机器人格斗。而实际上YouTube本身并没有关于禁止上传机器人格斗视频的规定,此番操作或许是因为算法误将该视频标注了虐待动物的词条,经审核后系统自动将其删除。在接到投诉后,YouTube人工团队重新进行了人工检验并恢复了原先被误删的视频。因此以后在类似审核案件中,应该由人工智能审核进行初审,有必要的情况下由人工进行再次筛查。
2.对于审核遗漏,改善算法技术
正所谓“道高一尺魔高一丈”,用户在熟悉了平台的智能审核原理后,有些图谋不轨的用户会借此打擦边球,但是阿里云计算公司在世界杯期间利用自然语言处理技术能够智能地分析出文字的语言情感,防止文本变异而产生的审核遗漏。
中华文化历史悠久,汉语的发展历程源远流长、博大精深,但是对古籍文献的审核是目前智能校对软件需要一同努力攻克的难题,有时还是需要专业的人工审核介入。
3.智能审核应注重社会效益,尽快建立人工智能算法审查机制
人工智能的飞速发展必然带来大量法律法规的立、改、废,甚至会引起伦理、道德层面的一些价值冲突。[4]在美国,17岁少女遭到残忍杀害的血腥照片疯传网络,部分网友表示看后产生恶心、心理阴影等不良反应,Facebook平台的人工智能审核力度遭到网友的强烈质疑。此次不良影响究竟是人工智能审核系统的失灵遗漏还是为了热度而故意保留,暂时无法考证,因而更加需要建立人工智能算法审查机制,在高质量完成审核工作的同时也要注重社会影响保障社会效益。
正如尼尔·波兹曼在《娱乐至死》中评价电视时提出的“每一种思想的新工具的诞生都会达到某种平衡,有得必有失,虽然这种平衡并不是绝对的;我们在或毁或誉时要十分小心,因为未来的结果往往是出人意料的。”[5]
也就是说如果人工智能的审核过滤机制原本是为用户屏蔽掉一些不良的极端信息,从而营造清爽的网络环境,但如果把自杀、他杀等残暴行为的发布内容或网络求助信息通过算法屏蔽掉后,平台方未作出后续行为从而掩盖了事实,妨碍案件的发现及办案,就与审核的根本目的大相径庭了。由于缺乏有效的自动化技术来识别这些内容,所有这些不可信和不恰当的内容都需要依赖于专业人员的知识储备、个人评判来识别,并核对事件的关注度和可信度从而甄别定夺是否告知于警方。[6]因此在人工智能审核恶意内容的技术尚不完善的前提下,建议人工介入处理。人工智能应该做到互联互通,当标记出有自杀等有危险性的想法时,应该帮忙联系急救人员。
2020年3月起《网络信息内容生态治理规定》开始实行,笔者认为人工智能审核技术很适合对网络暴力等网络不良行为进行追踪监测,以及加强对可疑用户的审核,从内容生产者和传播者的角度控制劣质内容的产生及传播。尽快出台算法的伦理道德规范,从而划分算法伦理道德法律的界限。
4.建议将区块链技术应用到智能审核中
区块链与人工智能的关系就好比计算机和互联网:前者是数据的存储方式,后者则是由数据产生的应用。区块链的真实就意味着更多优质训练数据,在应用人工智能技术的同时,用区块链保证流程的透明和灵活;人工智能在算法上的突破,也能帮助区块链提升数据的传输效率。数字出版产品的版权审核,如果将区块链技术与人工智能结合,将促进“版权审核”更加智能化、规范化。
5.探寻机器和人的新关系
自从人工智能进入大众视野以来,“机器是否会取代人类?人工智能给人员就业带来何种压力”的言论甚嚣尘上。但是在出版界,机器和人的关系一直都是人机协作、机器辅佐人工。在出版的审校工作中,编辑人员虽不如机器那般依托于庞大的数据库而拥有海量的知识储备,甚至工作效率远不及智能审核,但是在人工智能的協助下,编辑的功能正在逐步转变——编辑的工作将会向掌控全局、调整软件参数、最终审查等工作上发展。[7]同时,编辑不能产生惰性而过于信赖机器,仍然要发挥好把关人的作用。编辑要紧密观察机器的动态,及时对智能审核系统进行查漏补缺,完善其深度学习的数据库,让审核更加智能高效。
结语
在这个万物皆可AI的时代,人工智能的确对我们的工作起到了提质增效的作用,无论它技术进步得多么迅速和完善,人工智能审核都不能完全取代人工,智能和人工之间的关系永远都是智能服务于人工,机器辅佐人类,减轻人类的工作量。我们不能过于依赖它,否则人们便成了傀儡,要做AI的主人而不是奴隶。善于将AI灵活运用,使其成为我们的工具,探索出一条人机协作的高效之路。