□文│李 钢 苏 卓
得益于移动互联网的飞速发展,如今人们已不再局限于通过传统的文字、语音和图片等形式获取各种信息,而更青睐于简单、直观、表现生动的视频影像方式。中国互联网络信息中心(CNNIC)发布的第48次《中国互联网络发展状况统计报告》显示,我国网络视频用户规模不断增加,截止到2021年上半年,已达到9.44亿,占网民总数的93.4%,是仅次于即时通信的第二大互联网应用服务。[1]短视频已经成为网络信息传播的最主要渠道之一。
英国社会学家、传媒研究专家约翰·汤普森认为,“在以大众传播的发展为特点的社会里,意识形态分析应当集中于关注大众传播的技术媒体所传输的象征形式”。[2]短视频的兴起和流行,使得它所包含的一帧帧画面成为隐喻意识形态的新形式新象征。因此,当前的意识形态风险防范工作的重点亟待转向短视频领域。关注短视频领域潜在的意识形态隐患,积极探索应用新科技手段,增强在这一新领域的正向价值引导能力和负面价值消解能力,是社会面临的刻不容缓的重大挑战。
视觉识别就是在这一背景下被广泛发掘并应用于视频传播领域,尤其是短视频传播领域的人工智能技术。视觉识别能够通过实时获取短视频画面数据,分析其中可能蕴含的相关信息,研判应当采取的相应措施。随着技术的迭代创新,这种能力正在迅速提升。视觉识别这种独特的智能工具,如若运用得当,对于提高短视频领域网络意识形态风险防范水平将发挥显著的积极作用。
所谓视觉识别,主要是指对图像或视频进行智能识别,即以计算机视觉、模式识别、机器学习等人工智能技术为基础,“使机器自动实现人类视觉系统的功能,包括图像或视频的获取、处理、分析和理解等诸多任务”。[3]视觉识别不是某种单一技术的展现,而是众多智能技术协同合作、共同发挥作用的过程,它通常是由一系列复杂程序和多领域技术结合构成。
视觉识别的运行原理和程序主要有以下几个方面:首先是在识别前进行视觉模式的挖掘和选择。视觉模式是指“在大规模图像数据中存在的可重复的、结构化的、对应于某些物件部位的视觉模式单元,这些视觉模式单元相比于基于统计的低层特征来说,更接近于语义表示并且有较强的鲁棒性”。[4]目前通常运用的已挖掘的视觉模式主要包括“重复图像、基于全图统计的类别模式、基于局部关键点的视觉单词组、基于局部结构的视觉模式,以及基于隐层表示的视觉模式”。[5]接着是在选择和确定视觉模式后,读取视觉画面,定位和抓取要识别和处理的图像和视频资料。然后实施行之有效的视觉画面和图像的识别、处理和分析,理解图像或视频画面的模式类型以及要表达的寓意,为之后判别视频和图像是否符合相关要求和规定提供参考。视觉识别的主要对象和目标是人脸识别、物体识别、场景识别、属性识别、精细目标识别等。[6]
当前,视觉识别领域的一个重要发展趋势是探索使用深度学习(deep learning)的方法取代人工特征+机器学习的方法,并取得了积极成果。深度学习是机器学习中一个新的更高级的发展方向和领域,它最终的目的是想让机器能够像人一样具有分析问题解决问题的学习能力,能够识别文字、图像、声音和视频等数据。深度学习在语音和图像识别方面取得的效果,远远超过先前相关技术。“所以,‘深度模型’是手段,‘特征学习’是目的”。[7]借助于深度学习的方法,机器有望识别和理解更复杂、更高层、更多样的模式,从而发挥出比以往任何时候都更加卓越的性能表现。
短视频是近年来在移动互联网上兴起的一种全新的视觉传播样态,主要依靠移动智能终端为载体,通过社交网络平台为基础和链接,播放时长在数秒到数分钟之间的视频内容产品。近年来,短视频平台如雨后春笋般涌现,这些平台都高度重视人工智能技术的研发、创新,尤其是视觉识别技术,并探索将它们应用于短视频信息传播中,加速平台的发展,提高平台的市场占比。
视觉识别可以帮助短视频平台维护网络环境,助力信息分发,但目前更多还是局限于平台的运营和管理层面。由于短视频的超大人气和活跃的互动特性,短视频领域逐渐演变为意识形态风险的新策源地和意识形态斗争的新角力场。用好视觉识别,将会对短视频领域意识形态风险防范具有重要意义。
意识形态风险防范,关乎旗帜,关乎道路,关乎国家政治安全,是一场要迎难而上、守土尽责、敢于亮剑的攻坚战。防范意识形态领域不断上升的风险,一方面要想方设法抑制反主流意识形态社会思潮的渗透,另一方面要积极提升主流意识形态传播的广度、深度和效度,切实增强网络舆论引导能力。就短视频领域意识形态风险防范而言,视觉识别的价值主要在于:自动化捕捉反主流信息、自主式洞悉舆论热点、分众化明晰用户关注。
反主流意识形态短视频信息,意指悖逆主流意识形态和社会主义核心价值观的短视频信息。短视频的出现,一方面,带给人们原有媒介所无法比拟的视觉冲击和直观感受,提升了人们对信息进行“译码”的体验感和享受度;但另一方面,它却又比原有媒介更加容易成为反主流意识形态的藏身之所。这是因为“视觉图像指向的往往并不是图像本身,而是图像背后的隐喻,视觉图像往往有着复杂的意识形态建构”。[8]短视频的图像画面由于动态且多样,其意识形态隐喻较之先前的图像来说更为深层,人们往往是在不知不觉中就受其影响。这种隐匿于短视频中的意识形态威胁更为深远。借助于视觉识别开展自动化的智能“把关”、使反主流短视频信息无处遁形,成为新形势下维护意识形态安全的新思路、新手段。
首先,通过视觉识别技术,挖掘违背主流意识形态的图像特征与模式,归纳、整合、聚类形成数量巨大的负面信息特征库、模式库。其次,利用视觉识别技术,对网络上流通和传播的短视频给予严格筛查,对于存在问题的关涉意识形态的短视频,主动锁定并下架,或交由人工审核人员对其进行后续处理。最后,通过“捕捉”经验的不断积累,机器可以掌握反主流短视频信息的新形态、新样式,持续更新特征库、模式库,不断提升识别的准确度。由此,视觉识别可以成为一种短视频领域的智能“把关者”,与人工审核人员配合,以人机力量的协同来更多地抵御反主流意识形态的侵袭和渗透,使网络意识形态安全有了第一道“天然屏障”。
舆论代表着公众的共同关注,反映着公众的切身诉求,涉及着公众的现实利益,舆论的热点往往是大部分公众近期关注和争论的社会焦点,短视频领域的舆论也是如此。不过,与一般舆论不同的是,短视频舆论的热点更为难以洞悉和把握。这是因为,一方面,由于短视频可随时随地生产、加工、上传、扩散,导致各种主题、各种观点的短视频内容鱼龙混杂,令人眼花缭乱,很难大浪淘沙地直接分析出舆论热点所在;另一方面,由于短视频的媒介特性,很多舆论倾向往往不能够直接呈现,而是隐喻于画面之中,以内涵或恶搞的方式表达,这种潜舆论与显舆论交织使得舆论热点更为难以把握。
尽管如此,洞悉舆论热点仍然是我们做好意识形态风险防范工作的基本前提。马克思曾指出:“群众对这样那样的目的究竟‘关怀’到什么程度,这些目的‘唤起了’群众多少‘热情’。‘思想’一旦离开‘利益’,就一定会使自己出丑。”[9]眀者因时而变,知者随事而制。倘若不能及时、准确地把握舆论热点,那么就等同于无法洞察公众的关注、争论、疑惑和利益所在,也就无法有效地开展议题设置,及时地回应公众诉求,纾解公众情绪,解答公众疑虑,凝聚公众力量。如此一来,舆论引导工作就如同“盲人摸象”,主流意识形态便存在传播力、引导力、影响力、公信力丧失的风险。
视觉识别技术有望成为新形势下洞悉短视频领域舆论热点的一台智能“探照灯”。利用视觉识别技术,可以全天候自主浏览平台发布和传播的短视频,通过重点对新上架的视频、转发频率高的视频、点赞频率高的视频的画面特征进行识别、统计、分析,有望“探”出每日甚至是每个时段的高频画面所在,从而为研判舆论热点提供直接帮助。虽然机器识别在开始阶段、在新应用领域可能会出现偏差以及“看走眼”等情况,但是在研发人员的帮助下,通过反复学习,机器便能不断提升其识别和判断的准确性,以此为增强主流意识形态的议题设置力、现实回应力提供有力赋能。
在移动互联时代,分众传播超越了大众传播,跃居为信息传播的主要形式之一。除了一些共同关注的舆论热点、焦点以外,人们总是倾向于在一定圈子内获取和发出信息,圈子与圈子之间往往存在隔膜。在短视频领域,这种趋势和特征更为明显。短视频内容极为丰富,使得用户总是基于不同话题、不同场景来选取自身需要的短视频。这些话题和场景构筑了不同的圈子,塑造了不同的用户群体。当前,短视频平台已基本实现将视觉识别作用于分析不同群体用户的关注点,从而助力算法推荐模式的实施。除了赋能信息分发外,视觉识别的这项作用也将对主流内容的生产大有裨益。
短视频领域的意识形态风险防范,并非只需要“防御”和回应,而同样需要以主动、开放、自信的心态,积极传播主流意识形态,参与到信息市场的竞争之中,以正能量压制负能量,赢得网民的自觉认同。这就需要契合当下分众传播的规律和趋势,着力于不同的垂直细分领域,开展主流意识形态定制化的内容生产。“在当前个性化、分众化消费的时代,如果产品还停留在不问目标的普遍‘撒网’、目标对象不明晰的水平上,那该产品的价值实现相对就会比较低”。[10]为了切实有效地制作不同类型的弘扬主流意识形态的短视频内容,就必须分众化地获取短视频用户的关注数据,基于数据导向开展内容制作。当前,视觉识别有机会成为为主流意识形态定制化内容生产提供导向的短视频“前线侦察员”。
具体来说,借助于视觉识别,通过识别用户的短视频浏览画面,分析和统计画面图像所反映出的短视频元素,明晰不同群体用户各自的高频关注、主要关注,从而为后续的主流意识形态定制化内容生产提供依据。这种模式如若建立,则能够“使政治信息在形式上具有了差异性,而这种差异性则与不同微小目标的既有认知和态度相契合,从而达到短期的预期效果”。[11]当然,由于当前的视觉识别应用仍处于弱人工智能阶段,且短视频用户的关注点复杂多样,现有的识别数据可能对于主流内容定制化生产的参考价值还比较有限。但是,可以通过对智能设备的不断升级以及机器本身的持续深度学习来提升其效果。
基于视觉识别在短视频领域的应用现状,需要短视频平台、网信部门、主流媒体等多方共同努力,携手合作,守正创新,主动作为,从技术的“再升级”、对接的“加速度”和人员的“再培育”等方面,将视觉识别所带来的赋能价值切切实实转变为赋能现实。
短视频平台基本上为高科技互联网公司所建立,这些公司本身就是视觉识别技术的研发及应用主体。只是在商业利益的驱动下,他们现阶段将视觉识别的功用和效能基本只局限于经济目的,对于党和国家的意识形态风险防范工作还助力甚微。正是因为这样,习近平总书记强调,“要坚持移动优先策略,建设好自己的移动传播平台,管好用好商业化、社会化的互联网平台”。[12]在短视频领域,同样要坚定贯彻党管媒体的原则,以党的路线方针政策为指引,引导短视频平台发展,督促短视频平台承担其在意识形态治理方面应有的责任,切实将主流意识形态贯穿于视觉识别技术研发和应用的始终。一方面,重视对平台技术研发人员的社会主义核心价值观教育。技术研发人员有理想信念,有责任担当,视觉识别技术才具有为主流意识形态服务的前提和基础。另一方面,以服务主流价值为导向不断升级现有技术。平台要尝试将《互联网视听节目服务管理规定》《网络视听节目内容审核通则》以及《网络短视频内容审核标准细则》中有关威胁社会主义网络意识形态安全的规定,转化成具体的、可量化的、可操作的视觉特征标准,并以此为依据来训练智能设备和机器开展识别。同时,平台要加快推进机器的深度学习能力的探索与构建,针对其理解力和判断力的不足加以改进,以识别更为复杂的画面和内容,从而为意识形态风险防范提供深度赋能、高效赋能。
网信部门是我国负责意识形态风险防范工作的重要机构。短视频平台应将视觉识别发现的短视频领域危险信息特征和舆论态势,及时与网信部门沟通,使网信部门能够获取第一线的情报,通过定期开展大数据的分析,总结、归纳现有的网络意识形态风险特点、态势;审视、明晰网络意识形态安全程度;研判、推断网络意识形态风险可能的蔓延和传播路径,并进行前瞻性、系统性地预防、治理,确保网络空间可管可控。
意识形态风险防范还离不开主流媒体的舆论引导。主流媒体和短视频平台二者之间实质上是求同存异、相互依赖的协作关系,维护网络空间的天朗气清是双方共同的责任和愿景。要切实发挥视觉识别对意识形态风险防范的作用,就要加快短视频平台与主流媒体的对接合作。首先,加大数据共享程度。短视频平台借助于视觉识别所获取的舆论热点数据、分众用户关注数据都是主流媒体做好舆论引导工作、创新舆论引导方式的前提和基础。其次,加深技术合作程度。通过短视频平台向主流媒体输出较为成熟的视觉识别技术,以及双方共同合作研发等方式,能够对主流媒体开发、运营自己的短视频平台,从而进一步加强短视频领域的主流意识形态传播能力。例如,人民日报社2019年成立的人民日报智慧媒体研究院就是开展这一技术合作的实践范例。通过智慧媒体研究院的设立,人民日报社与短视频头部平台开展深度合作,研发符合主流需求的视觉识别等人工智能技术,并于2019年9月成功推出自主短视频平台“人民日报+”。
落实视觉识别对短视频领域意识形态风险防范的作用,也离不开“人”的能动发挥。这里的“人”,在笔者看来,既包含短视频平台的审核管理人员,也囊括专门的意识形态工作者。
一方面,要培育一支具备人机协同能力的审核管理队伍。今后一段时间,视觉识别可预见地仍将处于弱人工智能阶段,识别功能的发挥和识别任务的开展离不开审核管理人员的辅助。也许大部分时间机器均能正常运转,高效工作,但当机器遇到新的复杂情况,导致难以立即判断,出现迟疑、“卡壳”、误判时,就需要审核管理人员把关,及时发现并介入,对存在的问题进行纠偏。这就要求平台加大力度对审核管理人员开展培训。首先,通过加强学习和教育,促使平台审核管理人员增强“四个意识”、坚定“四个自信”、做到“两个维护”,切实将正向价值引导和负面价值消解作为自身的工作职责之一。其次,通过借助技术研发人员开展技术讲授和经验分享等方式,提高平台审核管理人员的智能素养和对视觉识别的理解,从而提高与机器配合的工作效率。
另一方面,要构建一支具备人机协同能力的意识形态工作者队伍。这里的人机协同能力,不同于上述的人与机器协同识别和审核的能力,而是指在获得机器识别的数据之后快、准、狠开展舆论引导的能力。习近平总书记指出:“正能量是总要求,管得住是硬道理,现在还要加一条,用得好是真本事。”[13]意识形态工作者只有具有这种人机协同能力,用好视觉识别,发挥所识别数据的价值,才是真本事,才有真效果。当前,我们的意识形态工作者队伍亟需摒弃传统的工作习惯和模式,与时俱进,开拓创新,加大对人工智能、大数据分析的学习力度,尽快培育起基于识别数据开展议题设置的新现实回应力、基于识别数据开展定制化内容生产的新内容生产力,从而在短视频领域做大做强主流舆论。