利用机器学习技术防范网络意识形态风险的理论模型与逻辑进路

2024-08-07 00:00秦博徐浩铭
党政研究 2024年4期

〔摘要〕新媒介时代网络日益发达,对我国意识形态的安全和治理带来了巨大挑战。现代机器学习技术特别是那些基于深度神经网络的模型,能够从大量非结构化文本数据中提取意义,应用范围已经从简单的图像识别扩展到了复杂的视频内容分析,从而为理解和预测公众行为及其背后的意识形态提供了更为深入的视角。由于网络传播路径预测依赖信息转发预测,后者体现了用户的个体行为差异,因而我们提出基于机器学习的网络意识形态风险识别的行为传播模型。该系统由信息采集层、数据分析层、预警发布层构成,可以提高对网络意识形态发展演变状况的实时感知能力,使相关主体能及时完成对网络意识形态风险的评估和决策,推动解决网络意识形态风险的智能化处置。

〔关键词〕机器学习;网络空间;意识形态;数据分析;风险管理

〔中图分类号〕D64 〔文献标识码〕A 〔文章编号〕2095-8048-(2024)04-0004-10

一、研究背景

新媒介时代对我国意识形态的安全和治理带来了前所未有的挑战。新媒介通过技术革新显著提高了互动性,特别是互联网和手机,极大地促进了信息交流与分享,但也伴随着诸多负面影响。为刷存在感,个别媒体开始追求流量和关注度,不惜牺牲社会责任,导致内容质量下降,对社会思想和价值观造成巨大危害。同时,西方错误社会思潮通过智能技术进行隐秘渗透,加上新兴智能技术的不确定性、资本与人工智能的结合,以及网络意识形态供给侧在“拟态环境”中的结构性失衡等问题,导致网络意识形态领域的潜在风险逐渐显现。“聚类算法”对信息的多重过滤与分化,削弱了主流意识形态的话语权威,逐步削弱了主流媒体的议程设置权和议题选择权。〔1〕

在新媒介语境中,网络舆论的形态不断加剧意识形态的风险和斗争,新媒介和互联网作为控制信息和争夺国际话语权的关键工具,已在国际政治中占据了核心地位。话语权和软实力已经超越传统的硬实力,成为国家间竞争的关键武器,网络空间因此成为舆论斗争和意识形态交锋的主要战场。〔2〕网络平台为公民表达利益和情感提供了匿名化、便捷及公开化的渠道,但其传播过程也汇集并放大了各种政治思想和意识形态,各种社会力量在此交汇,形成尖锐的对立和激烈的斗争。〔3〕

当前我国在网络意识形态斗争中面临的劣势主要源于新媒介技术的局限性。作为国际互联网的主导者和信息流通的掌控者,美国对全球网络技术规则拥有绝对影响力,具有凌驾于全球的网络技术霸权。〔4〕ICANN负责全球互联网域名和地址、IP地址分配及域名解析原则的管理,而我国尚未进入国际互联网核心圈层,严重依赖国外资源。这暴露了我国互联网数据的安全风险,增加了被境外势力利用进行负面宣传和舆论攻击的可能,削弱了我国在国际上的意识形态话语权。

人工智能和大数据技术的迅猛发展,使传统人工分析方法无法应对信息量的巨大增长。AI技术的应用,使得对文本、音频和视频等多种形式的信息内容进行自动化分析成为可能,极大提升了效率和准确性。因此,开发和应用高效的AI分析工具,对于准确把握和应对网络意识形态的挑战至关重要。

随着计算能力的显著提升和数据科学的不断进步,机器学习特别是深度学习技术在解析复杂社会现象中的应用已经步入一个新的阶段。在社会科学领域,这些技术不仅改变了数据处理的方法,而且重新定义了研究的边界和可能性。针对网络意识形态的分析,现代机器学习技术特别是那些基于深度神经网络的模型,如卷积神经网络(CNN)和循环神经网络(RNN),已经成为自动处理和分析大规模网络数据集的有力工具。自然语言处理(NLP)领域的最新进展尤为突出。Transformers架构的模型如BERT和GPT-4在处理语言理解和生成方面展示了前所未有的能力,能够从大量非结构化文本数据中提取意义,识别隐含的意识形态倾向和情感色彩。这些模型的应用极大地增强了研究者对社交媒体言论、新闻报道和公共讨论中意识形态动态的洞察力。进一步地,图像和视频识别技术也在意识形态的视觉表达分析中起到了关键作用。通过利用先进的图像处理算法,研究人员能够自动识别和分类含有政治象征和意识形态元素的视觉材料。这些技术的应用范围已经从简单的图像识别扩展到了复杂的视频内容分析,如使用深度学习进行场景重建、人物活动识别以及情感态度的解析,从而为理解和预测公众行为及其背后的意识形态提供了更为深入的视角。

此外,跨模态分析,即结合文本、音频和视频数据的综合研究,也正在开辟意识形态研究的新领域。这种方法允许研究人员获得更全面的数据视角,更准确地描绘和预测社会舆论的变化。例如,混合模型可以在分析政治演讲的视频时,同时处理演讲者的语言、声音的调性和背景中的视觉符号,为解释和预测政治事件的影响提供了多维度的分析框架。机器学习和人工智能技术的这些应用不仅展示了其在社会科学研究中的潜力,而且对公共政策制定和国家治理结构的优化提供了实质性的支持。在全球意识形态斗争日益复杂的今天,这些技术的进一步发展和应用将对维护社会稳定、促进健康的公共讨论以及防止意识形态操纵具有决定性的影响。

二、既往研究的优点与不足

纵观国内外研究的多年发展,意识形态治理与新媒介网络舆情相关研究在理论与实践上都取得了大量成果,围绕公共危机预警这一目标对网络舆情分析已经做了大量工作,取得了一定的成果,为本文的研究提供了一定基础。近五年来,利用机器学习技术防范涉外网络舆情和意识形态风险的研究日益增多,涵盖了多个方面,包括但不限于网络安全、恶意软件检测、入侵检测系统、对抗性机器学习以及深度学习技术的应用。

就国内研究来看,成果主要分为三类。第一类是人工智能在思想政治教育中的应用。刘箫锋等指出生成式人工智能对高校思政教育带来的挑战,并探讨了其对思政教育者角色、安全隐患和信息传播等方面的影响。〔5〕蓝江讨论了ChatGPT等生成式人工智能在人文社会科学中的历史使命,并提出了应对这一挑战的路径。〔6〕袁周南则从嵌入角度分析了人工智能在思想政治教育中的背景、依据和路径,强调了构建优质大数据库和思政教育设计团队的重要性。〔7〕段虹认为深度学习能够对高校意识形态安全工作产生重要作用并促进认同感的建立。〔8〕第二类是人工智能对政党执政安全的影响。孙会岩讨论了人工智能技术对政治安全的挑战,并提出了从顶层设计、治理实践和国际合作等方面维护政党政治安全的启示。〔9〕孙会岩与唐莲英分析了国外政党在人工智能时代应对政治安全挑战的策略,强调了政党利用人工智能技术进行政治动员、内部治理和政治传播的重要性。〔10〕第三类是人工智能对意识形态安全的影响。杨爱华讨论了人工智能对社会意识形态带来的政治、法律和伦理风险,并提出了应对策略。〔11〕徐景一从劳动过程理论视角分析了算法机器与资本控制之间的关系,强调了平台资本对劳动过程的控制和资本积累的重构。〔12〕刘章仪与李钢探讨了人工智能赋能网络意识形态风险防控的背景、向度和进路,提出了构建机制、完善政策、培养人才等方面的建议。〔13〕汪青与李明则分析了人工智能时代主流意识形态话语权建设的现状和挑战,强调了强化主流引领、优化内容供给等方面的重要性。〔14〕此外,还有几篇文献探讨了深度学习对意识形态安全工作的价值和网络左翼的特点。

关于网络安全与机器学习方面,Luca Pajola et al探讨了机器学习技术在无线网络应用中的威胁及其防范措施,强调了保护敏感机器学习应用免受可能威胁的重要性。〔15〕M. Ahsan et al.则从更广泛的角度审视了机器学习在网络安全中的应用,如通过减少人工干预来提升恶意软件检测的可行性、可扩展性和有效性。通过回顾机器学习在网络安全中的应用,特别是在提高恶意软件检测能力方面,展示了机器学习相对于传统方法的优势。〔16〕在对抗性机器学习方面,Bhargav Kuchipudi et al.研究了对抗性机器学习技术如何通过欺骗机器学习模型,影响基于机器学习的机制(如电子垃圾邮件过滤器)的安全性。〔17〕Raniah和Haitham通过探讨机器学习和深度学习在识别和防止网络入侵方面的作用,凸显了这些技术相比其他入侵检测系统的优越性。〔18〕Козлова和Довгаль分析了人工智能和机器学习在网络安全中的使用,为对抗网络犯罪提供了策略和解决方案。〔19〕在具体技术应用方面,Sudhakar和Kaliyamurthie讨论了回归、聚类和分类等机器学习算法在网络安全中的应用,以保护网络安全免受威胁。〔20〕Goyal和Sharma则探讨了机器学习在网络安全中识别复杂模式和预测基于数据的威胁的能力,目标是预测、识别和防止复杂的网络安全威胁。〔21〕

此外,Giulio Zizzo et al.讨论了机器学习系统对微小扰动的脆弱性,尤其是在网络攻击检测方面的严重关切,并提出了将对抗性机器学习技术应用于网络领域以增强安全性的建议。〔22〕在恶意软件检测与预防方面,D. Nisha et al.讨论了如何利用机器学习技术预测和防范机器学习模型中的恶意软件,包括研究不同类型的攻击和实施数据清理、算法鲁棒性增强以及隐私保护技术等对策。〔23〕在入侵检测系统方面,Chenniappanadar et al.指出机器学习减少了对人类专家进行入侵检测的依赖,通过使用各种算法和特征分析信息包,提高了网络防御的检测能力。〔24〕在深度学习与网络安全方面,K. Sathya et al.探讨了深度学习技术如何与机器学习技术结合,提供保护敏感信息、数据网络和计算机免受未经授权的网络攻击的解决方案,增强了网络世界的安全性。〔25〕这些研究表明,机器学习技术在网络安全领域的应用日益广泛,尤其在检测和防范涉外网络舆情和意识形态风险方面显示出其潜力。通过利用机器学习的模式识别和预测能力,可以大大提高对网络威胁的检测速度和准确性,从而为网络安全领域带来了新的机遇和挑战。

其他涉及此话题的研究大致分为现状综述、变量分析,以及问题与对策这三类。其一,现状综述的研究往往从网络意识形态和舆情的特定类型、社会领域、平台、视角等特定方面展开综合梳理,多运用内容分析及扎根理论等方法,虽能有效分类及构建核心范畴,但却无法探究现象背后的因果机制。其二,变量分析类的研究则关注到了网络舆情与意识形态治理之间的中间变量,以及和其他研究对象之间的相关性。一些变量系统模型被建构起来,但因为网络意识形态及其舆论的话题很难获取高质量的观察型数据,导致后期的分析结果充满不确定性与风险。其三,问题与对策性的研究立意较高,多个学科均有参与,提出了诸如强顶层设计、健全监管体系、培育受众心理、利用耗散结构、培养意见领袖等多方面的现实对策,具有很强的问题导向;但也正由于参与该类研究的学科视野众多,缺乏自我反思和互动交流,重复性研究较多,尚未建筑起共通性的学术话语。

从研究内容来看,既往研究主要体现在意识形态安全的情势与策略、高校意识形态系列问题、舆情分析的意义、建立预警机制的迫切性、基于网络舆情分析的预警体系构建机制等理论性问题的探讨,但是,涉及分析操作和预警实施细节的成果并不多;在分析方法上没有形成系统的方法论,尤其是在语义分析方面进展不大导致信息采集及分析深度不够。从理论和实践的现状看,目前关于新媒介下网络意识形态和舆情分析仍缺乏成体系的研究,存在如下问题。一是缺乏深入、系统的基础理论研究。大多数研究成果只对网络意识形态与舆情的定义以及在危机管理中的作用进行浅层次的分析,缺乏对网络舆情功能和作用的深入探讨,也尚未形成系统的面向公共危机预警的舆情分析方法论。二是缺乏对网络意识形态的深层次、智能化的分析研究。目前的分析方法主要是将信息处理方法与传统领域特有的技术分析方法相结合,重采集和处理,轻分析,尽管目前已经开始研究如何借助于计算机工具实现网络舆情分析,但大部分研究主要从文本层次对网络舆情外部特征进行简单的零碎统计处理,没有深入分析网络舆情信息内容中所隐含的知识逻辑关联和舆情传播中所涉及的复杂主体关系,从而影响了网络舆情分析的效果和结果信度。三是理论思辨与实际应用之间的相对割裂依然是突出问题。学科交叉融合不足,本土化创新不够,以及系统性分析框架的缺失等在很大程度上制约着该领域研究的进一步深化。从政治学、社会学、法学等学科角度的研究多集中于宏观层面的宏大叙事,缺少实证和复杂的变量分析。公共管理学、新闻传播学及信息科学等领域研究成熟,但该类领域所建立的因果模型往往是高度理想化的,很难解释复杂的社会现实。此外,深度、广度和意义不足也是这类看似科学类型研究的短板。

在此背景下,本论文的研究通过构建基于机器学习的网络意识形态与舆情治理模型,不仅弥补了国内外相关研究在理论与实践应用之间的不足,而且提供了具体的实施框架。本论文的优势在于其综合使用先进的技术手段和严谨的理论分析,以实现更有效的意识形态管理和舆情调控。此外,研究还强调了在技术应用过程中坚持社会主义核心价值观,确保技术应用与国家的长期发展战略相符合,这不仅有助于推动技术创新,还有助于形成更加和谐的社会治理模式。

三、构建网络意识形态与舆情治理模型的理论假设

基于国内外的前期相关成果,本文将从以下部分进行模型建构。

首先是在数据收集与现状分析的阶段,本文致力于构建一个多维度、全景式的理解框架,旨在深度挖掘网络舆情和意识形态的现状以及其背后复杂的形成机制。这要求采取双轨并行的策略。一方面,通过大规模的数据搜集,捕捉和分析网络舆情的宏观图景,包括但不限于社交媒体动态、论坛讨论、新闻报道及博客评论等多种形式的表达。须运用高级的数据爬取技术和自动化工具,以确保数据的全面性和时效性。另一方面,对于选定的关键个案采取定性深入分析,透过表面现象探究网络舆情的深层次成因和动力机制,如社会事件的引发、公众情绪的波动及其对社会意识形态的长远影响。通过精细化的案例研究,揭示网络舆情形成和发展的内在逻辑,以及它们如何在不同社会、政治背景下被解读和响应。为实现该目标,不仅依赖现有的大数据资源,如政府舆情监测数据库和人民网舆情频道等,还计划引入先进的数据挖掘和分析技术,包括但不限于自然语言处理(NLP)、机器学习(ML)、情感分析和复杂网络分析等。这些技术将使我们能够从海量无结构数据中提取有价值的信息,如关键词提取、话题识别、情感倾向分析和舆情趋势预测等。这些结果的分析将进一步用于理解当前网络舆情和意识形态的现状提供支撑,而且也为后续的信息传播预测模型和策略制定提供数据基础,同时还将为政府和社会组织在舆情引导、危机管理和意识形态稳定中提供有力的决策参考,促进社会和谐与稳定发展。

其次是在信息传播预测与意识形态风险预警的关键阶段,研究的目标是开发和应用高度精确的预测模型,这些模型能深入分析并预测社交媒体和传统媒体中信息的传播模式。此任务要求我们准确把握信息在不同媒体平台上的传播方式,包括传播速度、覆盖范围、传播深度以及可能的社会影响力。因此,我们将利用先进的计算模型,如基于复杂网络分析的传播模型,并结合最新的机器学习技术,来分析大规模用户行为数据。这将使我们能够精确预测信息在特定群体中的传播路径及其对群体意识形态的潜在影响,从而构建一个动态的信息传播预测模型。进一步地,研究还通过结合社会情绪分析、舆情趋势监测和公共意见分析,旨在及时识别那些可能引发社会矛盾和冲突的信息。一旦识别出潜在的风险点,将采取一系列预防措施,包括发布权威性和稳定性信息以进行积极引导,加强舆论监控以便及时调整策略,以及启动危机干预机制以减轻潜在的负面影响。此外,还应开发一个综合的信息管理平台,整合信息传播预测模型和意识形态风险预警系统,使政策制定者、媒体监管机构和社会组织能够在必要时采取更加有针对性和有效的行动。通过系统化的方法,研究不仅旨在有效应对当前的舆情挑战,还可预见并避免潜在的社会矛盾和冲突,为社会的和谐与稳定提供坚实的信息支持。

最后是利用大数据分析热点事件和话题,从宏观角度洞察社会舆情的动态变化,识别引发广泛关注的核心议题。这一分析过程涵盖三个关键步骤。第一,通过社交媒体和网络平台检索热点事件和话题的相关文本,利用高级的数据爬取技术和自然语言处理工具,确保广泛且深入的数据收集。第二,对这些文本进行深度分析,采用高级的文本分析技术,如自然语言处理(NLP)和情感分析,抽取关键话题和事件,构建文本数据库。这不仅包括识别主题词汇和表达情绪的词汇,还涉及理解文本中的隐含意义和情感倾向,为后续的分析提供丰富的数据资源。第三,运用文本聚类技术和机器学习算法,将文本按主题分类,通过算法识别相似或重复的内容,揭示舆情的主要趋势和社会关注点。该步骤不仅帮助理解公众对不同事件的关注度,还能揭示不同社会群体之间的意见差异和共鸣点。结合文本挖掘和信息传播模型,研究对收集到的文本进行综合评估,引入媒体报道指数、用户检索指数、社交媒体互动指数等评判指标,深入分析影响社会意识形态的核心问题和社会矛盾。包括使用复杂的数据分析方法,如情感分析、趋势分析和网络分析去理解不仅是舆情的表面现象而是更深层次的社会动态和意识形态变迁。通过这种方法,不仅能够识别当前的舆论热点,还能预测未来可能出现的趋势和潜在的社会矛盾,从而为政策制定、社会治理和公共关系管理提供有力的数据支持和策略建议。此外,通过分析不同社会群体对特定事件或话题的反应,研究能够揭示潜在的社会裂痕和统一的社会力量,为缓解社会矛盾和促进社会和谐提供科学依据。

四、构建网络意识形态与舆情治理模型的方法与技术

在当今信息化社会,网络舆情的影响力愈发显著,其中潜在的意识形态风险不可忽视。为了精准掌握网络舆情动态并有效识别潜在的意识形态风险,深入研究信息传播机制显得尤为关键。信息传播研究为观测网络舆情中的意识形态风险提供了坚实的理论支撑。在社交网络中,用户通过层层转发,使信息呈现出瀑布式扩散的特征。从语义角度来看,意识形态的检测极为复杂,即便对于人类来说也是一项挑战——这不仅需要深厚的政治知识,还需具备捕捉语言使用中微妙之处的能力。由于传播路径的预测依赖于信息转发的预测,而后者体现了用户的个体差异,因此,本研究提出了一种基于行为传播模型的方法。以下内容将详细探讨该模型及其在网络舆情意识形态风险识别中的应用。

(一)构建社交网络。在社交网络G<U中,节点U代表用户,边(u,v)表示用户u与v之间的关注关系,用户转发来自关注节点的信息,由此构成的网络构成了整体用户关系网络的子网。在信息r、用户网络G<U、历史转发消息集合M确定的情况下,就可以建立模型,预测某一用户转发信息的概率。用户转发行为分转发和不转发两种,是典型的二分类。因此,本研究采用逻辑回归(logistic regression)模型进行预测。具体如下:

p=(yu=(1|x))=11+exp(-ω(1+Fu(r,G)))

在模型中Fu为影响用户u转发行为的特征集;表示用户u的转发行为,的值为1或0,1表示是,0表示否。是权值向量,用户u利用N条历史文本数据,形成训练集。{r,用户u形成N个观测值,{y1u,y2u,…,i是转发数。N个观测值的似然函数为

1(ω)=∏Ni=1(1-p(yu=(1|x)))(1-yiu)p(yu=(1|x))yiu

当dl(ω)dω时求得的ω值即为要求的权值。

利用收集的数据训练信息预测的逻辑回归模型,建立基于用户行为预测的网络传播模型。模型建立以后,我们需要对社交网络中热点话题进行提取。

(二)信息文本分类。本研究所采集的社交网络中的文本,具有实时性、海量性、稀疏性、多样性、高维性、不规范性、主题分布不均匀等特征。因此,研究的首要步骤是对这些信息文本进行分类。朴素贝叶斯(Native Bayes)因其稳定的数学基础和分类效率,将被应用在文本分类中。〔27〕具体步骤如下:

·设X={q1,q2,…,qm}为一个待分类项,其中q是X的一个特征属性。

·研究将要把文本分为n个集合A=|a1,a2,…,an|

·计算概率P(a,|x),P(a2|x),…,P(an|x)|

·如果有P(a,|x),max(z1|x),P(a2|x),…,P(an|x)|则P(an|x)x∈ykc,

研究通过朴素贝叶斯计算以上中的各个条件概率,具体计算步骤如下:

·基于文献研究,找到已知分类意识形态的集合作为一个训练样本集

·通过统计得到各类别下各个特征属性的条件概率:

P(q1|a1),P(q2|a1),…,P(qm|a1);P(q1|a2),P(q2|a2),…,P(qm|a2);P(q1|an),P(q2|an),…,P(qm|an)

·如果各个特征的属性是独立的,根据贝叶斯定理可以得出:

P(qi|x)=P(x|ai)P(ai)P(x)

因为P(x)对应所有的意识形态分类,所以是一个常数,对P(ai|x)最大化只要对P(x|ai)P(ai)最大化,因为各特征属性是条件独立的,可以得出:

P(x|ai)P(ai)=P(x1|ai)P(x2|ai)…P(xm|ai)=P(ai)∏mi=1P(xj|ai)

最后采用P(z|ai)P(ai)的最大项作为最终的网络意识形态分类的类别。

(三)利用递归神经网络捕捉句法和语义。递归神经网络(Recursive neural networks, RNN)是一种捕捉句法和语义组合的机器学习模型,在各种句子级NLP任务上取得了最先进的性能,包括情感分析、复述检测和解析。这部分将运用一个用于偏见检测的有监督的RNN模型,且与以前的类似项目中在训练程序和初始化方面有差异。由于大多数意识形态偏见只有在句子树的较高层次上才变得可识别,所以主要依靠词级分布统计的模型说是不可取的。通过考虑语言的层次性质,RNN可以对语义组合进行建模,即一个短语的意义是该短语内的词的意义和结合这些词的句法的组合原则。虽然语义构成并不普遍适用(例如,讽刺和成语),但大多数语言都遵循这一原则。标准RNN模型背后的基本思想是,句子中的每个单词w都与基于解析树的向量表示xw∈Rd相关联,这些单词形成短语p。短语的每个也有一个与单词向量相同维度的关联向量xw∈Rd。这些短语向量应该表示由单个单词组成的短语的含义。随着短语本身合并为完整的句子,基础向量表示被训练以保留句子的完整含义。难度在于描述向量如何组合形成完整的表达。如果两个词wa和wb合并形成短语p,则假设短语级向量为

xp=f(WL·xa+WR·xb+b1)(1)

其中WL和WR是树中所有节点共享的d×d左右组合矩阵,b1是偏置项,f是非线性激活函数,如tanh。词级向量xa和xb来自于d × V维词嵌入矩阵We,其中V是词汇量的大小。学习表征是重要的,因为这些表征可以在给定的标记数据中区分出政治极性。如果这个向量空间的一个元素xd表示一个带有历史虚无主义倾向的句子,那么它的向量应该与保守主义倾向句子的向量xr不同。

有监督的RNN通过应用回归来实现这一区别,该回归将节点的向量xp作为输入,并产生预测值y^p。这是一个softmax层

p=softmax(Wcat·xp+b2),

其中softmax函数为

softmax(q)=exp q∑kj=1exp qj

Wcat是一个k × d矩阵,用于具有k维标签的数据集。我们希望softmax层的预测与我们的注释数据相匹配;分类预测和注释之间的差异可以通过交叉熵损失来衡量。所以可以继续优化模型参数,使语料库中所有句子的交叉熵损失最小。单个句子的交叉熵损失是该句子中真实标签yi的总和。

(s)=∑kp=1yp*log(p)

这就在所有句子中归纳出了一个监督目标函数:对训练集中归一化的节点数N的所有节点损失的正则化求和,

C=1N∑Ni(predi)+λ2||θ||2

我们使用带参数平均的L-BFGS (Hashimoto et al.,2013)来优化模型参数θ=(WL, WR, Wcat, We, b1, b2)。如下面的公式所示,目标的梯度是通过结构反向传播来计算的(Goller and Kuchler, 1996),

Cθ=1N∑Ni(i)θ+λθ

(四)网络意识形态风险预警。基于机器学习的网络意识形态预警系统是由信息采集层、数据分析层、预警发布层的三层式结构组成,如图1所示。

基于机器学习的网络意识形态风险预警的分析平台采用机器学习分析技术处理,将大数据与云计算相结合,建立专家模型库,多维度、全方位地分析挖掘海量的网络舆情意识形态风险数据,并通过云平台发布预警信息,培养和提高网络意识形态演变发展的实时感知,使相关主体迅速有效地完成网络意识形态风险的评价和决策,推动解决网络意识形态风险的智能化处置。

五、总结:优势与展望

网络舆论带来的意识形态危机对我国的综合性影响是复杂而充满不确定性的复合型科学问题,蕴藏各类复杂因素,同时又受到难以确定的各种内外环境影响,给风险预测造成了很大困难,依靠单一学科和视角难以解决。随着数据源的增长和方法的改进,爆发节点、话题发现和危机识别等会变得更加可被预测。本文充分利用大数据收集和机器学习技术等计算分析领域的最新成果,在底层数据捕捉非线性关系,达到更高水平的样本外准确度,力争实现不用于拟合模型的事件预测,比现有的基于语义的词汇判断的计算模型以及词袋模型TF-IDF算法等方法更具优势。

在研究方法方面本文有两个突破。其一,本研究把机器学习技术引入到网络意识形态预警系统中。建立社交网络信息传播模型,利用社交网络数据分析用户转发行为,实现对用户行为的预测,有助于实现意识形态风险的及早实时发现和及时化解,维护社会稳定。其二,运用整体性、交融性思路,采用结构—功能分析方法,将网络舆情意识形态治理作为集舆情监测、研判、预警、回应、引导、宣传、治理等为一体的完整体系,着重探讨预警及防范措施。

此外,本文还做出了平衡经验研究与人工智能的学术尝试。预测在数据分析技术与人工智能科技高速发展的当下变得容易实现了,但人类社会和政治生态的或然性、复杂性、自反性(self-reference)与不可重复性,为准确预测更加长期的时间和更宏观的局面带来了巨大挑战。网络舆情瞬息万变,数据失真度高,因此某些前提假设存在多种可能选择;意识形态与人的情感等深层思维密切相关,建立在高度理想化层面上的因果模型难以反应人的意识形态的丰富内涵,准行为主义的变量分析有脱离复杂社会现实的危险。本研究尽可能在大数据层面展开方法应用,通过海量样本直接发现和展示网络舆情中的意识形态规律,避免控制变量来检验关联可能造成的失真,也避免个案研究可能造成的失联,带来更有说服力的证据链。就理论意义而言,本研究将为网络意识形态及其治理提供增量性研究成果。随着网络化程度加深,社会的网络化与网络的社会化已经是必然。对作为社会空间的网络中的舆情与意识形态展开专题研究,可为进一步理解网络的社会作用和功能,网络社会中的多元主体行为方式、动机,以及网络影响现实社会的渠道、程度等问题提供有意义的分析进路和理论参考,并为网络舆情协同治理提供可靠的解决路径。在国家治理体系和治理能力现代化的相关研究中,网络舆情与意识形态治理逐渐成为显学,同时也弥补了网络舆情研究的不足。就应用价值而言,本研究跳出以往宏观的、概括性的对策研究模式,更关注实际问题的解决,在新媒介背景下,分析网络舆情和意识形态,研究社会矛盾的形成和化解,为有关部门分析研判意识形态风险、解决社会矛盾提供借鉴。

总的来说,在综合层面,本研究有利于将不同学科的研究进行交叉与整合,学科的交叉点和融合处往往可以生长出创新的知识,成为理论创新的新突破口,也将为实践操作提供新的方法技术。在理论层面,本文着力于探索网络舆情意识形态,对其进行风险评估,以便更好制定应急对策,尤其是对一般性、底层性规律进行摸索,旨在预测未来可能的发展趋势,为类似的意识形态管理与舆情疏导提供一定的理论模型和依据。在实践层面,本文充分利用人工智能、大数据等技术为应用基础,提升我国意识形态安全的防卫能力。研究获得的网络舆情及其治理的相关成果,可用来提供先导性服务,便于政府理解、介入、引导、干预,以及预测网络突发事件,并根据主体和要素多元化特征和舆情演化阶段性特点,充分把握,准确研判,实现有效应对和积极治理。

〔参考文献〕

〔1〕洪晓楠,刘媛媛.人工智能时代网络意识形态安全建设的发展契机、潜在风险与调适进路〔J〕.思想教育研究,2022,(10).

〔2〕闻言.为全面建设社会主义现代化国家、全面推进中华民族伟大复兴凝聚强大精神力量——学习《习近平关于社会主义精神文明建设论述摘编》〔N〕.人民日报,2023-01-16.

〔3〕李俊卿,张泽一.互联网背景下我国意识形态表征、安全风险及防范〔J〕.思想理论教育导刊,2016,(10).

〔4〕杜雁芸.科学技术与国家安全〔M〕.北京:社会科学文献出版社,2016:152.

〔5〕刘箫锋,张锦霖.生成式人工智能冲击高校思政教育的三维探赜〔J〕.国家教育行政学院学报,2023,(12).

〔6〕蓝江.生成式人工智能与人文社会科学的历史使命——从ChatGPT智能革命谈起〔J〕.思想理论教育,2023,(4).

〔7〕袁周南.人工智能嵌入思想政治教育:背景、依据与路径〔J〕思想理论教育,2020,(8).

〔8〕段虹,徐苗苗.深度学习对意识形态安全工作的重要价值〔J〕.马克思主义与现实,2019,(4).

〔9〕孙会岩.人工智能技术视野下党的政治安全:机遇、风险与治理〔J〕.毛泽东邓小平理论研究,2019,(9).

〔10〕孙会岩,唐莲英.人工智能时代国外政党的执政安全:挑战、调适及启示〔J〕.南京政治学院学报,2018,(4).

〔11〕杨爱华.人工智能中的意识形态风险与应对〔J〕.求索,2021,(1).

〔12〕徐景一.算法机器与资本控制:劳动过程理论视域下的平台劳资关系与资本积累〔J〕.社会主义研究,2022,(3).

〔13〕刘章仪,李钢.人工智能赋能网络意识形态风险防控:背景、向度与进路〔J〕.当代传播,2022,(3).

〔14〕汪青,李明.从疏离到弥合:人工智能时代主流意识形态话语权建设〔J〕.当代传播,2022,(4).

〔15〕Luca Pajola, Luca Pasa, and Mauro Conti. 2019. Threat is in the Air: Machine Learning for Wireless Network Applications. In Proceedings of the ACM Workshop on Wireless Security and Machine Learning (WiseML 2019). Association for Computing Machinery, New York, NY, USA, 16–21.

〔16〕Ahsan, Mostofa, Kendall E. Nygard, Rahul Gomes, Md Minhaz Chowdhury, Nafiz Rifat and Jayden F Connolly. “Cybersecurity Threats and Their Mitigation Approaches Using Machine Learning - A Review.” J. Cybersecur. Priv. 2 (2022): 527-555.

〔17〕Bhargav Kuchipudi, Ravi Teja Nannapaneni, and Qi Liao. 2020. Adversarial machine learning for spam filters. In Proceedings of the 15th International Conference on Availability, Reliability and Security (ARES '20). Association for Computing Machinery, New York, NY, USA, Article 38, 1–6.

〔18〕Ali, Raniah & Salman, Haitham. (2023). Subject review: Cyber security using machine learning and deep learning techniques. Global Journal of Engineering and Technology Advances. 16. 212-219.

〔19〕Козлова, Н.Ш & Довгаль, В.А. (2023). Analysis of the use of artificial intelligence and machine learning in cybersecurity. Bulletin of Adyghe State University. Series: Natural-Mathematical and Technical Sciences. 2023. Iss. 3 (326), pp65-72.

〔20〕M. Sudhakar and K. P. Kaliyamurthie, “Machine Learning Algorithms and Approaches used in Cybersecurity,” 2022 IEEE 3rd Global Conference for Advancement in Technology (GCAT), Bangalore, India, 2022, pp. 1-5.

〔21〕Y. Goyal and A. Sharma, “A Semantic Approach for Cyber Threat Prediction Using Machine Learning,” 2019 3rd International Conference on Computing Methodologies and Communication (ICCMC), Erode, India, 2019, pp. 435-438.

〔22〕Giulio Zizzo, Chris Hankin, Sergio Maffeis, and Kevin Jones. 2019. Adversarial Machine Learning Beyond the Image Domain. In Proceedings of the 56th Annual Design Automation Conference 2019 (DAC '19). Association for Computing Machinery, New York, NY, USA, Article 176, 1–4.

〔23〕D. Nisha, E. Sivaraman and P. B. Honnavalli, “Predicting and Preventing Malware in Machine Learning Model,” 2019 10th International Conference on Computing, Communication and Networking Technologies (ICCCNT), Kanpur, India, 2019, pp. 1-7.

〔24〕Chenniappanadar, S. K. ., Gnanamurthy, S. ., Sakthivelu, V. K. ., & Kaliappan, V. K. . (2022). A Supervised Machine Learning Based Intrusion Detection Model for Detecting Cyber-Attacks Against Computer System. International Journal of Communication Networks and Information Security (IJCNIS), 14(3), 16–25.

〔25〕K. Sathya, J. Premalatha and S. Suwathika, “Reinforcing Cyber World Security with Deep Learning Approaches,” 2020 International Conference on Communication and Signal Processing (ICCSP), Chennai, India, 2020, pp. 0766-0769.

【责任编辑:刘彦武】