吴家庆 曾贤杰
摘要:大数据时代,大数据不仅在帮助打造智慧政府、激发内需增量、变革商业模式、打破社会结构的“马赛克化”方面起到了重要作用,而且对意识形态领域也产生了一系列革命性影响。西方国家利用其在大数据方面的技术优势,对外进行意识形态渗透。为维护国家数据主权和意识形态安全,必须实施好国家大数据工程。
关键词:大数据;大数据工程;意识形态安全
一、大数据对意识形态领域产生革命性影响
马克思在很早的时候便注意到了科学技术同意识形态之间的密切关系。他在《资本论》中论述了自然科学通过技术与人的社会生活、特别是精神生活的内在联系,认为:“技术会揭示人对自然的能动关系,人的生活的直接生产过程,以及人的社会生活条件和由此产生的精神观念的直接生产过程,”根据马克思主义的观点,虽然科学技术本身不属于意识形态范畴,可是科学技术的发展对意识形态的变化具有深刻影响。大数据不仅是指体量巨大、结构复杂、类型多样、高速变化、真实质差的数据集合,而且也是一种现代技术,其对意识形态领域产生了一系列革命f生影响。
1.大数据技术成为把握受众思想动态的重要手段
近年来,伴随着互联网、物联网、三网融合、云计算等IT技术与数字电子技术、无线技术及光纤通信技术等通信技术的快速发展,数据呈“井喷”状态,这其中就包含着大量反映受众思想动态的数据。意识形态工作者运用数据采集技术全方位大纵深地获取源于不同信息载体的反映受众思想动态的数据,运用数据存储技术,将类型多样、结构复杂的数据转换为单一的或是便于处理的结构,运用数据清洗技术对内容残缺、重复冗余、过时失效以及带有随机噪声、孤立噪声等问题的数据进行清洗,运用数据分析技术对清洗后的可信赖数据进行关联分析,在此基础上建立反映受众思想动态的模型,进而达成对受众思想动态的准确认知和把握。很明显,大数据技术成为了意识形态工作者把握受众思想动态的手段。
2.大数据思维改变了意识形态传统决策模式
大数据不仅是指体量巨大、类型多样、高速变化的复杂数据集合,而且也是一种全新的思维方式。大数据思维可以被理解是一种在汇聚整合数据、分析处理数据的基础上进行决策的思维,是一种基于客观事实而少凭借主观经验进行决策的思维模式。意识形态传统决策模式是指意识形态工作者依靠自己的价值观念、思想方法、学识才能、经验教训等,在对以往进行概括总结及对未来开展综合分析的基础上,展开决策活动的思维模式。科学决策并不绝对排斥经验,但决策的“个人权威性”与“个人经验性”相结合,往往可能导致决策的局限性和狭隘性,发生决策失误。意识形态工作者在大数据思维的指引下,深入挖掘反映受众思想动态的数据,对其进行关联分析,在此基础上制订意识形态工作方案,这有助于提高意识形态工作方案的科学性和可行性,提升意识形态工作效度,增强意识形态治理能力。显而易见,大数据思维将在一定程度上形成对意识形态传统决策模式的替代。由此,大数据思维改变了意识形态传统决策模式。
3.大数据标准影响意识形态宣传部门的权威
可以说,大数据的使用是一把双刃剑,一方面为科学研究、教育治理等方面带来了重大机遇,另一方面对社会其他领域带来了严峻挑战。比如,大数据使用存在泄露隐私的隐患;“大数据的异构性、规模、及时性、复杂性和隐私问题从各个环节阻碍了数据价值的创造。”尤其值得注意的是,数据标准(数据搜集标准、数据计算标准、数据分析标准等)的不一致,直接导致了数据结论的不一甚至迥异。当前,由于数据的采集标准不同、分析标准相异、计算标准有别,导致社交媒体、智库、互联网公司等发布的数据分析报告同意识形态宣传部门所发布的结论相去甚远,甚至相悖。这在一定程度上造成意识形态领域噪音不断、余音不绝,消解了“权威”与“元叙事”,影响到了意识形态宣传部门的权威。
4.大数据处理将增加意识形态工作部门的工作成本
大数据时代,各种信息载体每天都会产生大量结构复杂、体量巨大、时效性强的反映受众思想动态的数据,对这些数据进行挖掘和存储等是把握受众思想动态的重要前提。但是,传统的数据挖掘、数据存储技术难以处理大量结构复杂、体量巨大、时效性强的反映受众思想动态的数据。具体而言:在数据存储方面,“传统的数据库追求高度的数据一致性和容错性,缺乏较强的拓展性和较好的系统可用性,不能有效存储视频、音频等非结构化和半结构化的数据。目前,数据存储能力的增长远远赶不上数据的增长,设计最合理的分层存储架构成为信息系统的关键”。在数据挖掘方面,“从数据库的观点看,挖掘算法的有效性和可伸缩性是实现数据挖掘的关键,而现有的算法往往适合常驻内存的小数据集,大型数据库中的数据可能无法同时导入内存,随着数据规模的不断增大,算法的效率逐渐成为数据分析流程的瓶颈。要想彻底改变被动局面,需要对现有架构、组织体系、资源配置和权力结构进行重组。”为此,应当对已有的数据技术进行升级。毋庸置疑,升级数据存储技术、数据挖掘技术等,是一项复杂的系统性工作,需要意识形态工作部门投入资金、制定科学合理政策等。这将在一定程度上增加意识形态工作部门的工作成本。
5.大数据治理将为维护自媒体空间的意识形态安全创造条件
大数据时代,具有平民化与大众化特征的自媒体,改变了固有的信息生产模式,重塑了信息生产主体,变革了信息生产中的精英主义传统,激发了大众压抑已久的创造欲望。大众化的话语形态因此而大量生成,在一定程度上消解了“权威”与“元叙事”,造成了自媒体空间主流与非主流观点并存,红色、黑色、黄色信息同在,正面报道与负面谣言同台竞技。这在较大程度上挤压了主流意识形态的传播空间,削弱了主流意识形态话语的辐射力,“同时也消解了主流话语的公信力。”毫无疑问,自媒体空间的话语治理首先应当是法律治理,但与现实公共空间不同的是,自媒体空间是话语与技术相融合的空间,所以,有必要运用大数据技术开展自媒体空间的话语治理。通过大数据采集技术对自媒体空间的话语进行大规模实证采集,运用大数据分析技术分析并揭示自媒体空间话语方式多层面特征,在此基础上构建自媒体空间话语监测数据库,开发自媒体空间话语监测预警平台,进而为规范自媒体空间的话语传播,提升自媒体空间的话语传播质量,维护自媒体空间的意识形态安全创造条件。
二、大数据成为西方国家进行意识形态渗透的重要工具
鉴于大数据对意识形态领域所产生的一系列革命性影响,西方国家非常重视大数据的发展,研发出了许多先进的大数据技术。一方面运用先进的大数据技术维护本国意识形态安全,另一方面利用其在大数据方面的技术优势,对外进行意识形态渗透。为确保上述目标得到切实贯彻执行,西方国家从宏观战略层面制定战略规划,指引大数据发展进程,从微观政策层面建立保障体系,确保战略目标得以落地。
1.制定战略规划,指引大数据发展进程
以美国为首的西方发达国家非常重视大数据的作用,通过制定战略规划,指引大数据发展进程。2011年总统科技顾问委员会提出建议,认为大数据具有重要战略意义,但联邦政府在大数据相关技术方面的投入不足。作为回应,美国白宫科学和技术政策办公室(OS.TP)建立了大数据高级监督组以协调和扩大政府对该领域的投资,并牵头编制了《大数据研究与发展计划》(以下简称《计划》)。2012年3月29日,《计划》正式对外发布,标志着美国率先将大数据上升为国家战略。再如澳大利亚,2012年10月,澳大利亚政府发布《澳大利亚公共服务信息与通信技术战略2012-2015》,强调应增强政府机构的数据分析能力从而实现更好的服务传递和更科学的决策,并将制定一份大数据战略作为战略执行计划之一。2013年2月,澳大利亚政府信息管理办公室(AGIMO)成立了跨部门工作组——“大数据工作组”,启动了《公共服务大数据战略》(以下简称《战略》)制定工作,并于2013年8月正式对外发布。
2.建立保障体系,确保战略目标得以落地
为确保大数据战略得以顺利实施,西方发达国家建立了一系列保障体系。一是技术支撑:美国高校和研究机构专注于大数据理论研究,对关键性技术进行前沿性研究,在数据存储、数据分析、数据安全等方面研发出了大量实用技术。二是资金保障:“法国政府宣布将在2013年投入1150万欧元,用于7个大数据市场研发项目,旨在通过试点探索,促进法国大数据发展。”2012年3月,美国政府启动了2亿美元的注资计划,意在提升从大量数据中“沙里淘金”能力。三是人才支持:美国《大数据研究与发展计划》的一个重要目标是扩大从事大数据技术开发和应用的人员数量。通过国家科学基金会,鼓励研究性大学设立跨学科的学位项目,为培养下一代数据科学家和工程师做准备,并设立培训基金支持对大学生进行相关技术培训,召集各个学科的研究。此外,美国的一些大学通过设置大数据相关专业,培养大数据人才。四是政策扶持:(1)数据共享政策:2010年12月,美国联邦政府宣布“云优先”政策,规定所有新建的政府信息系统必须优先考虑云平台。应用云平台为实现政府部门间共享数据提供了便利,因此,“云优先”政策的实质便是数据共享政策。“法国制定了公共数据开放和共享路线图,其核心内容为:更广泛便捷开放公共数据,促进创新性再利用,为数据开放共享创造文化氛围并改进现有法规框架等。”(2)数据开放政策:2009年1月,奥巴马总统签署了《开放透明政府备忘录》,自此,美国联邦政府开始向公众大量开放公共数据,并把许多数据公布在中央信息交换库——Data.gov网站上,便于民众查阅;加拿大实施了开放地理空间数据政策;2013年5月9日,奥巴马总统签署开放数据政策(Open Data Policy);法国制定了Open Data Proxi.ma Mobile政策。(3)数据安全政策:澳大利亚政府于2012年7月发布了《信息安全管理指导方针:整合性信息的管理》为海量数据整合中所涉及的安全风险提供了最佳管理实践指导@。“欧盟也一直非常重视公民隐私权的保护,欧盟的数据保护指令实行于1995年,当时互联网的使用并不普遍。但目前为止,27个成员国对该法令的认知各不相同,因此在推行过程中产生了很大分歧。2012年1月,欧盟委员会提出全面改革1995年的数据保护指令,以加强网络隐私权利的保护和促进欧洲的数字经济。”
有了促进大数据发展的顶层设计及保障体系,西方国家得以将大数据技术成功地运用到意识形态领域。一方面,西方国家的意识形态工作者运用数据分析技术自动分析出本国信息载体所蕴含的意见倾向,从而达成对本国受众思想动态的认知和把握,在此基础上制定相应的工作内容与议程,维护本国意识形态安全。另一方面,西方国家利用其在大数据方面的技术优势,对包括中国在内的社会主义国家进行意识形态渗透,企图通过这种柔性方式,达到不战而屈人之兵的目的,维护其所谓的国家利益。大数据在西方国家对华进行意识形态渗透方面的具体应用如下:首先,运用数据采集技术收集反映我国舆情动态的数据。2013年6月,CIA前雇员爱德华·斯诺登透过美国《华盛顿邮报》与英国《卫报》向外界披露,美国国家安全局(NSA)在2007年启动了代号为“棱镜”(PRISM)的绝密电子监听计划。在此项计划中,NSA要求美国电信巨头威瑞森公司(Vefizon)每天上交数百万用户的通话记录。联邦调查局与NSA均可直接进入微软、雅虎、苹果、Palmlk、谷歌、AOL等网络巨头的服务器,通过数据传感体系、智能识别体系等数据采集技术对中国的聊天记录、文件、视频、音频等上网信息中的反映我国受众思想动态的数据进行识别、定位和接入,进而获取了大量关于我国舆情动态的数据。其次,运用数据分析技术对涉舆数据进行分析。运用在线数据分析、预测性数据分析、数据网络挖掘、特异群组挖掘、图挖掘等数据分析技术,对涉舆数据进行关联分析,进而精准地把握我国的舆情动态。第三,通过数据载体对华进行意识形态渗透。在把握我国舆情动态的基础上,打造契合我国受众接受心理的话语体系,通过手机、社交平台(skype、YouTube、Facebook)、数据库等数据载体对华进行意识形态渗透。第四,改进意识形态渗透方式。运用情感语义分析、网络行为分析等数据分析技术,自动分析出我国受众对西方主流意识形态的认同情况,以进一步改进意识形态渗透方式,增强对华进行意识形态渗透的实效性。
西方国家之所以将大数据作为对华进行意识形态渗透的重要手段,是出于以下两方面的考虑:一是大数据的运用减少了意识形态渗透阻力。大数据时代来临前,西方国家以教育文化交流和培训项目为载体,以经济、技术交往为途径,以广播、电台为平台对华进行意识形态渗透。这种赤裸裸的渗透方式,在一定程度上引发了我国受众的反感,意识形态渗透的有效性因此而大打折扣,达不到其预设的渗透目标。通过运用大数据技术,广泛搜集反映我国受众心理需求、接受特点、思维习惯的数据,达成对我国受众接收特点的准确认知,通过打造契合我国受众接受心理的话语体系,进行意识形态渗透,从而在很大程度上减少了对华进行意识形态渗透的阻力,增强了意识形态渗透的实效性。二是西方国家具有先进的大数据预测技术,为把握对华进行意识形态渗透的对象和时机创造了条件。牛津大学教授维克托·迈尔一舍恩伯格指出:“大数据的核心就是预测,不是要教机器像人一样思考,而是要把数学计算运用到海量数据上,来预测事情发生的可能性”。正因为如此,以美国为首的西方国家斥巨资研发出了许多先进的大数据预测技术。在全方位、大纵深地获取反映我国受众思想动态的数据的基础上,充分运用大数据预测技术,精准预测出我国舆情的发展趋势,进而准确把握意识形态渗透的对象和时机。
三、实施国家大数据工程是维护国家意识形态安全的重要保障
大数据时代,实施国家大数据工程是应对我国意识形态安全面临的系列挑战的重要举措。
1.从宏观战略层面把握实施国家大数据工程的原则
一是普惠原则。要加快网络基础设施建设步伐,让信息时代的缺席者有机会通过网络平台表情达意,为意识形态工作者挖掘“沉没的声音”,科学制订网络意识形态工作方案创造条件。二是技术优先原则。无论是从类型多样、体量巨大的数据集中抽取出正确、真实的涉舆数据,还是对涉舆数据进行存储和关联分析,对关键、敏感涉舆数据进行保护,都离不开先进的大数据技术做支撑。因此,必须秉持技术优先原则,着力开发包括数据存储技术、数据分析处理技术、数据可视化技术在内的大数据技术。三是共享原则。掌握反映受众情感、诉求的数据或涉舆数据是开展维护意识形态安全工作的前提。当前,涉舆数据广泛分布于政府、企业、社会组织等部门,由于上述部门缺乏统一的数据存储标准,各部门所拥有的涉舆数据无法实现兼容,这加大了涉舆数据的采集成本。因此,必须坚持共享原则,建立部门间数据资源统筹管理与共享复用制度,进而突破数据共享瓶颈,形成部门间数据共享共用格局。四是法制保障原则。采集反映受众情感、诉求的数据(涉舆数据)是科学制订网络意识形态工作方案,维护国家意识形态安全的前提。在涉舆数据的采集过程中,不可避免地要涉及个人隐私遭泄露的问题,更糟糕的是,某些权力机构或掌握实权的人物可能为了一己之私而泄露、滥用涉舆数据。一旦一些关键、敏感的涉舆数据或数据分析结论遭泄露或被滥用,很可能会造成国家意识形态安全工作处于守势。为此,必须建立和完善相关法律、法规,从法制层面严格规范涉舆数据的采集和利用,为保障国家意识形态安全奠定坚实的法制基石。五是人才支撑原则。大数据从概念到实践,从技术到应用,从战略到执行的过程中,需要大量既谙熟大数据理论又具有数据搜集、存储、分析及应用经验的数据人才。六是内外结合原则。对我国而言,实施好国家大数据工程还有很长的路要走,还有很多的技术难关有待突破。因此,不妨学习并借鉴西方发达国家在这方面的成功经验与具体做法。当然,在借鉴西方发达国家的经验时,必须立足于中国的实际,灵活借鉴,防止生搬硬套。
2.从具体技术层面完善国家大数据工程的内涵
国家大数据工程,毋庸置疑,是一项复杂的系统性工程,是由多个子系统构成的。因此,要实施好国家大数据工程,就必须丰富各子系统的内涵,充实各子系统的内容。
一是实施数据搜集工程,提高意识形态工作方案准确性。还有不少人因为各方面原因无法通过网络平台表情达意。诚如徐继华所言,在科技迅猛发展的今天,还有很大一部分的农民和城市底层居民,他们因为各种原因而成为信息时代的缺席者,无法在网络世界表达意见和诉求。尽管他们的意愿也会由一些网民代为表达,但毕竟只是“被代表”。为此,有必要通过实施数据搜集工程,搜集反映这部分人群思想动态的数据,以提升意识形态工作方案的准确性。(1)实施信息惠民工程。国家每年应从网络基础设施投资中,拨付固定比例的资金用于农村现代网络基础设施建设,为广大农村地区的人民群众通过网络平台表达情感、反映诉求提供便利,为意识形态工作者搜集反映该群体思想动态的数据提供渠道。(2)大力发展农村现代信息教育。依靠国家财政可以建设一大批农村现代网络基础设施,但是,如果做为信息时代缺席者的农民不懂得如何使用这些网络基础设施,意识形态工作者同样无法获取反映他们的思想与情感方面的数据。为此,应当大力发展农村现代信息教育,提升广大农民的信息素养。
二是实施数据清洗工程,确保数据真实可靠。有必要通过实施数据清洗工程,清洗掉虚假的涉舆数据,以确保意识形态工作方案的准确性。(1)着力发展数据清洗技术。数据清洗技术(Data Cleaning)可以起到改进数据质量的作用,被广泛运用于数据仓库及决策支持系统中,其主要任务是从原始数据集中剔除内容残缺、重复冗余、过时失效及错误的数据。目前,已有一些用于数据清洗的ETL工具提供了功能强大的软件平台,利用它们可以从类型多样的数据源中对数据进行抽取、转换后加载至数据仓库中。因此,应当采取有力举措大力发展数据清洗技术,借助数据清洗技术,从原始的涉舆数据集中清洗掉虚假、错误与重复数据,抽取出正确、有效的涉舆数据,为开展涉舆数据分析,精准研判舆情创造条件。(2)公开数据。在确保关键、机密、敏感的涉舆数据不外泄的前提下,通过移动通信客户端、信息可视化等渠道公开涉舆数据,接受公众监督,让虚假数据无遁隐之处,为从涉舆数据集中清洗掉虚假涉舆数据创造条件。(3)监测数据。积极培育社会化的第三方数据监测机构,使其参与到涉舆数据的管理、控制与评估工作中,以剔除虚假涉舆数据,确保涉舆数据的真实可靠。
三是实施数据分析工程,提升意识形态工作者的数据分析能力。对数据的误解,会动摇意识形态工作者对意识形态工作紧迫性的认识。为此,我们应该通过实施数据分析工程,提高意识形态工作者对大数据的解读能力,增强意识形态工作者对意识形态工作紧迫性的认识。(1)培训意识形态工作者。借助高校平台,并积极发挥社会教育与培训机构的作用,对意识形态工作者进行数据科学和数据工程等学科培训,增强意识形态工作者的数据分析能力。(2)开发数据分析技术。发挥高校、科研院所、政府、社会组织等的作用,着力研发一大批先进的大数据分析技术。比如,情感语义分析、探索性数据分析、定性数据分析、离线数据分析、在线数据分析等,以帮助提高广大意识形态工作者的数据分析能力。(3)做好聘用大数据分析师工作。积极聘请既谙熟大数据理论又有大数据分析实践经验的数据分析师服务于意识形态工作部门,帮助提升我国意识形态工作者的数据分析能力。
四是实施强化数据意识工程,增强意识形态工作者的数据意识。伴随着各种随身设备、物联网和云计算、云存储等技术的发展,人和物的所有轨迹都可以被记录,数据因此被大量生产出来。海量数据从一个方面反映出了我国民众的思想、情感,为有效开展意识形态工作提供了条件。可是,长期以来一些意识形态工作者习惯于拍脑袋决策,没有养成基于数据进行决策的思维习惯。因此,有必要实施强化数据意识工程,以提高我国意识形态工作者的数据意识,提升意识形态工作方案的可行性。(1)做好大数据知识普及工作。应通过报纸、电视、新媒体等渠道,以社会大众普遍可以接受的方式,开展大数据知识普及工作,帮助意识形态工作者提高对其的认知水平,促使他们逐步养成基于数据分析做出决策的思维习惯。(2)建立和完善意识形态数据库。建立与完善意识形态数据库是一项复杂的系统性工作,其中之一就是需要意识形态工作者及时把握舆情导向。这就会促使意识形态工作者经常去密切关注各种涉舆数据,进而在一定程度上增强意识形态工作者的数据意识。(3)对意识形态工作者进行培训。一方面通过集中学习、讲座与开会等方式对意识形态工作者进行大数据理论培训,以提高意识形态工作者对大数据理论的认识水平;另一方面聘请数据专家在数据搜集、数据存储、数据分析、数据安全等方面给意识形态工作者以具体指导,从实践层面强化其对大数据的认知。
五是实施“大数据+意识形态对外传播”工程,增强主流意识形态对外传播的实效性。长期以来,我国在主流意识形态的对外传播过程中,把想说的、要说的当成国外受众想了解的东西,忽视了对国外受众的心理需求、接受特点、思维习惯等的分析研究。这种状况的形成,固然受社会知识精英陶醉于拥有知识特权、语言优先权,自视为教育者,将国外受众当成接收器看待这一主观原因的影响,但社会知识精英不了解国外受众的接受特点、思维习惯这一客观原因也不容忽视。为此,有必要通过实施“大数据+意识形态对外传播”工程,把握国外受众的接受特点和思维习惯,在此基础上制订意识形态对外传播方案,进而增强主流意识形态对外传播的有效性。具体而言:首先,收集数据。从国家级新闻网站的海外新闻数据中心,驻外使领馆的社交媒体平台,阿里巴巴、腾讯、新浪等互联网公司所存储的大量数据中抽取出反映国外受众心理需求、接受特点、思维习惯的数据,并对这些数据进行转换与装载,即ETL过程,按照规则、相关性与分类要素,合并至数据仓库中。其次,分析数据。运用定性数据分析技术、预测性数据分析技术等对上述数据进行关联分析,进而达成对国外受众的接受特点、思维习惯等的准确认知。第三,以有效方式传播主流意识形态。在知晓国外受众的接受特点、思维习惯等的基础上,打造契合其接受特点的话语体系,开展主流意识形态的对外传播工作。第四,改进主流意识形态传播方式。运用情感语义分析、网络行为分析等数据分析技术,自动分析出国外受众对我国主流意识形态的认同情况,在此基础上有针对性地改进主流意识形态的对外传播方式,增强我国主流意识形态对外传播的实效性。
(责任编校:文一)