罗 晨, 沈 浩
人工智能是一门正在蓬勃发展的新学科,1956年的达特茅斯(Dartmouth)会议被公认为是人工智能正式起源的标志(尼克,2017)。从定义上看,虽然具体的表述莫衷一是,但是基本上涵盖了“模拟人类”“系统设计”“任务应对”几个层面(McCarthy et al.,1955;Barr & Feigenbaum,1981;McCarthy,2007;Kok et al.,2002),针对人工智能技术的最新进展,有学者给出如下定义:基于大数据、算法和云计算三项技术基础,开发用于模拟、延伸和扩展人的智能的理论和方法的新技术,是制造智能机器、可学习计算程序和需要人类智慧解决问题的科学和工程(张洪忠等,2018)。
虽然人工智能旨在利用日益丰富的数据资源,发挥计算机的运算能力,结合不断更新迭代的算法来实现分析和决策,进而追求对人类思维乃至理性的无限趋近,但是从学术谱系来看,人工智能并非仅仅根植于计算机领域,而是滥觞于哲学、数学、神经科学、语言学等多元学科地带(陆汝钤,1989)。其跨学科特征不仅体现于源起,还显露在后续研究取向中,以自然语言处理下的二级概念机器翻译为例,机器翻译研究中素有两种思潮:更依赖语言学专家编撰语言转换规则的“理性主义”思潮和更依赖数学家与算法开发者编写程序从大规模数据中学习自然语言之间转换规律的“经验主义”思潮(AMiner,2018)。回顾逾60年的发展轨迹,伴随技术应用化步伐加速、近年来政策红利和大量经济资本的涌入,人工智能业已渗透至社会生活的各个环节并启迪各领域的学者对人工智能这一议题展开研究。相较于形式科学、自然科学、应用科学——这些人工智能研究的“主战场”而言,社会科学领域的相关研究虽然在数量上难以企及,但也保持着对人工智能技术发展和技术引发社会格局变迁的密切关注。有鉴于此,本研究希望结合文献计量的相关方法,对社会科学领域的人工智能研究进行图绘,具体包括:社会科学中的人工智能研究涵盖哪些领域(RQ1)、主要包含哪些研究主题(RQ2)、在知识发展过程中研究热点经历怎样的变迁(RQ3)、这些研究遵循着哪些主要的范式(RQ4)。
美国科学情报研究所(Institute for Scientific Information,ISI)编制的Web of Science(WoS)引文数据库是目前收录信息比较全面和认可度较高的数据库,且常用于科学文献分析(Chen, 2017)。本研究选择WoS核心合集中的社会科学引文索引(SSCI),以“artificial intelligence”作为主题①,限定文献类型为Article(文章)和Proceedings Paper(会议论文),语言为英文,时间跨度为所有年份②,最终获得符合条件文献共计2481篇,数据最后更新时间为2018年7月9日。
本研究引入文献计量方法(bibliometrics)作为支持。文献计量法是一种定量分析方法,以科学文献的各种外部特征作为研究对象,采用数学与统计学方法来描述、评价和预测科学技术现状与发展趋势(朱亮、孟宪学,2013),文献计量旨在分析不同科学领域的学术生产态势(Martínez et al.,2015),既可用于关注研究者或研究机构的科研影响力,又可用于探究科学研究领域的结构和知识变迁(Noyons et al.,1999;Montero-Diz et al.,2018)。针对每一项研究问题的具体方法如下。
首先,对文献的时空分布进行描述分析,分别利用文献记录中的“PY(出版年份)”字段和“C1(作者地址)”字段,③当一篇文献的作者地址包含多个国家或地区时,则分别在这些国家或地区对应的文献数量上加一;其次是研究领域分析,“SC(研究方向)”字段可以视为研究领域分布的象征(丁汉青、刘念,2017;丁汉青、吴雨蔚,2017),一篇文献往往关涉多个研究领域,因此在探讨各领域研究频数外,还需关注领域的共现,以便更深入地探寻人工智能研究的跨领域特征。
对于研究主题的探索,文献计量领域素有两种方法:以单个词语为基础的“自下而上”(bottom-up)方法,即对标题、摘要进行分词,再以词语作为变量利用聚类算法开展聚类并归纳类别特征(Peng et al.,2013;Tse et al.,2015);另一种方法主要利用关键词之间的共现,再基于共现网络进行聚类(丁汉青、曹璞,2015;Montero-Díaz et al.,2018)。人工智能研究中大量研究语汇并非单字,而是以短语或词组的形式出现,如人工智能领域的典型技术semantic search(语义搜索)、neural network(神经网络)等,这一特质说明若集中于单个词语则易忽略词之间的语义关联,使文本的主题表达面临信息缺失风险(常鹏等,2012)。在WoS中,除却研究者给定的“DE(作者关键词)”外,还有系统根据研究内容所补充的“ID(关键词添补)”,关键词作为研究内容的高度凝练,既包含词语,亦包含词组,其既有的分隔形式克服了人为分词带来的不准确。本研究提取“DE”和“ID”字段,对每则文献记录中的关键词进行清洗、合并,构造出关键词之间的共现矩阵,再将其纳入聚类分析以推测主题;此外,将关键词视为研究热点的代表,通过分析关键词的抑扬涨落来把握研究领域的热点变迁(Peng et al.,2013),由于分析材料中1990年之前的文献未包含“DE”与“ID”字段,因此从1990年开始,以5年作为一个单位,构建关键词的共现矩阵和网络,并根据每个关键词的相对度数中心度来确定关键词在对应时间区间的重要性。
对于研究范式,Kuhn(1996)认为科学范式(scientific paradigm)是包括观察对象、基本理论、问题建构方式、研究手段等环节在内的一套研究模式,范式之间存在着竞争、交替、转换,科学是在新范式取代旧范式的革命中向前发展的。对于范式的归纳可以利用文献共被引分析(document co-citation analysis),这一分析方法能够反映科学范式的基本结构(Chen,2018),若某文献被引用次数越多,说明这篇文献在相应研究领域中可能处于奠基性地位,其研究方法、技术手段、结论与发现可能推动了整个领域的发展(辛伟等,2014)。本研究选用具有跨领域适用性的CiteSpace知识图谱软件(Chen,2006)对所有文献记录进行共被引分析,从中提炼核心文献并总结研究范式。
SSCI中人工智能文献数量在总体趋势上有所起伏,但在近5年间,相关文献数量呈现稳步上升态势(图1)。
图1 SSCI人工智能文献数量随时间分布
文献量排名前20的国家或地区所产出的文献占据总量的85.56%,虽然中国目前是全球人工智能论文产出最多的国家(清华大学中国科技政策研究中心,2018),但是在SSCI的文献数目上仍与美国、英国存在一定差距(图2)。
图2 SSCI人工智能研究文献数量前20的国家或地区
从所有文献记录中共提取出106个研究领域,位居前10的领域依次是:计算机科学(n=847)、商业与经济(n=515)、心理学(n=358)、工程学(n=351)、运筹学与管理科学(n=322)、信息科学与图书馆学(n=220)、社会科学其他主题(n=165)④、教育与教育研究(n=135)、神经科学与神经病学(n=104)、数学(n=79)。
在研究领域共现上,106个研究领域之间共存在354条连边,构建的无向有权网络(图3)中节点标签的字体越大说明节点的度数中心度越高,连边越粗代表两个研究领域的共现次数越多。如果某研究领域的度数中心度越高,那么证明在这一主题的研究中,该学科具有重要的地位。度数中心度位于前10的节点如表1所示。
图3 人工智能研究领域共现网络
研究领域度数中心度工程学(engineering)40计算机科学(computer science)29心理学(psychology)29商业与经济(business & economics)24社会科学其他主题(social science-other topics)23环境科学与生态学(environmental sciences & ecology)22神经科学与神经病学(neurosciences & neurology)18社会学(sociology)17教育与教育研究(education & educational research)16数学(mathematics)16
从绝对数量来看,社会科学中的人工智能研究集中在经济学、心理学、管理学、信息科学、教育学领域。从与其他研究领域的关联来看,心理学、经济学、社会学、教育学领域常诞生与人工智能相关的交叉研究。以人工智能所归属的计算机学科为例,与其共现次数在50次以上的社会科学研究领域包括信息科学、管理学、心理学。综上,人工智能研究作为一个典型的跨学科领域,与社会科学领域中的经济学、心理学、管理学、信息科学存在密切关联。
至少包含一项关键词字段的记录共有2073条(83.56%),从中共抽取出7873个关键词,考虑到矩阵大小和运算复杂程度,本研究借鉴丁汉青、曹璞等(2015)的处理方式,将关键词按照词频大小进行排序,选择一定词频阈值之上的词作为高频关键词进行后续分析。本研究选择至少在1%记录中出现过的关键词共计86个,并去除鉴别力过低的常见词汇(包括artificial intelligence,model,system),最后构建出83行83列的关键词共现矩阵。周磊等(2014)通过实证研究发现社会网络分析方法中的层次聚类对共现矩阵分析的准确性最高,且运行结果较为直观,本研究使用社会网络分析软件UCINET对共现矩阵进行聚类分析。
根据UCINET生成的系统树图(图4)结构,可辨别出的核心研究主题包括:
图4 关键词共现矩阵聚类生成系统树图(部分,左侧数字为关键词对应ID)
(1) 算法及应用场景。对应关键词包括:neural network(神经网络)、genetic algorithm(遗传算法)、support vector machine(支持向量机)、particle swarm optimization(粒子群优化)、prediction(预测)、classification(分类)、optimization(优化)等。以经济学领域为例,Cavalcante等(2016)回顾了用人工智能技术来应对金融市场问题的一系列文献,发现人工智能路径的效果优于传统统计路径,主要用来解决金融市场中的预测问题(如股价预测、财务危机预测),经常被使用的技术包括多层感知器(Multilayer Perceptron,MLP)、支持向量回归(Support Vector Regression,SVR)等,近年来,文本挖掘相关算法的地位也日益重要。
(2) 系统构建与决策支持。对应关键词包括:expert system(专家系统)、decision-support system(决策支持系统)、decision-making(决策)、management(管理)、diagnosis(诊断)、knowledge management(知识管理)、performance(表现或性能)等。专家系统属于人工智能的前序发展成果,黄金时期约在20世纪80年代至90年代初,其旨在把知识提炼为规则,进而模拟专家思维对新输入数据进行推理,专家系统曾被广泛应用于化学、生物、医学领域(尼克,2017)。在社会科学领域,许多管理学相关文献隶属于该主题下,如Beriha等(2012)利用模糊逻辑(fuzzy logic)构建了着眼于安全推断的专家系统,可以凭借行业的安全相关费用支出比例来估测安全事故发生概率,从而提升行业的安全性能。此外,还有应用于旅行市场业务的推荐专家系统(Hsieh,2011)、应用于住院时长预测的医疗管理支持系统(Yang et al.,2010)等。
(3) 大数据及相关技术。对应关键词包括:big data(大数据)、machine learning(机器学习)、natural language processing(自然语言处理)、data mining(数据挖掘)。人工智能无法脱离数据和知识两种原材料,近年来允许数据直接输入的多层神经网络愈益受到欢迎,以数据驱动的模型和系统发展迅速(张钹,2018)。伴随社交网络、移动互联网、物联网的兴起,数据体量迅速增长,以数据挖掘为代表的大数据分析技术应运而生,大数据落地在一定程度上是由数据挖掘、自然语言处理、机器学习、商业智能等广义概念流行所推动的,且更强调对社会科学领域的应用(沈浩、黄晓兰,2013)。结合大数据的人工智能技术正在革新社会科学领域的既有研究路径,如在信息科学领域,利用主题逻辑结构(theme logic structure)和人工神经网络来处理大规模非结构化数据,从而预测期刊的研究主题趋势(Zhu et al.,2018)。与此同时,一部分法学和社会学研究也对大数据相关技术予以反思,比如Taylor(2017)认为互联网、大数据、人工智能、智能系统、云等要素之间相互交融,成为一个“嵌入式的信息域”(embedded infosphere),与之对应,相关信息传播政策需作出适当调整更迭,在系统论视角下建立一个综合式的政策架构以应对崭新的信息传播格局。
(4) 知觉与记忆。对应关键词包括:memories(记忆)、knowledge(知识)、perception(知觉)、recognition(识别)、brain(脑)、cognition(认识力)、language(语言)等。人工智能基本假设之一是能运用计算来为人类思维建模,而认知科学(cognitive science)也对思维议题情有独钟,因此人工智能自发展初期始就是与认知科学互动密切的领域(Forbus,2010)。相应地,该主题下的研究多集中在心理学领域,如Süß和Kretzschmar(2018)用心理实验方法来检验认知能力和先验知识对复杂问题求解(complex problem solving)的影响,证明了心理学研究对于模拟现实世界的有效性和用于复杂决策研究的潜力;Friedman等(2018)利用概念变迁计算模型对组合连贯理论(assembled coherence theory)进行验证,解释了认知科学中的常识应用机制;Khatchatourov等(2016)以音乐风格辨识为起点,探讨了儿童在辨识自我演奏音乐和人工智能生成音乐过程中的记忆处理问题。
(6) 教育改进。对应的关键词包括:education(教育)、children(儿童)、human-computer interaction(人机交互)、future(未来)、computers(计算机)、communication(交流)等。该主题强调人工智能对于教育领域的赋能,并借助实验心理学、用户体验、交互设计等领域的智识资源。例如,自适应在线学习系统(adaptive e-learning system)能够结合学生的访问偏好进一步改善学习过程中的互动体验(Ascaso et al.,2016);智能信息访问系统(intelligent information access system)如何改善生物医学和健康科学教学活动(Aparicio et al.,2018)。该主题下的研究清晰展现出以人工智能技术为中介的教育和学习过程对于现代教育的适切性以及对学生知识习得过程的促进效用。
此外尚有一些类别下的关键词数量较少,或者关键词过于侧重计算机技术,和社会科学研究领域关联度有限,这些类别暂不纳入本研究的考量范围。
本研究将相对度数中心度这一指标应用于不同时段的关键词共现矩阵之上,相对度数中心度也即标准化后的绝对度数中心度,该指标保证了不同规模网络图中节点的可比较(刘军,2014)。某关键词的相对度数中心度越高,证明其地位越重要。
表2 不同时段内相对度数中心度较高的关键词
关键词在6个时间段的变迁(表2)揭示出以下两点特征:
(1) 社会科学领域的人工智能研究热点变迁基本跟随了人工智能技术的发展轨迹。正如尼克(2017)的总结:专家系统自20世纪80年代初伊始经历十年黄金期,随着日本第五代计算机的幻灭,专家系统成了一个不时髦的词,但专家系统催生了知识表示,后者与心理学、语言学关系密切,除却知识表示这类依靠逻辑和符号系统来实现人工智能的路径外,另一条路径是通过仿造大脑来实现人工智能,其代表技术是神经网络。虽然神经网络的发展历经沉浮,但近年来互联网产生的海量数据给予神经网络更多的赋能空间,最典型的表现就是以多层神经元构成神经网络为基底的深度学习广受欢迎,与神经网络一样发轫于生物领域的另一条脉络是冯·诺伊曼(John von Neumann)的细胞自动机,历经遗传算法、遗传编程后演化为强化学习,这一派在2000年后受到日益密切的关注,并在2015年末因AlphaGo的出现而更受追捧。从关键词变迁中可以清晰看出,“专家系统”“决策支持系统”自2000年后地位逐渐下降,而“神经网络”“遗传算法”“心智”“智力”“机器学习”等关键词的地位开始上升,虽然社会科学领域研究热点未与技术发展步调保持及时联动,但基本呈现出技术演化路径对社会科学研究热点的牵引。
(2) 从较为单一到多元汇聚的应用场景。从早期的以知识为基础的专家系统占据主导,到后来应用至“管理”“市场”领域,并注重“预测”“优化”、应对“风险”等任务面向,充分印证了人工智能在成长过程中的应用导向,也即技术的落地。与此同时,人工智能与社会科学中各学科的交集也在扩大,最典型的是与认知科学领域的互动,人工智能“用计算机器模拟、延伸、扩展人类智能”之宗旨要求对认知科学中诸如“记忆”“语言”“知识学习”“知觉”“行为”等经典概念予以密切关注,而认知科学中的行为实验、神经学研究亦给人工智能发展提供了增援。另外,各种“视角”也为人工智能发展提供契机,比如从价格波动视角结合遗传算法来研究股票市场中限价的影响(Yeh & Yang,2010)、从动态学和生态学的视角来理解演绎推理,进而突破传统计算主义范式指导下对演绎推理的阐释(Faiciuc,2008)。
图5 人工智能研究文献共被引图谱
从所有文献记录中共抽取94429条引文。在CiteSpace中选取每一年中被引位于前100的引文,构建当年的被引网络,并用“最小生成树”(minimum spanning tree)算法对生成网络进行修剪,之后将各年网络进行合成。借用Gephi软件的网络绘制功能对导出的网络数据进行处理后可得出文献共被引图谱(图5),图谱中的每一个节点代表一篇文献,节点尺寸越大代表对应文献被引次数越多,两个节点之间若存在连边则代表两篇文献存在共被引关系。通过回溯图谱中关联度较强文献群集中的高被引文献,可归纳出以下三种主要的研究范式。
(1) 认知科学研究范式。图谱中认知科学相关文献数量丰富,且被引次数较高,这与“知觉与记忆”作为重要研究主题以及认知科学领域关键词的逐时段增多相呼应。Holland等(1986)融合心理学、计算机科学、哲学三重视角对归纳框架展开研究,认为知识归纳过程的本质是基于规则的心智模型,认识架构对环境中的要素关联做出解释,进而产生适应规则和具体行动,这一套归纳框架可被应用至自然环境和机器中。Boden(1991)利用计算范式对创造力予以全新解读,挑战了创造力来源于“直觉”的传统认知,并进一步认为可以通过计算模型来实现机器的创造力。Rumelhart等(1986)认为人类比机器更具优势之处在于人类心理的大规模并行计算架构,知识的产生来自各个神经元彼此的连接,从认知科学微观架构中启发的连接主义挑战了符号计算。与此类似,Newell等(1990)也强调人类大脑的心智实现,并发展出具有广泛性和包容性的统一认知理论(Unified Theory of Cognition)用以解释智能机体如何从环境刺激当中诱发出目标导向行为,这一试图模拟人类认知机制的通用性理论对于人工智能算法开发和系统设计具有重要的启迪意义。类似的研究还包括对意识的解读(Chalmers,1995),对人类决策、思考框架、认知偏误的探索(Kahneman,2011)。概言之,这一范式侧重发掘认知科学与计算机科学的共鸣点,旨在借用认知科学中对人类思维方式的解析来指导人工智能发展,并用人工智能技术来回应认知科学中的命题。
(2) 知识表示研究范式。这一范式下的核心文献名称多包含“expert system”(专家系统),专家系统的最高期望即是寻找并应用人类知识的普遍规则。Lenat和Guha(1990)认为系统的智能理解和智能行为来源于对所在领域概念、方法、启示的掌握,因此智能可以等价为对规则的提炼,有鉴于此,研究者希望将人类常识进行编码,建立起浩瀚的知识库,这也是知识图谱的原型架构。与之不同,Collins(1990)认为专家系统的有效性完全取决于使用者的知识水平,专家系统所掌握的是人类所赋予的“颗粒态”知识,而人类所拥有的知识源于社会,是相对连贯而稠密的,专家系统扮演的是人类专家知识过滤器的角色,在建构规则同时会无可避免地丢失一些背景信息。尽管对于专家系统的讨论存在分歧,但是专家系统在人工智能领域的奠基性意义无可否认,不仅在于规则提炼模式的提出,更在于其核心构念对后续概念图、大知识系统、语义网、知识图谱的催生。与此范式相关的文献还包括知识系统的搭建(Roth et al.,1983)、知识系统的实际应用(Chorafas,1986)等。
(3) 未来智能研究范式。该范式包括了人工智能的技术前景展望以及如何应对人工智能带来的社会变迁。在技术展望方面,神经网络的发展延展了人工智能的应用场景,基于对神经网络的深度学习正在成为一种领航技术路径,LeCun等(2015)提出以反向传播算法为基础的深度卷积神经网络(deep convolutional nets)和递归神经网络(recurrent neural nets)分别在图像、视频处理和序列型数据处理上带来突破;Silver等(2016)对AlphaGo的解析以及Mnih等(2015)对强化学习的应用凸显了强化学习在人工智能领域的重要地位,这些研究昭示着未来人工智能的前景与发展方向。在应对由人工智能驱动的社会变迁方面,相关文献主要关注技术发展对人类社会的影响和角色替代问题,牛津大学哲学家Bostrom(2014)的著作《超级智能》揭示人类在迅速发展的机器时代中遭遇的现实困境与可能风险,由于机器的进化速度领先于人类的进化速度,那么机器的“大脑”有可能超越人类的智能,甚至构成对人类文明的威胁,因此在发展过程中需要谨慎设立技术发展最终目标,并鼓励差别化发展,遵循共同利益(common good)原则。相比于Bostrom对“弗兰肯斯坦”的担忧,Brynjolfsson等(2014)则更为缓和,其将人工智能技术跃进的时代比作“第二机器时代”,并与“第一机器时代”(工业革命时代)作出对比讨论,认为两个时代最大的不同在于:后者的特征是人力和机器力量互为补足,前者的特征是机器在目前和未来可以完成更多本认为只有人类才可应对的任务,机器对职业领域和更广阔劳动领域形成激烈冲刷,这一论断的成立依据来自机器计算能力的指数级别增长和信息技术与数字通信的迅速推进。与此同时,机器会降低对自然劳动力的整体需求,在利益分配上,技术创造的“赏金”(bounty)也转移到以智能技术为代表的新兴技术行业上,整个社会的资源分配格局正在经历剧烈的变迁。虽然Brynjolfsson的视角主要基于宏微观经济学,但是与Bostrom一样对人工智能进行了技术逻辑之外的关切,侧重讨论技术的社会效应。总体上看,未来智能研究范式的理论资源不仅涵盖计算机技术、工程知识,也横亘哲学、经济学、人类学等多个学术谱系。
本研究借用文献计量领域的相关方法,对1975年至今的SSCI人工智能相关文献进行分析,梳理了文献的时空分布、研究领域、研究主题,分析研究热点变迁并归纳了主要的研究范式。社会科学中的人工智能研究体现出若干清晰的特质:首先,人工智能与认知科学保持着“相互嵌入”的关系,在历史渊源上,心理学家米勒(Miller)和语言学家乔姆斯基(Chomsky)共同开拓了认知科学,这不仅从逻辑层面上丰富了知识表示,更为后期的连接主义(connectionism)运动提供了理论基础,这些历史过往使得人工智能在方法论上渗透着认知科学的痕迹,比如深度学习中的多层神经元架构模仿的是人类的心智处理模式;更让诸多领域的研究者以认知科学作为交叉点而汇聚在一起,比如控制论创始人维纳(Norbert Wiener)对大脑建模的追求(尼克,2017)。历史上的学科交汇使得认知科学成为人工智能研究的重要范式之一,并成为重要的研究主题,目前认知科学中的心理学领域已成为社会科学与人工智能交叉的前沿阵地;其次,社会科学的研究视野伴随技术更迭而不断变迁,与自然科学等领域的技术主导取向不同,社会科学研究更侧重于将技术纳入应用环节,比如对于智能预测、决策、管理的追求,新技术的接踵而至无疑开辟了对于智能社会的想象,从而加速了技术在社会科学领域的采纳与验证步伐;与此同时,社会科学同样对人工智能建立了自反框架,比如从伦理、规约维度出发对大数据、生物仿真、社会变迁予以反思。
对于社会科学领域而言,人工智能的技术意涵不言自明,但于此以外仍有更广袤的待挖掘之地。以新闻传播学科为例,一派观点源于技术兴奋,在人工智能相关技术、模式推行的情境下,新闻传播领域面临业态、机制、逻辑的重塑(喻国明、姚飞,2017),不少学者从国内外人工智能助益新闻生产流通模式变革的成功案例出发,总结了人工智能对新闻内容生产、新闻信息通路、受众反馈产生的影响。譬如,以人工智能为代表的技术进步成为驱动媒体智能化的直接动因,并使“智媒”成为未来媒体发展的一种主要趋向(彭兰,2016;苏涛、彭兰,2018)。在“智媒”趋向的大背景下,人工智能重塑传媒产业业务链,信息采集、编辑制作、认知体验、内容推送环节皆在技术的渗入下“改头换面”(喻国明等,2017)。另一派从文化、技术政治路线展开考察,对人工智能的发展逻辑、相关技术的应用抱以反省,宏观层面的考察包括外部政治力量如何通过投资干预左右研究取向,从而使政治权力凌驾于学科自身发展规律之上(Committee on Innovations in Computing and Communications,1999);有关技术的多元想象如何对技术进行社会建构以及主导想象之后的力量如何推促技术发展并且形塑技术和相应政治文化制度之间的联系(Streeter,2011);技术发展过程中经历了怎样的权力主体让渡和技术大规模商业化之后合理性的存续(Wu & Yun,2018);人工智能的修辞效应是否遮蔽了技术发展的实质,种种“承诺性修辞”(promissory rhetoric)和“诱导性断言”(cringe-inducing assertions)营造了怎样的认识论陷阱(Elish & Boyd,2018)。微观层面的考察包含在高度媒介化社会中权力以算法作为寄居体进而以更为隐秘的机制进行渗透(Lash,2007),算法对把关权力进行程序化收编,甚至使公众在由自己意志编织起来的“信息茧房”(information cocoon)中降低理性判断力,进而实现对社会合意的控制(喻国明等,2018);算法对价值理性中关键信念的忽视(陈昌凤、石泽,2017)和新闻生产流程的“黑箱化”与随之而来的技术和资本反收编(仇筠茜、陈昌凤,2018)。这些视角的汇集丰富了人工智能研究的学术版图,并彰显新闻传播学科观点对于整个社会科学领域的裨益。
从本研究的结论出发,依然可以发现更多的研究突破点。譬如,从研究主题和研究热点变迁中都可看出,以“模拟”为主要特征并追求心智、意识、行为贴近人类的机器仿真和系统设计正成为新的技术兴奋点,这与现象学、主体理论、后人类主义思潮有着极高相关性,相应地,传播研究中也有“赛博人”(cyborg)等概念与之相照应(刘海龙,2018;孙玮,2018),人工智能技术促使生物逻辑和技术逻辑的互嵌更加深入,赛博人就是技术与人融合出的元媒介,最大限度地实现了技术具身(孙玮,2018)。尽管距离虚拟身体的实现尚有时日,但是技术作为身体的一部分要素并参与感知过程的状态是毋庸置疑的,人对世界的感知以技术为中介,技术与世界的交互则以人作为基础,人作为技术与世界的沟通界面更彰显出一种技术性的存在,那么在人从自然主体到技术融合主体的重组过程中,人与人的传播关系势必不能仅从人际传播角度出发,还需涉及对技术的关切,诸如人工智能时代人类社会系统之变迁、机器之后隐藏的人类社会关系、当机器具有自主意识后给人类社会带来的挑战。另外,Smythe(1994)曾从技术生产、研发、普及、创新等向度出发论述技术的非中立特征和政治性,并强调关注技术背后具体社会制度和意识形态的重要价值;Zhao(2007)同样呼吁关注技术发展优先秩序和技术创新的价值导向,顺延这一思考模式,值得探究的命题包括:人工智能在作为竞争实力筹码和经济效益累积工具的同时,在多大程度上提供了满足公共目的的产品与服务;人工智能在对既有产业格局起变革作用的同时是否遮蔽了一些劳动关系问题,比如“数据标注”(data labeling)工种(Reese,2016)是否演变为正在经历更加隐蔽剥削的“数字劳工”(Fuchs,2012),等等。
本研究尚存的不足之处在于:首先,文献检索时仅使用“artificial intelligence”作为主题检索词,虽然保证了“查准率”,但一定程度上忽略了“查全率”,可行的改进方法包括从计算机领域的高被引论文中提取合适的关键词作为检索依据;其次,在研究主题发掘环节,使用关键词共现矩阵作为聚类依据虽然尽可能准确地把握了语义,但依然承担了一定的信息损失代价。未来研究可在对英文摘要进行分词时辅以人工智能专属词典,利用诸如Birch聚类(Zhang et al.,1996)等方法将摘要划分为不同类别,再基于各个类别中对应的关键词来确定主题以达更好效果。
注释
① 本研究未选择“AI”作为主题检索词的原因在于“AI”具有多义指代,譬如:American Indian(美洲印第安人)、Alcohol-Interactive(酒精相互作用)等,而且关于人工智能的研究,在给出简称(AI)的同时也会标注全称(artificial intelligence)。为消除指代歧义、提升研究信度,仅选择“artificial intelligence”作为主题检索词。
② WoS核心合集收录了1975年至今的文献数据,因此检索文献的时间起点为1975年。
③ WoS核心合集的字段标识说明,获取自https://images.webofknowledge.com/WOK50B6/help/zh_CN/WOK/hs_wos_fieldtags.html
④ 根据WoS的界定,“社会科学其他主题”包括:跨学科研究(Interdisciplinary)、伦理学研究(Ethics)、社会科学史研究(History of Social Sciences)等。