刘庆振 钟书平 牛新权
摘要:近年来,计算传播学方兴未艾,其利用算法技术、大数据技术、人工智能技术等计算主义的研究方法为传播学的研究和实践带来了全新的视角,它丰富着传播学的经典理论,重构着传播学的学科知识,有助于培养传播学的创新人才。在技术革命的时代大背景下,围绕计算传播学的研究正在形成一个新的范式。
关键词:计算传播学;大数据;人工智能;计算主义
中图分类号:G206 文献标识码:A文章编号:CN61-1487-(2019)08-0010-05
计算传播学(Computational Communication)是近年来传播学与计算机科学和数据科学等学科交叉而逐渐兴起的一个新的分支领域。它的中心课题是如何利用大数据、算法、人工智能等全新的技术工具来更好地解释传播行为、促进传播过程、优化传播方式和测量传播效果。因此,它强调探讨数据和技术在整个传播过程中向人们揭示的现象以及对传播生态所造成的深远影响。计算传播学不仅仅是一种现象和趋势,更重要的还在于它是探讨传播流程和传播问题的新理论、新方法乃至新范式。
一、计算传播学的发生与发展
传统的大众传播模式是一对多的模式,通过大众传播媒介对各种信息进行编码和解码。但这种编码和解码的过程,由于其本身相对简单而缺乏双向互动的特征,因此更多停留在对传播内容的定性判断上。而媒介组织所开展的对部分受众行为的监测和效果分析,也同样因为传播过程的简单和传播研究方法的局限而大打折扣。事实上,传统的大众传播模式因为其本身是建立在一对多的单向逻辑之上的,所以无论是其内外需求还是在技术上,都不需要也不支持大规模的数据收集和运算。
網络传播使得人和组织正在以前所未有的方式不断连接起来,并在这种连接的基础上增加了大量的传播互动模式和方式,一对一、一对多、多对一、多对多、多对少、少对一、少对多等多种传播模式的排列组合不断涌现,熟人网络与陌生人网络相互交织、即时互动,并且在没有把关人的情况下,其传播频率和速率变得异常高效频繁,每个人每个组织都需要面对大量的编码、解释和解码过程。传播内容的增加,传播频率的增强,以及传播效果的增进,都会产生大量的数据,同时人们又能借助这些数据优化传播过程,算法的重要性日益被强化。计算主义在传播过程中的快速普及和广泛应用,正在使其从过去发送者把信息推送给接收者的逻辑和模式,转变为接收者仅仅通过智能屏幕获取他自己所需要的信息的逻辑和模式。
随着互联网和移动互联网的快速发展,网络空间实时产生的海量数据为人们观察和研究传播行为、传播过程提供了宝贵的资源。尤其是在近年来大数据技术和人工智能技术取得了实质性的突破之后,在数据挖掘、机器学习和智能算法的驱动下,计算主义视角和工具受到了社会科学各大分支领域的广泛关注和充分认可,传播学也开始尝试通过新的思路对传播过程进行解构和重构。在这样的背景下,计算主义被引入传统的传播学研究中来,形成了一个新的交叉学科:计算传播学。
在这个过程中,数据和算法所起到的作用不容忽视。事实上,在技术革命和算法崛起的时代背景下,经济学、营销学、统计学、管理学等社会科学领域的各大分支学科都正在努力建设并完善一套全新的可量化、可计算的研究方法,以更准确、更客观、更全面的视角来发现并研究解决社会问题。与此相对应,传播学也借鉴这些学科的最新探索方式和成果,试图通过更加严谨的计算主义方法对传播过程所涉及的各大要素和各类问题进行更好的解释和解答。可以说,计算传播学的发生和发展,已经使得传播学的量化研究方法从传统的统计调查思维跨进到了与当前大数据思维和技术紧密结合的全新模式。
说到计算传播学,首先要涉及到“计算”和“可计算”的问题,何谓“计算”,何谓“可计算”呢?事实上,直到目前在计算传播学乃至计算社会科学的领域,也没有谁能够给出一个非常明确且清晰无误的定义。尽管无论在现实生活中还是在学术研究中几乎每天都在“计算”,但这种无处不在的计算正是因为其存在的广泛性而为所有传播学者所忽略,没有太多人专门研究传播过程中的计算问题,也没有人讨论可计算性究竟是一种理论还是一种方法。直到涉及计算社会科学或者计算传播学的根本定义时,人们才想起来要解释一下什么是“计算”以及什么是“可计算”。这两个概念主要来源于自然科学领域,广义数学中的计算理论(Theory of Computation)是一种用来研究计算过程与功效的数学理论,它主要包括算法、算法学、可计算理论、复杂性理论、形式语言理论等分支方向。其中,可计算性理论(Computability theory)作为计算理论的一个分支,研究在不同的计算模型下哪些算法问题能够被解决。相对应的,计算理论的另一块主要内容,计算复杂性理论考虑一个问题怎样才能被有效的解决。
计算传播学的概念一出现,就在传播业界和学界受到了广泛关注,并获得了快速的发展,其内涵和外延也在近几年被大量的研究者不断地充实和扩展。与此同时,计算主义和数据主义的研究思维和研究方法也逐渐取代了传统的统计调查等量化方法,从而大大扩展了人们对传播现象、传播过程和传播问题的研究范畴和分析能力。
目前,国内典型的计算传播应用模式有智能推荐、计算广告、数据新闻等。这些典型的应用场景之所以能够快速的在市场上取得成功并受到业界学界的广泛关注和认可,实际上与进入21世纪后互联网技术、大数据技术和人工智能技术的普及密不可分。这些技术使得大量的用户行为能够以数字化的方式被跟踪和记录,从而为媒体、营销公司和科研机构对用户的深入研究提供最基本的数据素材。正是因为这些数据具备前所未有的广度、深度和规模,人们才得以能够从更加客观、更加精确和更加细微的视角,来理解整个传播过程所涉及到的包括生产者、传播者、用户、媒介、广告主等在内的方方面面,从而为理解这个过去看上去如此复杂的传播系统提供了一种全新的视角。
二、计算传播学的概念探讨
通常的观点认为,计算传播学是计算社会科学(Computational Social Science)的重要分支。这种提法在公开发表的学术论文和诸如百度百科这样的网络文本中屡见不鲜。事实上,计算社会科学的快速兴起,的的确确是计算传播学这一概念引发关注的重要背景之一。“计算社会科学的兴起使得我们开始更加严肃地思考可计算性在传播学研究当中的作用。”[1]加之传播学本身又是社会科学领域非常重要的一个分支,所以从语义逻辑的角度来看,认为计算传播学是计算社会科学的重要分支并没有不妥之处。
但在本体论而言,这种提法在一定程度上忽略了计算传播学作为传播学这个主体学科重要分支的事实,而有意无意地将它归入到计算社会科学这样一个几乎无所不包的概念之中。这会导致学术研究和产业实践片面地关注计算工具和算法逻辑等定语成分,而对传播要素和传播过程等主语成分缺少深刻的认识。因此,当把它表述为计算传播学是传播学的重要分支学科之后,就能够准确地把握它作为传播学与计算机科学、数据科学、人工智能、心理学、生物学等领域的交叉学科这一本质,就能够时刻提醒我们在产业实践和学术研究过程中清晰地把计算主义作为一种观念和工具引入到传播学,以更好地发挥其价值。
此外,大多数研究者为了研究的方便起见,都认为计算传播学起源于计算社会科学,原因在于2009年Lazer等一批社会科学家、计算机科学家和物理学家在《科学》杂志上发表了题为《网络中的生活:计算社会科学时代的到来》的论文。然而事实上,这篇文章无论在标题还是在正文中,都没有正式地提出关于计算传播学的概念。与其说这篇文章是计算传播学概念的策源地,不如说社会科学各个分支学科的很多研究者受到了计算社会科学这一概念的启发,将计算主义的方法、工具和技术与本学科之间进行了勾兑,从而提出了类似于计算人类学、计算社会学、计算新闻学、计算传播学更具体的分支学科概念,在客观上促进了社会科学各个领域与数据科学、信息科学和计算机科学等自然科学领域的交融。在这个过程中,“计算”“可计算”“社会计算”等概念被大量的使用于社会科学研究的各个角落。
所以,甚至可以更大胆地推论,计算传播学概念的产生与这篇文章并无必然联系,因为计算主义和数据主义在各个领域和不同学科中的广泛应用已经是一个不争的客观事实了,只不过理论研究工作把这种实践应用上升到学术层面存在一定的滞后性,但各个学科提出与此相关联的概念只是或早或晚的事情。例如,计算广告学的概念提出就比Lazer等人提出计算社会科学的概念还要早,它是雅虎研究院资深研究员Andrei Broder在2008年第十九届ACM-SIAM学术讨会议上首先提出来的,并给出了计算广告学的经典定义。[2]由于广告学与传播学之间存在着千丝万缕的密切联系,为什么不把计算传播学的起源追溯到2008年?抑或为什么不宣称计算社会科学的概念是受到了计算广告学概念的启发而提出来的?再比如,社会计算的概念早在1994年就第一次出现了,那是不是把计算社会科学的诞生应该追溯到1994年?或许也没这个必要。
因此,关于计算传播学的起源及概念提出,更倾向于认为随着计算主义和数据主义在传播学领域被越来越广泛的应用,传播学亟需提出一个新的概念来引导当前乃至下一阶段的理论研究和产业实践,在这样的语境下,作为分支学科的计算传播学在传播学这一母体中应运而生。之所以是计算传播学而不是数据传播学或算法传播学或其他什么概念被采用,其实是一个集体选择的结果。
在这个集体选择过程中,较早期的研究无疑起到了一定的概念启蒙作用。例如,祝建华等人(2014)从现有的传播学研究的角度对“计算社会科学”以及传播研究的关系进行综述,沈浩等(2014)也提出复杂网络和社会计算是传播学研究的新思路、新路径。王成军(2014)首先在其论文《计算传播学——作为计算科学的传播学》中使用了“计算传播学”一词。当然,也必须看到,一个新的学术概念是否具有较强的张力获得广泛的认可,并不仅仅取决于少数的几位研究者,更重要的是取决于活跃在学术界和产业界的大量意见领袖。经过近些年的产业实践和学术讨论,以及包括清华大学、南京大学、中国传媒大学、北京师范大学、北京信息科技大学等高校和喻国明、祝建华等研究者的积极探索,国内的学术界和产业界对计算传播学的概念已经形成了一定的共识,以“计算传播学”为主题的实验室、研究所和学术论坛也陆续地建立、开展起来了。
当然,不过分强调计算传播学是计算社会科学新的分支,并不代表我们忽略甚至不承认社会科学、计算社会科学之于传播学、计算传播学的意义和价值,它仍然在思维和方法上启发着我们谨慎大胆地开展更具有创新意义的传播学乃至计算传播学的研究工作。社会科学与自然科学虽然存在着很大的差异,甚至在绝大多数情况下无法形成放之四海而皆准的定理,但它仍被认为是一种科学的原因主要在于社会科学在对社会问题展开研究的过程中,像自然科学那样努力保持着一种客观中立的研究态度和事实描述,并尽最大的可能确保它所得出的研究结论是经得起推敲和检验的,也就是说可以证实或者证伪的。恰恰正是这种严谨的研究态度和研究方法,使得社会科学在研究过程中高度重视定量研究,通过可以量化、可以计算的方式来研究人类的社会行为乃至传播行为。
所以,计算传播学中的“计算”包含了两层重要的含义:第一层是从计算机科学或更广义的信息科学等视角来理解传播过程中的数据和可计算性;第二层是传播理论或更具体的传播现象所涉及到的对某些个性化和差异化算法的应用。从这个角度看,计算传播学关注的焦点是传播行为和传播过程的可计算性基础,以人工智能、数据挖掘、机器学习、推荐算法等计算机技术为主要工具,通过大规模地跟踪、收集、挖掘、分析在整个传播过程中所产生的大量数据,来发现传播现象和传播行为背后更深刻的底层代码和基础模式,并分析这些传播模式的发生原因、运行机制、逻辑原理和最终效果。
在这里,它并不忽略或者排斥传播学研究的传统方法,比如经验主义、功能主义、抽样调查、定性研究等等,但它更強调采用计算主义的方法,把它更广泛地应用到传播学研究的各个领域,并与传统方法相互结合,从而更好地利用不断增强的数据收集和分析能力,为传播学研究和实践进行服务。在这个基本思路的基础上,我们需要重点梳理传播学可计算性的各个要素和各个环节,讨论实现传播学可计算化的道路和方法,并积极探索力求寻找一个合理的关于计算传播学的概念或定义。
三、计算传播学的学科价值
在整个传播媒介不断进化的历史过程中,每一次新技术和新媒介的更迭进化,都会带来人们对交流、沟通、传播这些事情的重新思考。而在传播学从社会学分离出来成为一个独立的学科之后,传播学界对新技术和新媒介的研究也变得更加广泛和深入。从广播电视到互联网,从智能手机到万物皆媒,大数据和人工智能技术的快速发展对旧有的传播学知识产生了强烈的冲击,从而倒逼着今天的传播学界对算法工具和计算主义展开新的理论思考,这时候计算传播学逐渐成为一个全新的研究范畴,并补充、增强、完善乃至重塑着现有的传播学研究框架。然而,关于新媒体、新技术、新传播、新智能、新业态的大量研究,尽管层出不穷,但却往往乏善可陈,因为这样的研究仍然受到了旧思维、旧理论、旧权威、旧框架和旧方法的限制而无法做到有所突破或推陈出新。长此以往,知识将无法更新,研究将陷入僵局,人才将一潭死水。
事实上,过去以经验主义传播学为主流的研究方法,虽然在很大程度上可以结合定性研究和定量研究使其得出的结论看上去更有说服力,然而它在理论的拓展和实践的应用方面,都再也难以突破传播学过去数十年来发展而形成的基本框架。于是我们看到越来越多的研究转向了更加微观的领域,但中观上的研究方法和宏观上的传播范式进化却非常缓慢。这就导致细分领域和具体问题的研究因为理论的路径依赖和方法的惯性逻辑,而沦为一种难以证实或证伪的自洽。无论是对用户媒体使用行为还是内容传播效果的测量及在此基础上建立的模型,很多时候都是因为统计方法和数据缺陷而成为了一种掩耳盗铃以假乱真自欺欺人的游戏。
以议程设置这一基础理论为例,有相当长的一段时间,国内外的大量学者把主要的关注点都放在了经典的议程设置理论和应用上。这是早期研究传播效果最主要的理论和方法之一。正是因为这一理论告诉我们,用户可能会关注一些问题而忽略另一些问题,这种现象本身就足以对社会的公众舆论产生巨大的影响,所以才会发现,用户通常会有兴趣了解市场上的所有媒体关注的主要话题,并会受到媒体对这些话题进行排序的影响,甚至会直接采纳媒体确定的先后次序来安排自己对这些问题的关注兴趣。在过去,如果要确定哪些话题是媒体关注的话题、媒体是怎样进行排序的、用户真的会按照媒体的排序来关注这些话题,为了对这些进行清晰阐释,传统的做法是采取抽样调查与深度访谈相结合来进行市场调研,从而为议程设置提供之所以这么做的证据。但从目前信息技术和传播方式的巨大变革来看,智能硬件和社交网络的快速发展使得很难按照传统的议程设置的方式来掌控传播过程,统计调查的方式也无法解释乃至解决庞大的数据量和此起彼伏的新闻事件等现象及其背后所隐藏的社会问题。在这样的技术背景下,传播学的可计算性研究在总体特征上发生了革命性的变化。
在这样的氛围中,对学科的重新审视尤为必要,谋求创新和突破也成为产业实践和理论拓展的共同需求。计算传播学的兴起在一定意义上,也恰恰是在尝试通过跨学科研究的思维和方法,建立起数据科学、生物科学、计算机科学、人工智能科学等领域与传播学之间进行充分交流与合作的机制和规范,并探索、推进、形成传播学研究的新范式。它正在以全新视角、先进的技术、交叉的方法对传播过程和传播研究进行着前所未有的重新解构和建构,其广度、深度和规模都得到了极大的拓展。但在这个过程中,计算传播学必然会继承既往的传播学研究传统的全部精髓和经验,并对已有的研究方法进行全新的补充、完善和扬弃,借此完成对传播过程中可计算要素的梳理和研究工作。
当然,这种梳理和研究工作并不是一朝一夕就可以完成的,它需要一些时间。尽管21世纪的第一个十年是互联网发展的黄金十年,但在这黄金十年中,产业界和学术界都没有拿出一个非常具有颠覆性的传播解决方案。直到时间进入到第二个十年,大数据技术和人工智能技术突飞猛进并被产业实践广泛接受之后,才有越来越多的人忽然间意识到,数据才是最关键的生产要素,而算法则是把这一生产要素转化为生产力的引擎。因此,计算传播学的产生也不过是近十年的事情,直到目前,它也没有形成一整套完整的研究理论、研究框架和研究方法。
也就是说,今天的计算传播学仍然处在初始阶段的孕育期,它是传播学领域正在涌现的一个全新分支,距离形成一种新的科学研究范式,还有很长的路要走。正如香港城市大学媒体与传播系祝建华教授等所说的那样,要形成新的传播学研究范式或者学术创新,“需要四个条件:新现象的涌现、新数据的易得、新方法的普及、新人才的形成。”[3]
按照这四个条件来看,新现象的涌现已经成为一个不争的客观事实,无论是在互联网领域,还是在更多其他的经济领域,对新技术的应用和对大数据的重视已经成为普遍现象。新数据的易得性,也已经基本具备,无论是传统领域还是新兴领域,都能够以较低的成本和较便捷的方式积累或者获取大量的数据素材。然而新方法的普及和新人才的形成,却没有想象中那么乐观。尤其是对于已经形成一定研究规范和基本方法的传播学体系,新的研究方法的引进和普及需要打破对传统研究方法的路径依赖,说得更直接一些,是需要当前的传播学研究者打破行为惯性、走出舒适区去接受更多新鲜的事物。或者,需要在现有的学科体系内完善充实那些能够运用新的研究思路和研究方法的青年研究人才队伍。但无论是前者还是后者,都需要相对较长的一个时间周期。
四、面向未来的计算传播学
随着信息技术和生物技术的发展,计算理论早已经从原来的数学领域逐渐应用到更广泛的自然科学和社会科学领域,这其中最主要的原因还在于计算理论以数理统计和量化分析为基本立足点,从而使得其实践行为和研究结果都具有了高度的精確性、客观性和中立性,这与社会科学一直孜孜以求的科学性和有效性目标高度一致。传播学也同样在追求能够在最合适的时间地点、以最合适的媒介手段向最合适的目标人群传播最合适的内容信息,而如何更科学、更精准、更有效地实现这一理想,计算理论所涉及的算法、复杂性和可计算性等研究思路和具体方法,无疑提供了一条全新的路径。
计算传播学方兴未艾,它正在以全新视角、先进的技术、交叉的方法对传播过程和传播研究进行着前所未有的重新解构和建构,其广度、深度和规模都得到了极大的拓展。但在这个过程中,计算传播学必然会继承既往的传播学研究传统的全部精髓和经验,并对已有的研究方法进行全新的补充、完善和扬弃,借此完成对传播过程中可计算要素的梳理和研究工作。
還需要关注的一点是,当前正在发生的这场巨变是信息技术与生物技术相互交织相互协同的双重革命。信息技术革命使得我们正在把整个物理世界数字化和数据化,而生物技术革命使得我们正在把人体运行机制数字化和数据化,当新兴的数据科学和生物科学在不同领域相互交叉以后,就会产生不同的前沿分支学科,计算传播学就是双重革命背景下产生的这样一个传播学的分支领域,借助于大数据、智能算法、生物信息技术、深度学习等,我们可以跳脱出传统的视角,换一种计算主义的视角来看待整个传播过程以及用户对传播媒介、传播方式、传播内容等要素的生理反应和心理反应。
在计算传播学的范畴内,尽管信息技术和生物技术在研究传播过程的时候所侧重的焦点和领域完全不同,但它们共同的目标都是试图更好地、更完美地理解和解释传播行为。在此基础之上,计算传播学正在逐步的形成与传统传播学研究不同的一套全新的理论和方法论体系。这套体系将结合传播学的实际问题和学术精髓,同时借鉴、采纳并结合数据科学、智能科学、信息科学等领域的计算理论形成新的研究思路和研究方法,用来解决传播过程中存在的复杂性问题。事实上,传播学的研究从来都是紧紧围绕信息和生命这两个核心要素而展开的,只有理解了信息传播的过程,我们才能够更有效地采集和传播信息,只有理解了生命尤其是人类的生理结构和心理结构,才能够面向每个具有高度差异化的个体进行更精准的传播。计算传播学的巨大意义就在于,它启发我们用计算主义的视角来重新思考生命与信息的交互过程,它把信息的传播和人类的生命都看作了一种形式,这种形式可以通过程序或算法表现出来,而算法的运行就表现出了因此人类对信息的编码和解码过程就变成了我们所说的计算传播的过程,计算传播学的研究则是通过计算主义的研究方法揭示传播的本质的。
信息技术和生物技术的不断突破,都有助于从不同的方面探讨传播的本质问题,而两个领域的研究跨界和方法交叉形成的计算传播学,也已经充分地说明,数据、算法和计算等概念已经成为我们更好地理解传播本质的基础概念。一旦从计算主义的视角来审视个体和世界,就会发现无论是人的大脑、人的行为还是人与整个物理世界、虚拟世界的交往过程,都变成了一个庞大复杂的计算系统,人与人、人与信息之间的传播过程也不例外。更进一步地讲,传播过程这本大书是用数据语言和算法工具来书写的,它是一个巨大且复杂的计算系统。而在一个智能硬件、程序代码、媒体信息、用户数据等无处不在的社会状态下,越来越多的权力开始向计算能力和算法工具的拥有者转移。信息技术与生物技术的双重革命在很大程度上促进了这种转移,改变了传播过程中的权力关系和人类行为,这种变革对于社会科学乃至具体到传播学的学科发展起到了巨大的推进作用,为计算传播学的兴起和成长提供了现实的土壤和充分的条件。这也决定了计算传播学作为一门现代信息技术与生物技术双重革命和相互裹挟而形成的交叉学科的属性,以及它聚焦于传播行为和计算系统交叉融合所产生的各类问题。
参考文献:
[1]王成军.计算传播学:作为计算社会科学的传播学[J].中国网络传播研究辑刊,2014(0).
[2]刘庆振.“互联网+”时代的计算广告学:产生过程、概念界定与关键问题[J].新闻知识,2016(6).
[3]祝建华,张丽华,黄显.计算传播学与传播研究范式转移[J].青年记者,2018(22).