高申杨
不久前,由复旦大学新闻学院传播与数据科学实验室和华东政法大学新媒体数据研究院联合主办,复旦大学新闻学院、复旦大学国家文化创新研究中心联袂支持的“数据驱动与传播创新学术研讨会——暨《世界四大湾区数字媒体产业竞争力研究报告》发布仪式”在复旦大学举行。会后,记者采访了复旦大学新闻学院传播与数据科学实验室主任孙少晶教授。
记者:如今,我们越来越意识到传播学与数据科学的联系正在发生并且越来越深入。您如何理解传播学与数据科学的结合?
孙少晶:数据和传播的内在联系催生了传播数据科学。传播的过程也是数据产生的过程,传播技术和传播方式的发展丰富了数据内涵,作为传播的重要媒介,数据与传播在本质上是不可分割的。传播数据科学既着眼于在传播过程和理论视角中考察数据,又通过数据的相关环节考察传播现象。传播学需要建立在经验和数据上的观察,数据积累和使用为传播学者提供了传播过程研究及理论建构的可能,而传播理论发展为数据科学研究者在理解使用数据和批判解读数据方面提供了不同视角。传播学与数据科学的结合能够碰撞出思维的火花,两者在学科概念、研究范式和问题取向等方面有共通性。
记者:您认为数据科学研究与传播学如何才能更好的结合,两者的内在关联又是什么?
孙少晶:传播数据科学并非是表层科学用语的借鉴,两者不管是在理论、还是在方法层面都可以产生融合。过去我们常常会有一种误解,认为传播学只能提供理论或概念,数据科学只能提供工具和方法,数据科学革命的兴起和传播技术的创新带来的社会生活变化提醒我们必须打破这种观念。从理论层面看,传播学积累了丰富的理论和学术成果,而数据科学的批判研究、对数据的解读性思想也具有理论特点。从方法论层面,传播研究离不开严谨科学的研究设计和路径设计,数据科学也需要在把握传播规律基础上去分析呈现数据,促进对传播现象的经验理解。因此,无论是在理论还是在方法层面,两者都有互通结合之处。数据科学并非单一的工具开发和技术发展,传播学并非只有抽象的概念和理论,两者不是对立存在的,在同一层面上可以实现交流。对问题的思考会达成学科间的真正融合,我认为传播学与数据科学的连接核心是问题和创新,通过回答和解决共同的问题、追求和创新共同的目标实现两者在理论和方法层面的结合。
记者:在数据驱动型研究中常常面临着“数据孤岛”、数据结构化等问题,您可以分享一些数据获取和分析的方法吗?
孙少晶:传播数据科学研究的数据来源非常广泛,文字、图片、音视频、生理信号等不同形式的数据、已有或现有的数据都可以作为原始素材,采集数据的方式也是多样的。比如运用传统的社会调查、实验法等方式收集数据,再如利用实验设备收集微观的心理生理数据,以便帮助解答使用传统方法的研究无法回答的问题。研究者也可以利用互联网公开平台收集数据,如推特、微信、微博等等社交媒体数据,通过借助传播学提供的理论视角分析特殊类型数据,考察数据和社会深层次价值理念的关联。学者也可以将媒体和科学文献数据对比分析,探讨某一问题从专业平台进入大众讨论平台是否会产生曲解。
记者:您觉得传播数据科学的研究应该注意什么?
孙少晶:首先,不同于以往始于理论、终于理论的量化研究,传播数据科学研究离不开数据本身,要学会从不同层面挖掘不同类型的数据进行研究,创新研究方法,在考察数据的过程中形成有价值的社会问题。其次,打破传统思想的束缚,建立传播学和数据科学在理论共联和方法工具方面可以融合的观念。在研究过程中,除了利用语义分析、机器学习、数据建模、自动算法等工具,还要借助传播学的传统的理论分析方法对数据进行批判考察,将理论数据结合起来提升研究质量。需要注意的是,理论和方法的有效结合才能充分发挥两者的优势。不管是传播学还是数据科学,都有其学科范式的局限性,这就需要我们考虑两者的适用范围和预设前提,从而更好地界定研究范围。此外,还要警惕对数据过度迷信、过度崇拜和过度解读,关注在数据应用中可能产生的“数据鸿沟”、数据壁垒以及数据挖掘和隐私保护等伦理问题,注意对数据的批判性解读。
记者:在掌握了数据研究素材之后,如何更好地对研究中的新发现、新问题追根溯源?
孙少晶:社会科学领域的研究不能仅仅停留在描述层面,还要探究问题背后的深层发生机制。一方面,虽然随着信息技术的飞速发展,诸多物质性客体的数据化趋势日益突出,但是也要注重探求事物本源的路径和方法。创新研究方法,开发研究工具,综合运用不同方法对问题或现象进行细致和深入的分析。另一方面,搭建科学的数据搜集、挖掘和开发平台,建立具有传播学特点的核心信息库,与不同来源、不同性质的数据进行对话,结合数据分析工具和理论支持让数据“发声”。此外,通过长期积累建立具有重大意义的大型数据库,对数据进行结构化处理,跟踪不同阶段的数据变化情况,不断补充和修复确定模型的信度和效度,增强理论从假设、检验到建模的说服力。
记者:如今,人类社会活动产生的数据越来越多的被记录下来,数据为人类行为研究提供了重要视角,那么数据背后到底是什么呢,您如何看待数据科学研究的局限性呢?
孙少晶:数据驱动的社会研究既考察社会数据,也关注基于数据的传播问题,既要有“是什么”的理解,也要有”为什么“的阐释,既关注微观现象,也要关注宏观的社会情境。在传播数据科學的研究中,不仅要分析相关关系,更要探索层次关系、从属关系、因果关系。通过创新研究设计方法,基于现实的实证数据进行理论阐释,融合社会数据和传播理论,借助以量化和可视化形式的数据可以揭示人类社会行为的真正动因和隐藏的深层关联,例如运用社交媒体数据分析网民对公共议题的情绪和认知,考察网民行为的内部或外部驱动力进而预测不同传播模式对网民关注、表达和参与公共事件的影响。数据驱动的深入研究也推动了批判性数据科学发展,传播数据科学的研究者应该努力用理论的思维考察数据,同时用数据的思维反观理论。
记者:新闻传播学研究应该如何充分挖掘数据的价值?
孙少晶:植根中国数字媒体发展的新时代,“获取数据、分析数据、运用数据”已经成为社会科学研究者的基本功。积极应对大数据时代对新闻传播学研究带来的冲击和挑战,运用数据可视化工具提高新闻叙事能力、新闻分析能力,创新新闻生产模式和机制。重视具备数据深入挖掘、分析、处理和分享能力的人才培养,促进数据共享,消除数据孤岛,把海量的数据变成有用的信息,规范数据伦理,防止数据滥用,增强传播公信力。习近平总书记在若干重要场合指出,“在互联网经济时代,数据是新的生产要素,是基础性资源和战略性资源,也是重要生产力”,与中国挺立潮头的数字媒体产业实践的飞速发展相适应,我们更应该顺应数字技术发展的潮流,让数据、技术、科研的力量充分整合,促进跨学科、跨专业、跨院系、跨学校、跨行业的横向交叉融合。
记者:您觉得传播数据科学的发展对今后的社会科学研究有哪些启示?
孙少晶:当今数字技术、传播技术的发展已经全方位地影响到了我们相关地一切。人们的社交习惯、思维模式和生活方式发生了前所未有的改变,与数字技术所承载的内容相比,社会关系的变革、交往方式的变革、协作机制的变革更值得我们关注和思考。在数据已经深度影响社会发展的背景下,数据科学促使社会科学研究改变了传统的研究路径和方法,大数据推动下的学科交叉互动,多元学科知识、多元科学工具和方法碰撞、交流和融合,给未来的社会科学研究提供了更大空间。大国发展需要敞开朋友圈,拥抱全球化,学术创作也需要合纵连横、广纳博收、兼容并蓄,以开放和严谨的态度吸收人类文明的一切成果。所以,我们今天跟华东政法大学、同济大学合作来举办学术活动,联合发布研究报告,就是一种尝试,希望能够借助系列论坛、系列会议、系列报告等方式推动跨专业、跨学科、跨院校的合作。