摘 要 算法新闻是随着算法产生的一种新的新闻形式,近年来随着“信息茧房”等问题的广泛讨论随之引出了对于算法新闻伦理的讨论。值得注意的是,算法新闻伦理的研究需要考虑算法这一技术维度。算法新闻伦理聚焦于三个问题:一是算法作为一项技术对其进行研究的方式有哪些;二是算法新闻伦理的讨论如何应用算法研究进行讨论;三是算法新闻伦理的主要问题及其解决思路。
关键词 算法新闻伦理;ITO;逆向工程
中图分类号 G2 文献标识码 A 文章编号 2096-0360(2018)22-0081-03
近年来,机器生成新闻逐渐成为新闻制作生态系统的一部分,因而也模糊了新闻、计算机科学和统计之间的界限[1]。这类机器生成新闻有多种不同的表述,国内有学者总结了五种不同的说法,机器新闻,自动化新闻,数据驱动新闻,计算新闻,算法新闻[2]。在这五种说法中,最受学者们认同的是算法新闻这一提法。上述五种不同的表述都突出了算法新闻生产过程的不同特征,综合各种不同的说法,可以概括出算法新闻较为综合性的概念的表述:无人工干预,依托大数据资源,整合数学、计算机等多学科工具,以算法程序为核心生产新闻的过程。
随着算法新闻的普及和迅速常态化,关于算法新闻的挑战和伦理问题也逐渐开始成为学界关注的一个课题。显著地如国内较为关注算法推荐新闻产生的“信息茧房”这一现象。新闻业发展至今,技术通常被视为辅助新闻过程的工具。然而,技术及其物质载体不被认为是新闻生产实践重要的参与
者[3]。算法是算法新闻的核心参与者,因而,算法新闻伦理的讨论必须考虑算法这一技术维度。
1 算法及其伦理研究方式
算法作为技术,研究存在着难度。首先是技术壁垒,其次是算法自身的不透明性,即俗称的“黑匣子”。近几年来有学者尝试建立算法研究的模型,大致有三种:
一是被广泛应用于算法相关研究的输入—吞吐量—输出(ITO)模型[4]。这个模型是根据市场所有类型的算法应用程序特征总结出的模型。输入一般为大数据,输出为应用程序响应后的结果。有些情况下,输出也作为下阶段的输入。模型的关键在于吞吐量这一中间环节。在这一环节,主要是通过数据整理进行元素提取和相关性分配。
二是概念(聚集、可能性或概率、时间)与行为者(代码、实践、规范)所构成的一个3×3的矩阵[5]。这个矩阵勾勒了算法伦理研究的框架。即使算法是不稳定的研究对象,随时会调整,且不具备透明性,其伦理仍然可以通过重新描述一个伦理框架来进行系统的研究,以追踪、操作的概念,然后在算法组合的要素中寻找这些概念的证据。
三是包含数据、算法模型、界面、推理四个阶段的框架[6]。这四个阶段主要是对信息从开始到最终到达终端用所经历的渠道描述。这一框架运用扎根理论,以焦点小组的方式收集了50名新闻传播学界和业界的关于算法必须要透明的具体方面。
这三种算法研究模型,第一种侧重于算法在运行过程中的选择(过滤)与相关性匹配等机制。后两种则聚焦于算法的不透明性。第二种矩阵框架试图通过探究算法外部值得关注的问题而绕过探究“黑匣子”内部。第三种则是以透明为主题的一种算法研究框架。
借助于算法研究模型,可以探究算法新闻伦理的主要问题及伦理问题主要的责任对象以便于解决伦理问题。
2 算法新闻伦理
2.1 算法新闻中的权力迁移
算法新闻伦理可以从媒介/组织、专业/个人、社会/受众三个领域进行讨论。国外学者康斯坦丁·尼古拉斯·多尔将普勒尔的伦理多层责任体系(组织、专业、社会)与魏申贝格、马利克和肖勒提出的媒介、个人和受众领域这两种不同的分类体系进行综合得出以上三个领域[7]。算法新闻伦理之所以不同于传统新闻伦理的讨论,主要原因是算法的介入使媒介/组织与专业/个人领域面临着权力的迁移。权力的迁移在组织/媒介系统的表现主要是由机器人负责收集信息[8]。如BuzzFeed实验室开发的客户端BuzzBot,负责收集如来自博客等网络资源,从而代替了以往记者收集信息的工作。在专业/个人领域,原本由记者或编辑进行的诸如把关等环节大部分由算法程序代替,人类工作者只是辅助程序进行工作。由于掌握把关权力的算法以聚集或累积用户注意力为目标,因而用户接收到的信息则是以满足受众心理或观点相似的“溺爱式”信息,直至深陷“信息茧房”而不自知[9]。不能忽视的一点是,算法背后的设计者连同算法一起获得了这种权力。
多尔借助算法研究的ITO模型,从算法的输入、输出、吞吐量三个阶段分析产生算法伦理问题的因素以及各领域权力迁移的对象。详见表1。2.2 算法新闻伦理的现实问题
多尔为算法新闻伦理建构了理论基础,但是现实中各领域对于算法新闻的认知以及现实中存在的问题仍需要研究。
2.2.1 數据、代码、透明度:算法新闻伦理问题的关键因素
通过多尔的算法新闻伦理框架,可以看到数据、透明度、代码是算法新闻伦理中的关键因素,而这三个指标正好是算法的研究内容。新闻制作过程中的数据总是面临选择,不论是采访还是通过数据统计进行一个报道。现有数据的完整性、质量和可靠性对算法新闻至关重要,就像对其他形式的新闻报道一样[1]。而国外的一些相关研究表明,算法新闻数据来源主要是社交媒体,并不具备多样性,另外也难以保证数据的权威性。代码作为算法的直接载体,正在代替记者和编辑帮助用户筛选新闻,如何理解代码的意图将是未来需要进行研究的一个方向[10]。
算法新闻伦理与算法伦理相似,都面临着透明度的问题。新闻媒体中算法透明度的概念是试图阐明算法信息公开的机制。公开有关算法如何驱动各种计算系统的信息,将允许用户确定操作中的价值、偏见或意识形态,以便理解新闻产品的基本观点。算法透明主要有两个障碍:一是受制商业动机,无法披露;二是终端用户无法理解披露的内容[6]。
2.2.2 组织/媒介、社会/受众、专业/个人领域对于算法新闻的认知
多尔虽然分析了算法新闻伦理在三个领域的主要影响因素,但仍需要了解三个领域目前对于算法新闻的认知,以便认识到算法新闻面临的现实问题。目前,学术界对于组织/媒介、社会/受众领域进行了探究,尚未对专业/个人领域进行研究,如没有以计算机技术精英为研究对象的文献。
1)组织/媒介领域。目前,新闻机构,尤其是记者和编辑等人类工作者,对于算法这一技术的认识仍然存在质疑。国外有项研究专门探讨了专业人士对这一技术的看法。参与者来自BBC、CNN和汤森路透社等较有影响力的新闻机构。这些记者拥有由一家领先技术供应商提供的机器人写作软件的第一手经验。结果表明记者对自动化的判断存在质疑,包括算法新闻数据来源,以及算法的新闻敏感性[11]。
2)社会/受众领域。受众对于算法新闻的认知主要有以下三个特点。
首先,受众对于算法新闻背后的算法并不了解。有研究对美国大学生关于新闻个性化和新闻优先次序选择标准等问题进行了考察。结果发现,学生们基本上不知道新闻来源是否真实以及如何跟踪用户数据,并运用编辑判断来提供个性化结果[12]。
其次,受众对包括算法选择在内的所有方式都持有怀疑态度。但是,年轻人对算法選择的认可程度更高,喜欢软新闻的用户更加认可算法选择这一方式[13]。
再次,算法没有人类记者创作的新闻受用户欢迎。一项在线试验通过更换不同主题的新闻,如金融,体育以及文章实际来源和声明来源研究受众对于计算新闻的感知,研究表明,不管实际来源是人类作者还是机器作者,人类作者的新闻更受测试者欢迎[13]。
3 算法新闻伦理问题解决思路
算法新闻伦理的主要问题在于算法本身的局限性,如数据来源单一且缺乏权威性,以及受众对于算法新闻背后的算法质疑且不了解的矛盾现状。如何知晓数据源以及在没有技术背景的支撑下,受众又该如何监督算法新闻存在的伦理问题?
数据来源及其权威性问题需要增加数据审核功能,即如多媒体编程接口最好能够在搜集到数据后对于数据进行审核。数据的发布平台必须对数据进行审查,确保数据源权威性。数据源单一性主要是结构化数据的单一性,社会或国家机构可以在一个特定的时间发布机构相关数据。同时,非结构化数据也可以作为一种数据源,如已经在用的个人博客等。
受众监督算法的一个可能的尝试是通过“逆向工程”来实现。逆向工程是通过对领域知识、观察和推理的严格检查来阐明系统规范的过程,以揭示该系统如何工作的模型[6]。
逆向工程途径的提出是基于算法总有其确定的输入与输出,这两个端口可以帮助禅明算法的功能,而不用具体理解代码及其中的算法。最常见的是利用应用程序接口API观察访问算法的输入输出。输入也面临两种情况,可视和不可视,这就需要对输入进行模拟和通过与设计者交谈来观察。但需要考虑到的是算法并不是一成不变的,相反,它是会随时调整的。因而,通过逆向工程来了解算法新闻背后的算法运作机制仍然存在局限性。
参考文献
[1]Carl-Gustav Linden.Decades of Automation in the Newsroom[J].Digital Journalism,2017,5(2):123-140.
[2]吴锋.发达国家“算法新闻”的理论缘起、最新进展及行业影响[J].编辑之友,2018(5):48-54.
[3]Alex Primo,Gabriela Zago.Who And What Do Journalism?An actor-network perspective[J].Digital Journalism,2015,3(1):38-52.
[4]Latzer, M.;Hollnbuchner, K.; Just, N. & Saurwein, F. (2014).The economics of algorithmic selection on the Internet. Working Paper – Media Change & Innovation Division. University of Zurich, Zurich.
[5]MikeAnanny.Toward an Ethics of Algorithms:Convening,Observation,Probability, andTimel-iness[J] .Science, Technology,& Human Values,2015,41(1):93-117.
[6]Nicholas Diakopoulos , Michael Koliska.Algorithmic Transparency in the News Media[J].2016,5(7):809-828.
[7]Konstantin Nicholas D?rr,Konstantin Nicholas D?rr. Ethical challenges of algorithmi-c journalism[J].Digital Journalism,2017, 5(4):404-419.
[8]喻国明,杨莹莹,闫巧妹.算法即权力:算法范式在新闻传播中的权力革命[J].编辑之友,2018(5):5-12.
[9]陈昌凤,霍婕.权力迁移与人本精神:算法式新闻分发的技术伦理[J].新闻与写作,2018(1):63-66.
[10]Matthew S. Weber , Allie Kosterich.Coding the News:The role of computer code in filtering and distributing news[J].Digital Journalism,2018,6(3),310-329.
[11]Neil Thurman, Konstantin D?rr ,Jessica Kunert.WHEN REPORTERS GET HANDS-ON WITHROBO-WRITING:Professionals consider automatedjournalisms capabilities and conse-quences[J].Digital Journalism, 2017,5(10) :240-1259.
[12]Elia Powers.MY NEWS FEED IS FILTERED?Awareness of news personalization amon-gcollege students[J].Digital Journalism,2017,5(10):1315-1335.
[13]Richard Fletcher, Rasmus Kleis Nielsen.Generalised scepticism: how people navigat-e news on socialmedia[J].INFORMATION, COMMUNICATION & SOCIETY,2018:1-19.
作者简介:陈环环,中央民族大学传播学2017级硕士研究生,研究方向为计算传播学。