追根溯源:我国数据新闻的数据隐忧及突破路径

2022-02-13 09:19赵鑫镖王春煜
视听 2022年2期

赵鑫镖 王春煜

21世纪是以数据为生产资料的大数据时代。人工智能、云计算、区块链等新兴技术逐渐改变传统生产模式,成为新式生产力,而社会生产关系的运转则更加依赖互联网环境。信息技术是一种记忆的技术,而遗忘在互联网平台成了意外。互联网为大数据的产生提供温床的同时,也给社会带来了一定的风险。2010年,腾讯与奇虎360的“3Q之战”拉开了我国互联网领域数据安全问题的序幕。2016年,阿里巴巴集团意图让顺丰从腾讯云切换至阿里云,并要求顺丰将客户隐私数据提供给菜鸟物流。2020年4月,市场监督总局依法做出行政处罚,责令阿里巴巴集团停止“二选一”等违法行为。通过梳理我国数据安全相关问题可以发现,我国数据及其延伸产业在高速发展的过程中,不断出现数据垄断、数据寡头、数据侵权等问题。数据新闻是以数据为核心,通过挖掘、清洗、分析及可视化技术来展示数据背后关联和意义的新闻报道新形式。数据是数据新闻生产的根基和源泉。因此,在数据安全问题备受关注的背景之下,从数据安全视角出发讨论数据新闻的数据隐忧及其突破路径,具有重要意义。

一、从生产流程探寻数据新闻的数据隐忧

(一)数据垄断:一些政府部门和企业的数据开放程度低

南方都市报的数据新闻记者邹莹在从事数据新闻工作时发现,我国数据新闻最大的痛苦莫过于数据缺失,且多数数据未被公开,这种选题一旦碰壁,让人倍感无力①。我国政府和大型互联网平台掌控着大量高价值的数据资源,其中部分数据资源属于社会共有资源。合理利用这部分数据能促进数字经济发展与社会治理。当下,我国一些地方政府和企业的数据开放程度、范围、质量较低,数据垄断成为当地数据新闻生产与发展的第一绊脚石。

从全球数据开放的现状来看,欧洲地区数据开放程度排名第一,其次是美洲,开放程度最低的是非洲地区②。从整体来看,各地数据开放程度与其经济发展、科技水平、文化底蕴有很大的相关性,而数据新闻的数据获取难易程度与数据开放程度息息相关。随着我国国际地位的提高和综合实力的增强,2019年,我国修订了《政府信息公开条例》。从政府信息公开工作的基本原则来看,新修订的条例更加明确要以公开为常态,并且不断扩大主动公开的范围。此外,该条例还细化了政府信息公开的范围、程序、监督及保障机制。但当下,我国一些地方政府的数据公开仍存在滞后、惰性和模糊问题。未来,我国数据开放进程还需时间沉淀和不断推进。

其次,数据的公共资源属性在我国互联网平台企业中难以体现。从我国企业数据共享现状来看,企业数据共享使得数据使用权和所有权分离。数据获取者在使用过程中可能会带来数据滥用、数据侵权等问题。因此,大多数企业会将数据当作企业隐私来对待,对数据开放持保守态度。由于互联网平台数据可能牵扯商业机密和个人隐私问题,因此,如何使公共利益、企业利益、个人利益达成三项平衡,成为企业数据共享的难点。此外,我国企业数据共享还处于初始阶段,法律和政策对企业数据问题涉及较少,互联网平台企业的数据共享办法有待进一步制定与颁布。同时,由于很多企业认识不到数据共享的社会价值和长远意义,缺乏企业数据共享实践案例,导致企业数据共享不积极,这都不利于企业数据开放的推进。

(二)数据造假:数据的客观性和真实性难以保证

2021年两会期间,全国人大代表宋文新提出,整顿无底线追星,明星成名应靠作品和实力而不是数据和流量。近年来,随着网络新媒体的飞速发展,数据为王、流量是金的理念进一步被认同。数据带来的经济效益是直观的。正如《技术元素》里说的:“目光聚集的地方,金钱必将追随。”③大数据是一组系统信息,蕴含着新闻的价值④,而数据造假也为数据新闻传播带来了难题。2018年,艺人蔡徐坤过亿微博转发量引发社会对数据造假的关注。微博数据主要包括微博的点赞量、评论量、转发量,而明星的过亿微博数据大部分都是明星粉丝刷出来的假数据。加之自动刷量、批量刷量工具的运用,使数据造假变得简单快捷。此外,商品营销、公司公关、网络水军、优良统计传统的缺失、有效监督机制的缺位,都使得数据造假成为常态⑤,数据的准确性、客观性、可靠性、可信度难以得到保证。大数据的特点是数据体量大、种类繁多、价值密度低,这也为数据的核查和清洗带来极大的困难。优质的数据内容必须保证数据真实可信⑥。真实性和客观性是新闻的基本原则。数据新闻是数据驱动的新闻报道,而数据的真实和客观与否都会影响数据新闻报道的质量。数据造假不仅给数据新闻制作者清洗数据带来了困扰,还会误导受众。因此,数据造假成为数据新闻生产的第二绊脚石。

(三)数据依赖:崇拜数据与迷恋可视化表达

随着微博、微信、短视频的崛起,碎片化阅读成为读者乐于接受的信息获取方式。一图看懂新闻是读图时代的新特点。数据新闻是传统媒体为满足受众需求而形成的新闻报道新方式。但在满足受众需求的同时,传播者容易忽略数据本身的特征和新闻内容的特点,过分迷信数据本身,使得数据新闻的呈现仅是数据的组合与叠加,抑或浅显的统计分析。这就弱化了新闻对数据背后意义和关联的阐释,且执念于数据的可视化呈现。通过对比分析中美数据新闻的数据表现可知,对于新冠肺炎疫情期间的就业失业问题,财新网的《疫情冲击就业市场,艰难时刻如何度过?》仅展示了失业的数据,而纽约时报《被过早欢呼,关注核心失业率》的报道对失业率数据进行深入分析和深度挖掘,指出新冠病毒打破了大多数的经济模型,对于失业率的数据,应该剔除临时裁员后的核心失业率。此外,对于疫情期间的经济问题,财新网的《疫情冲击有多大?压力在哪里?广州民企这么说》只将数据调研转化为简单的可视化图示,而纽约时报的《观察经济衰退的另一种方式:用电量下降》则对美国电网的全国用电量进行了阐释⑦。

(四)数据侵权:存在数据隐私权和著作权侵权的风险

在数据新闻发布阶段,我国数据新闻作品面临着著作权和数据隐私权侵权的风险。数据侵权成为数据新闻生产与发展的第四个绊脚石。合法获取和使用数据是避免侵犯隐私权的重要方式。数据新闻获取的网络数据是由网民的个人数据组成的。数据隐私权是隐私权在大数据时代的延伸。法律规定,个人数据受隐私权的保护,需要征得个人同意和法律许可才能使用。网络平台上的个人数据及数据集归属于个人还是平台,成为隐私保护避不开的话题。国家网络安全法规定,个人信息是指以电子或者其他方式记录的能够单独或者与其他信息结合识别自然人个人身份的各种信息。网民的浏览记录、消息记录、消费记录等信息都可以界定为个人信息。此规定将个人信息的范畴进一步扩大,而关联性个人信息也应当被认定为个人信息。个人信息范畴的扩大虽有利于保护个人隐私权,但也可能导致个人信息边界的消弭。个人信息概念的泛化和模糊也为保护个人隐私带来困扰。

法律保护个人隐私取决于个人信息的认定,而现实中个人信息和非个人信息的界限并非黑白分明,一成不变,而是随着技术的进步不断变化。此外,个人隐私权还受个案情景差异的影响,这些都可能使数据新闻触碰数据隐私法律红线。

保罗·莱文森说过:“一切技术都是刀子的翻版。”技术在为数据新闻的数据获取提供便利的同时,也为隐私泄露提供了温床。置身于大数据时代,每个人都成了“全景式监狱”里的透明人。网络平台收集个人信息及数据主要通过用户注册、登录来创建用户基本信息,而数据库会创建用户的信息表,同时,信息表收集用户在网站上的操作行为。网站收集用户数据信息主要通过HTTP Cookie和Cookie技术。Cookie技术是通过设置记忆文件实现操作行为的记忆,实现用户的连续操作⑪。此外,还有对用户操作行为的不断备份,并对丢失文件进行恢复的增强技术。

互联网时代,全社会信息生产的分工更加去中心化,与第三方机构合作成为常态化运营现状,媒体独自生产数据新闻已经成为过去式⑫。数据新闻由于作品属性、著作权人身份的特殊性,令其版权保护变得更为困难⑬。数据新闻作品著作权归属问题超越了当下我国著作权法规定的法理概念范畴。对于一般的合作作品,其著作权归属于参与完成这一作品的所有自然人。因此,行使合作作品著作权必须取得所有作者的一致同意,缺少任何一位合作者的同意,合作作品著作权的行使都会被判定为无法律效力。由于我国对数据新闻作品版权保护还没有明晰的认定,相关概念还未充分厘清,应对治理及惩罚的相关规定还存在大量法理空白,因此,数据新闻作品著作权诉讼几乎陷入无法可依的现状。对法律部门而言,数据新闻中的数据归属认定技术操作难以实现,媒体对数据新闻版权保护意识较为薄弱,维权意识有限,使得数据新闻作品的著作权保护、著作权归属面临法律困境⑭。

二、从数据视角探索数据新闻的突破路径

笔者结合数据新闻的生产流程,从数据安全视角来追根溯源,分析我国数据新闻发展进程中的困境,通过对数据新闻的数据垄断、数据造假、数据依赖、数据侵权的问题思考,简析数据新闻的突破路径。以下,笔者着重探讨数据新闻媒体或机构在相关问题上的应对策略。

(一)承担数据责任,形成行业规范

为应对我国当下一些政府部门和企业数据开放程度低的难题,数据新闻生产者应采取客观理性的态度。信息共享、数据开放理念是伴随着互联网技术发展而产生的新理念。任何新理念从产生到被普遍接受都需要经过时间的沉淀和事件的推进,同时,接受过程中还会伴随层出不穷的新问题。绝对垄断和完全开放并不利于保障社会安全和经济发展。数据开放程度取决于信息的定位和获取信息对象的使用目的。目前,数据新闻行业规范还没形成,数据开放可能会带来责任难以认定的问题。而作为获取数据的主体,应当承担起相应的数据责任,具备数据伦理道德。传播者对数据的使用是为了进行必要的新闻传播,是为了满足公众获取信息的需求,以更好地引导社会舆论。

此外,数据新闻机构之间应首先在数据开放和数据共享的理念上达成共识,实现同行之间数据共享、共赢。数据新闻报道要给政府、企业和公众留下值得信任的印象,这是数据新闻媒体为解决数据获取困难应有的态度和格局。对数据新闻记者而言,如果采用非正当手段获取数据,抑或对数据进行偏向性筛选,都会影响数据新闻的公信力。因此,数据新闻媒体之间也要建立行业标准和道德规范,以此来影响和规制数据新闻记者的认知、态度和行为。

VarianClinic600直线加速器6MV高能X射线机,购自美国瓦里安公司;BV‐520型多普勒探测仪,购自上海寰熙医疗器械有限公司;Med550酶标仪,购自美国Bio‐Rad公司;CLARIOstar全波长荧光扫描酶标仪,购自德国BMG LABTECH公司。

(二)抢占数据自主权,降低对外部数据的依赖

媒体应建立自身的数据库来降低对外部数据资源的依赖程度,拥有一定的数据获取备选方案,数据新闻机构也可以与数据企业达成合作,签署数据合作协议。政府、企业、个人的数据资源丰富了数据的容量,提升了多样性,但同时也存在很多不确定性。数据持有者也可能存在私心问题。在面对不利于维护自身美好形象的数据时,数据持有者可能会修改相应的数据并进行选择性传达。数据新闻媒体在不知情的情况下进行数据处理和新闻报道,会丧失新闻报道的自主权,进而影响数据新闻的公信力和客观性。因此,数据新闻机构降低对外界资源的依赖程度就显得尤为重要。

媒体数据库的建立有利于提高媒体之间数据的相互使用,提高新闻业的透明度和公信力。2020年,美国已尝试自建媒体数据库。虽然中国也在摸索,但中国数据新闻机构自建数据库的开发程度和普及程度均不高。由解放日报出品的上观新闻的自建数据库已容纳有自采数据、爬虫数据和政府公开数据等内容⑮。

(三)提升数据素养,提高版权意识

身处信息时代的记者更加需要对大量数据进行核对、分析和整理⑯。为应对数据造假和数据侵权问题,数据新闻传播者应练就一双慧眼,提升从业人员的数据素养。如果新闻记者不具备良好的数据新闻素养,就会造成重要信息的遗漏,也会让错误的结论误导受众⑰。当下,我国新闻传播专业需要跨学科的知识储备。然而现状是,计算机专业的学生鲜少知晓新闻传播,新闻传播专业的学生很难有好的计算机编码基础⑱。由此可见,我国数据新闻人才培养应该划分校园培养和媒体培养两个分支。高校需聘请计算机、数学、统计专业的老师来开设数据挖掘、清洗、分析和可视化课程⑲,新闻专业的研究生招生也应重视理工科背景的跨专业考生。媒体培养可通过老人带新人的模式,定期开设数据素养学习班,和不同行业进行交流学习,在工作中磨炼和提升员工的数据素养。武汉镝次元数据科技有限公司就通过与高校及数据新闻研究所合作,培养出大量涵盖数据挖掘与搜索、数据分析、数据可视化与运营人才,形成了数据素质培育方案。再者,数据新闻机构需转变生产理念。数据新闻生产可以借力政府、企业或个人等具备数据清洗和分析能力的合作对象⑳,也可外包或成立相应的法律部门,让知法懂法的专业人才来把关数据的挖掘清洗和数据新闻发布过程。

为避免数据侵权问题的发生,数据新闻生产者理应向数据源提前说明使用者身份和使用意图㉑,并请求数据源对涉敏或涉密数据进行修改和审查,以符合数据归属者的合理预期和数据的合理合法利用的法理要求。数据新闻从业人员要提升版权意识,加强对数据新闻著作权的判定能力培养,养成维权理念。对于商业数据和个人数据,媒体可支付一定的费用,当数据涉及公共利益、企业利益或个人利益冲突时,要以社会利益为主,保护公众利益。总之,数据新闻传播者应承担更多的社会责任,在获取数据源的同时,不能辜负数据归属者的信任。应保障数据归属者的数据安全,不得泄露个人隐私数据。

三、总结

我国数据及其延伸产业刚刚起步,各种数据商业模式还在探索和发展之中,且暴露的相关数据问题还不彻底。当下,基于数据隐忧而提出的解决问题的方法还在不断酝酿和革新中。在这种情况下,处理数据问题的方式也应顺势而为,应时而变。

媒介依赖大众资源和社会公共资源,而社会和大众同样需要媒介来获取信息,因此,双方具备了依赖的相互性。数据新闻在危机传播中发挥着重要作用,危机数据新闻的传播高度依赖外部数据资源,而对数据依赖成瘾将会对数据新闻发展带来很多负面影响。媒介过度依赖外部环境资源会使得二者互动异化,互动异化则很可能会导致二者从合作走向分裂。因此,要提醒数据新闻媒体或机构在不断从外部环境中汲取养分的同时,也要释放对外部环境的回馈信号,及时给外界环境“回礼”。两者只有对等依赖,才能实现合作共赢。

注释:

①邹莹.可视化数据新闻如何由“作品”变“产品”?——《南方都市报》数据新闻工作室操作思路[J].中国记者,2015(01):92-93.

②唐斯斯,刘叶婷.全球政府数据开放“印象”——解读《全球数据开放晴雨表报告》[J].中国外资,2014(09):28-31.

③[美]凯文·凯利.技术元素[M].张行舟,余倩 等译.北京:电子工业出版社,2012.

④⑳陈力丹,李熠祺,娜佳.大数据与新闻报道[J].新闻记者,2015(02):49-55.

⑤朱鸿军.警惕数据新闻中的新闻伦理问题[J].传媒,2017(03):34-36.

⑥支庭荣.优质数据内容三要素:真实、量大、有用[J].青年记者,2021(07):5.

⑦杨宏.中美数据新闻专业规范对比研究——以新冠肺炎疫情期间财新“数字说”与纽约时报“UpShot”栏目为例[J].青年记者,2020(36):40-41.

⑧唐铮,丁振球.数据新闻的社交化传播之困——基于两个数据新闻微信公众号的定量研究 [J].新闻记者,2020(11):59-67.

⑨郎劲松,杨海.数据新闻:大数据时代新闻可视化传播的创新路径[J].现代传播(中国传媒大学学报),2014(03):32-36.

⑩⑰沈浩,谈和,文蕾.数据新闻记者的数据素养[J].青年记者,2014(21):17-18.

⑪丁晓东.用户画像、个性化推荐与个人信息保护[J].环球法律评论,2019(05):82-96.

⑫⑮王琼,徐园 等.中国数据新闻发展报告(2018-2019)[M].北京:社会科学文献出版社,2020.

⑬王鸿.可以分割使用合作作品著作权行使规范之完善[J].学海,2016(06):149-153.

⑭刘建.数据新闻合作作品著作权归属的困境及其破解[J].出版发行研究,2018(09):80-83.

⑯方洁,颜冬.全球视野下的“数据新闻”:理念与实践[J].国际新闻界,2013(06):73-83.

⑱刘义昆.大数据时代的数据新闻生产:现状、影响与反思[J].现代传播(中国传媒大学学报),2014(11):103-106.

⑲许向东.对中美数据新闻人才培养模式的比较与思考[J].国际新闻界,2016(10):100-110.

㉑王敏.大数据时代如何有效保护个人隐私?——一种基于传播伦理的分级路径[J].新闻与传播研究,2018(11):69-92+127-128.