□ 文 刘罗敏行
数据新闻是一种新型而多元的新闻报道方式,其以数据和文本的挖掘为资源基础,但由于数据本身的不确定性以及数据使用机制的缺陷,使得数据新闻面临侵权与被侵权的风险,影响了数据新闻的发展。本文在借鉴了欧盟相关规定的基础上,认为对于数据新闻的著作权规制应该坚持知识产权的公共政策性,简化版权许可负担,完善数据新闻的合理使用制度,多领域各主体共同协调以促进新闻事业在大数据时代下的新发展。
伴随着互联网和数字技术的发展,我国的新闻业面临着前所未有的数字化转型,这是挑战,也是机遇,数据新闻正是在大数据时代的挑战和机遇中应运而生的新型新闻样式。
数据新闻(data journalism)也称数据驱动新闻,是一种通过使用数据而完成的,以数据的挖掘、分析、统计、获取和可视化呈现为基础的新闻。关于数据新闻著作权规制的难点及有效方式探讨具有理论意义和价值。
虽然数据资源在一定程度上属于社会公共资源,但是当特定的个人或组织将某一领域的相关数据进行具有其独创性的收集、分析和整理工作后,数据文本便凝聚了这些组织和个人的智力劳动,属于著作权法保护的对象。以网易新闻的数据新闻栏目“数读”为例,在该栏目中有大量的数据新闻作品。以数据新闻报道《过去四十年,中国消失了91.6万所小学》为例,其使用的数据来源包括《中国教育统计年鉴》《全国教育事业发展统计公报》等。这篇报道其后又被搜狐、今日头条等转载,产生较大的影响力,然而其中的数据采集和整理均源自国家统计局、教育部等单位,事实上他们享有对其收集、整理的智力成果的著作权,若新闻作品任意汇编或使用相关数据而不对其进行数据来源的说明,将会面临侵害他人的数据智力成果的侵权风险。因此,规制数据新闻作品对于数据的使用既有利于新闻行业的发展也有利于对数据智力成果著作权人的保护。
“独创性”又叫“原创性”,是判断作品是否值得保护的核心法律要件。数据新闻需经过数据的收集、整理、分析、排版,在最终的新闻作品中包含了对数据的整理分析以及独立构思的可视化呈现,符合作品独创性的要求,应当对其进行著作权法的保护。
概括来说,数据新闻的数据形式丰富多样,包括文字、代码、图片、视频音频等,这些资源的获取途径是多样化的。既可能是新闻平台自行进行原始数据的搜集,如自行进行调查问卷,也有相当一部分来自于既有的已经成型的数据资料。一般来说这些资源又是受到著作权保护的对象,因此数据新闻中的数据面临的保护和利用是双重的。一方面,如果限制过于严格,会不利于数据资源的流通以及文化产业的发展,这与新闻自由以及鼓励、促进文化发展的初衷背道而驰。另一方面,在大数据时代,信息过剩严重,数据新闻通过相当的智力劳动基于数据分析得出的新闻作品使得新闻价值得到充分体现,通过数据挖掘、算法寻找,分析出数据与数据的关系并将其以可视化、互动化的形式呈现在大众眼前,使得专业的叙事能力和强大的信息支撑相结合,提供了更加多样的新闻报道路径,降低了信息不对称的可能性。此类数据新闻作品应该得到足够的重视与保护,因此对数据新闻的版权保护尺度的把握就显得尤其重要。
数据来源的广泛性决定了数据本身的不确定性和流动性。数据新闻所使用的数据不仅包括已经公开的数据,如政府部门、企业和其他组织根据公民的知情权而向社会公开的,而且包括媒体通过采访、调查等方式获得的数据。对于与公共利益相关且已经公开的数据,属于已经流入公共领域的部分,数据新闻对其的使用或可落入合理使用和法定许可。但是对于通过个体同意收集而来的访谈或调查数据,则具有很强的不确定性特征。单个信息在特定的条件下可能属于完全的公共领域之内的信息,但在特定环境下或与其他信息相联系的时候便会拥有特定的指向以及能被人所感知的独创性。有观点认为应该创立数据专有权,将数据信息改为衍生数据成为知识产权的客体。如果这些数据信息构成作品,属于能够被他人客观感知的外在表达,并以符号化的体系表达出来,且在文学、艺术和科学领域内具有独创性,那么我们就将其视之为智力成果,可以用著作权对其进行保护。然而,随着信息网络技术的发展以及新闻媒体渠道日益社交平台化,新闻发布的门槛日益降低,人人都能在其社交账号上讲述故事、发表意见。这种开放性的特点导致了数据进入新闻编辑时的审查制度的缺位,实践中出现的大量地引用其他新闻作品的数据新闻,这类报道缺乏原创性,只是在已有的数据新闻作品的基础上稍加修改,然而这种形式对原始新闻是否构成侵权,却并没有清晰的定义。
“公共政策性”是知识产权的独特的性质,知识产权的公共政策性可以大致描述为:为促进创新等公共政策目标,而在权利保护范围、期限等方面形成和呈现的特性,或者在保护范围、期限等制度设计上所刻意体现的公共政策考量和特性。知识产权的客体是无形的智力成果,其权利范围并不是天然产生的,需要依靠法律对其权利范围进行划定。出于对智力成果的保护和对创新精神的鼓励,著作权对于作者的保护是肯定的,但这并不意味着对作者权利的绝对保护。
当今时代,数据呈现爆炸式的增长和积累,数据流通已然成为人们最重要的生活方式。甚至有学者将我们所处的时代称之为“后信息时代”。在这样的时代背景下,数据资源的重要性不言而喻,对于数据新闻的作者而言,其作品是他的智力成果,有权利使其得到相应的保护,因此法律赋予了权利人对其知识增量一定程度和范围的财产权。对于使用者而言,数据资源本就是公共思想领域中的一部分,要想文化得以创新,就必须保证公众在公共文化领域中使用、学习、欣赏作品的自由,只有在这样相互的促进中,人类的文明才能得以发展。因此,对于数据新闻作品作者权利的保障更应该坚持公共政策的目标,使得交织发展的个人权利和公共利益得以不断调适和平衡.
一般来说,新闻报道所涉及的事实、数据等并不在版权保护范围内,但是在数据新闻的数据使用过程中涉及到对已经享有著作权的作品和相关数据库的利用,并且使用这些数据和文本还未经权利人许可时,就可能涉及侵权。然而如前所述,由于数据本身的不确定性以及法律上的不确定性,对于是否侵权还需要到具体的案件中再作判断,这导致了司法裁判的不确定性和版权归属的不确定性。另一方面,对于新闻作品来说,繁琐的审查不符合新闻作品本身的传播性、时效性的要求,不利于新闻传播行业的发展。
如何在保护内容产业的同时也能保证著作权人的权利得以实现呢?欧盟在立法方面做出了积极的努力。欧盟于2019年通过了《欧盟数字化单一市场版权指令》,该指令第二条的定义规定“文本和数据挖掘”是指任何旨在分析数字形式的文本和数据的自动分析技术,以便生成包括但不限于模型、趋势、相关性等在内的信息。该版权指令的第三条至第六条则规定了新的版权例外情形和限制,包括“以科学研究为目的的文本和数据挖掘”、“在数字和跨境教育活动中使用作品或其他内容”以及“文化遗产的保存”。事实上,增加版权例外规则,确保版权信息充分利用,是有利于公共利益的行为,版权限制与例外制度的核心价值,就是在各种法律之间维持一种平衡。
总之,随着信息技术的发展,大量的数据抓取和文本分析已成为数据新闻收集使用数据的必经之路,在这个体量庞大的自动化过程中,简化版权许可负担、允许新闻媒体以公共利益为目的,合理地使用自动化技术分析数据,将大大减少法律障碍,促进数据新闻领域数据分析能力的发展。
数据新闻作品使用的数据来源具有体量大且性质不确定的特点,因此,在新闻报道中的数据使用均需征得著作权人明示许可的要求,将大大增加数据新闻创作的成本,成为信息传播的阻力。虽然我国《著作权法》在修法后扩大了新闻报道的引用范围:在合理使用条款规定中将原条款的“时事新闻”修改为“新闻”,进而将新闻报道扩展到了时事之外的其他领域,更加充分保障了公众的知情权,这的确是合理使用制度上的一大进步,但这里对“新闻报道”的引用仅限于在报纸、期刊、广播电台、电视台等媒体中不可避免地再现或者引用已经发表的作品,这样的信息通道是单向的。然而在当今的媒体环境下数据新闻相对于传统媒体而言,其数据与文本挖掘实则更依赖于自下而上的自媒体、社交平台等渠道,在这样交流互动的渠道下,数据的收集使用更为全面更具有时效性,更趋近于最后的数据新闻作品,以此才更能保障公众的新闻自由和新闻知情权。因此,合理使用制度应充分注意到这一现象,并对现有法律做出尽可能清晰的明确定义。
在社会层面,社会大众往往有网络资源免费的惯常思维,在网络上上传或下载作品时缺乏相应的法律风险意识,因此增强民众的版权意识是多元主体协同治理的基础。对于生产数据新闻的媒体方而言,形成行业自律机制非常重要。与传统的新闻报道相比,数据新闻主要依靠的是海量的数据收集和文本挖掘,这增加了数据新闻侵犯他人知识产权的可能性。另一方面,数据新闻的数字化呈现方式更能使受众直观、便捷、高效地接收信息,这增加了数据新闻被侵权的风险。因此,保护数据新闻作品的版权就显得尤其重要,只有媒体的版权意识提高,新闻业发展出相应的行业自律机制,新闻市场才会有一个绿色健康的竞争环境,文化产业才能得到更好的发展。总而言之,只有社会大众、媒体和政府机构多元主体协同合作,才能更好地应对新时代数据新闻所带来的更多的挑战。
在数字时代背景下,数据新闻作为新的信息形式,其智力成果的保护对新闻文化事业的发展具有重要的意义。明确数据新闻作品的著作权保护难点才能对症下药,在坚持知识产权公共政策性的基础上进一步简化数据新闻的版权许可负担,完善数据新闻的合理使用制度,并在法律和政策的保障下联合社会大众和新闻行业等多元主体,从不同层面对数据新闻可能涉及著作权侵权的风险进行规避才能更好地发展数据新闻,促进新闻自由和文化事业的繁荣发展。■