“爬虫”窃取的电子书

2023-06-21 17:16秦风
检察风云 2023年12期
关键词:腾飞爬虫网页

秦风

利用“爬虫”软件,非法复制发行他人作品3968本,违法所得2031万余元。2022年11月29日,江西省永丰县人民法院发布了这起线上侵犯著作权案,侵权人肖俊被判处有期徒刑5年,罚金100万元,并退缴全部违法所得。

 “爬虫”赚流量

现年30岁的肖俊,湖南省衡阳市人。2014年7月,肖俊入职当地的文化传媒公司,该公司的经营模式主要是通过提供电子阅读赚取广告费。

肖俊从中得到启发,一年后,他通过自学应用软件程序,开发了“某读免费小说”App(以下简称某读App)。为了利用该软件牟取利益,他从腾讯广告联盟下载广告包并插入“某读”应用程序,用户在通过某读App阅读小说时,一旦点击弹窗跳出的广告,腾讯广告联盟会自动以点击量计算其推广费。

2015年9月24日,肖俊在长沙市租赁了写字间,注册成立“畅想网络技术工作室”(以下简称“畅想工作室”),并以该工作室名义将某读App上架到小米商城、应用宝等平台,供读者下载使用。

经过三四年的运行,某读App的用户逐渐增多,但扣除版权费用和房租及人工开支,工作室只能勉强维持经营。如何才能实现“暴富”梦呢?肖俊想出了歪招。

2019年6月,肖俊租用了腾讯云服务器,并在互联网上搜索源代码进行编写,添加了“爬虫”软件,通过将“爬虫”程序编程植入某读App应用,实现了App的优化,同年12月,某读App基本成型。

作为数据采集程序,“爬虫”不仅能自动扒取各个小说网站的网页链接,还可以将小说名称、小说作者、小说简介、小说图片等信息进行分类,并上传至腾讯云服务器,且不间断更新扒取内容。用户只要通过软件程序搜索小说相关文字,服务器会自动从扒取的小说信息中提取出来,再转码至第三方网页重新排版,运营者可插入广告公司提供的广告供用户阅读。

但是,网络服务商对著作权资质实施严格的审查制度。为了过关,肖俊伪造了作品转让以及授权证明,再上传至各个应用商城。另外,肖俊还写了“软文”,通过自媒体对其App进行推广。

江西省某大学在校学生吴成,经常在手机上阅读付费小说。2019年5月的一天,他浏览某微信公众号,看到推广某读App的软文。该软文称,不必注册账号,不必充值,直接下载某读App,就可以免费阅读。吴成点击了软文中的链接,果不其然,他在某读App里直接输入小说名称,可以搜索到想看的小说,还可以下载到手机。天下没有免费的午餐。吴成在阅读时,每进入一个界面都会有广告自动弹出来,软件运营商主要靠这类插入广告赚钱。

换马甲“变现”

某读App的盈利模式,是与腾讯广告联盟合作投放广告,点击量的单价在0.2元至1元之间,每个月计算好广告总点击量和广告收入后,腾讯广告联盟就会将对账单寄过来,肖俊审核签完字再寄回去,腾讯广告联盟就会将广告投放的钱转到畅想工作室的对公银行账户。

2020年1月,畅想工作室账户收到近百万元广告推广费,肖俊欣喜之余,又觉得这钱赚得有点烫手。某读App提供的作品毕竟是盗版,要想长久经营,并且躲避法律风险,得从长计议。

肖俊在上海宝山区、奉贤区租赁了两处写字间,分别以其父亲和母亲的身份注册了工作室,即上海昶悠网络技术工作室(以下简称“昶悠工作室”)和上海毓璃网络技术工作室(以下简称“毓璃工作室”)。为了制造假象,肖俊还让畅想工作室与昶悠工作室、毓璃工作室之间签订合伙协议。

从2020年5月起,他开始用两个工作室的对公银行账户,接收腾讯广告联盟结算的广告推广费用。

除了让父母挂名担任工作室法定代表人,肖俊还将某读App换上新的马甲,推出了“海某免费小说”App和“豆某免费小说”App,这两个App使用的都是某读App的安装包,肖俊将它们更换名字和软件头像后上架,出现在小米商城、华为商城、VIVO商城、应用宝等各大平台,从此流量“变现”的渠道更广了。

2020年1月1日至2021年8月24日,腾讯广告联盟向肖俊支付广告推广费共计2031万余元,其中畅想工作室账户收入916.76万余元,昶悠工作室账户收入28.68万余元,毓璃工作室账户收入1086.39万余元。肖俊收到广告推广费后,转到以其父亲肖某名义设立的股票账户用于购买股票。

依法受制裁

2021年6月,北京腾飞克科技有限公司(以下简称“腾飞克公司”)发现某读App未经公司许可,大量非法复制公司享有著作权的作品。

不久,腾飞克公司授权南通昊轩知识产权服务公司(以下简称“昊轩公司”)就某读App侵犯知识产权纠纷事项,代为签署提交起诉书、投诉书、证据等法律文书,代为向有关机关请求追究侵权人的行政、刑事和民事责任等。而后,昊轩公司又将该授权转授给江西永丰舸渡网络科技有限公司(以下简称“舸渡公司”)。

舸渡公司根据被复制小说的书单,委托司法鉴定机构对某读App鉴定,结论为与版权公司享有版权小说相似度大于70%的书多达3968本。

2021年8月19日,肖俊因涉嫌侵犯著作权罪,被江西省永丰县公安局刑事拘留,同年9月24日被执行逮捕。

案发后,肖俊的父亲肖某多次代表儿子与腾飞克公司协商,2021年9月10日,腾飞克公司与肖俊签订了一份《谅解协议书》,肖俊自愿一次性支付赔偿金200万元。协议书载明,腾飞克公司系《最强大师兄》等作品的独家信息网络传播权完整著作权权利人,乙方(肖俊)在未经腾飞克公司授权的情况下,在肖俊开发的某读App内复制、转载及传播《最强大师兄》等热门网络小说。鉴于肖俊的代理人多次主动找腾飞克公司协商并赔礼道歉,以及肖俊的悔改态度,甲方接受乙方的道歉,同意给予谅解。然而,该协议并未履行。

以“爬虫”技术窃书不可为

2022年3月8日,永丰县人民检察院以侵犯著作权罪,对肖俊提起公诉。其间,因肖俊无法到庭,法院裁定中止审理。2022年8月,恢复审理。

法庭上,公诉人指控称,被告人肖俊以营利为目的,未经权利人许可,复制发行他人文字作品,情节严重。

肖俊辩称,其没有复制、发行他人作品,某读App只是提供链接,其行为不构成犯罪。

经过公开审理,法院认为,被告人肖俊在其开发的某读App中,通过网络“爬虫”技术内置搜索引擎,并配之相应的转码技术实施侵犯著作权的行为。其特殊之处在于,不同于以往传统电脑客户端的著作权侵权,该行为是依托移動互联网App进行著作权侵权。

法院指出,网络“爬虫”是自动提取网页的程序,它为搜索引擎从其他网页上下载网页,是搜索引擎的重要组成部分。肖俊利用网络“爬虫”定向抓取相关网页资源,过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的队列,直到达到系统的某一条件时停止。所有被“爬虫”抓取的网页会被系统存储,进行一定的分析、过滤,并建立索引,以便之后查询和检索。在该App中,肖俊还设置了转码技术,基于搜索引擎技术,对电脑端网页格式进行自动转换,即自动生成移动手机端网页格式。肖俊以营利为目的,未经著作权权利人许可,擅自在其开发的某读App中复制发行他人享有著作权利的文字作品,其行为构成侵犯著作权罪。

2022年11月29日,江西省永丰县人民法院公开发布一审判决书,被告人肖俊犯侵犯著作权罪,判处有期徒刑5年,并处罚金人民币100万元;追缴被告人肖俊违法所得2031万余元及其产生的收益,上缴国库。在法定期限内,肖俊没有提出上诉。

(文中除肖俊外,其余人名均为化名)

编辑:夏春晖 386753207@qq.com

猜你喜欢
腾飞爬虫网页
利用网络爬虫技术验证房地产灰犀牛之说
基于Python的网络爬虫和反爬虫技术研究
卢腾飞
小小三双鞋,见证腾飞路
基于CSS的网页导航栏的设计
利用爬虫技术的Geo-Gnutel la VANET流量采集
基于URL和网页类型的网页信息采集研究
大数据环境下基于python的网络爬虫技术
网页制作在英语教学中的应用
10个必知的网页设计术语