刘田 张文德
〔摘 要〕针对数字图书馆中著作权的特殊性,应用修正收益法、收益分成法、市场法3种评估方法及加入反馈环节,对数字图书馆中的著作权评估结果进行线性组合预测(按关联度大小确定权系数法)和非线性组合预测(加权算数平均值组合预测和加权调和平均组合预测两种模型),使评估结果更贴近实际,为数字图书馆下的著作权评估提供一种新构思。
〔关键词〕数字图书馆;著作权;评估模型;反馈环节;组合预测
DOI:10.3969/j.issn.1008-0821.2012.02.004
〔中图分类号〕G250.76 〔文献标识码〕A 〔文章编号〕1008-0821(2012)02-0015-05
Study on Copyright Valuation Model in Digital LibraryLiu Tian1 Zhang Wende2,3
(1.Library,Fujian Agriculture and Forestry University,Fuzhou 350002,China;
2.Information Construction Office,Fuzhou University,Fuzhou 350108,China;
3.Institute of Information Management,Fuzhou University,Fuzhou 350108,China)
〔Abstract〕According to the speciality of copyright valuation in digital library,a linear combination forecasting model(coefficients according to correlation degree)and a nonlinear combination forecasting model(weighted mathematic means and weighted harmonic means)were established with modified profit method,profit sharing rate method,market method and feedback,which make valuation more reasonable.This paper put forwards a new method for copyright valuation in digital library.
〔Key words〕digital library;copyright;valuation model;feedback;combination forecasting
數字图书馆的出现给著作人的著作权保护带来了许多新问题。在数字图书馆时代,关键要对数字图书馆中的著作权进行合理科学的评估,从而保持社会公众利益和著作权人利益的合理平衡。而知识产权评估的特殊性,决定了必须建立一个各种方法相互补充的评估方法体系[1]。
本文以传统知识产权的评估理论为依据,针对数字图书馆中的著作权的特点,选择修正收益法、收益分成法和市场法3种评估方法,并加入反馈环节,通过组合预测方法构建线性和非线性组合预测模型。使评估结果值更贴近实际,为数字图书馆下的著作权评估提供了一种新思路。
1 评估方法
1.1 修正收益法
曾丽霞等[2]采用DELPHI法、AHP方法、模糊评价法对收益现值法的结果进行修正,构建一个包括社会效益、经济效益、数字化效益三大方面、3个层次、45个指标的评估指标体系及模型,以合理评估数字图书馆环境下的著作权的真实价值。评估步骤如图1:
评估初值E0(收益法)评估因素体系及权重(AHP方法)纠偏系数C(双权数模糊评价法)公允评估值E(E0×C)图1 修正收益法评估步骤
1.2 收益分成法
康云萍等[3]选用基于收益法基础上产生的收益提成率法来评估数字图书馆著作权的价值。结合AHP方法确定带来超额收益的相关因素,通过构建一个指标体系系统来确定无形资产收益权重,全面、综合地衡量数字图书馆著作权的价值。评估步骤如图2:
评估初值E0(收益法)评估因素体系及权重(AHP方法)确定收益提成率β(DELPHI法)公允评估值E(E0×C)图2 收益分成法评估步骤
2012年2月第32卷第2期数字图书馆中的著作权评估模型探讨Feb.,2012Vol.32 No.21.3 市场法
市场法[4]是根据替代原则,采用比较或类比的思路及其方法判断资产价值的评估技术规程。运用市场法要求充分利用类似资产成交市场价格信息,并以此为基础判断和估测被评估资产的价值。运用市场法,首先要选择适当的参照物。参照物与待评估资产之间应当具有可比性,包括功能、市场条件及成交时间等方面;然后对于参照物和待评估资产之间的差异进行分析和量化;最后在参照物成交价格的基础上调整已经量化的差异指标。市场法的基本计算公式为:
被评估著作权价值=同类交易实例价格×调整系数
由于数字图书馆是一个新兴事物,因此有关数字图书馆的交易实例非常少见,这就给现行市场法应用带来了障碍。如果依赖传统媒体的交易价格作参考的话,就忽视了数字图书馆作为数字媒体、网络媒体的新特点,评估结果就显偏颇。而且现行市价法的调整系数的确定带有非常明显的主观色彩,对评估人员的经验依靠程度非常大。
本文尝试从两个途径运用市场法对数字图书馆中的著作权进行评估,一是由数字图书馆提供之前作品著作权交易记录,建立数据库。通过将带估图书/文献与数据库中已有记录进行比较,在匹配度超过80%的情况下,根据匹配程度确定调整系数,从而得出被评估作品的著作权价值。
当本地数字图书馆的数据库中没有符合条件的条目时,再转而连接网络方式。用户可根据自身情况选择网络途径,主要包括以下4种情况:(1)其它数字图书馆的数据库。(2)专业评估机构相关历史数据。需要成为对方的使用用户,而且需要耗费比较多的时间,并付费,相应的结果也更准确。在此列举几家专业评估机构[5],如下:①北京北方亚事资产评估有限责任公司,②北京无形资产评估有限责任公司,③北京中金浩评估有限责任公司,④北京无形资产评估有限责任公司,⑤深圳市世鹏评估有限公司,⑥天诚评估咨询公司,⑦北京无形资产评估公司等。(3)非盈利型评估所相关历史数据。需要与对方有合作关系,需要耗时。在此列举几家专业评估机构,如下:①国家科技评估中心,②科技部科技评估中心,③长春市科技评估中心,④浙江联政科技评估中心,⑤广东省科技评估中心,⑥河北省科学技术情报研究院科技评估中心,⑦科学技术部科技评估中心,⑧江西省科技评估中心,⑨黑龙江省科技评估中心等。(4)法律途径维权问题赔偿。例如①2002年北京大学法学专家陈兴良诉中国数字图书馆有限责任公司著作权侵权案。②2004年中国社会科学院知识产权中心郑成思等七位我国知识产权保护的知名专家状告北京书生数字技术有限公司侵犯其著作权。③2007-2008年期间,上千名博士、硕士状告北京万方数据股份有限公司未经许可擅自将自己的论文收录入数据库并出售给一些单位和个人。对于授权不完整的案件,万方被判构成侵权而承担相应的侵权责任。赔偿标准博士论文3 100~3 300元,硕士论文2 500元。④2008年“中国知网”(CNKI)被近百名硕博士告上法庭,诉称侵犯其著作权。案件中有21起获得了法院判决支持,获赔金额在2 000~3 500元不等。显然,经由法律判决所得赔偿金额,与著作权本身价值相比明显偏低。如果应用于市场法,需要注意调整参数的修正。
2 反馈环节
在评估过程中加入反馈环节,既可以用短期的反馈来修正评估值,使评估值更趋近实际;又可以用反馈来检验评估的准确性,进一步改进参数,使得之后的评估更准确。
对于选取的指标数据,由用户将其直接量化成“放大”或“缩小”。指标主要包括:
2.1 点击率
点击率是一个比率,直接数字量为点击量,即阅读量。点击率是对网络和数字资源利用率的真实反映,在一定程度上能够真实反映出作品的学术水平与社会影响力,也是目前比较公认的网络信息质量评价标准。点击率可以反映作品的影响力,社会价值和学术价值,有助于用户花费最少的代价获取资源。
2.2 浏览量
作品所在网页被浏览的情况。浏览量>阅读量。它体现的是作品和相关文献被关注的情况。
2.3 下载量
作品被网络读者下载的次数。下载量<阅读量<浏览量,它体现的是作品满足用户需求的程度。
2.4 被引用情况
作品被刊物上的文献的引用情况,包括国内外核心刊,EI/SCI/CA/CSCD/CSSCI来源期刊等。并根据期刊影响力量化此处被引用数。
2.5 关键词及相关词在数字图书馆中的搜索情况
搜索情况反映了作品研究内容的被关注度。但此处需要说明的是,在学术界,搜索量不等同于优质度。一方面,新的领域新的理论,文献较少,也许搜索也少,但反而说明其新颖程度。另一方面,一些偏僻冷门的学科也面临被搜索少的问题。所以在搜索情况的比较上,要特别具体问题具体分析,再给出是“加分”还是“减分”。
2.6 作品在搜索引擎中的搜索情况
不只是数字图书馆,在门户搜索网站上,作品被关注的情况。如果无法和网站协商,得到有效数据,也可以借鉴搜索的条数和搜索用时等。在收集数据时要特别注重微博或博客、分享网站、空间、论坛、贴吧、Wiki等新兴发布交流平台的收录情况。
2.7 作者是否继续进行相关主题研究
如果作者有就相关主题继续出版书籍、发表文献、参加会议等,可加强此主题的完整性和连贯性,属“加分”项。
采样作品出版/发表后3个月、6个月、1年的相关指标数据,由用户输入,根据关联度计算调整系数,从而得出相应的反馈数据的著作权评估值。
3 组合预测
基于以上3种评估方法和反馈环节,考虑到每种评估方法都有一定的局限性,而又不能互相替代,故引入组合预测,通过线性或非线性组合预测的方法对几个评估结果进行组合,使各方面因素考虑的更充分全面,以期得到最佳结果。
组合预测[6],就是将不同的预测方法进行适当的组合,综合利用各种方法所提供的信息,从而尽可能地提高预测精度。组合预测方法比单一预测方法更为科学,因为对同一预测问题,不同的预测方法提供不同的有用信息,如果简单地将预测误差较大的一些方法舍弃掉,将会丢失一些有用的信息,这对信息是一种浪费,应予以避免。根据组合预测模型的组合形式不同[7],组合预测一般可分为线性组合预测和非线性组合预测。
3.1 线性组合预测
设预测对象存在m个单项预测方法,利用这m个单项预测方法得到的第i个单项预测方法的预测值为f璱,i=1,2,…,m。
若组合预测值f满足:f=l1f1+l2f2+…+l璵f璵,则称该组合预测为线性组合预测。其中l1,l2,…,l璵为各种预测方法的加权系数。
在判断加权系数时,线性组合预测可分为(1)等权平均组合预测,即各组合预测加权系数相等,这种方法不需要了解单一的预测值的预测精度,也不需要进一步知道单一的预测误差之间的相互关系。使用起来简单方便。(2)不等权组合预测。又包括按误差绝对值和确定权系数法;按方差大小确定权系数法;按误差倒数确定权系数法;按关联度确定权系数法等。其中①按误差绝对值和确定权系数法,利用加权平均的方法,对较精确的预测值赋予较大的权重,简单方便,数学意义明显。②按方差大小确定权系数法,按方差大小确定权系数。对方差较小的模型预测值赋予较大的权重,简单方便,数学意义明显。③按关联度大小确定权系数法,灰色系统理论提出的一种分析系统中各因素关联程度的量化方法,与实际值关联度越大的模型加权值越大[8]。
本文选择按关联度大小确定权系数法,组合预测时,对于3种评估方法,先求取或采访各单项评估方法在预测段数据与实际值的关联度,再确定其加权值,从而使评估值更接近实际值。
3.2 非线性组合预测
若组合预测值f满足:f=g(f1,f2,…,f璵),其中g为非线性函数,则称该组合预测为非线性组合预测。常见的非线性组合预测形式有:加权几何平均组合预测模型和加权调和平均组合预测模型。
3.2.1 加权几何平均组合预测模型
加权几何平均组合预测也是常用的组合预测方法之一。它有时比加权算术平均组合预测方法有更好的组合预测效果。下面给出其模型,并讨论组合预测权系数估计。
根据加权几何平均数计算公式,令:
Иt=∏mi=1xliit
其中t为第t时刻的加权平均组合预测值,xit为第i种单项预测模型在第t时刻的预测值,i=1,2,…,m;t=1,2,…,N,li为第i种单项预测方法的加权系数,且总和为l,满足归一化条件。
为了计算加权集合平均组合预测的权系数,将上式两边取自然对数得:
若预测误差不存在,即t=xt则有:
Иlnxt=∑mi=1lilnxit t=1,2,…,N
然而由于多种因素的影响,组合预测的误差一般是不可避免的。因此定义如下形式的预测误差:
В濯t=lnxt-∑mi=1lilnxit=∑mi=1li(lnxi-lnxit),?t=1,2,…,N
其中e璽称为加权几何平均组合预测在第t时刻的组合预测对数误差。
因此以预测对数误差平方和为准则的非负权系数的几何平均组合预测模型为下列最优化问题,记为模型(2玻保:
ИminQ=∑Nt=1e2t
∑mi=1li(lnxt-lnxit)=et,?t=1,2,…,N
∑mi=1li=1,?li牛埃?i=1,2,…,m
记R=(1,1,…,1)琓,R为元素全为1的m维列向量,L=(l1,l2,…,lm)T,В牛健疲危簦剑保濯itejtm×mВeit=lnxt-lnxit,其中E称为加权几何平均组合预测的对数误差信息矩阵。则有:
А疲危簦剑保濯2t=∑Nt=1∑mi=1∑mj=1lieitljejt=LTEL于是该模型化为矩阵形式,记为模型(2玻玻:
这也是一个二次规划问题,利用獽uhn-Tucker条件[9]可将其转化为线性规划模型来求解,得最优组合预测权系数向量。
3.2.2 調和平均组合预测模型
调和平均组合预测是一种比较常用的组合预测方法,在某些情况下它可以比加权算术平均取得更好的组合预测效果。因此有必要对其进行研究,以便选择适当的组合预测模型。
设某一预测问题的某个指标序列为{x璽,t=1,2,…,N},对此预测问题存在m种单项预测方法对其进行预测,设x﹊t为第i种单项预测模型在第t时刻的预测值,i=1,2,…,m;t=1,2,…,N,根据加权调和平均数计算公式,令:
Иt=∑mi=1li∑mi=1lixit=1∑mi=1lixit
其中t为第t时刻的加权调和平均组合预测值,li为第i种单项预测方法的加权系数,且li满足归一化约束条件:
А疲恚椋剑保飒i=1,?li牛埃?i=1,2,…,m
为了计算加权调和平均组合预测的权系数可变化为:
А疲恚椋剑保飒ixit=1t,?t=1,2,…,N
假设在理想的情况下,t=xt,即预测误差的不存在,则有:
А疲恚椋剑保飒ixit=1x
然而在预测的实践中,组合预测的误差一般均是存在的。因此定义如下形式的预测误差et:
В濯t=∑mi=1lixit-1xt
其中e璽称为加权调和平均组合预测的在第t时刻的组合预测误差。
显然组合预侧的预测误差平方和越小越好,因此以预测误差平方和为准则的非负权系数的组合预测模型为下列最优化问题,记为模型(2玻常:
ИminQ=∑Nt=1e2t
∑mi=1lixit-1xt=et,?t=1,2,…,N
∑mi=1li=1,?li牛埃?i=1,2,…,m
记R=(1,1,…,1)T,R为元素全为1的m维列向量,L=(l1,l2,…,lm)T,E=(e1,e2,…,eN)T,X=(1/x1,1/x2,…,1/xN)T,H=1/x111/x12…1/x1N
则有:А疲危簦剑保濯2t=ETE=(HL-X)T(HL-X)。
于是模型(2玻常┗为矩阵形式,记为模型(2玻矗:
minQ=(HL-X)T(HL-X)
显然,这是一个二次规划问题。根据二次规划理论可知,该二次规划问题的最优解一定存在。利用獽uhn-Tucker条件可将其转化为线性规划模型来求解,从而可获得最优组合预测权系数向量。
可见,两种非线性组合预测都是基于不同时刻的预测值进行组合的,因此适用于加入反馈环节的评估过程。
3.3 两种预测模型的比较
线性组合预测是不同评估方法之间的一种组合,而非线性组合预测由于加入反馈环节,其总体预测效果会优于线性组合预测方法。对于非线性组合预测,除了引入反馈环节,可以考虑再对不同评估方面的结果进行线性组合,这就结合了不同方法的优点和不同时刻的数据,使评估结果更接近实际值。但反馈环节需要时间采集数据信息,因此有一定限制。所以要根据实际情况选择预测模型。
4 应用举例
某科普作品的作者授权超星数字图书馆使用其著作,超星数字图书馆对该著作数字化后,通过提供在线阅读和下载的方式将该著作提供给读者,并对读者收取了相关费用。根据该著作在超星数字图书馆的浏览量和下载量来统计,预计在未来5年,该著作每年可为超星数字图书馆创造经济效益10万元,超星数字图书馆按收益的20%支付报酬给著作权持有人。评估时确定的折现率是11%。求该著作权的评估值。
4.1 修正收益法
输入:10万元-11%-5年-20%,在不更改系数的情况下得到
E1=7.3918×1.062733≈7.86(万元)
4.2 收益成本法
输入:10万元-11%-5年,在不更改系数的情况下得到
E2=39.76万×6.051%=2.41(万元)
4.3 市场法
连接数据库。根据参数的比较,找到一篇匹配度>85%的文献,基于二者分类号的大类相同,数据库中的作品字数略少于待估文献字数,出版时间比待估文献早半年,且其他数据的相似度亦较高。待估文献选题较新,原文献的评估值为6.5万,根据专家意见得到调整系数为0.87。
E3=6.5万×0.87=5.66(万元)
4.4 线性组合预测
根据用户输入,根据关联得到的线性组合预测参数。
E=0.5×E1+0.2×E2+0.3×E3=0.5×7.86+0.2×2.41+0.3×5.66=6.11(萬元)
4.5 反馈环节
3个月后,此文献的反馈情况比设想得差,低于设想情况,γ1取0.95。
E(1)=E×γ1=6.11×0.95=5.80(万元)
6个月后,此文献的反馈情况与设想接近,γ2取1。
E(2)=E×γ2=6.11×1=6.11(万元)
1年后,此文献的反馈情况比设想得好,高于设想情况,γ3取1.12。
E(3)=E×γ2=6.11×1.12=6.84(万元)
4.6 非线性组合预测——加权调和平均组合预测模型E=0.14×E(1)+0.28×E(2)+0.58×E(3)=6.49(万元)
5 结语与展望
本文结合修正收益法、收益分成法和市场法,加入反馈环节,利用组合预测方法,提出了几种评估方法相结合的数字图书馆中的著作权评估模型。其一是对不同方法的评估结果进行线性组合预测(按关联度大小确定权系数法);其二是根据不同时刻反馈值,对评估结果进行非线性组合预测(加权算数平均值组合预测和加权调和平均组合预测两种模型),以减少单一方法或单一时刻对评估造成的局限性,使不同评估方法和不同时间的反馈值互相补充,从而使评估结果值更贴近实际。评估模型为数字图书馆著作权问题提出一个参考,可以作为对著作权人进行合理补偿的依据,为解决数字图书馆著作权人合理利益和社会公众利益的博弈提供现实基础。
目前数字图书馆下著作权评估问题还是一个比较前沿的问题,相关的法律依据、基础资料和数据还不是很充分。本文评估的前提是出于传统的“读者付费”机制,与之相对的开放获取(OA)则建立了另外一种付费机制——“作者付费”机制[10],即出版机构向作者(而不是读者)收取一定的出版费,并通过网络出版其作品,而读者对这些资源的获取则是完全免费的。如果在评估中再引入这一概念,两方面结合对数字图书馆中的著作权进行评估,可能更符合读者利益,有待进一步研究。另外,在利用组合预测时,如果可以运用人工智能的非线性方法,人为因素就会更少,也使结果更贴近实际。在反馈方面,参数的选取还有待完善,如果可以加入自学习环节,就可以将反馈“学”来的参数注入程序中。所以加入人工智能也是未来努力的方向。
参考文献
[1]张文德.数字图书馆的知识产权评估方法研究[J].图书情报工作,2006,(5):91-94.
[2]曾丽霞,张文德.数字图书馆环境下的著作权评估方法新探[J].图书情报工作,2007,51(3):80-84.
[3]康云萍,张文德.利用收益分成法评估数字图书馆的著作权[J].情报杂志,2007,(10):22-24.
[4]邵俊岗,陈源丽.基于市场法的软件价值类比估计评估模型研究[J].佳木斯大学学报:自然科学版,2009,(2):210-213.
[5]知识产权评估企业名录[EB/OL].http:∥corp.net114.com/sou/%E8%AF%84%E4%BC%B0%20%E7%9F%A5%E8%AF%86%E4%BA%A7%E6%9D%83.html.
[6]陈雁.组合预测方法研究及其软件系统设计与开发[D].哈尔滨:东北农业大学,2007.
[7]毛开翼.关于组合预测中的权重确定及应用[D].成都:成都理工大学,2007.
[8]张疆涌.组合预测方法研究[D].南京:东南大学,2008.
[9]Roger H.von Haefen and Daniel J.Phaneuf.Kuhn-Tucker Demand System Approaches to Non-Market Valuation[J].The Economics of Non-Market Goods and Resources,2005,(6):135-157.
[10]王咏梅,张文德.开放获取模式下“作者付费”机制在中国运作探析[J].新世纪图书馆,2010,(6):44-47,56.