王 娜,杨建梅,李志宏
(华南理工大学 工商管理学院,广东 广州 510640)
20世纪80年代以来,以开放源代码软件、百度百科、维基百科等优秀知识产品的生产为代表,出现了大众生产这种崭新的生产方式。大众生产不断地冲击着现有的生产方式,并使社会和经济发生了许多深刻的变化。
目前,对于大众生产的研究已经成为了学术界的一个前沿。国内外对大众生产的研究主要集中在相关概念的制定及内涵[1],大众生产的组织结构[2]、主体特征[3]、产权制度[4]、参与动机[5]几个定性的方面。定量研究旨在探索大众生产的规律,比如奉献者的贡献呈现幂律分布[6],封闭环境与开放环境下大众生产系统的智能体数量变化及系统的稳定情况等[7]。而有关评价大众生产系统效率的研究相对较少,利用DEA对百度百科的词条效率进行直接研究的论文几乎没有。
本文探讨了评价百度百科词条效率的输入和输出指标,收集了百度百科“管理理论”分类中的164个词条的相关数据,并利用DEA方法分析了相关词条的效率,这也是对一个人类活动系统的绩效的评价[8]。
由于DEA方法不需要预先估算参数,使得该方法的实践范围极其广泛,尤其是在数理统计方法无法适用的情况下更能显现出其显著优势。DEA方法主要在三大领域得到广泛的应用: 生产函数与技术进步研究、系统预测与预警研究和经济系统的效率评价研究[9]。
经济系统的效率研究评价。在银行效率研究方面,Aly,Grabowski,Pasurka,Ranga首次应用DEA方法对美国322家银行进行了技术效率、规模效率和配置效率的分析[10]。Wang,Huang,Lai等人以2004年中国的4家国有商业银行和12家私有商业银行为研究对象,选定资本金、资产为输入指标,净收益、ROA、ROE为输出指标进行分析[11]。在企业效率和成本收益方面,Chandra利用DEA的CCR模型对加拿大29家纺织公司进行了效率分析[12]; Friedman和Stein应用相关性分析、DEA值的方差分析和交叉效率分析3种不同的分析方法,对以色列72家工业企业的效率进行了排序,并验证了DEA方法的适用性[13]。在工业企业的经济效益和管理效率评价方面,1990年魏权龄等应用DEA方法对中国纺织工业系统内的177个大、中型棉纺织企业进行了经济效益评价[14]。谭志国应用DEA评价模型,对我国主要制造企业的总体效率、纯技术效率和规模效率进行了测算,分析规模收益状况,并对非DEA有效的评价单元进行投影分析及投入产出值的调整,进而分析了企业经营效率与资源配置效率之间的关系[15]。另外,DEA方法在学校、图书馆、医院等公共事业单位、各种软科学、基础设施投资、投资绩效评价以及运营绩效分析及评价等方面都有广泛的应用。
以下是魏权龄等介绍的DEA效率评价模型。
CCR模型是DEA方法最基本的模型。假设有n个决策单元,每个决策单元都有m种类型的“输入”,以及s种类型的“输出”,分别表示该决策单元“消耗的资源”和“活动的成效”。各决策单元的输入数据和输出数据分别由xij和yij表示。xij为第j个决策单元对第i种类型输入的投入量;yrj为第j个决策单元对第r种类型输出的产出量;vi为对第i种类型输入的度量权数;ur为第r种类型输出的度量权数; 而且xij>0,yrj>0;vi≥0,ur≥0;i=1, 2, …,m;r=1, 2, …,s;j=1, 2, …,n(xij,yrj均为已知的数据,可以根据历史资料或预测得到,vi及ur为“权”变量)。
记Xj=(x1j,x2j,…,xmj)T,Yj=(y1j,y2j,…xsj)T,j=1, 2, …,n,则可用(Xj,Yj)表示第j个决策单元DMUj,对应的权系数V=(v1,v2, …vm)T,U=(u1,u2, …us)T,每个决策单元都有相应的效率评价指数:
通过适当的选取权系数v和u,使其满足0≤hj≤1,j=1, 2, …,n。现在对第j0个决策单元进行效率评价,记为DMUj0。在各决策单元的效率评价指标均不超过1的条件下,选择权系数u及v,使h0最大,于是构成如下分式规划的最优化模型:
利用Charnes-Cooper变换,可以将它化为一个等价的线性规划问题:
minθ=Vp1
根据线性规划的对偶理论,可将上述线性规划(p1)转化为对偶规划解决问题(加入松弛变量s+,s-以后):
minθ=VD1
该对偶模型(D1)即为常用的CCR模型。
此时,生产可能集T变为:
通过增加该凸性假设,使得对评价单元的评价由同时评价规模有效性和技术有效性转化为单纯评价技术有效性,在生产可能集TBCC的BCC模型为:
minθ=VD2
其对偶模型为
2006年4月20日,百度正式发布百度百科,这是一个全民参与“生产”的在线百科全书。2008年4月21日,百度推出其正式版。百度百科的全部内容对所有互联网访问用户开放浏览。词条的创建和编辑只能由注册并登录百度网站的百度用户(生产者)参与,生产者不可匿名编写词条。原则上,除因严重违反百科协议而被封禁的用户外,其他百度 用户享有平等编写词条的权利。按照百度百科的官方解释: 精神上,百度百科主张的是“平等、协作、分享”; 技术上,百度百科与百度贴吧、百度知道构成三位一体的知识分享系统,并且相互结合以补充百度搜索引擎。
截至2012年2月15日为止,百度百科上共收录4454209个词条,共12大类,96个小类。拥有145名核心生产者(编写至少10个高质量和5个优质版本)组成的百科蝌蚪团。百度百科拥有一批爱知识,有能力,并有志于将全球最大的中文百科全书建设得更加宏伟的优质成员。109名分类管理员负责百度百科词条的日常管理与发展建设。
按路径“百度百科-经济-管理-管理理论”,本文以“管理理论”分类中的164个词条为决策单元(删去明显不是管理理论范畴的三个词条),来分析百度百科词条的生产效率。“管理理论”分类可以看成一个人类活动系统。
参照国内外文献,遵照指标选择的目的性、全面性、可行性、精简性、代表性原则,以及百度百科的特点,本文选取了词条编辑次数(次)、词条字数(个)作为输入指标,词条浏览数(次)、“本词条对我有帮助”数(个)作为输出指标。其中,词条的编辑次数能够反映出生产的活跃度,是词条投入的重要衡量数据; 词条字数代表了生产者投入的精力。词条的浏览数是词条的吸引力的体现,而“本词条对我有帮助”数则是词条有用性的体现。上述输入和输出指标,在百度百科官方网站上都有显示,我们收集了截至2012年2月15日的数据作为分析数据。
利用DEAP2.1软件,分别应用DEA投入导向的CCR模型和BCC模型计算出技术效率、纯技术效率和规模效率。
164个词条的技术效率平均值为0.227(标准差0.186),纯技术效率平均值为0.466(标准差0.269),规模效率平均值为0.536(标准差0.265)。表1是技术效率大于50%的十个词条以及与“复杂科学”相关的四个词条的计算结果。
表1 词条效率
1. 技术效率分析
技术效率(TE)可以判断被评价单元是否存在资源浪费。若评价单元的TE<1,则说明被评价单元存在投入资源浪费,且浪费的比例为1-TE。
由于所有词条的技术效率平均值为0.227,意味着百度百科“管理理论”分类中,所有的投入中存在77.3%的资源浪费情况,即77.3%的投入不能有效地形成知识产品的产出。另外,本文选取的164个词条中,达到技术有效的仅3个,比例为1.83%,分别是词条“5W2H分析法”、“头脑风暴法”和“米尔格伦实验”,其余均为技术无效。所以,百度百科中“管理理论“分类中词条的技术效率并不高,而且各个词条的技术效率参差不齐,标准差为0.186。
出现这种状况的原因在于百度百科采取大众生产的模式,大量生产者自由自主、独立地进行词条的编辑,而生产者的水平是参差不齐的,所以难免出现高投入、低产出、高消耗、低效率以及词条编辑效率不同的问题。
2. 纯技术效率分析
纯技术效率(PTE)剥离了规模因素的影响,反映了评价单元在不考虑规模效益的情况下,有多少比例的资源浪费是因为未达生产函数的前沿面造成的。
从纯技术效率水平来看,“管理理论”分类各个词条的异质性在0.148-1.000之间浮动,标准差为0.269,大于技术效率的异质性。另外所有词条的纯技术效率平均值为0.466,说明“管理理论”分类词条因为纯技术无效而浪费的投入资源占到53.4%。164个词条的纯技术效率有效(PTE=1)的比例为14.02%,边缘无效率(0.9 3. 规模效率分析 规模效率用来衡量决策单元的投入规模是否合理,是否处于最优生产规模上。164个词条的规模效率平均值为0.536,与纯技术与技术效率相比,水平较高,但是规模有效的词条的比例仅为1.83%,又低于纯技术效率的比例(14.02%)。 4. 投入冗余分析 通过投入冗余分析,能够进一步找到DEA无效单元的改进方向,进而给出各个无效评价单元达到有效的调整值。表2是DMU64“复杂科学管理”词条的纯技术效率的投入冗余分析。 表2 DMU64的纯技术效率值及其投影 决策单元在DEA有效前沿面上的投影点为: x1=978.31,x2=1.174,y1=4754.000,y2=38.000 表明该决策单元要达到DEA有效,投入上应该减少词条字数4021.683个,减少编辑次数4.862次。其余各个评价单元均可参考该单元进行,总体来说,“管理理论”分类中的词条普遍存在投入冗余。 本文应用DEA方法对百度百科“管理理论”分类的词条效率进行了评价。通过选择评价指标、效率分析、投入冗余分析,得出了百度百科“管理理论”分类中的词条的技术效率、纯技术效率以及规模效率都比较低,投入资源过多等结论,并认为这些特点是百度百科的大众生产特性所决定的。 为了提高百度百科词条的效率,在产出不变的条件下,要减少对词条的投入。即减少词条的编辑次数,减少词条的字数,以减少输入资源的浪费。也就是要在保证词条质量的前提下,保证能够用最少的时间、最精简的语言描述出词条最全面的意义。而要做到这一点,就要适当提高词条编辑的门槛,如实行只有在达到某一等级要求后才能编辑等措施,以减少无效的编辑次数。另外,也可采取竞争机制进行管理员的选拔,以选择出最负责、最熟悉的生产者作为各类词条的管理员等。 另一方面,提高百度百科词条的效率,不能只“节流”,还要“开源”。提高词条的浏览次数,归根结底,是要增大百度百科对用户的吸引力; 提高“本词条对我有帮助” 数,就是要激励用户对词条的质量进行评价。对于百度百科的吸引力,可以通过加强宣传,提升百度百科的知名度; 完善百度百科的功能,提高易用性; 提升百度百科词条的数量和质量等方法,吸引更多的用户参与到百度百科的浏览、编辑、完善中。对于用户对词条的质量评价,可以通过增加积分,提升等级等措施来激励用户。 我们认为从“管理理论”词条的效率分析,可以推出百度百科存在着普遍的投入资源浪费问题,这虽是大众生产的特点,但是也有改进的余地。不过基于一个分类词条评价结论的推测,还需要进一步的实际验证。 参考文献: [1] Yochai Benkler. Coase's penguin,or Linux and the nature of the firm[J]. Yale law journal,2002,112(3): 369-446. [2] Ori Brafman,Rod A. Beckstrom. The starfish and the spider: The unstoppable power of leaderless organizations[M]. New York: Portfolio,2006. [3] Chades Leadbeater,Paul Miller. The Pro-Am revolution: How enthusiasts are changing our society and economy[M]. London: Demos,2004. [4] Michel Bauwens. The political economy of peer production[J]. Post-autistic economics review,2006,37: 33-44. [5] 常静,杨建梅. 百度百科用户参与行为与参与动机关系的实证研究[J]. 科学学研究,2009(8): 1213-1219. [6] D. M. Wilkinson. Strong regularities in online peer production[C]. In Proc. 9th ACM Conf. on Electronic Commerce (EC),2008. [7] 姚灿中,杨建梅. 基于多智能体的大众生产系统稳定性研究[J]. 计算机工程,2011,37(3): 13-15. [8] 杨建梅. 人类活动系统的复杂性与管理[J]. 华南理工大学学报社科版,2011,13(4): [9] 袁群. 数据包络分析法应用研究综述[J]. 经济研究导刊,2009,57(19): 201-203. [10] Aly,Grabowski,Pasurka,Rangan,Technical scale and allocative efficiencies in US banking: An empirical investigation[J]. Review of Economics and Statistics,1953,(2): 211-218. [11] Wang,Huang,Lai,Measuring the relative efficiency of commercial banks: A comparative study on different ownership modes in China,Journal of American Academy of Business[J]. 2005,7(2): 219-223. [12] Chandra,Cooper,Shangling,Rahman,Using DEA to evaluate 29 Canadian textile companies considering returns to scale,International Journal of Production Economics[J]. 2000,54: 129-141. [13] Friedman,Stern,Combining ranking scales and selecting variables in the DEA context: The case of industrial branches,Computers Operations Research[J]. 2001,25(9): 781-791. [14] 魏权龄. 数据包络分析[M]. 北京: 科学出版社,2006. [15] 谭国志. 基于DEA的汽车工业企业投资有效的分析[J]. 工业工程与管理,2004,9(6): 107-112.四、结论及建议