郝晓雪 王凯艳
(河北金融学院图书馆 河北 保定 071051)
国内用户生成内容研究的文献计量分析
郝晓雪 王凯艳
(河北金融学院图书馆 河北 保定 071051)
运用信息计量学的相关理论与方法,对国内用户生成内容的相关文献进行统计,以期了解目前国内用户生成内容的研究现状与特点。研究发现,用户生成内容的研究文献在逐年增加,但还未形成明显的高产作者群;研究内容主要集中在用户生成内容的主体、概念、平台、商业运营等;研究群体主要来自高校师生,并且多分布于图书情报与新闻传播领域;其研究仍处于初级阶段,基础文献和热点文献还未显现。
用户生成内容;UGC;文献计量分析
用户生成内容(User-generated content, UGC)又称UCC(User created content)或CGM(Consumer generated media),泛指以任何形式在网络上发表的由用户创作的文字、图片、音频、视频等内容,它是Web2.0环境下社会化媒体中一种新兴的网络资源创作与组织模式[1]。随着信息通信技术的迅速发展,以用户主动创作为主要特征的Web2.0环境逐步形成,各类“去中心化”社会化信息系统如春笋般出现,用户从信息的被动接受者变为主动贡献者,互联网进入了“全民织网时代”。与此同时,用户生成内容也得到越来越多的学者关注。
本文利用文献计量学方法,对国内用户生成内容相关研究文献进行定量分析,对文献的年载文量、著者、内容、文献来源、文献被引频次等进行统计分析,以客观揭示国内的相关研究现状及特点,为以后研究提供参考。
本文以CNKI中国学术文献网络出版总库作为统计来源,在跨库检索页面中选择“期刊”、“特色期刊”、“博士”、“硕士”数据库,在高级检索界面以“模糊”方式检索“题名”或“关键词”中含有“用户生成内容”或者“UGC”的文献,发表时间不限,检索时间为2017年6月5日,最终得到485篇文献,删除5篇无著者文献、10篇医学等方面的不相关文献,剩余有效文献样本470篇。套录每篇文章的“题名”、“作者”、“单位”、“文献来源”、“关键词”、“摘要”、“发表时间”、“基金”八项信息。
3.1 年载文量分析
国内用户生成内容的年载文量情况见表1。
表1 年载文量分布及百分比
由表1可以看出,2007年国内出现第一篇关键词中含“UGC”的文献,为廖肇华的《互联网搜索引擎探究》,文中作者明确提到用户创造内容(UGC); 2008年国内用户生成内容研究文献为7篇,并开始逐步增长;2013年之后,相关研究文献大幅增多,并呈现快速增长趋势;2016年文献数量达115篇,这说明用户生成内容受到越来越多专家的关注,与之相关的文献也越来越多。
3.2 著者分析
3.2.1 核心著者分析
表2 第一著者分布数据
(注:A为论文数,B为著者数,C为著者累积数,D为著者百分比,E为该层次论文总数(即A×B),F为E的累积数,G为F的百分比。)
由表2可知,发文量在2篇及以上的著者有36人,占著者总人数的8.53%,这8.53%的著者撰写了84篇文献,占文献总数的17.87%。这种情况显然与“二八”定律不吻合,说明关于用户生成内容的研究还处于初级阶段,还未形成典型的高产作者群。随着越来越多的一般著者加入,其发挥的作用会越来越大,将构成用户生成内容研究的著者群。
3.2.2 著者合作度分析
为进一步研究该领域内著者合作程度,现对其合作度和合作率进行统计,合作度和合作率越高,说明其合作智能发挥的越充分[4]。
合作度=(一定时期内相关文献)作者总数/(一定时期内相关文献)论文总数;
合作率=(一定时期内相关文献)合作论文数/(一定时期内相关文献)论文数×100%。
用户生成内容研究领域著者的合作度和合作率见表3。从表3可知,该研究领域的平均合作度为1.39,平均合作率为33.19%。总体来说,其合作程度呈上升趋势。
表3 合作度与合作率分析
3.3 内容分析
3.3.1 关键词分析
关键词是表达文献主题概念的自然语言词汇。对关键词进行处理、统计,合并同义关键词,最后共得出585个关键词[5]。频次为1的关键词共有423个,占72.3%;频次为2-5的关键词共129个,占22.1%;频次在6或6次以上的关键词有33个,占5.6%。频次≥6的33个关键词见表4。
通过对这33个关键词的分析可知,“用户生成内容(UGC)”、“专业生产内容” “Web2.0”、“社会化电子商务”、“社会化媒体”、“社交网络”、“新媒体”等是国内研究较多的领域,涵盖了UGC主体、概念、平台及商业运营等研究。此外,“UGC模式”、“用户行为”、“用户体验”、“质量评价”、“微博”、“移动互联网”、“品牌态度”等也彰显了UGC在“用户”、“内容”、“技术”、“应用”等层面的研究偏向。
表4 关键词频次统计表(频次≥6)
3.3.2 学科类别分析
学科类别分析结果见表5,此处仅列出在该学科发文6篇以上的前15名。可以看出,国内用户生成内容的研究主要集中在“新闻与传媒”、“计算机软件及计算机应用”、“互联网技术”、“图书情报与数字图书馆”、“贸易经济”领域。
表5 学科类别分析
3.3.3 研究层次分析
用户生成内容的研究主要集中在基础研究(社科)、行业指导(社科)、工程技术(自然)方面,其中基础研究(社科)方面的载文量最多,达到156篇,占总载文量的32%,见表6。
表6 研究层次分析
3.4 文献来源分析
3.4.1 文献来源
文献来源统计见表7。本文仅列出刊文量在5篇及以上的来源期刊和博硕论文研究机构。其中,北京邮电大学博硕论文、《新闻研究导刊》的文献数量最多,均为15篇。刊文量在5篇及以上的来源期刊中,图书情报领域占6种,占比达27.3%。北京邮电大学、湖南大学、华东师范大学、南京大学、华中师范大学的研究文献为博硕士论文。由此可见,国内用户生成内容的研究高校学生占较高比例,图书情报领域、新闻传播领域是用户生成内容研究的主要领域。
3.4.2 研究资助来源
经统计共有109个类别的基金资助了用户生成内容研究。表8列出了支持力度最大的前15位。由表可以看出,国家自然科学基金、国家社会科学基金、教育部人文社会科学规划基金对用户生成内容研究的资助力度最大,文献篇数分别为46、25、15篇,约占所有基金支持篇数的56%。
表7 文献来源统计
表8 研究资助来源分析
3.5 被引频次分析
被引频次是评价文献学术价值及应用价值的有效手段。文献被引频次统计见表9,本文仅列出被引较高的前16篇文献。其中,被引频次最高的是赵翔宇、范哲、朱庆华的《用户生成内容(UGC)概念解析及研究进展》(2012),从用户(Who)、内容(What)、动因(Why)、模式(How)四个维度,及其相互间的联系深入解析了UGC概念中最为本质的一系列问题。赵翔宇、朱庆华的《Web2.0环境下影响用户生成内容的主要动因研究》(2009)排第二位,在分析UGC中参与者分类的基础上,探讨了影响用户生成行为的动因,并构建了动因整合模型。其他高被引文献的研究内容还包括:UGC的内容特性、自组织模式、质量测评及相关法律问题等。根据普赖斯定律确定高被引论文(即高产作者的论文)的方法[6],用户生成内容的高被引文献数量为84篇,占全部文献的17.87%,说明国内关于用户生成内容的研究还处于起步之后的快速发展阶段,还未形成明显的基础文献和热点文献。
通过以上计量分析可以看出,目前国内关于用户生成内容的研究,主要有以下特点:(1)研究文献数量日趋增加,由2007年的1篇到2016年的115篇,其文献数量每年都在增加;(2)高产作者群尚未形成,一般著者占有较大分量,并且著者之间合作程度较高;(3)研究内容主要为用户生成内容的主体、概念、平台及商业运营,学科领域主要集中在新闻与传媒、计算机软件及计算机应用、互联网技术、图书情报与数字图书馆,研究层次主要为社科领域的基础研究和行业指导;(4)研究用户主要为高校师生群体,并且国家自然科学基金、国家社会科学基金、教育部人文社会科学规划基金对其支持力度最大;(5)用户生成内容研究仍处于初级阶段,还未形成明显的基础文献与热点文献。
表9 被引频次统计
[1] 朱庆华,赵宇翔,谈晓洁,等.新一代互联网环境下用户生成内容的研究与应用[M].北京:科学出版社,2014:10-23.
[2] 邱均平,苏金燕.我国竞争情报研究文献计量分析[J].情报科学,2008,26(12):1761-1765.
[3] 罗式胜.文献计量学概论[M].广州:中山大学出版社,1994:309-310.
[4] 邱均平.信息计量学[M].湖北:武汉大学出版社,2007:45-55,101-112.
[5] 彭希羡,孙霄凌,朱庆华.国内社交网络服务研究的文献
计量分析[J].情报科学,2012,30(3):414-418.
[6] 刘雪立.基于Web of Science和ESI数据库高被引论文的界定方法[J].中国科技期刊研究,2012,23(6):975-978.
[7] 崔微,曾润喜,王国华.中国网络舆情研究文献计量分析[J].情报科学,2011,29(1):131-135.
BibliometricAnalysisofUGCResearchinChina
Hao Xiao-xue Wang Kai-yan
Using related theories and methods of informetrics, this paper does statistics on the relevant literature in order to learn about the Research status and characteristics of User-generated content in China. The research literature on user-generated content is increasing year by year, but it has not yet formed a distinct group of productive authors. The research content mainly focuses on the main body, concept, platform and commercial operation of user-generated content. The research group mainly consists of teachers and students from colleges and universities, and is largely distributed in the field of library information and news communication. The study result shows that the research of User-generated content still stays in the initial stage, and the basic literature and hot literature have not emerged yet.
User-generated Content; UGC; Bibliometric Analysis
G350
A
10.13897/j.cnki.hbkjty.2017.0098
郝晓雪(1988-),女,硕士,河北金融学院图书馆助理馆员。王凯艳(1986-),女,硕士,河北金融学院图书馆助理馆员。
2017-07-08 责任编辑:张长安)