赵一鸣 姚 丹 邓胜利
(武汉大学信息资源研究中心,武汉,430072)
技术视角下社交问答平台问题和答案的相关研究进展
赵一鸣姚丹邓胜利
(武汉大学信息资源研究中心,武汉,430072)
[摘要]社交问答改变了用户在线获取信息的方式,研究者对社交问答中的问题、答案等用户生成内容开展了大量的研究。本文综述了问题分类、推荐、检索方面的研究,总结了答案评价方面的研究进展,包括回答者的评价和答案本身的评价两个方面,最后指出了一些潜在的研究机会。
[关键词]社交问答用户生成内容问题分类问题检索答案评价
1引言
社交问答自出现以来,用户点击量一直持续增长,在Alexa的2014年网站排名中,社交问答平台Yahoo!Answers排在参考咨询类网站的榜首[1]。相较于 Facebook、Twitter等社交媒体平台,社交问答中的文本内容更丰富、信息可靠性更高,因此很多学者热衷于针对社交问答平台展开研究。
社交问答设立的动机是为用户提供一个提出和解答问题的平台,其成功的关键在于用户的广泛参与、互动和交流。国内外代表性社交问答平台包括Yahoo!Answers、AnswerBag、Answers.com、Knowledge-iN、Stack Overflow、Quora、Naver Knowledge、新浪爱问、百度知道、腾讯搜搜问问、知乎等。
社交问答的研究可以分为用户、内容两个方面,用户方面的研究包括用户需求、参与动机等,内容方面的研究包括问题分类、问题检索、问题质量、答案质量等[6]。根据问答平台的特点,用户自然地被分为提问者和回答者,社交问答中的用户生成内容也天然地形成了问题和答案两个子集。本文从技术的视角对问题和答案两个方面的相关研究进行了梳理。
2问题的分类、推荐与检索
对问题的相关研究包括用户和技术两个视角。用户视角下的研究包括根据问题的分类来区分提问者的角色、通过分析问题内容判断用户信息需求及提问动机等等。技术视角下的研究以问题分类、问题推荐、问题检索三个方面为主,问题自动生成、查询扩展等内容则可以纳入问题检索的范畴。
社交问答平台是典型的知识交流与共享平台,问题的分类对于社交问答平台中知识的组织、分享与交流非常重要,也是问答平台组织排列内容的重要依据。问题分类的研究一方面有利于合并同类问题,为同类问题进行自动推荐已有的相关答案,或者将问题推荐给相关用户进行回答;另一方面也有利于研究者面向特定领域的特定问题进行数据的挖掘与分析。同时,当前主流的社交问答平台以综合性的大网站为主,基于有效的问题分类,可以直接通过内容的迁移,形成若干个面向领域的垂直类社交问答平台,强化问答服务的领域特色和专业性,形成黏性更强的社交问答用户社区。
在分类标准方面,Ignatova[2]提出了一个包含九种类型的问题分类方案,并从语义、语法和词汇三个层次对分类效果进行评估。Harper[3]等基于Pomerantz[4]和Ignatova[8]等人的研究,利用亚里士多德和20世纪修辞理论家的相关成果,构建了一种能够通过修辞分析对问题进行分类的方法。同时通过对不同类型问题差异性的量化分析得出,不同类型问题包含不同的常用词,且对应答案的数量和字数也存在一定的差异。社交问答中的问题可以分为两类,一类是对话类问题,希望通过交流获得灵感和启发,另一类是信息类问题,主要针对特定的事实进行提问。不难看出,第二类问题更具有长期保存的价值。但是,在第一类问题中,社交问答平台在满足用户信息获取的需求以外,还为用户提供了情感和心理支持,发挥了较好的社交作用。
在问题分类的自动化处理方面,词袋模型、组合内核函数、支持向量机、朴素贝叶斯分类、n-grams和LDA等语言模型被广泛使用[5-8]。比如Lei[9]等提出了一种基于支持向量机的机器学习算法,并使用一系列词汇和语义的特征量去改善分类的效果。而Cai[10]等则利用维基百科中的语义知识来解决社交问答中大规模的问题分类问题。
问题推荐可以看成是问题分类的一个分支或者是一种延伸,因为推荐从本质上说就是对问题的分类与排序。
社交问答中问题推荐的研究主要分为两个方向,其一是将推荐作为一种问题分类来实现,另外一种是通过排名模型来生成一种问题推荐的排名列表,以便将问题及时地推荐给最适合的用户进行回答[11]。前者可利用问答对局部和整体特征来加强分类效果[12],后者可结合用户-问题-答案的组合、贝叶斯网络模型[13]、基于主题的用户兴趣模型[14]等,通过获取用户的兴趣主题来决定排序,从而向用户推送问题。Zhou[15]等提出一种基于专业知识的问题推荐方法,首先通过用户以前的回答历史来计算用户的专业性,这一任务主要通过基于文档模型、线性模型和聚类模型来实现,其次通过用户之间的关系机构来重新排列用户的专业性。将两步整合到一个概率模型中用于计算用户的最终排名。另外,还可以基于多通道空间向量的表示模型[16]、分类敏感性语言模型[17]、语法树结构的检索框架[18]等查找相似问题。
由于需要将问题推荐给潜在的回答者,提问者的偏好、回答者的答案质量、用户评论和投票等信息都被纳入到问题推荐的考虑范围。比如Zhou[19]等提出一种结合相关性和答案质量的推荐模型,首先将单词不匹配和答案质量带入一个统一框架用以生成一般概率模型,并通过改进的翻译模型为用户兴趣打分以及通过回答者的专业技能和答案的非文本特征来为答案质量进行评分,以实现通过用户排名来达到问题推荐的相关效果。Chang[20]等将问题推送的重点从传统的面向专家的推荐转向面向具有合作和提供有用答案的潜在用户方面,并将用户的回答、评论和投票等用户偏好列入问题推荐模型中。
问题推荐方面比较有特色的研究还包括:Jeon等[21]提出了一种在社交问答中查找语义相似问题的算法,通过语言翻译模型来计算问题与问题的相似度,并同时考虑了与问题相对应的答案信息,实现问题自动推荐。Xu等[22]则从社交问答中用户的角色出发,第一次系统的探讨两种角色(提问者和回答者)对问题推荐效果的不同影响,并构建一个基于双重角色模型的问题推荐方法,这种方法通过将提问者与回答者之间的用户关系以及回答者和问题的内容关系整合到一个统一的概念框架中去以实现最终任务。
社交问答平台保存了大量有价值的问题和答案数据,检索已有的问题以满足用户的信息需求是其提供的重要服务之一。当用户的信息需求可以从已有问题的答案中得到满足,则可以大大减少用户获取最佳答案的时间。问题检索的研究强化了社交问答平台作为人类社会知识库的作用,因为大部分用户通过检索现有问题即可获得需要的信息,而不需要再次重复提问,减少了重复提问和资源的浪费。检索技术本身的飞速发展也给嵌入在社交问答平台中的检索服务提供了支撑。目前,网民越来越习惯于在社交媒体中寻求答案,这为社交问答平台提供了新的发展机会,而社交网站检索功能的好坏直接决定了用户的使用体验和持续使用的意愿。
向量空间模型、Okapi模型、语言模型以及翻译模型都被应用于社交问答平台中的问题检索。相比而言,有学者认为翻译模型的检索效果要高于前三种模型的检索效果[20]。基于短语的翻译模型,相较于传统的单个词语的翻译模型来说检索效果有所提高[23]。基于词权重排序的翻译模型,引入噪音控制,使检索效果大幅提高[24]。基于目的的语言模型,可应对用户的短文本检索问题[25]。基于翻译的语言模型,将翻译模型与查询语言可能性模型相结合,可为用户提供相关且高质量的问题[26-27],Cai[28]、Zhou[29]等在其研究中也使用了该模型。
问题的主题信息对提高用户问题检索的效果起到一定的作用。问题的主题和问题的焦点是问题的主要组成部分,相似问题的检索就是相似问题主题和焦点的检索,可使用基于最小描述长度树识别相似问题的方法,提升用户检索效率。此外,Zhang等[30]提出一种基于主题的语义相似性计算方法来发现社交问答中的相似问题。Cai[27]、Zhou[28]等也同样研究了潜在的主题信息对社交问答平台检索效果的影响。
问题的分类信息也被用于问题检索的相关研究中。社交问答平台的类别信息主要有三种作用:类别的等级结构方便用户浏览问题和答案;基于类别的知识组织便于用户在子类中搜寻信息;类别信息能够有效的改善问题检索模型。2009年,Cao等[31]使用层次聚类和局部平滑方法计算新的问题属于某一类别的可能性,并通过实验证明这种检索模型的检索效果。2010年,Cao等[32]又提出了一种新的利用分类信息以提高检索的效率方法,该方法包括两个关联度的评分,且这种方法普遍适用于现有的问题检索模型。2012年,Cao等[33]再次提出了四种新的方法用以提高问题检索,分别是LS法(the leaf category smoothing enhancement)、CS法(thecategory enhancement)、QC法(the query classification enhancement)和DS法(the question classification enhancement)。
问题自动生成可以辅助用户进行问题构建,德国Ubiquitous Knowledge Processing 实验室[34]从社交问答平台上的低质量问题中通过拼写和语法错误修正以及从关键词中自动产生问题的方法,自动生成高质量问题,从而提高用户提问的效率。
3回答者中的专家发现及答案质量评价
对社交问答平台中的答案展开的研究很多,比如回答者的参与动机、提问者对答案的满意度、答案质量、答案可信度、答案的相关性评价、答案分类等等,其中涉及到自然语言及相关技术处理的研究以专家发现、答案质量评价两个方面为主,专家发现从本质上说也属于答案评价的研究范畴。
提问者通常希望答案来自“专家”,通过评估用户的权威性来识别“专家”对于高质量答案的获取至关重要。社交问答平台将这种数量较少但活跃度高,并能提供大量高质量答案的核心用户称之为专家。
专家发现的过程中,学者们往往通过HITS、PageRank等算法来测量问答社区中用户的权威性,比如Jurczyk等[35]基于用户关系构建提问者与回答者之间的社会网络,并使用HITS算法计算每个用户的权威度。但是,这些传统的基于链接分析的方式并没有考虑到用户间的主题相似性以及用户的专业知识和用户的声誉,Chen[36]通过对社交问答平台中影响用户声誉的关系进行提取和分类,提出一种基于用户声誉使用模型的新方法,并通过实验验证了该方法优于链接拓扑关系HITS算法。Zhou等[37]考虑了链接的结构和用户的主题相似性,构建了一种基于PageRank算法的主题敏感度概率模型,较传统算法更为准确。
使用HITS、PageRank等算法进行专家发现存在一定的问题,即需要人工设定专家的数量。为了克服这一问题,Bouguessa等[38]提出一种结合γ混合分布、贝叶斯信息标准和期望最大化算法的权威用户自动识别系统,并通过相关数据证明了该算法的有效性。
另外,问题内容、专家档案之间的相似性、专业知识的层次差异、问题回复的数量都可以纳入权威用户识别及专家发现的过程[39]。Kao[40]、林鸿飞[41]等也分别在前人研究的基础上提出了专家发现的相关方法。
答案质量评价对于理解用户的信息需求、提升问答服务质量有重要作用。一方面,由于用户信息需求的复杂性和模糊性,何种答案是满足用户需求的最佳答案是一个非常复杂的问题;另一方面,答案的质量决定了用户对于问答平台的评价,网站应该尽量采取措施屏蔽掉低质量、虚假、完全不相关的答案,同时,网站还需要优化激励机制,鼓励更多的用户参与回答,尤其是那些拥有专门知识的用户,激发群体智慧,提高答案的针对性和有效性。
答案质量评价是一个包含信息质量和自然语言处理技术的跨学科问题,答案的文本内容与非文本特征都可以作为评价其质量的依据。文本内容特征对质量的影响高于社会和非文本因素的影响,其中内容的完整性、可靠性、准确性以及用户的表达方式和积极的评价与答案质量有着密切的关系,而高频词和答案的长度对答案质量的影响较小,此外还有学者指出答案的质量与最佳答案的选择不存在直接关系。在Adamic等[39]的研究中,答案的长度、其他答案的数量和用户的历史记录是最佳答案选择的重要指标。
与Adamic[39]的研究中显示的用户更加倾向于较长的答案作为最佳答案不同,Kim等[42]则认为用户更加倾向于短而直接的答案,其假设提问者在选择最佳答案时都会对其作出相关评论,这些评论反映了用户选择特定答案的原因,即答案质量的评价标准。早在2007年,Kim等[43]收集了1200多条用户评论,并就此构建问题答案质量评价框架,包括内容、认知、效用、信息源、外部因素、社会情感和一般叙述七个一级指标。考虑到数据量较少和相关评价标准的局限性,2009年,Kim等[42]收集了7000多条用户评论,将提问者的答案质量评价标准分为六类,即内容、认知、效用、信息源、外部因素和社会情感,并包含准确性、特殊性、简洁性等23个子指标,研究发现问题类型对评价标准有重要影响,比如在讨论性问题类中,用户的社会情感是选择最佳答案的最主要标准。
此外,Fichman[44]、Chua[45]、Golbeck[46]等对社交问答平台中答案质量评价方面也做了一些有特色的研究。
4结语
通过以上综述可以看出,近几年对社交问答中的问题、答案等用户生成内容的研究集中在问题分类、推荐、检索,以及答案的评价等方面,而且从技术视角切入的研究成果占了较大比重。
目前,社交问答中用户生成内容有关的研究机会还包括:
(1)研究问题中蕴含的用户信息需求
社交问答平台为用户提供了大量开放的、容易获取的知识,这些知识来自于和他们有同样经历、同样诉求或者同样兴趣的人,这一特点使得社交问答平台中的答案会比搜索引擎里面的答案更贴近于用户的真实需求,同时,也为社交问答平台带来了大量的用户生成内容,为研究者理解公众信息需求、开展学术研究提供了宝贵的文本资源。大量的学者利用Yahoo!Answers、All Experts、Live Qn等社交问答平台中的文本内容研究用户的图像信息需求、用户选择或评价最佳答案的标准、社区反馈等等[43,47]。
(2)研究问题和答案中蕴含的用户行为模式及特点
社交问答平台中存留的问题和答案等用户生成内容,从本质上说,是一种用户网络日志。基于网络日志研究用户行为的成果非常丰富,但基于社交问答中用户生成内容挖掘用户行为模式和特点的研究还不够充分。除了用户的参与动机、用户分类以外,值得研究的内容还包括:用户进行知识创造和传播的机制,用户在社交问答平台中的行为模式及其影响因素,用户类别对用户提问、搜索、回答等行为的影响等等。
(3)对社交问答中的文本进行统计分析、数据挖掘和可视化
目前已经有学者面向特定领域,使用社交问答平台中的文本数据进行词汇的统计分析、空间聚类、主题发现及可视化等研究,以发现用户的词汇使用模式和统计特征,挖掘用户关注的热门主题、主题之间的语义关系、主题的演进等[48-49]。作为社交媒体中用户生成的天然知识库,社交问答平台中的文本内容正在成为科学研究中最流行的文本数据源之一。
参考文献
[1]Alexa.The top ranked sites in references category[EB/OL].[2014-12-21].http://www.alexa.com/topsites/category/Top/Reference
[2]Ignatova K, Toprak C, Bernhard D, et al. Annotating question types in social Q&A sites[C]//Tagungsband des GSCL Symposiums’ Sprachtechnologie und eHumanities. 2009: 44-49
[3]Harper F M, Weinberg J, Logie J, et al. Question types in social Q&A sites[J/OL]. First Monday, 2010,15:7.[2014-07-05].http://firstmondey.org/ojs/index.php/fm/article/view/2913/
[4]Pomerantz J. A linguistic analysis of question taxonomies[J]. Journal of the American Society for Information Science and Technology, 2005, 56(7): 715-728
[5]Qu B, Cong G, Li C, et al. An evaluation of classification models for question topic categorization[J]. Journal of the American Society for Information Science and Technology, 2012,63(5):889-903
[6]Fan S, Wang X, Wang X, et al. Using hybrid kernel method for question classification in CQA[C]//Neural Information Processing. Berlin Heidelberg:Springer,2011:121-130
[7]Chan W, Yang W, Tang J, et al. Community question topic categorization via hierarchical kernelized classification[C]//Proceedings of the 22nd ACM International Conference on Information & Knowledge Management. ACM, 2013: 959-968
[8]Bae K, Ko Y. An effective category classification method based on a language model for question category recommendation on a cQA service[C]//Proceedings of the 21st ACM International Conference on Information and Knowledge Management. ACM, 2012: 2255-2258
[9]Lei Y, Jiang Y. Chinese question classification in community question answering[C]//2010 IEEE International Conference on Service-Oriented Computing and Applications(SOCA). IEEE, 2010:1-6
[10] Cai L, Zhou G, Liu K, et al. Large-scale question classification in cQA by leveraging Wikipedia semantic knowledge[C]//Proceedings of the 20th ACM International Conference on Information and Knowledge Management. ACM, 2011: 1321-1330
[11] Xu F, Ji Z, Wang B. Dual role model for question recommendation in community question answering[C]//Proceedings of the 35th International ACM SIGIR Conference on Research and Development in Information Retrieval. ACM, 2012: 771-780
[12] Zhou T C, Lyu M R, King I. A classification-based approach to question routing in community question answering[C]//Proceedings of the 21st International Conference Companion on World Wide Web. ACM, 2012: 783-790
[13] Guo J, Xu S, Bao S, et al. Tapping on the potential of q&a community by recommending answer providers[C]//Proceedings of the 17th ACM Conference on Information and Knowledge Management. ACM, 2008: 921-930
[14] Ni X, Lu Y, Quan X, et al. User interest modeling and its application for question recommendation in user-interactive question answering systems[J]. Information Processing & Management, 2012, 48(2): 218-233
[15] Zhou Y, Cong G, Cui B, et al. Routing questions to the right users in online communities[C]//IEEE 25th International Conference on Data Engineering. IEEE, 2009: 700-711
[16] Dror G, Koren Y, Maarek Y, et al. I want to answer; who has a question?: Yahoo! answers recommender system[C]//Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM, 2011: 1109-1117
[17] Li B, King I, Lyu M R. Question routing in community question answering: putting category in its place[C]//Proceedings of the 20th ACM International Conference on Information and Knowledge Management. ACM, 2011: 2041-2044
[18] Wang, K, Zhao Y M, Tat-Seng C. A syntactic tree matching approach to finding similar questions in community-based QA services[C]//Proceedings of the 32nd International ACM SIGIR Conference on Research and Development in Information Retrieval. New York,NY:ACM,2009:187-194
[19] Zhou G,Liu K,Zhao J.Joint relevance and answer quality learning for question routing in community QA[C]//Proceedings of the 21st ACM International Conference on Information and Knowledge Management.ACM,2012:1492-1496
[20] Chang S,Pal A.Routing questions for collaborative answering in community question answering[C]//Proceedings of the 2013 IEEE/ACM International Conference on Advances in Social Networks Analysis and Mining.ACM,2013:494-501
[21] Jiwoon J, Croft W B, Lee J H. Finding similar questions in large question and answer archives[C]//Proceedings of the 14th ACM International Conference on Information and Knowledge Management. New York,NY:ACM,2005:84-90
[22] Xu F, Ji Z, Wang B. Dual role model for question recommendation in community question answering[C]//Proceedings of the 35th International ACM SIGIR Conference on Research and Development in Information Retrieval. ACM, 2012: 771-780
[23] Zhou T C, Lin C Y, King I, et al. Learning to suggest questions in online forums[C]//Proceedings of the 25th AAAI Conference on Artificial Intelligence(AAAI 2001).Menlo Park,CA:The AAAI Press,2011:1298-1303
[24] Lee J T, Kim S B, Song Y I, et al. Bridging lexical gaps between queries and questions on large online Q&A collections with compact translation models[C]//Proceedings of the Conference on Empirical Methods in Natural Language Processing. Association for Computational Linguistics, 2008: 410-418
[25] Wu H, Wu W, Zhou M, et al. Improving search relevance for short queries in community question answering[C]//Proceedings of the 7th ACM International Conference on Web Search and Data Mining. ACM, 2014: 43-52
[26] Cao X, Cong G, Cui B, et al. The use of categorization information in language models for question retrieval[C]//Proceedings of the 18th ACM Conference on Information and Knowledge Management. ACM, 2009: 265-274
[27] Ji Z, Xu F, Wang B. A category-integrated language model for question retrieval in community question answering[A]//Hou Y,et al(eds). Information Retrieval Technology. Berlin Heidelberg: Springer,2012:14-25
[28] Cai L, Zhou G, Liu K, et al. Learning the latent topics for question retrieval in community QA[C]//Proceedings of the 5th International Joint Conference on Natural Language Processing.Chiang Mai,Thailand:Asian Federation of Natural Language Processing,2011:273-281
[29] Zhou G, Cai L, Zhao J, et al. Phrase-based translation model for question retrieval in community question answer archives[C]//Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies-Volume 1. Association for Computational Linguistics, 2011: 653-662
[30] Zhang W N, Liu T, Yang Y, et al. A topic clustering approach to finding similar questions from large question and answer archives[J]. PloS One, 2014, 9(3): e71511
[31] Cao X, Cong G, Cui B, et al. The use of categorization information in language models for question retrieval[C]//Proceedings of the 18th ACM Conference on Information and Knowledge Management. ACM, 2009: 265-274
[32] Cao X, Cong G, Cui B, et al. A generalized framework of exploring category information for question retrieval in community question answer archives[C]//Proceedings of the 19th International Conference on World Wide Web. ACM, 2010: 201-210
[33] Cao X, Cong G, Cui B, et al. Approaches to exploring category information for question retrieval in community question-answer archives[J]. ACM Transactions on Information Systems (TOIS), 2012, 30(2): 7
[34] Ignatova K, Bernhard D, Gurevych I. Generating high quality questions from low quality questions[C]//Proceedings of the Workshop on the Question Generation Shared Task and Evaluation Challenge.Pittsburgh,2008.[2015-04-21].http://www.ukp.tu-darmstadt.de/fileadmin/user_upload/Group_UKP/publicationen/2008/QG08_Ignatova.pdf
[35] Jurczyk P,Agichtein E.Discovering authorities in question answer communities by using link analysis[C]//Proceedings of the 16th ACM Conference on Information and Knowledge Management(CIKM ’07).ACM Press,2007:919-922
[36] Chen L, Nayak R. Expertise analysis in a question answer portal for author ranking[C]//IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology, WI-IAT’08. IEEE, 2008(1):134-140
[37] Zhou G, Lai S, Liu K, et al. Topic-sensitive probabilistic model for expert finding in question answer communities[C]//Proceedings of the 21st ACM International Conference on Information and Knowledge Management. ACM, 2012: 1662-1666
[38] Bouguessa M, Dumoulin B, Wang S. Identifying authoritative actors in question-answering forums: The case of yahoo! Answers[C]//Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. ACM, 2008: 866-874
[39] Adamic L A, Zhang J, Bakshy E, et al. Knowledge sharing and yahoo answers: Everyone knows something[C]//Proceedings of the 17th International Conference on World Wide Web. ACM, 2008: 665-674
[40] Kao W C, Liu D R, Wang S W. Expert finding in question-answering websites: A novel hybrid approach[C]//Proceedings of the 2010 ACM Symposium on Applied Computing. ACM, 2010: 867-871
[41] 林鸿飞, 王健, 熊大平, 等. 基于类别参与度的社区问答专家发现方法[J]. 计算机工程与设计, 2014, 35(1): 333-338
[42] Kim S, Oh S. Users’ relevance criteria for evaluating answers in a social Q&A site[J]. Journal of the American Society for Information Science and Technology, 2009, 60(4): 716-727
[43] Kim S, Oh J S, Oh S. Best‐answer selection criteria in a social Q&A site from the user-oriented relevance perspective[C]//Proceedings of the 70th Annual Meeting of American Society for Information Science and Technology. Medford,NJ:Information Today,2007:1-15
[44] Fichman P. A comparative assessment of answer quality on four question answering sites[J]. Journal of Information Science, 2011, 37(5): 476-486
[45] Chua A Y K,Balkunje R S.Comparative evaluation of community question answering websites[A]//Admin P A(eds).The Outreach of Digital Libraries:A Globalized Resource Network.Berlin Heidelberg: Springer,2012:209-218
[46] Golbeck J, Fleischmann K R. Trust in social Q&A: The impact of text and photo cues of expertise[C]//Proceedings of the 73rd the American Society for Information Science and Technology Annual Meeting on Navigating Streams in an Information Ecosystem.Medford,NJ:Information Today, 2010:1-10
[47] Yoon J W,Chung E K. Understanding image needs in daily life by analyzing questions in a social Q&A site[J].Journal of the American Society for Information Science and Technology, 2011,62(11):2201-2213
[48] Zhang J, Zhao YM. A user term visualization analysis based on a social question and answer log[J]. Information Processing & Management, 2013, 49(5): 1019-1048
[49] Zhang J, Zhao YM, Dimitroff A. A study on health care consumers’ diabetes term usage across identified categories[J]. Aslib Journal of Information Management, 2014, 66(4): 443- 463
Research Progress on Questions and Answers in Social Q&A Platforms: A Technology Perspective
Zhao Yiming Yao Dan Deng Shengli
(Center for Studies of Information Resources, Wuhan University, Wuhan, 430072)
[Abstract]Social question and answer (social Q&A) platforms broaden the way of online information access for users, and users post tons of questions and answers on those platforms. The growing popularity of social Q&A platforms presents great academic research opportunities and novel challenges. This paper aims to review and synthesize the advances of social Q&A studies on question classification, question recommendation, question retrieval, expert discovery in answerers and answer evaluation. Potential research opportunities and directions are presented and discussed at last.
[Key words]Social Q&AUser generated contentQuestion classificationQuestion retrievalAnswer evaluation
(收稿日期:2015-05-15)
DOI:10.13365/j.jirm.2015.04.032
[中图分类号]G350
[文献标识码]A
[文章编号]2095-2171(2015)04-0032-07
[作者简介]赵一鸣,助理研究员,博士,博士后,研究方向为知识组织与可视化,Email:zym_0418@qq.com;姚丹,硕士研究生,研究方向为用户信息行为;邓胜利,教授,研究方向为用户信息行为与服务。
[基金项目]本研究得到国家社会科学基金项目“基于社交问答平台的用户知识贡献行为与服务优化研究”(14BTQ044),武汉大学70后学术团队项目“网络用户信息行为”和中国博士后科学基金面上项目“基于词汇集聚关系的潜在主题可视化研究”(2014M552090)的资助。