王茜+钱力
摘要:在以博客、社交网络、云计算、物联网等信息发布方式和技术为载体的大数据时代,数据具有异构复杂、增长剧烈的特征,用户对信息的个性化、知识化、专业化、智能化的需求,给商务网站个性化推荐服务带来极大挑战。从梳理大数据和个性化推荐服务内涵入手,本文分析了大数据背景下商务网站个性化推荐服务所呈现的新特征和面临的挑战,从精准深度挖掘、数据关联、个性化决策、知识化平台等视角,探讨了大数据背景下商务网站个性化推荐服务的发展方向。
关键词:大数据;商务网站;个性化推荐服务;语义网;知识组织
中图分类号:F7246文献标识码:B
收稿日期:2014-03-20
作者简介:王茜(1981-),女,河南项城人,中国科学院文献情报中心博士后,河南师范大学商学院副教授,管理学博士,研究方向:电子商务、企业战略管理;钱力(1981-),男,河南项城人,中国科学院文献情报中心馆员,中国科学院大学博士研究生,研究方向:智能信息处理与信息可视化。
基金项目:国家社会科学基金后期资助项目“数字资源长期保存的技术研究与实践”,项目编号:09FTQ005。
博客、社交网络、基于位置的服务(LBS)等新型信息发布方式的涌现,以及云计算、物联网等技术的兴起,将人们带入大数据时代[1]。海量数据在为商业网站制定决策提供越来越充分的信息的同时,也给商务网站个性化推荐服务带来极大挑战:一方面,数据的异构复杂性、增长的剧烈性,而且商务网站的商业氛围逐步成熟、饱和度也逐步提高,迫使它们的信息服务模式做出改进、突破;另一方面,服务用户也被杂乱无章的海量数据包围,要求商务网站充分利用现代信息技术,更准确、及时及更智能的为服务用户提供主动化、人性化、个性化、系统化、专业化的服务。因此,关注大数据环境下电子商务个性化推荐服务的特征与挑战,探讨个性化推荐服务新的发展动向,对于打造商务网站竞争优势、拓展个性化推荐服务研究内容等方面具有重要的实践意义和理论意义。
一、大数据的内涵与特性
随着信息爆炸式增长,“大数据”一词越来越成为人们关注的热点与焦点,先后被《自然》杂志、计算机社区联盟、麦肯锡、《华尔街日报》、《纽约时报》、瑞士达沃斯世界经济论坛、奥巴马政府等以不同形式进行讨论。在中国,“大数据”也已成为炙手可热的话题,仅以中国知网数据库检索为例,截止到2014年3月1日,以大数据为题名的论文2 633篇,2013年之前共发文539篇,而2013年全年发文达到1 833篇,主要涵盖计算机技术、经济战略、电子政务、新闻传媒、电子商务、企业管理等领域。关于大数据的内涵虽然尚未统一,但通过梳理相关表述(表1),发现对大数据的关注点却是趋于一致的,认为大数据是指那些超出传统数据库系统处理能力的数据,具有规模性、复杂性、高速性、时效性及价值性。在大数据时代,一方面,数据不再仅仅承载着简单记录功能,也不再是一堆凌乱的数字,而是承载着信息和知识的金矿,具有巨大的经济价值与社会价值。另一方面,数据来源的多样性、数据增长的剧烈性、数据规模的庞大性、数据价值的时效性、数据之间的关联性等方面,都对目前的数据处理能力与方式具有挑战性。
二、电子商务个性化推荐服务内涵与模式
在互联网普及的时代,为了解决顾客信息超载的问题,引导顾客较为便捷地找到打算购买的商品,推荐系统便成为众多电子商务企业提供的一种服务模式。所谓推荐系统,是一种根据顾客的需求、偏好、个人资料及历史交易行为,为网络消费者提供决策建议的软件系统,如推荐他们想要的商品或从哪里获得想要的商品[7-9]。传统电子商务推荐服务,或是基于顾客历史数据来抽取和推荐他们共同偏好的商品如热销商品推荐等[10-11],或是根据网站促销意图将其主打产品推送给顾客,如新品推荐、特价推荐等[12],能够为顾客提供较好的决策支持服务。但在追求个性化、语义化的Web30背景下,传统推荐服务所展示的实际效果并不理想,很多用户都将这些推荐当做垃圾广告处理。个性化推荐系统的兴起能够很好地解决传统推荐系统所带来的问题,它基于顾客个性化特征和需求,依托协同过滤、内容过滤、知识发现、交互式推荐等技术,在合适的场景、合适的时机、通过合适的渠道,把合适的内容,推荐给合适的用户,为顾客提供个性化的购物体验[13-14]。在个性化推荐服务系统中,消费者不再是被动的信息或网页浏览者,而是主动参与者。目前商务网站的个性化推荐服务模式有个性化定购推荐、关联挖掘推荐、基于主体或关键词的排序推荐等。
(一)个性化定购推荐
用户根据自身的需求和对商品信息的自我评估,直接填写表单,提交给商务网站,之后商务网站通过邮件或者其他通信方式满足用户的需求。这种推荐方式增强了商务网站与顾客的直接联系,捕获顾客需求,但是该推荐方式缺乏服务主动性,在具体实施时不能够为顾客找到符合其需求的有价值的产品提供支持。
(二)关联挖掘推荐
商务网站根据用户已经在其服务中体现出的行为,进行关联挖掘,发现及推荐用户可能需求的服务产品。目前在实践层面运用最广的有基于用户的协同推荐系统和基于物品的协同推荐系统。基于用户的协同推荐系统根据用户的购买或浏览记录等,挖掘出用户之间的相似度,然后利用与目标客户相似度较高的客户对相关产品的喜好,作为预测目标客户对特定商品喜好的程度,进而根据喜好程度来对目标用户进行推荐。基于物品的协同推荐系统则是依据物品被购买或被浏览的记录,挖掘出相似物品进行推荐。这种推荐方式关键在于信息的获取与信息的过滤,因此,在实施层面仍面临着无法有效推荐新产品、新客户、不能够及时的感知用户兴趣的变动等问题,同时由于在推荐信息过程中采用的是比对推荐方法,因此,在推荐效果方面与用户需求还存在一定差距。
(三)基于主题或者关键词的排序推荐
通过用户提供的需求主题或者关键词,在服务产品检索平台中进行匹配检索,将一定的检索结果推荐给用户。这种推荐方式的缺点是检索出太多的推荐结果,而且其中夹杂着很多的干扰信息。endprint
三、大数据环境下电子商务个性化推荐服务的特征
(一)海量数据为基础的推荐服务
社会化媒体、电子商务、移动通讯的出现和发展,将我们带入了一个大数据时代。我们每个人每天都以不同形式制造、传递着不同类型的数据,每天都有PB级别的数据产生。这些爆炸增长的数据对于我们的重要价值在于其本身包含的巨量的信息,在当今互联网时代,每一条信息都有一个与之相对应的人,每个人的情感、爱好、生活习惯、消费倾向也都将体现在数据之中。因此,海量数据不但使电子商务企业的个性化推荐显得必要而且也成为可能。
(二)复杂多样及异构的数据推荐服务
伴随着互联网技术的迅速发展,网络信息的服务模式也变迁迅速,例如,近期“微信”服务风靡全球,对原有的短信服务模式发起的全新的冲击,甚至对其有着颠覆性的更新。而电子商务企业未来的服务也不仅面对着文本信息表达的服务产品,像音频、视频、图像等特征的复杂数据,同时各自具备着独特的数据结构,这也作为未来大数据发展的一个方向。
(三)关联数据的丰富性个性化推荐
大数据时代是web30发展的产物,数据之间的关联从技术上可以面向全球服务,同时数据价值的提升进一步促进企业用户对关联数据的高度重视。在此背景下,能够为用户推荐更丰富、更全面的服务信息,不仅让用户掌握了他们迫切需求的服务产品,而且也让他们从多个侧面来了解与之相关的服务产品,一方面增加用户的社会认识,另一方面提升电子商务企业的服务质量。
(四)语义个性化推荐
过去,电子商务的个性化推荐基本都是基于关键词的匹配检索,进而发现与用户相关的需求信息,进行个性化推荐。而当今,语义网的出现让计算机理解用户的想法和语言,更人性化、智能化的在第一时间为用户挖掘到深层信息。Berners-Lee在1998年首次提出语义网的概念[15],其核心是:通过给万维网上的文档(如HTML)添加能够被计算机所理解的语义,从而使整个互联网成为一个通用的信息交换媒介。简单地说,语义网是一种能理解人类语言的智能网络,它不但能够理解人类的语言,而且还可以使人与电脑之间的交流变得像人与人之间交流一样轻松。
(五)Alert与RSS模式的个性化推荐
当前用户在大数据环境下,被浩瀚的数据所包围,很难在第一时间发现、了解自己需求的服务信息,而Alert服务具备及时性、个性化的特征,服务系统发现与用户需求相关的信息时,第一时间提醒用户去关注,极大提升了用户的工作效率。RSS以 XML标准化格式分发信息,通过 XML 标准定义信息的包装和发布格式,其强大的信息聚合和推送功能为信息提供者和接收者提供便利。例如,当前的一些期刊出版商、Google学术搜索等服务机构,为用户提供的alert及RSS服务,得到了广大用户的好评。
(六)个性化推荐的多维度性
可以推荐个性化的本地域或者跨地域的社群组织、爱好圈以及社交网络等相关的服务信息,将这些信息有效联系起来,让服务信息具备更全面的维度,为用户提供多个侧面的个性化推荐服务。
四、大数据环境下电子商务个性化推荐服务面临的挑战
(一) 企业数据的保存与利用
电子商务企业在web30的信息时代,企业数据每时每刻都在剧增,如何将这些数据信息迅速、有效保存是企业服务质量的关键,同时保存仅仅是企业服务的一个中间环节,如何挖掘、利用好保存的大数据,将是一个电子商务企业未来发展的关键。如果仅仅保存,这对于大数据是严重浪费。就海量数据,提供高附加值的数据分析服务,将大数据封装转化为服务,形成可对外开放、可商业化的核心能力,一定程度上也实现了商业模式的创新,为个性化推荐提供强大的数据服务基础。
(二) 企业数据的快速处理计算
海量数据对计算机硬件的性能带来挑战,因为企业要求在最短的时间内,尽可能创造最大的价值,而面对大数据,通过什么信息技术进行快速处理、计算,形成结构化的、开放应用的数据,这个问题不仅仅电子商务企业面临的一个挑战。现今的云计算,在概念层面上,一定程度上解决了这方面的一点问题,但是,在目前的现实信息环境中,由于网络以及硬件的限制,还不能汇聚更多的计算机,达到预订的计算目标。
(三) 企业数据的有效组织形式
企业数据的组织形式直接决定着其服务模式、服务质量。传统的以关键词进行匹配检索的服务模式,目前仍然是个性化推荐的主流,这些数据大多以关系数据库的形式,将其各自的元数据进行集中或者分布式进行组织。但是,随着数据量的增长、服务要求的提升、语义网的迅速发展,数据组织形式肯定要发生转变。例如,为用户提供个性化关联服务、语义个性化推荐服务等更高层面的知识服务,传统的简单组织方式已经不能满足这方面的发展需求。在这一方面,可以借鉴当前的热点研究Link Open Data、Virtuoso(语义存储工具)、RDF等与语义网相关的数据组织方式。
(四) 企业提供服务模式的转变
数据是企业提供服务的基础,面对数据规模、存储方式以及组织方式等特征的转变,企业所提供的传统服务模式势必也同步转变,来应对当前整个数据环境的更新。主要面临以下几种转变方式的挑战:
1.由被动服务为主动服务。被动服务是指客户主动到企业电子商城中发现自己需要的商品,更具有目的性、针对性,但是对于企业来说,严重忽视了客户巨大的潜在需求,通过主动服务模式,将与每一个用户潜在的信息需求更精确的发现,推荐给用户,一方面方便了用户,甚至给用户意想不到的需求惊喜,另一方面增强了企业销售的强度。
2.由基于关键词或者主题词检索的服务转为基于语义的智能检索服务。随着web30、语义网的迅速发展,智能检索服务开始具备一定的知识基础,例如DBPedia发布规范的大数据集、各个行业领域的发布的知识组织体系(KOS)等知识组织规范,同时借助传统的叙词表以及行业的巨大的语料资源,为用户提供语义的智能检索服务逐步将开始实施,从而实现为用户提供更准确地信息检索方式。endprint
3.由传统的个性化信息检索结果推荐服务转变为个性化知识推荐服务。个性化信息检索结果是将每条信息进行罗列在页面中,供用户浏览,通过查看详情来衡量此信息的重要度。而个性化知识推荐服务,是将每条信息分割成更小的带有语义的知识单元,用户能够在第一时间内更快、更准确的掌握每条信息的概要内容,进行决策是否对自己有价值。
五、电子商务个性化推荐服务的发展方向
(一)个性化推荐的精准深度挖掘
在运营商内部,根据用户喜好推荐各类业务或应用是常见的,比如应用商店软件推荐、电视视频节目推荐、关注购物推荐等服务,通过关联规则、信息
摘要抽取、情感分析等智能分析算法进行计算后,可以将之延伸到商用化服务,即此过程也是利用“数据挖掘技术”帮助运营商进行精准营销。典型的一个反面例子,我们生活中日常的“垃圾短信”,其实这些所谓的垃圾信息并不一定都是“垃圾”,只是因为收到的人并不需要而被视为垃圾,而通过对用户行为数据进行挖掘分析,可以给需要的人发送需要的信息,这样的“垃圾短信”就成了有价值的信息。典型的一个正面例子,即在日本的麦当劳,用户在手机上下载优惠券,再去餐厅用运营商DoCoMo的手机钱包优惠支付,从而运营商和麦当劳可以充分利用搜集到相关消费信息,例如经常买什么汉堡,去哪个店消费,消费频次多少,然后精准推送优惠券给用户。
(二)商品之间丰富的数据关联
大数据时代,关联数据可谓是企业增强自身竞争力的一种潜在法宝,不仅能够建立海量商品之间的关联关系,而且还改善用户搜索商品关键词、丰富用户检索商品结果内容的类型、改善商品排序策略以及创建用户与商品的个性化关联等方面都占据着重要角色。
首先,企业充分利用目前网络中发布的开放资源,将自身的产品与之进行关联发现,丰富了企业客户需求信息的深度与广度,帮助客户发现更多或者潜在的需求信息;其次,企业充分利用自身的海量数据,通过关联数据的格式规范,将自身数据进行加工发布,让更多的网络平台进行关联发现,一方面拓展了自身销售的途径,另一方面达到了通过其他平台来宣传自己的效果;最后,企业完全可以基于关联数据开发自身的商城平台,实现海量分散数据的增值服务,例如目前的易淘网站,通过关联淘宝、京东等等商城的信息,取得了不错的营销效果。
(三)知识大汇聚的电子商务智能平台
例如当今的易淘网,汇聚多个电子商城于一体,提供个性化推荐服务,既省时、又准确、全面的为用户推荐商品信息。但是,未来的发展,在上述的基础上,服务产品的粒度会更小,而且随着行业领域知识组织体系(KOS)的建设与完善,计算机能够学习与理解结构化的细粒度服务信息,为用户提供知识服务,商品平台的服务模式也从传统的基于关键词匹配的检索服务平台迈向基于语义的智能检索服务平台,最终建设成一个知识大汇聚的智能商务平台。
(四)商务网站的个性化决策功能
电子商务企业可以利用每日产生的海量商务运营数据,加以运用成熟的运营分析技术,借助现代先进信息技术工具,特别是自然语言处理、语义网以及行业知识组织系统等技术平台,有效提升企业数据资源的利用能力,让大数据成为企业决策的制胜法宝,持续保持自己的核心竞争位置。例如亚马逊在制定新产品和服务的决策过程中,利用大数据技术分析消费者有关新产品和服务的海量数据,能够很好地捕捉到新产品受欢迎的程度,预判消费者购买行为,进而决定新产品和服务运营策略(推向市场、取消或全新尝试等)。再如2012年美国总统大选,两党双方均不惜代价,利用大数据来预测大选中选民的趋势。当时罗姆尼共和党坚信形势对自己有利,蓄势待发。奥巴马民主党也分秒不停,想摸准选民的风向,主导选情。数周内他们对选情数据进行的细粒度采集和多位形势分析,作为制定竞选策略和掌握获胜机遇的机制[15]。
六、小结
大数据既为商务网站带来了挑战,同时又为他们开来了机遇。数据的海量倍增、服务性能的压力也受到了一定程度的影响以及为用户所带来的困扰等等方面迫使电子商务企业从根本上进行转变,从服务意识中感受未来的紧迫性。同时,随着大数据技术与平台的成熟发展、数据规范及知识组织体系的扩展与壮大,为电子商务企业创建自身的品牌服务带来了商机,比如个性化推荐的情景感知服务,商城平台能够在第一时间理解“当前用户是谁?应该为他提供什么服务?应该为他提供一个可视化导航?”等用户需求服务,为用户节省时间的同时,也为用户带来了方便与惊喜。
参考文献:
[1]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(1):146-169.
[2]Mckinsey Global Institute. Big data:The next frontier for innovation, competition, and productivity[R/OL].[2013-01-22].http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation
[3]Grobelink M. Big-data computing:Creating revolutionary breakthroughs in commerce, science, and society[R/OL].[2013-01-22].http://videolectures. Net/eswc2012_grobelink_big_data/
[4]IBM. What is big data?[EB/OL].[2013-03-02].http://www-01.ibm.com/software/data/bigdata.
[5]Barwick H. The “four Vs”of Big Data. Implementing Information Infrastructure Symposium[R/OL].[2013-01-22].http://www.computerworld.com.au/article/396198/iiis_four_vs_big_data/endprint
[6]Big data[EB/OL].[2013-01-22].http://en.wikipedia.org/wiki/Big_data.
[7]]Ricci, F. Travel recommender systems, IEEE Intelligent Systems[J].November/December,2002:55-57.
[8]Ansari, A., Essegaier, S., et al. Internet Recommendation Systems[J].Journal of Marketing Research. August,2000, 37(3):363-375.
[9]Haubl, G., and Trifts, V., Consumer Decision Making in Online Shopping Environments:The Effects of Interactive Decision Aids[J]. Marketing Science, 2000,19(1):4-21.
[10]J.B. Schafer, J.A. Konstan, J. Riedl. E-commerce recommendation applications[J]. Data Mining and Knowledge Discovery,2001(5):115–152.
[11]B. Sarwar, G. Karypis, J. Konstan, J. Riedl. Analysis of recommendation algorithms for e-commerce[C].Proceedings of the 2nd ACM conference on Electronic commerce, 2000:158-167.
[12]江秀佳,何源光.国内电子商务个性化推荐系统改进研究[J].图书情报工作,2009,53(16):137-140.
[13]朱岩,林泽楠.电子商务中的个性化推荐方法评述[J].中国软科学,2009(2):183-191.
[14]柏林森.电子商务个性化推荐初探[R/OL].[2013-01-22].http://blog.sciencenet.cn/blog-3075-517258.html.
[15]杨鸣.大数据可改变企业发展游戏规则—技术处理及模式分析[R/OL].[2013-05-22].http://scholarsupdate.zhongwenlink.com/news.asp?NewsID=10812.
(责任编辑:李江)endprint
[6]Big data[EB/OL].[2013-01-22].http://en.wikipedia.org/wiki/Big_data.
[7]]Ricci, F. Travel recommender systems, IEEE Intelligent Systems[J].November/December,2002:55-57.
[8]Ansari, A., Essegaier, S., et al. Internet Recommendation Systems[J].Journal of Marketing Research. August,2000, 37(3):363-375.
[9]Haubl, G., and Trifts, V., Consumer Decision Making in Online Shopping Environments:The Effects of Interactive Decision Aids[J]. Marketing Science, 2000,19(1):4-21.
[10]J.B. Schafer, J.A. Konstan, J. Riedl. E-commerce recommendation applications[J]. Data Mining and Knowledge Discovery,2001(5):115–152.
[11]B. Sarwar, G. Karypis, J. Konstan, J. Riedl. Analysis of recommendation algorithms for e-commerce[C].Proceedings of the 2nd ACM conference on Electronic commerce, 2000:158-167.
[12]江秀佳,何源光.国内电子商务个性化推荐系统改进研究[J].图书情报工作,2009,53(16):137-140.
[13]朱岩,林泽楠.电子商务中的个性化推荐方法评述[J].中国软科学,2009(2):183-191.
[14]柏林森.电子商务个性化推荐初探[R/OL].[2013-01-22].http://blog.sciencenet.cn/blog-3075-517258.html.
[15]杨鸣.大数据可改变企业发展游戏规则—技术处理及模式分析[R/OL].[2013-05-22].http://scholarsupdate.zhongwenlink.com/news.asp?NewsID=10812.
(责任编辑:李江)endprint
[6]Big data[EB/OL].[2013-01-22].http://en.wikipedia.org/wiki/Big_data.
[7]]Ricci, F. Travel recommender systems, IEEE Intelligent Systems[J].November/December,2002:55-57.
[8]Ansari, A., Essegaier, S., et al. Internet Recommendation Systems[J].Journal of Marketing Research. August,2000, 37(3):363-375.
[9]Haubl, G., and Trifts, V., Consumer Decision Making in Online Shopping Environments:The Effects of Interactive Decision Aids[J]. Marketing Science, 2000,19(1):4-21.
[10]J.B. Schafer, J.A. Konstan, J. Riedl. E-commerce recommendation applications[J]. Data Mining and Knowledge Discovery,2001(5):115–152.
[11]B. Sarwar, G. Karypis, J. Konstan, J. Riedl. Analysis of recommendation algorithms for e-commerce[C].Proceedings of the 2nd ACM conference on Electronic commerce, 2000:158-167.
[12]江秀佳,何源光.国内电子商务个性化推荐系统改进研究[J].图书情报工作,2009,53(16):137-140.
[13]朱岩,林泽楠.电子商务中的个性化推荐方法评述[J].中国软科学,2009(2):183-191.
[14]柏林森.电子商务个性化推荐初探[R/OL].[2013-01-22].http://blog.sciencenet.cn/blog-3075-517258.html.
[15]杨鸣.大数据可改变企业发展游戏规则—技术处理及模式分析[R/OL].[2013-05-22].http://scholarsupdate.zhongwenlink.com/news.asp?NewsID=10812.
(责任编辑:李江)endprint