电子商务中的评价口碑数据分析关键技术研究

2015-09-18 02:33唐辉军宁波大红鹰学院信息工程学院宁波315175
现代计算机 2015年14期
关键词:分词购物电子商务

宋 扬,唐辉军,杨 孝(宁波大红鹰学院信息工程学院,宁波315175)

电子商务中的评价口碑数据分析关键技术研究

宋扬,唐辉军,杨孝
(宁波大红鹰学院信息工程学院,宁波315175)

随着我国网络经济的快速发展以及网上购物市场需求规模的不断扩大,电商产品的满意度日益成为被关注的主要问题。在网络购物日益流行的今天,各类电商、商品不断涌现。为帮助用户在海量商品中选购到真正适合自身的商品,协助商家在制定商品营销策略时,方便、快捷地获取商品的消费者反响,自动化的观点挖掘变得越来越迫切需要。电子商务评价口碑数据挖掘技术的提出,为解决该问题提供方向。

电子商务;评论信息;口碑搜索;经营决策

2014年浙江省大学生科技创新活动计划暨新苗人才计划(No.2014R423003)

0 引言

电子商务的诞生催生了网络经济的繁荣,也带给了个人购物的便捷性和低成本性。根据数据统计,2014全年网购电商交易额突破12.3万亿,网络购物的影响力由此可见一斑。在网络购物浪潮中,网民们经常会对商品的评价、商品的销量、店铺信誉等比较关注,并以此作为自己购物的信任首选。卖家也会积极应对买家的口碑评价调整自己的经营策略。淘宝、京东、易迅等众多电子商务网站平台的迅猛崛起,使得商品的展示和销售绝非在某一特定平台上,绝大多数商家选择在各个电商平台上进行铺货销售。买家的商品评价是电商制定运行规则和卖家销售商品中最重视的信息。

由于目前电子商务平台种类繁多,用户选择的余地较大,但也相对地造成了某类商品价格、物流服务的不统一性,这对一些由于网络知识和计算机操作相对薄弱的、网络安全意识比较差的网购用户,难以快速、直观地获取他们感兴趣商品的关键信息,从而无法迅速找到性价比高的网购商品,甚至出现在网购过程中直接碰到钓鱼网站或诈骗网站,造成了一定的经济损失。这种情况严重影响了电子商务的发展,如何快速定位顾客的需求商品信息,商家如何面对口碑开展商务决策,成了网络购物中买卖双方共同面对的问题。

1 口碑评论信息概述

口碑评论信息是消费者在网购结束并确认收货后通过网络交流的所有关于产品和服务的具体特性的信息,其中包括消费者对本次消费商品的质量、体验描述等评价信息[1]。从信息的产生和运行过程来分析其主要包括对产品、服务等的评价,已经完成网络购物的消费者给商品的评论信息一定程度上给后续购买的消费者提供一定的提示信息导向,消费者根据商品的评论进行网购,很好地降低了消费者的搜寻成本,提高网购消费效率,因此哪些因素影响消费者,成为了现在研究的主题之一[3~4]。评价信息除了对后续购买者有一定的舆论导向外,卖家也可以并根据有用的评论信息,分析相关数据进而做出经营战略调整[2],把产品更好更大规模地推广出去。网络市场是个信息不对称的市场,卖方对产品的主要质量信息拥有比买方更多的信息,在线评论成为了消费者与消费者、消费者与卖家之间重要的沟通渠道[5~6]。

2 口碑搜索系统功能设计

图1 系统功能图

由上图可知:

(1)用户登录到电子商务评价信息的自动抽取与分析系统,账号和密码均可自行设置。

(2)对主题词进行设置,则将商品网址自行复制粘贴到“商品网址”框中。

(3)若是需要对主题词进行修改,则打开系统管理中的主题词管理,在这里分别有“主题词”、“好评语”、“坏评语”等模块,其中,“主题词”有:颜色、宝贝、物流、快递、服务态度、质量、款式等;“好评语”有:很好、不错、真品等;”坏评语”有:不好、差、假货等。

(4)输入商品网址,对商品的网购地址进行有效输入,进而采集相关数据。

(5)进行采集分析。

电子商务评价信息的自动抽取与分析系统是基于多平台电子商务下的口碑评价信息搜索挖掘。通过对各大电商平台中的某类商品信息进行整合,应用网络爬虫技术从用户评论中挖掘大众用户对商品的口碑评价,并从商品整体和其各个特征对口碑进行分析、归纳和总结,进而基于一定可视化工具应用的用户交互式展示,从而开展用户需求与商家经营决策交互。

根据系统需求分析及其数据库的设计,相关电子商务评价信息的自动抽取与分析系统设计应包括系统登录、评论抓取、系统管理、主题词管理、用户管理、密码修改、开始采集、使用算法分词、开始分析等功能,实现对网店销售评论数据的有效挖掘和利用。系统模块如图1所示。

该系统的功能流程图如图2所示。

图2 系统流程图

3 口碑评价信息搜索技术分析

对电子商务智能口碑搜索与分析支持关键技术的研究,重点为多平台电子商务网站下的口碑评价信息搜索挖掘,以此开展用户需求与商家经营决策交互。其主要应用的技术如下:

(1)中文自动分词技术

基于搜索的分词方法可作为中文评价信息有效应用技术。该技术实现可以对预料中相邻共现的各个字的组合的频率进行搜索识别,依据本系统内容,主要从物流、态度、质量三个方面看评价分析。这种方法只需对每条商品的评价信息进行预先设置内容。进而根据评价信息中的分词结果得到识别内容。最后依据分词结果可用作商品总体评价和特征评价的统计依据。其基本实现流程如图3所示。

图3 基于统计的中文分词

搜索方式可依据一定的算法展开,例如后3位最大遍历查找即为解决该问题的一种方法。其算法流程如图4所示。

图4 后3位最大遍历查找

(2)数据采集技术

数据采集技术主要收集用户对某一类商品的评价信息集成。在本项目的实现过程中,可选用Scrapy作为屏幕抓取和Web数据抓取框架,其主要用于抓取Web站点并从页面中提取结构化的数据。Scrapy的主要技术应用过程如下:

①基于Python语言端开发获取URL,对HTML网页进行清洗。

②Scrapy引擎获取URL,请求调度。

③引擎调度通过下载中间件发送到下载器。下载器通过预定义的下载数据类型字段,下载到数据库。

在Scrapy的下载数据过程中,定义数据是十分重要的一项工作。其涉及到最后的数据库生成字段,一个典型的数据字段类型item设置可以表示为:

from scrapy.item import Item,Field

class Torrent(Item):

name=Field()

url=Field()

description=Field()

size=Field()

(3)基于B/S结构的Web系统

图5 系统数据库E-R图

所有技术依据B/S结构而实现,首先制定中文自动分词算法,针对某一需求的商品信息,依据Scrapy技术建立网络爬虫,依据分词统计结果,应用作为显示的交互技术,实现用户需求准备定位和期望,实现商家经营决策支持。页面主要有以下模块功能:

数据采集模块功能:用户只有登录后才可以进行数据采集。输入对应的地址进行数据采集,如没有登录,系统提示错误并返回登录页面。用户采集的商品数据库E-R图可用图5来表示。

分词模块功能:根据采集数据,针对每一条评论信息,采用基于神经网络分词算法和基于统计的算法,分词的结果将导入数据库中。

分析模块功能:进行分词以后,用户可以查看分词结果统计。

用户修改资料模块功能:用户可以登录后修改自己的注册信息。

4 结语

对电子商务智能口碑搜索与经营决策支持关键技术的研究旨在通过对各大电商平台中的某类商品信息进行整合,从实际网络购物需求出发,通过商品口碑信息搜索,从用户评论中挖掘大众用户对商品的口碑评价,达到口碑信息的有效集成和分析,进而基于用户交互式展示,体现经营商家决策依据,实践证明对于购物者节省购物时间提升网购效率,促进商家决策依据具有重要的实际意义。

[1]朱玉如.口碑传播在社交化电子商务网站中的应用分析[J].今传媒,2014(2):121~123

[2]陈明亮.在线口碑传播原理[M].杭州:浙江大学出版社,2009

[3]粟佳,廖惠.社会化购物网站的信息传播研究[J].东南传播,2012(10):110~111

[4]郭志杰.电子商务模式决策分析[J].中北大学学报.2010(4):79~81

[5]王兴德.电子化商务决策分析[M].北京:清华大学出版社,2003.

[6]李天姣,宋一飞.Web 2.0时代下的网络口碑传播——以“大众点评网”为例[J].今传媒.2012(07):99~100

E-commerce;Review Information;Reputation Search;Business Decisions

Research on the Key Technologies of Review Reputation Data Mining in E-commerce

SONG Yang,TANG Hui-jun,YANG Xiao
(College of Information Engineering,Ningbo Dahongying University,Ningbo 315175)

Along with the large scale of economy of network and rapid development of the online shopping in our country,product satisfaction has become main problems to be concerned.As the online shopping increasingly becomes popular today,all types of business,goods are constantly emerging.To help users in the massive commodity purchasing to really choose the suitable ones for their demand,assist businesses to make decisions based on getting the repercussions of the consumer conveniently,automated opinion mining is becoming more and more urgent.The introduction of the technology of the data mining to the e-commerce reputation,which provides the direction for solving the problem.

1007-1423(2015)14-0050-04

10.3969/j.issn.1007-1423.2015.14.012

宋扬(1992-),男,浙江淳安人,本科,研究方向为信息管理与信息系统

唐辉军(1982-),男,浙江宁波人,研究生,讲师,研究方向为数据挖掘

杨孝(1993-),男,浙江温州人,本科,研究方向为第三方物流

2015-04-01

2015-04-22

1007-1423(2015)14-0054-0610.3969/j.issn.1007-1423.2015.14.013

猜你喜欢
分词购物电子商务
2025年我国农村电子商务交易额达到2.8万亿元
分词在英语教学中的妙用
我们为什么选择网上购物?
结巴分词在词云中的应用
结巴分词在词云中的应用
《电子商务法》如何助力直销
圣诞购物季
快乐六一,开心购物!
跨境电子商务中的跨文化思考
不可错过的“购物”APP