国内可视化电子商务研究进展∗

2019-07-31 09:54孙雨生李沁芸
计算机与数字工程 2019年7期
关键词:数据挖掘可视化电子商务

孙雨生 刘 阳 李沁芸

(湖北工业大学经济与管理学院 武汉 430068)

1 引言

随着Web2.0 及读图时代到来、电子商务蓬勃发展,用户信息需求日趋多样性、可视化,消费群规模[1]及商务信息爆炸式增长[2~3]、用户与商品信息逻辑关系日趋复杂[1],在这种形势下,传统电子商务平台技术及功能局限性、用户有限信息处理能力致使用户难以与大型商务数据集有效交互[4]并精确获取所需商品、商家信息,用户认知负荷及商务运营成本陡增,最终影响用户使用体验及商务活动效率。新出现的可视化电子商务为这些问题解决提供了新途径:其按用户需求可视化表征用户、商品、商家信息及其行为信息(搜索、购买、供货)和信息背后隐藏、逻辑、复杂结构关系,方便用户基于商务平台与大型商务信息源、可视化结果高效交互[1,5],快速准确获得所需信息[6]进而决策,在降低用户认知负荷同时提升其满意度;其可视化商务过程信息以建立买卖双方信任并成交、提高商务效率(购买率、销量)[7~8];最终基于互联网优势实现商家间市场、产品、经营等方面互补互惠、诚信可见合作,形成水平、垂直业务链,实现大规模、经济化、灵活性[4]、可视化全球商业运筹管理[8]。因此,研究可视化电子商务问题有重要意义。

本文首先以中国知网、万方数据的学位论文库、期刊论文库及维普的期刊论文库为信息源,以“可视”和“商务”为关键词组合在题名中检索相关文献(截止2017 年11 月2 日,从知网获得硕博论文4 篇,期刊论文35 篇,从万方数据获得硕博论文8篇(新发现4 篇),期刊论文40 篇(新发现6 篇),从维普获得期刊论文11 篇(新发现6 篇),合计55篇);然后详读55 篇文献归纳国内可视化电子商务研究进展并根据提及频次、内容质量详细标注,本着最大限度反映国内可视化电子商务研究进展重要文献原则(剔除广告等劣质文献、视觉电子商务范畴文献)选出17 篇参考文献(内容覆盖55 篇文献);最后阐述可视化电子商务内涵、核心内容及研究框架,并从理论基础、核心内容、实践应用三方面揭示国内可视化电子商务研究进展。

2 可视化电子商务简介

2.1 定义及内涵

可视化电子商务运用信息可视化(基于信息处理平台[4,6]借助可视化手段清晰有效传达沟通信息[9]的新思想、技术、方法),基于电子商务平台收集、组织、交流和利用[4,6]相关信息(实体(商品、顾客[2]、商家)及实体间联系信息(购买记录(订单[2],反映顾客购物行为、商品热度等)、供货信息(反映商家供货能力等)),此外还涉及金融、通信数据[6]),按用户商品[1]信息需求[4,6]搜索并将结果(非物理空间、非数值型(高维、流式、非结构化和网络型)信息[6])可视化处理(基于计算机图形图像[3]、多媒体技术,心理学、人机交互等理论[8]映射、变换并用图形、图像、声音[1]、动画等可视化表征电子商务海量多层次[4]信息特征及隐藏[4,6,8,10]逻辑[1]、复杂结构关系[4,6,8]、规律)后展现在二维空间以便用户观察、分析、计算[3]并与大型信息源、可视化结果高效交互[1,5],进而准确获取并理解感兴趣商品[1]信息,供决策(商品营销、购物服务(如商家比较)[1,4])参考[6],以降低用户认知负荷并提升其体验(满足个性需求(产品定制))[5]、满意度及黏度,提升电子商务平台功能[4]、商务资源运转效率(可视化交易过程(购买、支付)以建立买卖双方信任关系,激发购买欲[1,4,5]、完成交易),降低商业运营成本[1,4]。

2.2 核心内容及研究框架

分析现有文献,笔者认为可视化电子商务核心研究相关理论基础、核心内容、实践应用,研究框架见图1。

3 可视化电子商务研究进展

纵观现有成果,国内可视化电子商务研究已出现但尚处起步阶段,相关成果最早是2005 年刘伟国[11]发表的论文《基于GIS 的电子商务物流配送可视化信息平台研究》,学术研究集中在理论基础(架构体系[3,7,11~13]、挑战与对策[1,3,4,6,13]、发展趋势[1,4,8])、核心内容(可视化表征[9,13],可视化技术、工具、方法[2~5,13~16],可视化资源组织[4,6,15])等方面;应用研究集中在用户界面[4,10,16]、搜索[14]与推荐[17]、交易过程[4]、数据挖掘[3,13]等可视化,还涉及物流信息[11]、移动电子商务[14]可视化等。

3.1 理论基础

3.1.1 架构体系

1)体系结构

刘伟国[11]、叶娟[7]提出集成 C/S[11](内部用户信息共享、传输、业务处理)、B/S[7](外部用户信息发布)可视化电子商务平台体系结构:分客户端层[7](用户基于Web 服务器与系统交互)、表示层(分离业务逻辑与CFM(服务器端执行、cold fusion格式动态网页)、JSP 页面表示)、应用层(基于应用服务器实现业务逻辑)和数据层(基于数据库服务器存储数据);周一帆[12]提出基于B/S 架构、SSM(Spring、Spring MVC、Mybatis)框架可视化电子商务平台体系结构,分表示层(支持基于JSP、Velocity(MVC 架构显示)可视化展现结果以便用户交互)、控制器层(基于controllers 处理用户请求)、业务逻辑层(核心,由业务逻辑对象组成)、数据访问对象层(基于DAO 组件访问数据库)、领域对象层(由支持业务逻辑的传统Java对象组成)。

2)功能模块

刘伟国[11]构建基于GIS 的可视化电子商务第三方物流配送平台以动态可视化处理结果、高效收集、处理、利用物流信息,核心是车辆调度、车辆监控、GIS 管理等组件;周一帆[12]构建化肥可视化电子商务平台以管理用户信息、PC 及手机端订单,由报表(OLAP、数据钻取、图表显示、PDF 管理、Excel导出)、用户管理(后台用户、经销商管理)、促销管理(促销活动、促销码管理)、订单管理(订单及其详情列表)、数据统计(按条件生成数据汇总图)、数据透视(加载、布局、导出)模块组成;陈晴光[13]构建可视化电子商务数据挖掘模型可视化输出挖掘结果并动态更新以支持商务决策,由可视化系统(含结果解释评价模块;经客户端传挖掘结果给Web页面并可视化(表格、图形、图像)显示)、挖掘控制器(基于可视化系统显示、结合应用解释挖掘器所得模式以便用户理解、判断、评估、筛选[13]并反馈给其他模块[3]直至用户满意)、数据挖掘器[3,13](从预处理数据中发现模式、规则并借助OLAP 引擎(快速分析数据立方体中数据、通过接口及时返给用户并创建数据立方体[3])和相关算法动态更新)、网站数据动态采集与预处理[3,13](按任务确定数据源并获取原始数据(多不完全、冗余和模糊;分原始数据(服务器日志(发现用户行为特征)、查询数据、注册信息(结合访问日志更好了解用户)、代理服务器数据(以代理日志形式保存用户访问信息)等)、不同层次综合数据(归纳原始数据存于数据仓库)),按约束调用相应预处理子模块进行过滤、规格化、归纳、二义性分析等处理以供数据挖掘器使用)等模块组成;黄辉[14]基于可视化搜索引擎构建移动可视化电子商务平台,由业务应用、网络图片数据自动采集与分析、用户数据分析与挖掘(用机器学习技术分析搜索引擎及电子商务平台所采集用户点击数据,辅以专家分类训练提升可视化搜索精度)模块组成,分别与API、机制管理、数据管理接口对接。

3)运行机理

陈晴光[13]提出基于C/S 模式在线访问客户数据的可视化电子商务数据挖掘机理:先用Web数据库(通过ODBC、ADO、OLEDB、ADOM 接口)访问及数据挖掘技术(按需选择挖掘算法)模型化处理(抽取、转换、分析等)电子商务数据以提取辅助商务决策信息(先用模式分析进行发现再联机分析验证);再在动态网页上用空间和非空间属性(大小、颜色等)以图表或可视化文本显示所得数据模式供分析员观察、理解并找出内在规律和变化趋势。陈维斌[2]提出基于网页格式模板、元素构件、素材的可视化电子商务网页生成机理:基于格式描述器从模板库载入格式模板,借助元素构件引导用户添加网页元素、设置格式并将格式存入ECM 文件供网页生成器读取、解释以构建网页框架、合成预制网页素材并从数据库中提取商品数据生成动态网页。

3.1.2 挑战与对策

喻星晨[3]认为基于像素可视化电子商务数据挖掘面临缺乏面向用户需求的数据挖掘方式(当前多面向网站管理员,需设置用户权限满足其个性需求、简化可视化结果以降低认知负荷、提升挖掘精度与速度),数据格式转换(按数据挖掘技术需求转换服务器客户数据格式),分布性、异构性数据源挖掘等挑战;陈晴光[13]认为可视化电子商务数据挖掘面临挖掘结果深度可视化、动态化,数据多样化挑战(目前部分实现图形、图表化但多静态)以动态转换挖掘结果为商业行为;解聪[15]认为分析电子商务时序用户交互数据面临交互序列时序关联及上下文关联分析(某时段大量交易的商家可能在促销,若交易来自同一(群)买家,则需研究交易时间、地点相关信息以深入探索买卖双方特殊关系)、最常见交互模式(工作日交易稀疏,节假日交易频繁)发现、特定感兴趣交互模式(如虚假交易、刷信誉交易(常交易额小但量大))识别三大挑战;杨峰[6]提出可视化电子商务面临可视化形式单调(树形结构应用、图符选择标准缺乏)、深度不够[1,4,6](仅可视化商品、商家、供货信息,很少基于层次结构可视化信息结构关系(需应用分类树、概率分布[15]、关联规则[4,6,15]、相似性计算及修改[15]、趋势、聚类、偏差等技术)以同时了解信息全局结构和局部特征)、信息覆盖范围较窄等挑战;黄辉[14]提出可视化电子商务图像搜索技术面临图像特征值提取(目前多提取图像关键点、共同点并用大维向量结构化存储、逐一匹配,对图片库容量要求较高且搜索效率低)挑战(需构建更符合用户搜索、使用习惯的新算法,设计有效图像多维特征读写机制以提升搜索速度)。

3.1.3 发展趋势

代玉梅[4]、潘平[1]认为用户需求个性化、企业经营全球化、市场竞争白热化迫使企业引入ERP、知识管理等经营理念,应用数据仓库、联机分析、数据挖掘等智能决策技术与工具提升应变能力,迫切需信息可视化支持;潘平[1]、段文敏[8]认为下一代电子商务网站用户界面和体验方向为信息可视化(多为动态图形界面):将信息可视化作为商家与消费者沟通最有效手段延伸到复杂交易处理系统,实现标准工作流程、合作系统、商业流程管理以降低运营成本;将随信息管理理论与实践发展获得更大发展[1]。

3.2 核心内容

3.2.1 可视化表征

现有电子商务主要可视化表征方法见表1。陈晴光[13]提出可视化电子商务数据挖掘模型在页面中提供图表显示类型选择与效果设置功能,将各数据处理、图表生成的Java Applet嵌入网页以与用户动态交互(旨在动态查询数据仓库,发现隐藏有价值信息);陈旭毅[16]用Space Tree(按当前所需显示类目量动态安排屏幕空间)可视化呈现含类目商品分类目录;张敏[9]提出由用户基于Flex 所提供接口用Flash制作各种效果皮肤用于Treemap(可视化层次数据方式)以按需设计可视化效果,用面积特征展示数值型数据、基于颜色策略的颜色特征尽可能展示非数值型(节点类型、所处层次等)及数值型数据关系等,此外,解聪[15]用花朵状图标可视化表示城市商品进出口量及交易方向;杨峰[6]指出慧聪网用树状图可视化商品信息、用轮廓图(最早树状可视化技术)可视化磁盘文件结构。

表1 主要可视化表征类型及方法

3.2.2 可视化技术、工具、方法

1)界面显示可视化

陈旭毅[16]用 TGWikiBrowser(Java 编写可执行文件)、基于物理方法的力导向可视化模型(由节点和节点间边(看作排斥力与吸引力作用)连接成的网状图(平衡时最稳定美观))显示商品、用户关系:双击需聚焦的节点(自动移到图中心),其余节点重新在力作用下以其为中心形成新平衡态;赵东宏[5]认为商品展示逐步由二维图形图像展示向三维过渡,目前主流网络三维可视化技术见表2。

2)用户交互可视化

整合可视化分析、数据分析(引入用户干预,结合感知能力、领域知识与自动算法)等从时序、地理信息、高维数据三维全面刻画、动态可视化时序用户交互行为数据间特性、关系,多分析单用户行为模式、判断并描述动态用户交互网络全局结构变化、分析全体用户交互趋势及关联模式[15]。解聪[15]提出在大规模数据集中探索感兴趣时序交互模式的多用户交互数据可视化工具MUIE 及分析方法:全局总览(通过概率输出决策树识别与特定任务显著交互记录,基于基本特征(原始、新定义属性)、文本特征(文本分析所得主题、关键词)、时序特征(时间单元内用户交互频率)计算每条交互显著度并投影到2D 像素图(时间显著度TOS图(从不同时间数据聚合粒度多层次可视化探索交互数据))、细节可视化(查看上步数据细节)。

表2 主流网络三维可视化技术[5]

3)搜索可视化

基于大规模并行计算和图像搜索技术(核心是图像搜索算法)、图片库进行图像识别、匹配以提升查准率、查全率、速率[14]。

4)数据挖掘可视化

以用户为中心,基于数据挖掘、可视化技术发现海量电子商务数据中潜在有用知识并动态显示于Web 页面:前者涉及用户(兴趣)关联(基于用户所访问站点及文件发现站点、文件间关联,揭示用户兴趣及用户间关联)、序列模式(如购买序列)、客户分类、客户群及Web页面聚类、频繁访问路径(基于Web 服务器日志中站点访问次数)等[13]挖掘技术;后者涉及数据图表、基于像素可视化技术(将数据值映射成一带颜色像素,按数据集维数将屏幕分割为多个子窗口)[3]。

3.2.3 可视化资源组织

杨峰[6]、代玉梅[4]、解聪[15]认为可视化电子商务可视化概念(特征)信息,主要是商品信息(数量、库存量、新旧度、价格等级等,描述商品绝对、相对特征)并涉及顾客信息、商家信息(地域分布、规模、品牌档次、社会声誉、供货情况(反映商家星级、诚信度等[6])等)、购买信息(购物记录,常用于分析用户兴趣度、星级、诚信度,商家星级、诚信度、商品销售速度等)、总体特征(赋予各类商品分类标志进而可视化,较少),很少可视化其他知识形式信息[4,6];解聪[15]将交易数据看作买卖双方高维交互,探索时序用户交互数据中时序关联及上下文关联以辅助理解用户行为、偏好及发现用户交互趋势等;陈晴光[13]认为电子商务中信息资源包含用户访问日志文件[3]和查询数据、注册信息、代理服务器数据,基于预处理器[3]对数据源进行过滤、规格化、归纳、二义性分析,为数据挖掘器[3]提供干净、准确、简化数据。

3.3 实践应用

3.3.1 可视化界面

代玉梅[4]、吕阳[10]认为友好可视化界面以用户为中心,通过增强界面信息数据间关系[10]方便用户快速高效与大型数据集交互并获取所需信息[4];陈维斌[2]分析电子商务网页结构特点提取网页元素并构件化,设计基于网页格式模板、元素构件、素材的可视化电子商务网页生成模型,改进数据描述器(可视化描述数据源、素材格式及其应用和处理,供网页设计者选择商品种类及其属性)并用于中小企业电子商务网站构建。

3.3.2 可视化搜索与推荐

黄辉[14]基于可视化搜索引擎构建移动可视化电子商务平台,核心是基于商品数据库的可视化搜索引擎体系(主要是图像精确识别(基于用户拍摄标准图像(如海报、商标、封面等)搜索商品,用于购票、购物、娱乐等)和图像语义相似度匹配(基于模板、纹理、特征等语义匹配与用户所拍摄样板风格、类型相似商品,轮廓识别用户所拍摄商品简笔画搜索类似形状商品,常与第三方合作提供可视化搜索服务、完善网络图片数据自动采集与分析机制)。

此外,黄辉[14]提出目前著名图像搜索系统有IBM 的 QBIC、哥伦比亚大学 Visual-SEEK,MIT 多媒体实验室Photo-Book 和UC Berkeley 的Chabot等;部分知名IT 公司在一定地区范围推出有限图像搜索服务(标注和索引文字、网页图像):谷歌推出同时支持图像及其文字识别的手机拍照搜索服务Goggles 并尝试用于电子商务,亚马逊收购并将SnapTell 的可视化搜索技术用于其电子商务平台;杨本植[17]认为好的电子商务网站推荐可视化系统应符合用户需求及兴趣偏好(新奇发现能力强)和企业需求(支持其销售、决策)。

3.3.3 可视化交易过程

可视化交易过程可视化购物细节、较高级信息(如支付)[4],但目前多基于轨迹、时间、位置信息及依附于轨迹的交易信息动态可视化商品物流信息(如交易、物流类型等)以辅助理解物流轨迹聚类模式、发现不同类型交易轨迹模式。解聪[15]基于动态更新的背景密度图、粒子动画(粒子从发货地向收货地沿特定轨迹移动并在到达后消失,同城交易表示为粒子自旋动画)可视化每笔商品交易物流信息,基于省会城市间实时交易数据矩阵(每行代表所选城市向其他城市出口数据)可视化主要城市进出口交易量,用色调编码交易量(量越大则矩阵对应格颜色越深)、花朵状图标(内部圆半径表示城市交易量,圆外多个扇型(半径表示进出口量)指向表示交易方向)表示城市进出口量及交易方向;刘伟国[11]基于GIS/GPS、知识工程等技术与理论构建可视化电子商务第三方物流配送平台,提供基本功能(分可视化显示(地理对象被选中时属性显示、车辆实时监控(基于GPS 经纬度、时间信息在电子地图上可视化显示车辆实时位置及属性等)、货物跟踪(按物流配送、调度和GPS信息显示货物状态、位置等)、GIS空间查询(基于GIS地图、文本查询进行属性、图形及其交叉查询并可视化显示结果)、车辆调度和路径规划(基于平台接口所提供物流配送和地理信息(道路网络拓扑结构)规划路径进而调度车辆并将结果可视化显示在GIS 上(按道路网络与电子地图对应关系,通过道路网络所提供弧段、节点属性查询并显示电子地图相关图元))、GIS 基本管理(图层、地理对象管理)、信息处理(采集、存储、查询、管理、传输、发布))和扩展功能(车辆自动导航、紧急事件响应、未安排配送计划预警、扩展功能接口等)。

3.3.4 可视化数据挖掘

目前研究较成功的是结合空间地理信息可视化技术呈现挖掘结果,国内电子商务领域相关应用尚未成熟[13]:陈晴光[13]提出动态可视化挖掘结果的可视化电子商务数据挖掘模型;喻星晨[3]提出基于像素的数据挖掘可视化系统,用于挖掘潜在客户(分类老客户确定分类关键属性及相互关系以正确分类新客户),分析客户并提供个性化服务,预警和控制异常事件(用孤立点分析技术发现潜在危险客户以及时防范;聚类不良信用客户特征并用于新客户行为监测、分析、预警及信用风险管理)。

3.4 其他研究

杨本植[17]提出在电子商务网站生命周期各阶段基于人机交互学(设计评估基于计算机系统使其最易为用户所用学科,由用户基于界面与Web应用交互)、可用性评测评价网站用户体验(使用过程中感受、获得内容总和)以最大限度满足用户需求和期望(节约时间金钱、提升工作效率)、提高网站可用性(特定使用环境下满足用户特定用途有效性、效率及用户满意度)[10,17]及用户留存率和重复访问率、提升产品变现率及竞争力并降低网站维护成本。具体需考虑网站开发技术(涉及服务器能力、网页生成方式、浏览器、网速等)及运行方式(使用环境)复杂多元性、用户群广泛多样性(背景及需求差异性)、市场和竞争者、任务和目标等因素。

4 结语

综上,本文揭示了可视化电子商务内涵、核心内容和研究框架,从理论基础、核心内容、实践应用三方面阐述了国内可视化电子商务研究进展。理论基础主要研究可视化电子商务架构体系(体系结构、功能模块及运行机理)、挑战及对策、发展趋势;核心内容主要研究可视化表征、可视化技术(涉及界面显示、用户交互、搜索、数据挖掘可视化)、可视化资源组织;实践应用主要研究界面、搜索与推荐、交易过程、数据挖掘可视化四方面。

接下来,笔者将系统对比、使用体验主流可视化电子商务应用进而构建解决方案,以供相关研究与应用参考。

猜你喜欢
数据挖掘可视化电子商务
基于CiteSpace的足三里穴研究可视化分析
自然资源可视化决策系统
改进支持向量机在特征数据挖掘中的智能应用
思维可视化
2025年我国农村电子商务交易额达到2.8万亿元
自然资源可视化决策系统
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
新丝路电子商务公司办公室
软件工程领域中的异常数据挖掘算法