基于大数据分析的用户需求挖掘研究

2016-11-30 14:11李伟超贾艺玮赵海霞
创新科技 2016年11期
关键词:数据挖掘图书馆用户

李伟超 贾艺玮 赵海霞

(1.郑州航空工业管理学院,河南 郑州 450046;2.航空经济发展协同创新中心,河南 郑州 450046)

·信息资源管理·

基于大数据分析的用户需求挖掘研究

李伟超 贾艺玮 赵海霞

(1.郑州航空工业管理学院,河南 郑州 450046;2.航空经济发展协同创新中心,河南 郑州 450046)

首先介绍大数据、大数据分析以及用户需求挖掘的相关概念,论述大数据对用户需求挖掘的影响,并对不同行业用户需求挖掘的案例进行研究分析,由浅到深地研究了大数据分析在用户需求挖掘这一方面的影响及重要性。

大数据;大数据分析;用户需求;需求挖掘

随着大数据的急速膨胀,其对于政府、企业会越来越重要,大数据分析能帮助人们获取更为全面的知识和思考能力,也更需要通过用户需求的挖掘获得更多的大数据,这为企业发展提出了新的挑战。企业要想在信息时代占领制高点,就必须重点关注用户的需求,而需求的挖掘都有赖于大数据的分析。

1 大数据分析以及用户需求挖掘的概念

1.1 大数据与大数据分析的概念

1.1.1 大数据的概念。大数据早已在多个领域广泛应用,目前随着互联网的普及使人们更加普遍认识及应用[1]。关于大数据,人们广为熟知的是它的“5V”特征,即Volume(大量),Velocity(速度),Variety(种类),Veracity(真实),Value(价值)[2]。总的来说,大数据是一个数据类型丰富、种类巨大的数据集,并且不能用传统的数据处理方式进行采集、管理和分析。

1.1.2 大数据分析的概念及类型。其一,大数据分析的定义。大数据分析(Big Data Analytics,BDA)是大数据概念与方法的焦点,指的是对大量的、种类多样、增长较快且内容真实的数据进行剖析,并从中找到能够帮助决策数据的相互关系与其他有用的数据的过程。其二,大数据分析的类型。第一,可视化分析(Analytic Visual⁃izations)对于大数据分析工具来说,其最基本的要求是数据的可视化。可视化分析能清晰地展示出数据的相关关系,并且可以使用户更直观地看到数据的分析结果。第二,数据挖掘算法(Data Mining Algorithms)。可视化让用户看到结果,数据挖掘就是机器的计算,数据挖掘算法有很多种,可以分别从集群、分割、孤立点等方面挖掘到数据的深处,找到数据的最大价值。这几种算法不但要能够处理大量的数据,并且也要能够在极短的时间内达到使用者的要求。第三,预测分析能力(Predict Analytic Ca⁃pabilities)。我们进行大数据分析的目的就是为了能够利用得到的数据解决实际的问题帮助预测未来,预测性分析可以利用可视化分析和数据挖掘的结果得出我们想要的数据。第四,语义引擎(Semantic Engines)。大数据的杂乱性、非结构性给大数据分析带来了一定的困难,所以我们就需要一些工具和算法进行分析、筛选、管理数据。第五,数据质量和数据管理(Data Quality and Master Data Management)。对最终分析的数据结果需要有质量以及管理方面的要求,而数据分析的质量可以通过规范化的流程和工具来得以实现。

1.2 用户需求挖掘的概念

用户需求挖掘广义上的概念一般是指以用户的需求为目标,在海量的数据中分析出用户的显性和隐性需求的过程。如图书馆用户需求挖掘,首先要明确目标用户,详细划分用户需求,加强与用户的互动和沟通,以建立有效的用户反馈机制。对于图书馆行业来说,研究用户与馆藏的互动,以此对用户提供有用的信息和有价值的馆藏。数字图书馆有很多用户所需要的数据源,比如用户注册数据、读者调查信息、数字资源的点击量、科研工作者的论文等等,图书馆能够通过机器和工具挖掘这些大量的关联资源。

总之,用户需求挖掘即通过对用户进行跟踪了解后,利用数据挖掘技术及一系列网络工具统计出用户对哪些信息和数据是真正感兴趣,并能够为其推送定制相关产品的一种手段。

2 大数据对用户需求挖掘的影响

2.1 大数据为用户需求挖掘提供海量数据

互联网+时代,对于大数据最基本的加载、激活、管理、推送的处理要求能够更好地了解用户的需求,人们可以多渠道获得海量的数据,经过对这样数据的获取以及用户在不同时期的目标和需求的不同,可以对用户的心理进行深度分析,对于这一过程的分析,实际上已经实现了用户需求的挖掘。通过这些分析我们可以大致地分析出实现用户的行为属性和人口的基本属性。如果进一步进行分析,实现数据的深度挖掘,可能还会呈现出用户的画像,可以在这个画像里面把基于用户的所有模块都呈现出来,如用户偏好,消费习惯等,且可以从用户使用的终端上进行分析。

2.2 大数据为用户需求挖掘提供技术支撑

如今对大数据的采集、组织与分析处理已不是传统的数据库工具所能完成的,这就要求大数据分析需要一些新的软件工具以及方法。而经常用于用户需求挖掘的方法有很多,下面通过分类法、回归分析法、Web数据挖掘法对用户需求挖掘的过程进行分析:

2.2.1 分类法。主要用于查找较大范畴的数据库,把要分析的数据对象区分为不同种类,其目的是利用划分的形式把数据对象归类到特定的类型中。淘宝就是利用了分类法,根据用户近期的购买记录实施划分工作,并且能够很好地为用户进行商品推荐,达到提高销售量的目的[3]。

2.2.2 回归分析法。这是一种函数计算方法,能够显现出数据集中某些数据的独特性质,以及相关数据的不同之处,因而发现相关数据的依赖程度。此方法使用非常广泛,能用于研究各项数据序列的预测和计算,在挖掘用户需求的每一个阶段都能够应用[3]。

2.2.3 Web数据挖掘法。主要应用于网络数据的方法,已逐渐形成综合性的技术,如今较常使用的有PageR⁃ank、HITS和LOGSOM算法,这几种方法的用户群比较抽象,没明确的范围对这些用户进行细致、严谨的分类[3]。

3 基于大数据分析的用户需求挖掘案例

大数据必将持续地对企业、社会、国家的战略资源产生重要影响,成为各种组织的重要资产,尤其是成为组织和公司提升竞争力的有效手段。用户需求的数据、用户与其产品在线的互动记录都将成为企业的重中之重。另外,大数据在市场影响方面的角色也越来越重要,影响着广告、新产品的上市,特别是用户的需求行为。

3.1 基于大数据分析的电商用户需求挖掘

3.1.1 O2O电子商务模式(Online-to-Offline)。它是一个连接线上用户和线下商家的多边平台商业模式[4]。它将实体经济和线上资源相互整合,网络就成了线上到线下的通道,线下企业能从线上网络挖掘用户喜好,而用户可以在线上完成商品的筛选并支付,然后到实体店进行享受服务,如今备受追捧的团购网就是这一模式最成功的应用,如Foursquare、大众点评网、Twitter等电商企业很多都投身020,国内腾讯和百度等也在迅速跟进[5]。

3.1.2 基于大数据的O2O电商用户数据挖掘应用[6]。一是实施精准营销:基于O2O的模式,用户数据挖掘对市场的划分更为细化、行为分析更为准确、用户需求更为明确。经过对用户活动产生的大批信息数据进行采集、管理与分析,可以明确用户自身的兴趣爱好、浏览习惯、消费方向和需求等,并因此推测出用户属于什么群体或者是直接判断出下一阶段的活动,继而在此基础上,向用户进行定向销售。与传统渠道相比,节减营销成本,增加销售效率,提高平台知名度,还可留住大量用户群。另外,O2O模式通过对用户需求的分析,挖掘出高价值用户群,针对这些用户的特色实施个性化跟踪服务,由此获取更高效益;二是O2O平台网站的优化。对用户后台登录系统进行数据分析,可以了解用户访问的形式,对优化O2O平台提供决策和判断依据。且可以根据用户特征和浏览规律来优化网站布局,并将具有一定信誉度和关联的产品排列在一起来增加销售量。另外还依据O2O平台用户的浏览记录,可以分析出用户浏览的网页之间关联性,并依据其特点为其推荐有关产品,提升用户消费满意度;三是保持客户关系稳定:经过对O2O电商用户需求挖掘分析,这一平台能够呈现并留住用户群体。这些分析包含了用户群的细分、兴趣爱好的分析、关联销售以及流失的用户的分析。O2O平台通过对这些行为数据的分析,能够发现潜在的用户,也可以对这些用户的特点进行分析,使其成为经常性的用户;四是欺诈分析与防范:O2O平台除了能对用户的活动进行分析,还能够使用数据挖掘技术对在线的商家记录进行分析并利用网络计算方法建模,针对这一商家的用户评论、交易的数据进行分析处理,然后估算出这一商家是否有诈骗趋势。另外还可以直接筛选出与其他商家不同的群体,并以此来防范欺诈,同时协助O2O平台的风险管理。

3.2 基于大数据分析的高校图书馆用户需求挖掘

随着互联网的快速发展,信息行业和大数据的关系越发紧密。数据分析在新闻传播业、信管行业以及图书情报业的应用引起了广泛的关注,这对于传统图书馆行业带来的挑战不言而喻[7]。因此对高校图书馆读者的服务也要做出相应的调整,那么,在基于大数据分析的基础上高校图书馆用户需求会发生以下变化:

3.2.1 服务形式多样化。由于网络上获取资料信息越来越方便,导致图书馆用户的流失,已逐渐成为网络服务用户。由于受经济能力以及网络条件的约束,国内高校还保留着事实性咨询、指导类咨询等这些传统服务方式。虽然这是两种手段不同的服务方式,但是它们的目标一致,都拥有特别的优点以及各自用户群。

3.2.2 服务手段现代化。高校图书馆用户绝大多数能够熟练运用计算机,这就要求高校图书馆在信息科技不断创新的背景下做到能够为师生保证最为简便、快速的信息服务。要不断提升数据筛选和文献获得能力,为师生们提供更为方便的网络平台。此外,高校图书馆用户在电子邮件和文件的传输等方面的需求量也越来越高,所以大数据分析和技术手段是满足用户需求的一个重要的途径。

3.2.3 服务效率高效化。大数据分析与技术对高校图书馆用户的数据远程传送速率有了很大的提升。但是,高校图书馆的计算机网络系统的处理速度还要更加高效,以便能对用户的要求做出迅速的回应,满足用户的需求和期望。

3.2.4 服务内容精品化。齐夫在《人类行为与最小努力原则》中指出“在解决问题的前提下,人们趋向于选择工作量最小的途径[8]”。大数据背景下高校图书馆用户能否从大量的、无序的、非系统性的数据中找到自己需要的资源成了重中之重,且要对采集信息的时间、经济成本加以控制。因此,高校图书馆对数据的供应以及服务都面临严峻的形势,用户对数据内容的精品化就成了高校图书馆行业需要努力的方向。

4 结语

近几年来,有关不同领域用户需求挖掘的研究成果比较丰富,大数据恰好为这些研究提供了大量的分析数据[9]。同时,还要对大数据视角下用户的显性与潜在需求有一个明确的认识,在利用大数据的方式、技术实现、服务模式的改进和创新、大数据的应用策略等问题的研究要进一步深入,积极开展用户需求数据策略的实证分析,这样才能更好地利用大数据分析技术挖掘用户真实需求,更好地为用户提供服务。

[1]方巍,等.大数据:概念、技术及应用研究综述[J].南京信息工程大学学报,2014(5):405-419.

[2]楚静,薛姝.湖南新型城镇化推进模式及政策选择[J].湖南城市学院学报,2015(4):61-65.

[3]胡佳.大数据时代的数据分析与挖掘[J].中国新通信,2014(23):34.

[4]徐国虎,孙凌.基于大数据技术的线上线下电商用户数据挖掘流程分析[J].中国集体经济,2012(30):187-188.

[5]TechWeb.团购[EB/OL].http://www.techweb.com.cn/uc⁃web/page/catid/339,2016-12-20.

[6]徐国虎,等.基于大数据的线上线下电商用户数据挖掘研究[J].中南民族大学学报(自然科学版),2013(2):100-105.

[7]王志梅,等.网络环境下用户信息需求研究[J].图书情报工作,2004(7):90-92、113.

[8]李鸿.大数据背景下高校图书馆的用户需求与信息服务[J].中国科技信息,2014(1):79-80.

[9]黄艳芬.近年来我国信息用户需求研究综述[J].高校图书馆工作,2007(1):26-29.

Research on the Mining of UsersNeedsbased on Big Data Analysis

Li Weichao Jia Yiwei Zhao Haixia
(1.Zhengzhou University of Aeronautics,Zhengzhou Henan 450046 2.Collaborative Innovation Center for Aviation Economy Development,Zhengzhou Henan 450046)

In this paper,the author firstly introduces the related concepts of big data,big data analysis and user needs'mining,then discusses the impact of bigdata on user needs'mining.It also studies and analyzes the case of user needs'mining in different industries.The impact and importance of bigdata analysis in user needs'mining are studied from shallow to deep.

big data;big data analysis;needs of users;needs mining

TP311.13

A

:1671-0037(2016)11-72-3

2016-10-6

2016年郑州航院研究生教育创新计划基金项目“网络信息资源长期保存中信息安全管理机制研究”(2016CX028);河南省高等学校重点科研项目软科学研究计划项目“互联网+环境下实验区众创空间与驱动力发展研究”(17A870003);2014年校级“信息管理核心课程教学团队”(201401)。

李伟超(1976-),男,博士,副教授,研究方向:信息资源管理;贾艺玮(1991-),女,硕士研究生,研究方向:信息资源管理;赵海霞(1992-),女,硕士研究生,研究方向:档案信息资源管理。

猜你喜欢
数据挖掘图书馆用户
改进支持向量机在特征数据挖掘中的智能应用
基于用户和电路的攻击识别方法
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
图书馆
信用卡资深用户
软件工程领域中的异常数据挖掘算法
两新党建新媒体用户与全网新媒体用户之间有何差别
去图书馆