摘要:伴随我国网络信息化技术不断创新,“数据挖掘”作为数据分析、发展趋势及创新手段,其重要性不言而喻。通过近年来研究发现,“数据挖掘”应用的科学性与优化性对数据质量提升、应用效率提高、误差减低等影响颇大。本次研究将基于数据挖掘的用户行为进行分析研究,为下一步工作开展提供依据参考。
关键词:大数据;数据挖掘;用户行为
★基金项目:江苏省高校哲学社会科学研究基金项目,项目名称:大数据时代下电商平台用户行为分析研究,批准号:2017SJB1553。
前言
“数据挖掘”应用是当下我国各行业重要应用技术之一,具有较大的意义影响。然而现阶段有关我国基于数据挖掘的用户行为分析研究相对较少,基于该问题现状,要求行之有效的方法对其进行分析研究,如网络用户行为分析、建模与算法分析、大数据未来发展等,本次研究对基于数据挖掘的用户行为进行分析,有十分重要的理论意义。
1、数据挖掘概述
随着我国科学技术不断提升及发展,计算机、网络信息及大数据技术逐渐得以广泛应用及研发。其中,最为重要的是大数据技术,数据技术不是单一片面的简单流程,而是更为科学、合理的系统布局。从当下我国对数据技术及相关专业理论的研究中可以得出,如何利用与发挥好“数据挖掘”对其提升应用效果十分重要。数据挖掘是基于大数据技术下的一种核心应用手段,对大数据技术得以发挥起到重要的推动作用。数据挖掘是指对海量大数据内容进行识别、寻找其规律的一种保障技术。主要包括:数据准备阶段、规律寻找阶段、规律表示阶段。“数据挖掘”不是简单的基础技术,而是一种较为复杂、繁琐的科学流程,其目的主要是实现人类对海量数据的掌握、调取及利用,主要任务包括聚类分析、关联分析、异常分析、演变分析、特异群组分析、关联分析等,如图1:
数据挖掘具有以下特点:第一、发现性特点,发现性特点是数据挖掘主要特征之一。由于海量数据容量之大,在对其进行处理、利用过程中必然会受到诸多阻碍。通过数据挖掘可以对数据库知识进行寻找、提取。在该过程中“发现”特点较为明显,它规避了传统数据挖掘的形式化与流程性,提升了其整体效果与综合利用。第二、涉及性特点,涉及性特点主要是指数据挖掘的运行及工作方式种类较多。可以采用多种不同方式及手段对数据知识进行寻找、发现。第三、稳定性特点,数据挖掘最为基本的保障为“稳定性”,在数据挖掘过程中不会受其他因素影响,对发现数据知识及关联分析的精准、可靠起到一定的安全保障作用。这也是数据挖掘最为重要的基础核心之一[1]。
2、基于網络时代的用户行为的作用分析
2.1 用户行为决定企业盈利
随着现阶段我国网络信息技术不断发展,诸多网络平台与网络服务都将“用户需求”作为重要发展目标。这也是相关网络企业得以发展及规模壮大的重要基础。企业的盈利性在于市场稳定与满足用户。而用户正是市场的重要根基。因此,基于上述情况科学、合理的对用户行为进行分析研究十分重要。用户行为是指用户基于某种网络服务或平台所提供的服务、体验,而发生的一种主动性消费诉求及实际行为,体现了用户主观思想与心理需求。企业只有对用户行为进行有效分析,并根据其数据统计情况进行运营、发展战略制定,才能成为提升企业盈利的重要推手[2]。
2.2 用户行为决定平台良性发展
当下我国信息化建设正在快速发展,各领域、各行业都在融入大量信息化元素。如教育、医疗、电子商务、军事、工业、科研等。这些行业领域都离不开对“用户行为”的分析研究。通过对用户行为进行及时、科学分析,可以对用户需求与情况进行全面掌握。并对其行业平台发展与网络资源利用尤为关键。因此,从行业网络平台良性发展的角度来讲,加强对用户行为的分析研究,将重点问题与用户需求进行寻找、发现,可以快速提升该行业平台的运行能力[3]。
3、用户行为具体研究——基于数据挖掘技术
3.1 网络用户行为分析
用户行为分析主要是指对网络用户行为、上网规律及心理诉求的预测、判定。利用数据挖掘技术对网路用户进行分析研究,主要采用算法或模型构建等方式完成。在该过程中通过对其进行数据发现、寻找及分析,可以将用户兴趣作为网络平台重要经营发展策略,并为用户分区提供关键理论依据。由于网路具有一定的虚拟性,其用户行为也与实际用户行为具有明显差异。所以,在对其进行分析过程中一定要对网络用户特点进行了解掌握,具体特点如下:第一、技术性特点,网络用户多为具有一定的计算机、网络知识,且信息化接受程度较高,通常可以独立完成其网络操作。第二、隐蔽性特点,网络用户基于虚拟世界与心理规避感,往往具有隐蔽性特点,如修改相关信息内容、删除痕迹等。第三、个性强特点,网络世界是开放的,网络用户通常不必局限于现实生活中的束缚与规定,可以独立进行意识及个性塑造、发挥[4]。
3.2 建模与算法分析
第一、建模是利用数据挖掘进行网络用户行为分析的重要基础,主要从用户行为特征、用户兴趣入手对其进行模型构建,其目的是提升规范分析力度。以用户兴趣模型为案例,该模型主要包括关键字模型、主体模型、基本本体论模型、向量空间模型等。例如:关键字模型主要通过对用户行为关键字的提取,如“咖啡”一词可以代表喜欢喝咖啡的用户。主题模型是采用用户兴趣归纳与分区的方式,将用户行为及特点进行集中体现与合理分区。
第二、算法主要采用K-Means算法。通过K-Means算法可以轻松完成其聚类。另外,一个科学、合理的用户兴趣模型顺利构建,主要是需要对优秀且高效率用户兴趣模型算法的选择及应用。通过对相关数据信息整理后发现,其用户兴趣模型算法主要包括:遗传算法、聚类算法、决策树算法、贝叶斯算法等。但其效果最为明显,且采用率最高的为“聚类算法”。聚类算法是指通过建立不同群组的用户的兴趣簇来划分各用户,主要借助K-Means算法对用户根据其兴趣程度的权重进行聚类,从而达到对用户进行兴趣的划分[5]。
4、“数据挖掘”技术的未来发展
4.1 时代发展的必然产物
随着网络信息技术不断普及应用,大数据时代已经来临。大数据时代是指通过数据共享、数据采集、数据海量存储等实现资源互利、数据传输及应用发展时代。大数据时代下最為代表性的就是“数据挖掘技术”。数据挖掘技术通常是指网络技术、计算机技术、通讯技术及相关衍生出来的传感技术、自动电气化及人工智能技术等[1]。数据挖掘技术范围、范畴较宽。从其实用性及作用性角度来讲,数据挖掘技术分为监控、智能及保障三大方面。随着我国科学技术水平不断创新突破,数据挖掘技术也随之日益更新,在诸多领域及行业中都较为常见,已经渗入到人们日常生活及生产建设中去[6]。
4.2 实现数据信息化呈现
数据挖掘用户行为分析的最大作用是为网络平台提供更为精准的数据信息,并使其数据信息以立体性、数字化信息形式呈现出来,我国现阶段数据挖掘技术主要以数据智能分析为主,结束了以往的传统分析模式,通过对用户信息样本、特征采集,通过寻找后以信息化数据形式呈现出来,为网络平台战略发展提供更为科学、准确的信息参考。这种参考性主要体现在应对经营预案明确方面。而通过数据信息化呈现,可以让相关技术人员更为立体、鲜明的掌握其用户需求,为下一步工作开展打下基础[7]。其统计效率、统计质量、统计速度之快、之准、之全较为完善,可以为日后相关工作开展及信息掌握起到积极参考作用,其价值性不言而喻。
结论
综上所述,通过对基于数据挖掘的用户行为进行分析研究,主要包括:数据挖掘概述、基于网络时代的用户行为的作用分析,其包括用户行为决定企业盈利、用户行为决定平台良性发展、基于数据挖掘技术用户行为具体研究,其包括网络用户行为分析、建模与算法分析、大数据未来发展等,从多方面、多角度对基于数据挖掘的用户行为进行阐明,为下一步工作开展奠定坚实基础。
参考文献:
[1] 张利利,马艳琴.基于数据挖掘技术的航空客户流失与细分研究及R语言程序实现[J].数学的实践与认识,2019(6).
[2] 孙欣,李俊飚,张亚迪,等.基于数据挖掘技术的嘉定地区电动汽车个人用户充电桩信息分析[J].电力与能源,2019,40(02): 75-77+110.
[3] 周浩,林波荣,张仲宸,等. 基于数据挖掘技术的北方寒冷地区居民用水、用气数据处理方法探讨[J]. 暖通空调,2019,49(02): 64-72.
[4] 韦建国,王玉琼.基于网购平台大数据的电子商务用户行为分析与研究[J].湖北理工学院学报,2019(3).
[5] 杨国胜,郭贝贝.机器学习增强的电子商务平台用户行为预测[J].科技与创新,2019,121(01):130-131.
[6] 刘娜娜,张强.基于电商平台的消费者需求及产品数据挖掘技术分析[J].内蒙古统计,2019(01):42-45.
[7] 杨奕,张毅,李梅,等.基于LDA模型的公众反馈意见采纳研究——共享单车政策修订与数据挖掘的对比分析[J].情报科学,2019,37(01):88-95.
作者简介:
金琳,硕士,盐城工学院,讲师,研究方向:大数据管理、数据挖掘、电子商务等。