吕绍鑫
摘 要:随着计算机网络技术的日益发展,而数据挖掘技术在高校网站信息当中的实践应用已经到了一个比较成熟的阶段。网站作为信息传播的主要载体,运用其直观形象的使用方式,见证网络信息的快速发展,在既能够给予人们便利的情况下,也相应的给相关机构带来了巨大挑战。本文将针对高校针对网站规划以及网站建设方面,运用数据挖掘技术进行实践应用的内容,做相关阐述。
关键词:数据挖掘技术 高校 网站信息 实践应用
中图分类号:G647 文献标识码:A 文章编号:1674-098X(2020)03(b)-0091-02
随着教育信息化的发展,高校网站建设已经从形象建设转变为现如今的信息建设,这主要是因为当今社会是信息时代,高校用户对于信息的需求量也在与日俱增。也就是说在内容和数据方面都被要求需要达到较高的水平,在高校信息化建设的目标前提下,使用数据挖掘技术来帮助设计人员针对高校网站数据进行挖掘,从而找到适合高校网站建设的一种模式,在大量的信息中为人们提供有价值的信息以保证良好的服务。
1 相关概念
1.1 数据挖掘技术
数据挖掘技术在实践中体现出一种较强的综合性,它既能够针对网站设计来对数据实现有效采集,还能够通过技术本身来对网站数据来进行初步整理。也就是说数据挖掘技术能够在归纳式的推测前提下来针对用户进行预测,从而使得决策更加准确。数据挖掘技术涵盖众多学科方面的内容知识,不仅包含数据库技术和信息获取技术,在某些时候还会使用到统计学的相关技术[1]。
根据数据挖掘技术所面对的处理对象的不同,它分别有三种应用模式,其在各个行业发挥着不同的重要作用,第一个就是结构挖掘,第二个则是内容挖掘,第三个是使用挖掘。在数据挖掘技术实践过程中比较常用的,有关联规则技术,序列模式技术以及数据挖掘当中特有的路径分析技术[2]。网站数据本身相对于传统的数据库,其有着数据内容庞大且复杂的特性,并且它并没有以规定的数据模型呈现出来,所以网站数据内容当中,每一个站点都必须采取独立设计,这也就导致了,在网站数据背景下的数据挖掘技术也比每个结构化数据都要更加复杂[2]。
1.2 数据处理
针对现实的网站数据,可以发现半结构化是网站数据的典型特点,所以要想解决半结构化数据源模型,在数据挖掘技术当中已经成为了最重要的问题之一[3]。这将对网站的数据模型进行重新定义,也就是说需要针对半结构化模型当中所需的相关数据进行自动检索,通过数据挖掘来应用半结构化数据模型抽取技术和半結构化模型,这也是数据挖掘技术当中的重要环节[4]。
半结构化的数据模型是以一种xml的新型元标注语言为数据基础的,其数据描述与对应的关系,数据库当中的属性可以实现1对1,并且在这个过程中的网站建设是相对来说较为容易的,可以在这样的基础上针对数据模型进行精确查询。与此同时,该新型元标注语言的开源代码也是较为丰富的,在它的应用下将大大的降低网站工作人员的工作成本,通过相应的技术与条件帮助解决网站数据半结构化分析困难的主要问题。
2 具体应用
2.1 数据的收集与整理
对数据进行大量的收集是数据挖掘当中的重点组成部分,但是因为表达方式不同,往往会造成数据挖掘当中存在一定的不确定性。所以就需要针对数据来做好相应的简单处理,确保数据能够受到专业化的提取与进净化。为相关设计人员提供网站数据基础,让他们能够获得应有的有用信息,从而在数据挖掘过程中提高工作的质量效率与水平。综上所述,数据预处理就是用户针对网站进行访问时所需要的最原始的数据库内容。
高校网站的服务器能够针对用户访问的次数跟时间来进行记录,用户访问的数据将会被网站日志进行记录,所以网站日志就是得到数据最简单直接的方法之一。可以通过网站日志来对这些内容做好简单记录,其中包含用户名、浏览日期等方面的内容。但是在实践操作过程中,会发现网站日志,对于他自身所收集到的信息也有存在不准确的情况,所以如果直接的对其进行利用往往是不可取的,所以需要针对相应数据做好一定的处理才可以确定相关内容。其中包含针对浏览界面的确定以及用户与用户的访问序列的确定,还有对用户的访问路径进行完善等方面的内容,如果对信息的质量要求较高的话还需要高校网站能够形成专门的数据库。
2.2 数据模式的发现
要想发现数据模型,就必须运用数据挖掘的算法,可以通过针对页面的网页浏览量设计来确定网页的浏览数。产生的结果,在相关人员对此进行有效测量的情况下,能够对时间序列建模和时间序列的预测情况进行具体了解,从而分析出时间序列的主要目标。整体的趋势与长期运动的规律都是需要观察的点,在时间序列当中周期运动又或者是周期性变动,也是需要重点关注的要点之一。上述内容都是趋势分析当中的关键所在。
此外在针对页面访问进行统计的过程中能够发现,往往排名靠前的都是对于高校网站首页的访问,也就是说大部分的高校用户都是通过浏览器收藏夹的资源定位来对网站进行访问的。在此情况下进入到高校网站访问当中,只能基本上就是对第一个页面进行大致的浏览。当然也有小部分用户在对网站进行访问时是从其他页面进入的,不过占比并不高。但是根据网站各个网页被访问的次数和浏览时间,可以得出哪些页面内容是网站当中最受关注的,而哪些页面内容又是网站当中最不受关注的,其中重点内容部分是否包含用户访问网站的主要目标具体内容,哪些内容又是属于高校用户一点都不会关心的无用内容,从而针对用户访问网站的主要目的进行具体分析。
2.3 网站改进
对于网站改进,可以运用模式分析的方法来进行模式分析,其本身就是针对已经产生的模式来进行分析和优化的,它是在原有的基础上,针对被发现的数据模式和统计资料来进行转化的,通过这种方式为用户实现更优质的服务体验。也就是说,可以把现有的数据模式和统计资料转化成所需的知识,从而在其中寻找到最有价值的数据模式加以应用。在数据挖掘过程中,需要了解到用户趋势,才是反映用户对网站访问的主要内容,也是后期改变和提升的主要方向所在。在用户趋势上可以看出城市人员是针对高校网站进行訪问的主力军,所以应当通过采取相关的措施,在能够覆盖到城市人员的网站上进行推广,并且采取多种宣传手段来加大推广力度,从而使得用户能够更为直观更为方便的访问到高校网站。
此外还需要意识到网站本身不仅仅可以作为外界了解高校具体情况的一个展示平台,也可以成为内部学生获取信息的主要通道,将教学资源整合到网站当中,也有助于更好的展示学校的教育资源水平。但是为了防止内部教育资源,泄露或者是重要的实验资料被窃取,同样也要做好相应的数据加密工作。针对高校内的优质师生资源进行数据挖掘,让他们也参与到高校网站建设工作当中,能够在校内达到教学资源共享,帮助更多的学生提升自身的学业水平,这才是努力办学,严谨办学的最终目的,数据挖掘技术对于高校网站信息建设方面的贡献,不仅仅是为了通过浅层的数据挖掘来保证高校形象的建设,更是要让高校自身成为一个具有关键作用的信息平台。
3 结语
在数据挖掘技术与高校网站建设的结合应用当中,逐渐在实践过程中寻找到了解决问题的方法,也就是根据网站建设的指导内容来实现解决策略优化,从而提升高效用户的访问质量。针对网站建设重点进行明确,并且将高校网站页面做好优化设计,同时根据信息采集内容来针对网站的结构内容做好及时的调整与设计,从而提升高校网站的总体使用质量。
参考文献
[1] 付蓉,何毅.Web数据挖掘在高校网站建设中的运用[J].信息与电脑:理论版,2015(10):89-90.
[2] 陈金菊.基于数据挖掘的读者个性化服务研究[J].图书馆学研究,2016(23):84-91.
[3] 穆荣.Web数据挖掘在高校网站建设中的运用研究[J].中国战略新兴产业,2017(16):89.
[4] 孙永辉,周宏.数据挖掘技术在高校成绩分析中的应用研究[J].科技创新导报,2015,12(33):157-159.