任仲晟
摘要:这些年以来,我国的互联网技术得到了进一步的发展,这也因此增加了用户对于数据的使用量,在这样的背景下,使得数据挖掘技术得到了广泛的运用。利用此项技术,能够让用户从庞大的数据中挑选出自己需要的数据,而伴随数据挖掘技术的升级,使得它在Web技术中心也凸显出了强大的作用,特别是在Web预取中,在结合数据挖掘技术以后,能够让更加准确的进行数据搜寻,这样一来便可以让Web资源得到共享。那么下面我们就要具体的讨论一下数据挖掘技术在Web预取中的具体应用。
关键词:数据挖掘;Web预取;应用
中图分类号:TP391 文献标识码:A 文章编号:1007-9416(2020)09-0054-02
由于网络技术的发展,使得在Web预取中采用数据挖掘技术逐渐变成了一种主流趋势,数据挖掘技术能够让用户方便的搜寻访问模型,而且还能够采用聚类分析的方式来建立和用户有关的信息,这样便可以掌握用户在各个页面下所表现出的行为,从而能够给用户带来更为高效的信息服务。但是当前怎样把数据挖掘技术完美的使用在Web预取中,并全面展现出数据挖据技术的价值,成为了相关工作者的主要任务[1]。
1 数据建模
在还没有进行建模的时候,要掌握之前所获的Web使用日志,其无法直接进行处理,要先转化到合适的格式,所以要对日志文件先进行预处理,要严格挑选数据,删除掉没有价值的数据,获取用户使用记录数据,这样就能够开始数据建模工作。
在进行建模的时候,要采用数据挖掘技术关联算法,来给进行完预处理的数据做精准的运算,然后在数据里挖掘出模式集合。数据挖掘技术是计算机技术得到发展后的产物,采用此项技术,能够在大规模的数据中挖据出隐蔽,而且能够对科技决策提供重要参考价值的数据,然后通过所取得的成果,就能够掌握用户的行为。通常在建模的过程中,普遍会采用关系规则算法,其主要是用来掌握用户的兴趣关联规则,其能够反映用户使用网络的热情间的关联性。而想要加强数据挖掘的效果,节省资源,那么最好减少缓存区数据,同时删除所有没有作用的数据,例如之前所保留的各类图片等。而想要避免浪费资源,让算法更加简单,那么就最好在创建数据模型的过程中,不去分析用户兴趣间的关联性,而且对并不复杂的兴趣关联规则模型,关联分析法普遍适用。由于数据挖掘技术主要是从庞大的数据里对数据进行挖掘,所以整理数据的时间会很久,这意味着很难通过在线的方式反映出用户的行为,而解决的方式只能是事先预测。
而想要确保预测用户行为的合理性,那么最好在进行预测的时候,实时的调试模型参数和算法。在获取充足的预测结果以后,就能够把结果保存到数据库里[2]。
2 模型改进和机器学习
浏览器如果运用了数据挖掘算法,就能够做Web预取,所以可以采用目前所拥有的浏览器来对所拥有的机制采取改善,改善的方向主要是提供用户的Web使用日志,在用户采用互联网的时候开启分析模式,来给用户后面所要采用的网络做出有效的预测,并对最应该访问的网页事先进行缓存,在用户使用了这部分网页以后,就能够在缓存中获取到数据,这样用户就能够在第一时间使用到,从而得以节省一部分的时间。要是用户没有登录到相关网页,那么就对用户的行为进行记录,这样就可以方便以后对模型做出修改,以及对数据进行保存。从而便能够很大程度的降低由于网络延迟问题所出现卡慢的情况,以此加强用户的体验感。
3 数据挖掘技术在Web预取中的应用
3.1 能够加强Web预取数据的精准度
因为互联网里存在大量的信息,所以在诸多的信息里查询到所要使用的信息时,就算运用了最为高端的搜索引擎,也依然有可能在挑选数据的时候出现差错。而且互联网的开放性、共享性等优势,让人们可以在各个时间段传送信息,这就造成信息数据随时都在增加,而采用搜索引擎,只可以给少量数据做出挑选,如若不然会降低搜索引擎的使用效果。但是,要是和数据挖掘技术进行融合,就可以让上面的难题得到解决。一般情况下,数据挖掘技术主要有内容挖掘、结构挖掘等,而经常使用到的则是内容挖掘。在对数据进行检验的过程中,要设立合理的条件,同时用户还要掌握所用数据的特点。和传统的搜索引擎技术比较能够发现,数据挖掘技术尽管在速度上稍慢一些,不过可以对信息进行准确的检验。而且还可以放入人工智能模块来给数据进行有效的处理,这样就可以让技术实现智能化。反过来的话,要是采用传统的搜索引擎来搜索数据的话,那么数据要通过复杂的挑选后才可以允许使用,但是数据挖掘技术则能省略掉这些复杂的过程,能够直接对数据进行搜索和使用[3]。
3.2 能够应用到电子商务领域当中
在Web预取中,因为用户需要各种数据,所以在采用数据挖掘技术的过程中要掌握各个用户对于数据的要求。如果客户想要把数据使用到艺术设计方面的话,那么就要采用一些流行因素;如若用户将数据使用到商业方面的话,那么就要采用数据挖掘技术挑选出用户资源。这些年以来,互联网技术的进步,让网购变成了主流,这因此让电子商务得到了发展的机遇,从而使得更多的企业对电子商务引起了高度的重视,不过市场竞争也变得越发的激烈。在这样的情况下,企业若要在电子商务领域中立足,那么就要尽量丰富客户资源。在调查中掌握到,大量用户在网购的过程中,均会采用搜索引擎来搜索想要购买的产品信息。所以如果能够在电子商务中使用数据挖掘技术,就能够把网络商品信息进行整理,从而便可以让网站满足用户的要求,而且还可通过用户的要求挖掘更多潜在的用户。在挖掘数据的过程中,所要采用的数据来源于两点:首先是消费者的购物记录和信息等;其次是消费者的点击率。利用上面两种数据能够让企业掌握消費者的行为。通常情况下,数据均是在服务器中得到的。在利用数据挖掘技术的过程中,无需获取原始数据,而是要先整理数据,比如进行数据合并,让各种数据库中的数据全部结合起来,之后在这些数据中挑选出需要的数据,并清理掉多余的数据,最后采用相关文件来对数据进行转化,这样就可以确保数据挖掘格式更加具有安全性。和各类目标进行融合,利用各种搜寻方法,能够取得所需要的数据,此时就可以利用合理的技术来分析数据,这样一来便得以保证数据具有使用价值[4]。
4 结语
互联网的进步使得数据量越来越大,因此加大了信息的搜索难度。而搜索引擎依靠准确、快速的特点得到了人们的青睐。不过由于互联网发展速度飞快,因此加大了搜索引擎的使用难度。所以有必要将数据挖掘技术使用到搜索引擎中,可以直接对数据进行处理,从而得以提升数据挖掘的精确性。
参考文献
[1] 王志俊.试论数据挖掘技术在Web预取中的应用[J].科技资讯,2019,17(21):19-20.
[2] 谢怡文.试分析数据挖掘技术在Web预取中的应用[J].电脑编程技巧与维护,2017(7):66-67+74.
[3] 周戈.数据挖掘技术在Web预取中的应用研究[J].电脑开发与应用,2012,25(7):9-10+13.
[4] 徐宝文,张卫丰.数据挖掘技术在Web预取中的应用研究[J].计算机学报,2001(4):430-436.