成海
摘 要:首先,文章对计算机文本挖掘技术和网络安全进行了简要的概述;其次,简要说明了计算机文本挖掘技术的方法。最后,结合自身工作和学习经验,分析计算机文本信息挖掘技术在网络安全中的应用措施,希冀能为此专业发展尽到些许绵薄之力。
关键词:计算机;文本信息技术;网络安全
社会由于经济水平的不断发展和进步,早就进入到一个经济大爆炸的时代。21世纪是信息技术爆发的时代,计算机网络信息技术取得飞速的发展。在这个时代,计算机和互联网占据着最主要的作用。无论是生活还是工作,信息技术为社会带来了巨大的改变。人类的日常行为已经无法离开计算机,但它在为人带来极大便利的同时,也埋下了重要的安全隐患,不可忽视。
1 计算机文本挖掘技术和网络安全简述
1.1 计算机文本挖掘技术简述
计算机文本挖掘技术属于第三次工业革命以来,从不断发展的互联网技术中产生的一项新技术。它是对计算机内部文本信息处理的一项新技术,通过对大量文本信息的处理和挖掘,来获得计算机文本的内容,进一步获取其中有价值的信息,从而给工作和学习的开展带来极大的便利[1]。
1.2 网络安全的简述
随着信息技术的发展,现代人的所有信息都被储存在计算机互联网之中,给现代人的生活带来了不小的方便,但也相当于“有把无形的利剑随时悬在头顶”,一旦出现计算机问题,极易造成信息的泄漏,变成“透明人”被公之于众,所以網络安全尤为重要。黑客泛滥、窃取信息等网络安全问题不容忽视,要及时运用文本挖掘技术来构建安全网络系统,保护公民的信息安全。
2 文本信息挖掘技术的方法
2.1 关注文本信息技术的来源渠道
在数据挖掘的过程中,挖掘的对象和方法都不是单一的。实际操作过程要采取可视化的方法来进行全面的数据挖掘,包括:二维数据表数据、文本数据、多媒体数据和万维网数据,这些数据都是文本信息需要去挖掘的地方。另外,数据挖掘具有极强的专业性和知识性,所以也要去学习和运用它的背景知识,对挖掘数据中的建模具有很大的积极作用。通过运用所学习的背景知识,能够在挖掘数据中提高精准性,从某些角度来讲,会极大地提升计算机的工作效率。
2.2 临近分类法
临近分类法最为简单、最易操作,是在文本分类的过程中被采用的次数最多文本挖掘方法,可以创建c个分类方案,对所有区分的文本方案和数据进行比对。通过对比,各文本特征分类明显,最佳的方案一目了然,更简单地确定了文本的属性。但邻近分类法同样存在着一些无法绕过的问题:若是文本内有不同的文本特征存在,相邻对象就会极大可能出现平行、共线的情况,最终也会导致文本挖掘的结果失去精准度。
临近分类法虽然操作极为方便、原理通俗易懂,但却会出现不同分类特征,可能会出现共线和平行的现象,使临近分类法的信息分类结果可能存在误差,具有极强的波动性质。所以,目前已经拥有解决临近分类法弊端的相关改进措施,其改进的主要原理为:对共线之间不同信息数据的特征进行有效的分析,将一些容易引发成共线的特征进行合并,同时最大限度地去压缩文本向量的信息维度,使得临近分类法的成功效率和运算效率都能够得到进一步的提高,进而提升文本挖掘的工作效率。
3 计算机文本信息挖掘技术在网络安全中的应用
3.1 网络新闻媒体领域
计算机技术已经深入渗透到了每个人的生活和工作之中。当今社会,有80%以上的工作都是在计算机互联网上完成的。大数据时代,计算机互联网具有强大的人脉和丰富的资源,能让人最快速地掌握第一手的资料。在这一背景下,也衍生出了很多新的词汇,比如人肉。网络媒体的传播速度,是传统纸质媒体传播速度的好几倍,传播过程也更加简便,所以与之相应的个人隐私和网络舆论问题,也不容忽视。这就需要把计算机文本信息挖掘技术合理应用到网络新闻媒体领域中去,运用独特的技术对网络新闻媒体产生的舆论成因和条件进行分析,对网络新闻媒体产生舆论的正确性进行合理的判断,对网络新闻媒体产生的舆论进行简要的描述,并且进一步向下预测其未来的发展走向。
3.2 医疗健康领域
随着人民生活水平的逐渐提高、人均收入的不断增多,越来越多的人开始期盼拥有一个良好的身体素质,健康生活方式的重要性也成为人民大众开始“提上嘴边”的一个话题。计算机文本信息挖掘技术同样也可以在医疗健康的领域有所建树,发挥它独有的价值,尤其是在计算机文本信息领域中,中文信息分析有着其独特的优势,这是英文所不具备的,所以,计算机文本信息挖掘技术在对中医药学的挖掘研究上更是有着得天独厚的天分。当今社会,计算机文本信息挖掘已经在医疗健康方面开始普及,并得到了广泛的运用[2]。比如:利用文本信息挖掘技术分析各种疾病下中药和西药的用药理念和用药规律,将两者进行比对,进一步把得出的结果信息加以反馈,取两者之所长,补两者之所短,从而使现有的医疗技术水平得到进一步提高,造福于人民群众。同时,也有利于从业者和非从业者都能够在计算机网络上面学习到相关的知识结构,进一步提高人民的综合素质水平。
3.3 专利信息领域
随着人类科学技术水平的不断升级,各种物质产品也在不断地更新换代,越来越多的发明也如雨后春笋般地涌现出来。在这样的前提条件下,尊重原创、支持原创的意识也就顺应时代而诞生了出来。在信息大爆炸的时代,借助各种平台的推广,新兴事物都会以一种不可思议的传播速度进入公众的视野。这固然是好事,可以让所有人都能够在第一时间了解到全新的世界,但在传播的过程中,有无数的风险也隐藏着,其中,黑客的窃取导致传播速度变慢、中间者“添油加醋”地改装并据为己有、商业机密的泄漏等种种问题迎面而来,各种别有用心的“宵小之辈”从中牟利,最终导致原创者“惨淡收场”。所以,保护专利信息的安全不可忽视。计算机文本信息挖掘技术在专利保护上的具体表现为对专利技术所有权的挖掘、登记调查权力的挖掘、专利使用权的挖掘等几个方面,并以此为基础,确定后续的发展方向和未来的热点计划,最终实现更新的技术开发。
3.4 市场营销领域
在多元化的市场,企业不再是孤军奋战,各企业之间的联系日益密切起来,这同样也带来了激烈的竞争,像一个“没有硝烟的战场”。如何跟紧市场的风向标,在多元化的市场中占有自己一定的份额,是每一个企业发展都需要面对的问题。在市场营销领域中,计算机文本信息挖掘技术有着不可忽视的作用,具体表现为整合市场的大部分资源,扩大企业的经济效益,并且让企业自身不断地总结和反省,统筹优化自身结构,能够更好地帮助企业掌握第一手商业资料,从而促进企业的不断发展。除此之外,计算机文本信息挖掘技术还能帮助国家机构在对市场进行调节时,及时分析市场和企业的情况,比对出市场的优势和不足,并给出相应的前瞻性建议,使得国家能够更好地对市场进行宏观调控,最后达到促进国民经济发展的目的。
3.5 个性化创新领域
由于思维的开放、思想上的兼收并蓄,现代人不再满足于古代的千篇一律,而是更加追求极致的美和个性化的发展。从生活到工作、从工作到学习,现代人的价值观都较从前发生了很大的改变。计算机文本信息挖掘技术在一定程度上满足了现代人这种追求个性的愿望,可以从多个角度出发,分析现代人不同的行为性格色彩,解析不同人的不同心理追求,并给出针对性更强的建议,为其提供专业性更强的个性化服务,这也使得现代人对它的认同感更加强烈起来。但在利用计算机文本信息挖掘技术进行个性化创新时,同样也需要注意几点问题:
(1)由于个性化具有独立性和不相关性,所以用户与用户之间的个性化创造并没有一定的关联性,这也就在一定的程度上增大了对个性化创新管理的难度,可能会引起一些较为严重的网络安全事故。
(2)对于计算机文本信息挖掘技术来说,创建个性化的前提是要将用户自身的数据信息毫无保留地传输到计算机当中。对于用户来说,需要确认个性化的服务足够安全才会将自身的信息进行传输,所以,针对用户信息资源保护就需要投入更多的资源。
3.6 信息检索领域
计算机文本挖掘在当下的信息检索领域同样有着极为完善的应用。信息检索领域涉及的范围非常广泛,为人类的生产和生活带来了极大的便利。它可以仅通过几个甚至是一個关键词在整个网络范围内对信息数据进行搜索,为用户提供相应的信息查询服务。在信息检索的过程当中,用户具有极大的自主权利,即使在不知道搜索数据具体形式的情况下,也能够有很大的概率寻找到自身想要的数据信息。同时,计算机文本信息挖掘技术可以利用智能化的系统对用户搜索的信息进行初步的筛选,通过信息的对比和筛选,将一些不必要的信息或是与搜索关键词相似度较低的数据信息进行过滤,仅留下部分与用户搜索相似度较高的文本信息,并选取其中相重合的部分为用户进行标识,以使得用户的查找更加方便和清晰。除此之外,计算机文本信息挖掘技术还能够对用户搜索的信息进行动态展示,对内容第一时间作出更新,并弹出对话框来对用户进行更新提醒。
4 结语
这是一个丰富多彩的时代,也是一个机遇和挑战并存的时代。这个时代,计算机网络的安全问题并没有得到完美的解决,所以就需要进一步丰富计算机文本信息挖掘技术的手段,不断完善自我,挖掘更多更有价值的网络内涵,从而保障网络信息的安全,满足时代飞速发展的硬性需求。
[参考文献]
[1]邢翀.浅析计算机文本挖掘技术在网络安全中的应用[J].山东工业技术,2018(11):126,136.
[2]张永东.计算机文本信息挖掘技术在网络安全中的应用[J].信息与电脑(理论版),2018(14):140-141.