张建英
(河南科技职业大学 河南 周口 466000)
新时代社会互联网技术的不断进步,大数据应用越来越广泛。计算机可以通过编程算法的运行实现代替人脑对事物进行识别分类。智能识别系统是基于对大量数据的处理学习,类似人为经验总结的机器学习系统,更多的是平台大数据进行统计分析并分类学习。本文对大学生网络行为数据进行识别系统研究,由于大学生网络行为相关管理制度和途径不完善,这就要求对大学生的网络行为进行分析,希望能够通过信息管理系统分析研究,正确指引大学生网络行为习惯,在大数据背景下促进大学生网络行为更加有利于学习教育和自身的健康发展。
大数据技术应用产生于互联网技术的进步[1]。近年来,随着大数据技术平台的不断完善以及国家通信基础设施的不断完备,“互联网+”智慧生活的智能终端设备走进生活,推动了大数据时代的到来。在此背景下,为了保证网络环境的计量监管信息的安全,需要对网络行为进行合理监管。各个行业的网络行为数据都具有行为推动作用,出于对网络行为的管理需要,对网络行为使用数据的分析并进行可视化的操作,评估预判下一行为的趋势,提高网络行为效率,降低网络行为错误风险是研究热点。网络用户的大数据,通常是通过统计软件进行海量信息统计存储,利用分析软件进行大数据处理分析,对足够大的数据进行算法学习,可以超越原有数据库架构[2]。与此同时,伴随大数据技术的进步,实现传统信息采集方式无法完成的快速提取、识别、管理和服务的数据采集。大数据技术是人类历史进步标志性的时代产物,让大数据技术发挥管理和分析使得技术实现最大社会效益,合理使用大数据技术能够对大学生网络行为管理产生指导价值,进而对获取大学生网络行为数据为高等教育的管理政策合理化更新提供科学参考。
大数据技术作为当下数据分析领域的主要技术,基于大学生网络行为数据进行大数据处理分析,计算机通过数据算法学习,数据分析结果更具准确性和针对性[3]。通常高校大学生网络行为管理方式是通过对调研结果进行记录分析。管理分析的人确定调研样本对象,对上网时间、上网地点、上网方式、网络功能内容以及大学生生活对网络的依赖性进行调研统计。这种方式调研结果的时效性、真实性都是不够的,而利用大数据技术可以跨过人为观察和回答,直接通过网络终端后台网络数据进行全量采集、实时统计。大学生在进行网络行为的同时就可以产生行为数据并记录保存,然后对存储的网络行为数据进行分析评估。
大学生的网络行为大致可以分为4个板块,学习、娱乐、社交和消费,见图1。
图1 大学生网络行为
每一个行为板块都有对应的行为目的,网络学习是为了信息获取,网络娱乐通常进行游戏影视等,网络社交是大学生业余交流互动的主要方式,网络消费是为了提高生活内容品质。明确大学生的网络行为目的,就得细分大学生的网络功能实现使用工具,例如网络学习是在中国知网还是万方数据查找资料等,通过大数据明确大学生的网络行为具体内容。
大数据的技术架构主要是通过数据分布计算处理分析,数据分布得越精细,网络数据延时越低[4]。大数据主要利用堆栈技术,通常有基础、管理、分析和应用4层[5]。作为架构的最底层基础层主要是用来对网络行为数据进行采集和实时跟踪。架构的第2层管理层,其作用是对采集的网络行为数据进行随机提取、信息转化和系统数据装载,这一层的存储管理计算可以为后期的数据智能化提供保障。第3层分析层就是将数据信息智能化,通过算法挖掘分析,可以得出大学生网络行为习惯的潜在规律,为大学生行为管理方式提供依据。最后的应用层是对大数据分析结果做出决策判断,达到系统服务用户的作用。
在大学生网络行为的分析模型客户端层面,用户的功能以学校校园网络为数据收集范围。由于在校大学生上网是通过校园服务器外接,因此学生账户信息可以作为个人信息采集接口。大学生上网的网络行为数据可以实时记录,将行为数据根据网络学习、网络娱乐、网络社交、网络消费分类保存。结合学校网络行为管理考察标准,对学生的网络行为进行评估。评估有个人评估和总体评估,个人评估就是对系统识别的网络行为进行规范指导,总体评估是对校网学生的网络行为进行总结,以可视化的方式反馈给在校师生。
互联网的发展使得各类信息实现网络传送,大学生是网络用户中最为活跃的群体之一,所以大学生网络行为如何有效管理问题,如何处理大学生网络行为数据变得尤为重要。大学生网络行为的传统调研方式缺乏时效性和准确性,随着大数据时代的到来,使得大学生行为数据可以可视化呈现,大数据技术的核心作用是展现数据的现实应用价值,而计算机对数据算法学习是其核心技术[4]。系统通过对大量网络行为数据进行处理分析,使得网络行为管理更加精准化、人性化。
将采集到的大学生网络行为数据以分布式文件的形式保存在HDFS系统中,通过映射和归约的方式对数据做计算处理,基于算法通过Hadoop进行数据计算训练,生成大学生网络行为数据模型,最后将模型可视化提供给客户端。系统流程图见图2。
图2 系统流程图
模型的基础层。该层主要功能是用Python、数据采集平台等对网络行为数据进行采集和实时跟踪,并且根据HDFS系统进行分步式保存。
模型的管理层。该层主要功能是对采集的网络行为数据进行随机提取、信息转化和系统数据装载。通过映射归约批量处理网络行为数据,极大方便了对分布式存储的数据程序编写,通过系统实现指定映射函数和归约函数进行大量数据计算,可以为后期的数据信息挖掘提供保障。
模型的分析层。该层主要功能是将数据信息智能化,通过Hadoop中实现算法,对数据进行模型训练挖掘分析,可以得出大学生网络行为习惯的潜在规律,为大学生行为管理方式提供依据。
模型的应用层。该层主要功能是对大数据分析结果做出决策判断,达到系统服务用户的作用。
此系统主要是分析大学生网络行为识别问题,其主要目标是对大量大学生上网产生的网络行为数据进行处理。所选择的网络行为数据是多类信息的存储模块,模块数据的文件需要进行结点处理,效率低下[3]。为了克服该数据处理问题,根据映射归约机制,采取对数据不切片的方式,使存储的数据设计统一,提升系统的数据处理性能。
系统运行环境是检验系统的重要阶段,运行系统的环境能力对测试结果具有很大的影响。测试环境选用合适的客户机和服务器。功能测试应当对系统的每一层进行分步测试,为用户提供合格的系统服务。测试结果的评估按照需求分析进行功能评估。
大学生网络行为识别系统可以实现大学生网络行为数据通过大数据技术进行潜在行为规律可视化,将网络行为展开成详细和具体的数据模型进行分析。在实际的高校网络行为管理中,可以将大数据识别大学生网络行为这一技术充分利用起来,使得大数据技术规范约束好学生的网络行为习惯。在对大学生网络行为数据的采集整理分析过程中,不仅能够有效管控学生的网络行为,了解学生的网络功能使用的喜好和关注内容,同时在分配学校网络资源时也可以根据大数据分析结果对学生提供个性化网络内容服务[4-5]。将系统识别分析结果反馈给学生个人,成为自适应学习工具,弥补传统学习方式存在的盲目性,投其所好提高学习积极性,使得学生在高校得到更好的学习成长。
综上所述,本研究建立大学生网络行为识别系统是为了对大学生网络行为的学习、娱乐、社交和消费进行分析、归纳,构建有效可行的指导、监督、信息反馈运行机制,使得大学生网络行为管理变得越来越高效。同时,也可以为我国高校管理部门和教育部门提供参考,促进高校教学方式优化升级。