一种基于Java编程的脏字过滤器的设计

2012-02-28 05:10:40孙文华
网络安全与数据管理 2012年9期
关键词:库中词组原理图

孙文华

(南昌工程学院 网络信息中心,江西 南昌 330099)

良好的网络文化对培养青少年的爱国意识、创新精神、促进青少年良好的个性发展以及文化学习等方面都有积极的作用。但是网络文化中混杂着种种不良因素,对青少年造成许多负面影响:网络中的不健康内容不利于青少年的成长,甚至造成许多青少年犯罪行为的不断发生;网络世界的虚拟性还会造成青少年对现实社会的不满,青少年对网络世界的过分迷恋会导致网络孤独,网络中多元化的内容会导致青少年认识偏差,网络的隐匿性容易使青少年道德弱化[1]。特别令人担忧的是不良的网络文化对青少年的犯罪起着推动作用,值得全社会关注和重视。

本文提出了一种脏字过滤器软件的设计,对网络中不良的内容进行查找、发现,避免这些不良网络文化侵蚀青少年的心灵健康。

1 脏字过滤器的设计原理

脏字过滤器的原理图如图1所示。其原理如下:(1)对脏字库的内容进行分割,把脏字库中所有的脏字或词组分开,并把这些脏字或词组存入数组中;(2)将待测文件库中的文件进行逐个读取,并记录文件的内容;(3)在待测文件中查找是否存在刚存放脏字或脏词组内容的数组里面的内容,如果有,进行标注等操作;如果没有,继续检查待测文件库中的下一个待测文件,直到待测文件库中的待测文件都被检查完为止;(4)输出结果。即输出待测文件库中每个待测文件中包含脏字或脏词组的个数及出处等信息。

图1 过滤器原理图

2 算法实现

软件开发环境:myeclipse平台,Java语言。首先以myeclipse平台新建一个 java project,在新建的 project中需要导入下面相关文件:

至此,完成了脏字过滤器软件代码的编写工作,接下来可以进行run操作,即可以得到待测文件库中的待测文件包含脏字次数及出处等相关信息的结果。

3 实验结果分析

脏字库的存放路径:D:脏字典 file.txt;脏字库文件中的内容略。

待测文件库的存放路径:D:脏字待测文件库;文件库中存放了三个文件,分别为:test1.txt、test2.txt、test3.txt。

运行该过滤器软件后,得出的检测结果如图2所示。

由图可以看到把待测文件中脏字及脏词组出现的次数全部显示出来,结果与实际情况完全一致。

本文设计的脏字过滤器软件,已在myeclipse环境下通过Java语言实现,并对整个过滤器软件进行了测试,测试结果显示该设计完全可以达到对网页文件中的脏字进行过滤,还能指出这些脏字的数目及其出处。为网络管理员的管理带来方便,并给网络管理方面的编程人员提供了一个良好的开发平台。

[1]周伟文,侯建华.网络改变了什么:青少年的网络生存[M].石家庄:河北人民出版社,2005:292-294.

猜你喜欢
库中词组原理图
动物城堡
动物城堡
浅谈STM32核心板原理图设计
科学咨询(2020年53期)2020-03-19 07:41:46
电路原理图自动布图系统的设计与实现
基于Protel DXP 2004层次原理图的设计
智能盘库在自动化立体库中的探索和应用
副词和副词词组
ID3算法在构件库中的应用
河南科技(2014年10期)2014-02-27 14:09:02
下载中心新添资料目录
电子世界(2005年4期)2005-04-29 23:49:10