多元舆情智能检测系统设计

2020-02-19 17:53屈翼展伍建昌

数字通信世界 2020年1期

屈翼展，伍建昌，陈新

（中国人民解放军空军预警学院，武汉 430019）

1 净化网络环境

日前，国家网信办依法查封了某些用户以及公众号，责令相关负责人对涉及到的查处内容并进行全面整改。究其原因，是一些个人消息平台、自媒体或者是面向公众的网络宣传平台错误散布虚假、消极内容、突破道德底线，造成不必要的社会恐慌，对社会风气造成极大的危害。所以针对虚假和反社会反人类信息的互联网治理显得迫在眉睫。现在社会上常见的舆情监测方式有人工监视、软件检索等方式。这些方法都存在一定的缺陷，比如人工监视费时费力；软件搜索往往需要人工提供样本，使得监视不够及时和有效，同时在检测准确度上也有待提高。目前大部分检测方式都不能兼顾检测文本、图像以及视频信息，而当今的信息却又不是单一的，往往都是多种形式信息源相互交叠出现。多元舆情智能检测系统则将传统检测算法与当前热门的深度学习算法结合，两者优势互补，整个系统对网络舆情的检测速度和准确率较传统检测方式都有较大提高，并且具有检测文本和图像两种信息源的能力。本系统旨在保证互联网信息安全，净化网络环境，并促进社会和谐与稳定。

2 系统设计与实现

2.1 系统原理

图1 系统原理框图

本系统主要针对负面文本、恶意篡改图像进行检测。对于负面文本，本系统主要运用基于深度学习算法来进行检测，检测识别率得到明显提高；在篡改图像检测方面，本系统基于经典匹配算法与深度学习模型相结合的方法来对篡改图像进行检测，传统算法用于检测复制-粘贴篡改类型的图像，深度学习模型主要用来检测拼接篡改类型的图像，在检测的速度和准确度上都有提高。对于输入的测试样本，系统将根据样本类型（文本或者图像）来选择相应的检测模型，通过检测模型检测后输出检测结果。如果是文本型样本，输出结果给出的是文本的情感判别（正面、中性、负面）；若是图像型样本，输出结果则在原始样本上标注出篡改区域和类型。

2.2 系统特点

当前绝大多数检测系统都只能对单一形式的样本进行检测（文本或者图像），并且很多时候采用人工检测，经过P图软件恶意篡改后的图像肉眼很难分辨且费时费力。在信息形式图文并茂的今天检测效率较低，并且由于检测不够全面，其结果可信度也较低。本系统将文本检测模型与图像检测模型结合，能同时检测恶意评论和篡改图形。在图像篡改检测方面，传统特征点匹配算法与深度学习算法结合，能够检测两种不同篡改类型的图像。系统对于目前互联网上绝大多数负面评论和篡改图像检测都有较高的检测速度和准确度，并对检测样本给出一个综合评价，给网络恶意信息检测部门提供一个参考，给网民提供更好的网络生态环境。

2.3 应用前景

目前，网络负面信息以及虚假图片肆虐情况愈发严重，对于图文负面以及虚假信息的及时检测和跟踪了解，对于净化网络环境具有十分重要的意义。对于最近网络突然爆红的AI换脸，本系统也能做出不错的检测判断。系统利用爬虫再加上实现数据流处理功能后，不仅针对可以达到实时检测的目的，还能够实现被动检测以及预警的功能，为政府网安部门或者是企业对于负面信息的发现以及处理提供了更加高效便捷的工具。对于已经标记为正面或负面的评论，可以通过云端平台作为模型的训练样本；对于检测到的经过篡改的图片样本，同样可以作为模型的训练样本进行保存，为后续的系统提供了更大的潜力。

随着研究的不断深入，可以将本系统更好地进行完善，发展出更加多元化的功能，向着舆情的全态势掌控分析的方向发展。本系统将来不仅可以在电脑等平台上实现，也能够在手机平台上实现，方便用户在移动终端也能通过本系统得到是否为虚假信息的反馈，能为规避负面信息爆发式传播、促进社会更加和谐稳定做出工作。

3 结束语

互联网通信技术的普及，加速的信息的传播，同时增加了负面信息，恶意信息甚至是非法信息的数量，互联网通信成为不法分子传播谣言、反动言论、暴力色情和恶意煽动群众的工具。本系统提供一种智能高效的网络负面信息的检测方法，提出将传统检测算法与深度学习算法结合，文本检测与图像检测结合，可对负面网络言论和恶意篡改图像进行检测，并且具有检测速度快、准确度高，检测覆盖面广的特点，解决了传统检测方法存在的问题，有利保障了网络信息安全。