王德贵 丁大为
上一期我们介绍了Base64编码的基本知识和应用在文本编码中的实例,下面继续学习Base64编码在图片和声音中的应用,以及信息审核中的原理解析。
1.图片编码
由于图片的大小不一,Base64编码文件可能特别大,可以将图片等比例缩放,这要下载一个图片转换插件“TaifunImage”(图1)。
这里调用了一个过程“resizeimage”,在AppInventor中,也叫函数(图2)。
用这个函数将任意大小的图片,转换成宽度为300,高度按原图成比例的新图片,便于转码。
图片来源可以是照片,也可以是图像文件。经过缩放处理后,点击“查看”按钮,即可看到图3的效果。这里显示的编码大约是全部编码的1/25。
2.声音编码
把3秒的音频文件,转换为Base64编码(图4)。
点击录音后调用录音机实时录音3秒,录音格式默认为“3gp”,也可选择其他音频文件进行转换,这里不再说明,有兴趣的朋友可自行研究。这里将音频文件的Base64编码显示成文本,文件越大,编码也就越长,传输也就会越慢(图5)。
1.文本审核
(1)基本测试:Base64编码,是处理发送和接收信息的基本编码,随时都在使用的。比如在文本审核时,过滤一些敏感词语。组件设计如图6,组件属性随意设置,能测试即可。
(2)敏感詞汇代码:输入敏感词汇,然后提交,就会在下方显示其Base64编码。延时1秒(1000毫秒)是因为文件管理器是异步保存文件,保存后才进行编码(图7)。
(3)待审文本代码:输入待审文本,然后提交,就会在下方显示其Base64编码。延时后保存文件,然后进行编码(图8)。
(4)文本审核代码:敏感词汇和待审文本提交后,才能进行文本审核,用红色背景提示包含敏感词汇。
比如“敏感词汇”输入“流氓”,“待审文本”输入“谁是流氓”,提交后显示如图9左图,再点击“文本审核”,即显示图9右图。
通过实例,我们看到Base64编码可作为比较文本内容的一个方法。
2.图片审核
如果是文字图片,先识别文字后,直接审核文字无需转码。普通图片则需要转码后与敏感图片的编码进行比较,这个比较不是单纯地比较重复代码,而是需要提前进行机器学习(AI神经网络学习),获取敏感图片的特征编码,再用于审核待审图片的编码。想要开发自己的审核程序可以参考相关AI神经网络学习的开放平台的说明(百度、腾讯、阿里等),本文不做探讨。
3.音频审核:一般是将音频文件进行语音识别后,通过文本比较进行审核。
4.视频审核:视频如果是人工审核,则需要大量人力和时间,一般采用的方法是在视频中抽取一定数量的帧,变成图片后再进行审核。
实际应用中,对信息的审核是根据内容和算法的不同,而采取了不同的审核方法,主要是利用AI(人工智能)进行自动审核,除了自己开发应用程序外,现在很多网站也提供了相应的服务,有兴趣的朋友可以上网查询一下相关资料。