王彦雄
(山西广播电视无线管理中心,山西 太原 031000)
近年来,人工智能(Artificial Intelligence,AI)技术发展迅速,以图像识别、机器翻译及自然语言处理等为代表的智能任务处理技术水平显著提升,这对广播电视行业而言机遇与挑战并存。在此背景下,本文以人工智能技术在广播监管领域的应用为重点,深入研究机器学习、深度学习、自然语言处理、计算机视觉等关键技术,并分析它们在文本分析、数据挖掘、图像和视频分析、自动化决策方面的实际应用,有助于提升广播监管的智能化和自动化水平,为广大听众提供更多高质量的广播内容与服务。
人工智能亦称智械、机器智能,是一项计算机科学领域内旨在使计算机系统具备模仿人类智能的能力。人工智能包括机器学习、自然语言处理、计算机视觉等关键技术,使计算机可以理解、学习和处理复杂信息,做出决策、解决问题并执行任务,而无须显式的编程。AI 的目标是模拟人类智能行为,使计算机能够自主学习、适应新情境,并表现出智能的特质,如理解语言、感知环境、推理和规划[1]。
1.2.1 机器学习
机器学习致力于开发算法和模型,使计算机系统能够从数据中学习和提高性能,而无须明确的编程。在机器学习中,计算机系统通过分析和处理大量数据,识别模式和趋势,从而进行预测和决策。机器学习包括监督学习(通过标记的数据进行训练,如图像分类)、无监督学习(从未标记的数据中发现结构,如聚类分析)以及强化学习(通过试错方法学习最佳行为策略,如自动驾驶)等不同类型的学习方法。自动机器学习是机器学习全流程或部分流程的自动化,包括自动数据预处理、自动特征工程、自动超参数搜索以及自动模型部署等方面[2]。
1.2.2 深度学习
深度学习也是一种机器学习技术,模仿人脑神经网络的结构,使用多层神经网络来学习和提取数据的高级特征。这些多层的神经网络称为深度神经网络,具有出色的模式识别和表示学习能力。深度学习已在计算机视觉、自然语言处理及语音识别等领域取得巨大成功,具有图像分类、语言翻译及人脸识别等应用。深度学习的核心是通过大规模数据训练神经网络,使其自动发现并学习复杂的特征和模式,从而实现高精度的预测和决策。轻量化深度学习技术不断探索,凭借低内存和低计算量的优势,在端、边等资源受限情况下适用[3]。
1.2.3 自然语言处理
自然语言处理(Natural Language Processing,NLP)专注于使计算机能够理解、分析和生成人类自然语言的文本和语音。NLP 技术包括文本分析、情感分析、语音识别及机器翻译等,使计算机可以处理大规模的文本数据、从中提取信息、识别语义关系,并回应自然语言的查询。NLP 的应用范围广泛,包括虚拟助手(如Siri 和Alexa)、智能搜索、自动摘要、智能客服和情感分析等。随着深度学习和大数据的发展,NLP 取得了巨大的进步,使计算机在与人类语言交互方面表现得越来越智能和自然。生成式人工智能技术不断成熟,被广泛应用于智能写作、有声阅读、新闻播报及语音导航等领域,实现人工智能与听、说、读、写等能力的有机结合[4]。
1.2.4 计算机视觉
计算机视觉旨在使计算机能够模仿人类视觉系统,识别、理解图像和视频数据。计算机视觉涵盖图像处理、特征提取、对象检测及图像分割等技术,使计算机能够分析视觉数据并从中提取有用信息。计算机视觉在各种领域都有广泛的应用,包括画面重建、事件监测、目标跟踪、目标识别、机器学习、索引建立以及图像恢复等[5]。
人工智能技术在广播文本分析与语音识别中有重要的作用,通过文本分析实现对广播内容的智能监控,通过自然语言处理精准识别虚假、敏感信息,提升广播节目的内容质量。在实时监测广播内容方面,文本分析与语音识别技术能够自动转录广播节目、新闻或访谈,将语音内容转化为文本,并实时分析内容,以确保内容遵守广播规定和法律法规;帮助监管机构及时检测并采取行动,处理任何违规广播内容,包括不当言论、低俗语言或其他不适内容。在敏感信息检测与过滤方面,通过自然语言处理技术,计算机可以扫描广播节目中的文本,检测潜在的敏感信息,如涉及隐私、虚假信息或令人不安的言论,一旦发现,系统可以自动过滤或标记这些内容,以便监管机构进一步审查。这有助于确保广播内容的质量和合规性,维护广播行业的声誉。
以国家广播电视总局广播电视科学研究院推出的“智能声音广播监管平台”为例,其采用先进的人工智能技术,包括自然语言处理技术、语音识别技术、机器学习技术等,以提高监管效率和准确性。该平台具有智能识别、分类、标注及拦截等功能,能够自动识别播出内容中的敏感信息,如淫秽色情、封建迷信、暴恐等不良信息,并自动进行拦截和处置。该平台还支持对播出内容进行分类和标注,以方便后续的编辑和处理。平台的智能分析功能还支持播出内容的舆情分析,为相关部门提供决策依据[6]。
数据挖掘与分析主要针对广播节目中的用户行为和广告内容进行数据挖掘、素材审核、合规分析等操作。第一,用户行为分析。通过收集和分析广播受众的行为数据,监管机构可以了解观众喜好、观看习惯和反馈,有助于广播企业更好地了解他们的受众,优化内容,并针对观众需求进行节目定制。用户行为分析还有助于监管机构监测广播企业是否遵守广告时段规定等其他监管要求。第二,广告监管。通过监控广播内容中的广告插入和广告时段,监管机构可以确保广告播放的合规性和公平性。数据挖掘技术可以用于检测广告中的虚假信息、不当宣传和广告的频繁播放,还可以分析广告效果,包括观众反应和广告点击率,以帮助广告商改进他们的广告战略。
以湖南快乐阳光互动娱乐传媒有限公司的“广告素材智能审核系统”为例,其利用人工智能技术进行广告素材审核,基于自然语言处理和图像识别等技术,能够自动分析广告素材中的内容,识别违规信息并进行拦截。它支持多种类型的广告素材审核,包括语音、文字、图片和视频等,快速准确地检测出不合规的内容,提高审核的效率和准确性。
图像和视频分析主要体现在对广播节目的音频内容审核与广播版权监测。音频内容审核涉及自动分析广播节目中的音频内容,以识别和监测任何可能违反法规、道德或社会标准的元素,包括暴力、色情、恶意广告以及其他不适内容。自动视频审核工具使用计算机视觉和机器学习技术,可以快速扫描大量视频流,识别问题并报告给监管机构,从而确保广播内容的合规性和质量。版权追踪涉及广播内容中的音频和视频监测,以确定是否存在侵犯版权的情况,如未经授权的音乐或影片使用。通过音频指纹识别、内容匹配和数据比对,系统可以识别、跟踪违反版权规定的广播节目,并采取适当的法律行动。
以5G 智慧电台iMango 4.0 系统为例,系统充分运用人工智能的计算机视觉、机器学习和AI 语言合成技术,实现智能抓取、一键生成及智能监控等功能,能够对广播节目的音频内容、版权及异常情况进行监管监测,实现对广播音频内容提供数据交换的隐私保护、归属权确认、权限管理和数据定责等。
自动化决策与智能监管主要体现在广播节目异常检测与预警、自动程序合规性检查两个方面。异常检测与预警主要是自动监测广播内容中的异常行为或违规情况。通过机器学习和数据分析技术,系统可以实时分析广播节目,检测任何可能的异常情况,如广告插播不当、违规内容、技术故障等。一旦检测到异常,监管机构可以立即收到警报,采取适当行动,以确保迅速响应问题。自动程序合规性检查是使用自动化算法来检查广播企业是否遵守监管规定和相关法规,包括广告时段的合规性、节目内容的分类及广告广播限制等方面。系统可以自动化地分析广播数据,与规定进行比对,并生成合规性报告。这种自动化程序可以显著减少监管机构的工作量,确保广播企业的遵守程度。
以国家广播电视总局监管中心与国家广播电视总局五五三台合作完成的“智慧广播监测系统”为例,系统集成人脸识别、特定目标识别及自然语言处理等技术,实现对广播目标内容的靶向监管,还可以监测节目的合规性,如是否符合播出标准、是否含有违规内容等。
在广播监管领域,人工智能技术的应用为提高广播内容的质量、合规性和监管效率提供了强大的工具。本文探讨了机器学习、深度学习、自然语言处理以及计算机视觉等核心技术,并详细分析了它们在文本分析、数据挖掘、图像和视频分析以及自动化决策等方面的应用。这些技术的不断创新和发展,为广播监管带来了更多机遇,为观众提供高质量的内容,同时维护了内容的合规性。