摘要:数字技术开启了全新的数字影像时代,数字影像对传统的影像产业和审美观念的变革也辐射到经济社会发展的各个方面。文章从数字影像时代生成式人工智能应用现状入手,基于技术可行性和市场需求度两个方面,对生成式人工智能技术嵌入宣传片的可行性进行分析,发现生成式人工智能技术的应用可以有效提高影像清晰度,改善图像细节,甚至可以应用于虚拟现实和增强现实领域提升用户的视觉观感和体验。基于大模型发展现状,文章探索出收集素材与模型训练、模型反馈及优化、多模态交互的生成式人工智能技术嵌入高职招生宣传片的路径,得出以下结论:生成式人工智能技术通过语义分析、图像识别、自动剪辑等功能对招生宣传片内容进行智能生成和处理,为高职招生宣传视频的制作提供了更丰富、更创新的方式,可以有效提升宣传效率和效果。相比于传统宣传片的制作,生成式人工智能技术生成宣传片的过程是通过数据模型训练,且随着大模型技术不断发展和数据规模的增加,与文本、图片、视音频等有关的内容生成数据训练和其应用所覆盖的领域逐渐增多,其成本将进一步降低,宣传片的调整会及时响应、适配不同受众,宣传片更新会更加快速,从而形成技术和宣传片之间的正反馈循环。这对于高职院校吸引优质生源、提升高职院校的知名度和形象、增强高职院校竞争力等至关重要。
关键词:人工智能技术;AIGC;职业院校;招生宣传片
中图分类号:G717.32 文献标志码:A 文章编号:1674-8883(2024)08-0146-03
基金项目:本论文为2023年度北京市高等教育学会“首都产业升级转型背景下职业教育产教融合路径优化策略 与典型案例研究”成果,项目编号:MS2023376
人工智能(AI)作为计算机科学的分支,主要应用聚焦于模拟、延伸、拓展人类智能相关方法、技术及应用系统。图灵奖得主、人工智能之父约翰·麦卡锡将人工智能技术概括为要让机器的行为看起来就像人所表现的智能行为一样。AI技术自兴起至今已经有60余年历史,经历过三次发展高潮,现已作为第四次产业革命的引擎[1]。自OpenAI公司推出新模型ChatGPT后,生成式人工智能AIGC(AI Generated Content)进入大众视线[2]。作为专业生成内容(PGC)和用户生成内容(UGC)之后新生成内容来源和生成方式的整合,被广泛应用于媒体传播领域。
AIGC应用于影像既可以改善其输出影像的视觉质量和效果,也可以通过虚拟现实和增强现实技术实现新内容的生成,为数字影像的创作、处理增加创意。生成式人工智能技术通过人工智能算法从海量数据中学习提取相关要素生成全新内容,不仅具备人工智能的分析、判断、决策功能,还具有内容创作功能[3]。随着人工智能相关技术和工具的改进,实现了以人类水平能力生成内容的颠覆式技术创新,这也为其应用于数字影像产业注入了新活力[4]。
当前来看,生成式人工智能最常见的应用场景集中于机器辅助生成内容阶段,在文本和代码领域(例如文字续写或纠错、文字转语音、文字生成语音等领域)的应用相对成熟,图像和视频领域还需进一步探索[5]。当前来看,生成式人工智能在图像和视频领域主要是通过图像智能编辑、智能海报生成、视频智能配音及剪辑、智能特效等方式提高或替代部分专业性机械劳动[6]。数字影像与人工智能及生成式人工智能技术的结合现阶段主要应用于视觉大模型应用领域。
生成式人工智能技术历经早期的符号主义(逻辑主义)、连接主义、行为主义,直到人工神经元网络的提出及神经网络的重新流行,再到深度学习的兴起,到2020年后集成多模态生成模型运用不同维度数据,如图像、文本、声音等,在高维空间的不同分布进行多模态复合式生成,随技术、算法、模型的不断优化迭代,其应用领域不断扩展[7]。将生成式人工智能技术嵌入宣传片制作中,可以在一定程度上提高制作效率和创意表达。
(一)技术可行性
从技术手段上来看,生成式人工智能可以应用于影像增强、影像生成和处理、影像修复和恢复、影像插值等领域。具体来说,通过生成式对抗网络技术(GAN)的生成样本与鉴别样本,将模糊、不清晰的图像和视频转换成视觉效果更优质的图像和视频;通过人工智能生成技术提高并完善低照度图像的亮度和细节;通过生成式人工智能技术合成不同曝光度影像;通过生成式人工智能技术将损坏影像、低分辨率影像进行重构等等。
生成式人工智能技术可以有效提高影像清晰度,改善图像细节,甚至可以应用于虚拟现实和增强现实领域,增强用户的视觉观感和体验。
(二)市场需求度
从市场需求来看,首先,将生成式人工智能技术嵌入宣传片制作,可以满足宣传片个性化定制的创意性需求。通过录入大量相关宣传片数据,智能提取出所需要的关键词和元素集,并指定宣传片的特定风格、面向人群等,针对不同目标受众达到多元化宣传的目的。其次,将生成式人工智能技术嵌入宣传片制作中,既可以提高宣传片制作效率,又能降低制作成本。
此外,随着生成式人工智能“类人”能力的不断增强,内容生成大模型的推理能力也将不断突破,与智能化的推荐系统、模型相互交互,将以低廉成本产生面向不同受众的宣传片版本,进一步提高宣传效率[8]。值得注意的是,生成式人工智能技术的应用存在着敏感数据外泄、易生成错误信息等风险。面对此类新型技术风险,技术工程师正试图从技术领域进行规避,如基于人类反馈的强化学习训练(RLHF)将模型与人类价值观对齐,已取得一定成效。
在工业化发展进程中,农业经济、工业经济到现阶段的数字经济社会发展对劳动力的需求在不断变化,职业教育作为教育体系中的重要组成部分,能够满足劳动力需求变化,数字化转型背景下我国职业教育已进入提质培优、增值赋能新阶段。但相比普通教育,职业教育始终面临着“矮人半截”的窘境,一方面在于职业教育培养体系与企业实际要求的职业技能与素养存在“两张皮”错位时滞性问题;另一方面,大众对职业教育存在认知错位,面临知晓度不高、信息链不完善等问题[9]。招生宣传作为大众了解职业教育、将招生宣传透明化的重要途径,把握好招生宣传片的窗口抓手对于提高大众对高职认知、为我国现代化道路建设注入职教力量、推进职业教育高质量发展至关重要,更是高职院校实现“阳光招生”、形成特色职业院校宣传的关键举措[10]。
相比于本科院校,职业教育更注重技能的传授,将最新的生成式人工智能技术嵌入高职宣传片一方面既符合职业教育发展初衷,技能培训不仅仅局限于传统技能更强调前沿技术的应用[11];另一方面又是对生成式人工技术应用的长尾效应场景扩展[12]。生成式人工智能技术作为现阶段代表性颠覆性技术,遵循颠覆性技术“从边缘力量到未来主流”的技术演进过程,在成为主导技术的过程中经过多轮技术跨领域汇聚—融合—试错—收敛,需要在技术与愿景、实际需求之间进行适配[13]。将生成式人工智能技术嵌入高职宣传片作为颠覆性技术的扩散拓轨过程,其路径遵循着从初始场景到中间场景,再到目标场景、扩展场景的应用跃迁,符合从原始性创新到集成融合型创新模式。
(一)收集素材与模型训练
将生成式人工智能技术嵌入高职宣传片,需要收集目标高职院校的素材,包括与招生相关的视音频资料,院校、专业介绍等文本信息,若素材不符要求将直接影响生成效果和宣传片成品[14]。需要对收集的资料进行处理、修剪,调整大小和格式等,以满足生成式人工智能模型的要求。在此过程中,还需要形成对应规则训练模型,让模型进行学习,熟悉素材的特征和规律,对模型进行监督调优,并为下一步生成新内容提供依据[15]。
(二)模型反馈及优化
首先,针对模型进行训练和反馈,人类专家参与到内容生成过程中,通过输入控制参数、高职招生宣传关键字等,引导模型生成特定内容。其次,生成的内容需要持续进行调整改造,包括招生宣传片的细节修正、微调等等,以确保生成的招生宣传片更符合院校要求。最后,导出整合形成完整的宣传片。值得注意的是,在生成式人工智能技术嵌入高职宣传片的过程中,仍需要人类专家的参与、判断和干预,如创意的方向、整体宣传片的导向调整等,以确保最终成品的质量。同时,在技术应用宣传片生成的过程中,仍需确保版权的合规性,防止出现侵权等问题。
(三)多模态交互
生成式人工智能技术还可以利用跨模态模型进行内容生成,通过图像甚至文本即可生成视频,随着模型的不断升级,不仅可以把握图像、文本的具体含义,还可拆分出不同层次,将其转化成更富创意的视频生成内容,弥补生成式人工智能应用创意不足等问题。现阶段生成式人工智能技术已进入指数级进化阶段,自文本生成图像至文本生成视频历经了短时间的跨越,多模态大模型展现出强大性能,不同于以往人工智能视频的塑料感,最新版生成式人工智能多模态模型对文本数据的处理使生成视频的精良度和艺术感显著提升,视频细节的精细度几乎已达到专业水准。
现阶段是人工智能技术赋能各行业的关键期,将孕育催生无数新业态。将生成式人工智能技术嵌入高职宣传片,为高职招生宣传提供了新思路。通过生成式人工智能模型语义分析、图像识别、自动剪辑等功能对影像内容进行智能生成和处理,为高职招生宣传视频的制作提供更丰富、创新的方式。作为改变游戏规则的技术,生成式人工智能技术的应用使高职招生宣传片在视频呈现的内容和方式上实现了颠覆式创新和升级,未来甚至可以实现针对需求不同的生源定制化生成宣传片内容,更加清晰地宣传和展现高职院校的实力和特色,提升宣传效率和效果,与目标生源进行高效交互互动,增强宣传片受众的参与感,这对于提升高职院校竞争力至关重要。除了将生成式人工智能技术嵌入具体应用场景外,还应关注的是生成式人工智能技术嵌入对视频领域逻辑的改变。随着个人生成视频门槛的降低,影像创作、传播将更简单、高效、多样。其通过抽象文本生成、制作出类似电影的多镜头视频功能,使普通用户也可达到接近专业导演、摄影的镜头应用水准,降低视频制作的门槛和难度,未来人人都可以成为视频内容生成者将成为现实。
值得注意的是,随着生成式人工智能技术的超速发展和模型单位不断迭代,生成式人工智能技术应用下视频影像的存储和隐私、产权保护问题将迎来新的挑战,监管问题日益凸显,生成式人工智能技术赋能视频领域如何有序、健康发展将成为未来的重要课题。
参考文献:
[1] 张心悦.人工智能技术发展现状与展望[J].电子技术与软件工程,2021(2):199-200.
[2] 高含钰.人工智能ChatGPT将为市场带来什么[J].中国质量万里行,2023(8):75-76.
[3] 支振锋.生成式人工智能大模型的信息内容治理[J].政法论坛,2023,41(4):34-48.
[4] 闵嘉剑,于博柔,张昕.生成式人工智能时代的设计教学探索:以清华大学“AI生成式影像”课程为例[J].建筑学报,2023(10):42-49.
[5] 徐思彦.生成式人工智能:发展演进及产业机遇[J].人工智能,2023(4):43-50.
[6] 肖君,白庆春,陈沫,等.生成式人工智能赋能在线学习场景与实施路径[J].电化教育研究,2023,44(9):57-63.
[7] 翟葵.视觉语法下人工智能宣传片的多模态话语分析[J].海外英语,2022(15):56-58.
[8] 王哲,宋重阳.人工智能的应用对宣传文化领域的风险挑战及对策分析[J].信息系统工程,2021(3):58-60.
[9] 乔晓艳.职教高地建设背景下高职招生制度实施现状,困囿与改革进路[J].教育与职业,2023(2):47-53.
[10] 张楠.新媒体环境下高职院校新闻宣传队伍的重点任务与建设策略[J].现代职业教育,2023(6):113-116.
[11] 许嘉扬,郭福春.数字化时代高职教育教学改革的知识图谱分析[J].高等工程教育研究,2023(4):138-144.
[12] 徐卓函.大数据时代人工智能的创新与发展研究[J].科技资讯,2015(13):2.
[13] 肖仰华.生成式语言模型与通用人工智能:内涵,路径与启示[J].学术前沿, 2023(14):49-57.
[14] 彭瑜.新舆论环境下典型宣传要三个“两手抓”[J].新闻研究导刊,2018,9(17):164.
[15] 曹晓明,张永和,潘萌,等.人工智能视域下的学习参与度识别方法研究 [J].远程教育杂志,2019,37(1):13.
作者简介 李颖,助理研究员,研究方向:技术经济及管理。