AI，无处不惊喜

2023-03-22 10:02本刊综合

发明与创新 2023年11期

本刊综合

近日，一款名为ChatGPT的智能聊天机器人“火爆”全网，掀起了人工智能（AI）新的浪潮。ChatGPT的厉害之处在哪？除了跟人聊天，AI还在哪些领域表现优异？AI会取代人类吗？……本期，让我们在一个个具体的应用场景中，感受AI技术“狂飙”的速度！

同学们，你们了解人工智能吗？简单来说，人工智能是研究和开发能模拟、扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学，其研究的目的是促使智能机器会听、会看、会说、会思考、会学习、会行动。

1956年，约翰·麦卡锡、马文·明斯基等科学家在美国达特茅斯学院开会研讨“如何用机器模拟人的智能”，首次提出“人工智能”这一概念。如今，60多年过去了，以深度神经网络为代表的人工智能技术飞速发展，实现了从“不能用、不好用”到“可以用”的技术突破，在绘画、文学创作、视频、音频等方面不断带给人们惊喜。

AI绘画

2022年8月，游戏设计师杰森·艾伦的绘画作品《太空歌剧院》获得了新兴数字艺术家竞赛“数字艺术/数字修饰照片”类别一等奖。据报道，参赛者没有绘画基础，是通过AI绘图软件Midjourney耗时80个小时才创作出了该作品。

图1 《太空歌剧院》

近年来，AI绘画成为国内外社交网络争相讨论的热点话题，各类AI绘画平台纷纷涌现。借助AI绘画软件，哪怕是绘画“小白”，只需要动动手指，输入几个关键词或直接输入相关图片，再选择自己喜欢的画风和视角，AI“画师”便可自动生成一幅笔触细腻、构图精美的画作。

AI绘画本质上是通过人工智能算法作画，其创作过程是AI系统通过学习大量的人类绘画作品数据，从而对绘画产生一定的趋向性认识，继而从已有的图像中提取数字特征，并根据训练图像的风格创建一幅新画。

这种模式也使AI绘画无法对最终生成的结果进行精准控制。在网络上，类似“狗狗变美女”“男生变女生”等AI绘画“翻车”现场比比皆是，它们在让人忍俊不禁的同时，也暴露出AI绘画距离真正被人类利用还有一段路程要走。

AI写作

2017年，微软亚洲研究院研发的AI“小冰”出版了人类历史上第一部人工智能诗集《阳光失了玻璃窗》，其中包含139首现代诗；2018年，AI创作的第一部小说1The Road出版；2022年，谷歌子公司DeepMind发布剧本写作模型Dramatron，它能从用一句话表述的戏剧冲突中生成剧本标题、角色、场景、对话；等等——越来越多的AI文学创作案例进入公众视野。

图2 《阳光失了玻璃窗》封面

你们一定会好奇，AI的写作能力究竟如何？有人在AI中文诗歌自动生成系统——“九歌”上进行了测试。该系统由清华大学团队研发，由多个专门为中文诗歌生成设计的深度学习模型组成，运用超过30万首古人诗作进行训练，支持生成集句诗、绝句、词等不同体裁的诗歌。

测试者以“池塘”和“春雨”为主题词，让“九歌”创作一首五言绝句，系统迅速给出了以下答案：“春雨暗池塘，垂杨扶短墙。月明山色淡，风静水声凉。”这首诗对仗工整，意境优美，由此可见，AI创作的诗歌达到了一定的水平。

不过，虽然人工智能可以根据算法逻辑模仿人类创作出文艺作品，但它无法模拟人类基于历史经验、生命体验而产生的情感与意识，更难像人类那样睹物思人、托物言志。这是目前人工智能无法创作出伟大作品的重要原因。

AI换脸

一提到“AI换脸”，就不得不提Deepfake技术。Deepfake是由“deep machine learning”（深度机器学习）和“fake photo”（假照片）等意义组合而成的一个词，可以理解为机器通过深度学习而制造出假照片、假视频等虚假产物。该技术最常见的应用就是“AI换脸”，即在视频中将一个人的脸部移植到另一个人的脸上。

图3 （图/图虫创意）

换脸时，机器先要识别出人脸的位置。由于换脸用的素材与待换脸视频中的人脸的朝向、表情等往往不同，因此，识别出人脸位置后，机器要进一步对人脸进行校准。通过寻找面部具有鲜明特征的区域，机器可以确定每一帧画面中人脸的朝向、表情，进而将待换脸视频中需要插入的人脸与素材匹配。

AI“合音”

AI技术的迅速发展使得人机交互变得越来越频繁，“语音合成”作为人机交互中的重要一环，可使人类与计算机的交流更加方便。

语音合成又称文语转换，是将输入的文字信息转化为可听的、连续的语音，赋予机器“说”的能力。在语音合成技术领域，国内的科大讯飞公司一直保持着领跑者的地位。

目前，科大讯飞通过将发音内容、情感、音色进行解耦，实现了对情感及音色的自由控制并输出合成语音，让智能语音更具“人味”。不同的行业可根据自身的特点和应用场景进行选择。如讲座类场景可选择音色稳重又有亲和力的发音；面对小朋友，发音者的音调可以更加活泼；在新闻播报场景中，有力量感、庄重的声音则更加合适。

AI聊天

2022年12月，美国人工智能公司OpenAI发布了自然语言生成式模型ChatGPT，这是一种基于GPT-3（生成式预训练模型）技术的聊天机器人，它可以通过人工智能模型来与用户对话，并自动理解用户的问题，提供更精确、更有价值的信息。

相比GPT-3，该模型回答问题的方式更加贴近人类，具备记忆能力，可实现连续对话，同时还具备修改代码、撰写论文、诗歌创作等能力。

图4 （图/图虫创意）

虽然ChatGPT表现突出，但也引发了不少争议。有人认为它会成为高校学生写论文、考试的“作弊神器”，也有人认为它代表了人机协同的未来趋势。

复旦大学计算机科学技术学院副院长彭鑫表示，ChatGPT可被看作是一个智能助手或一个聪明的秘书，它非常擅长分析、整合既有的知识，并通过人机对话的方式不断生成文本内容。“区别于此前常见的分析决策型AI，如人脸识别，ChatGPT属于所谓的生成式AI，代表了目前以大数据和大算力为基础的深度学习技术发展新高度。”

与其他AI应用一样，ChatGPT在为用户提供方便的同时也面临诸多法律风险和安全、伦理方面的挑战，如何对相关技术进行监管，从而让人们更好地利用新兴技术，是全社会今后需要思考的问题。

小编说：除了以上这些应用，人工智能还在多个领域大放异彩：在交通领域，无人驾驶技术方兴未艾；在医疗领域，医生能在人工智能的辅助下更快、更准确地得出诊断结果；在家居领域，扫地机器人等已走入寻常百姓家；在教育领域，教师利用人工智能提高教学效率，越来越多的学生了解、学习人工智能相关知识；等等。

值得赞赏的是，有的青少年充分发挥自己的创造力，发明出很多与人工智能相关的作品。如长沙市雷锋中学唐琮浩、谢涵制作的“人工智能交互式饮水机”就曾在第121届巴黎国际发明展上斩获大奖。

相信在未来，人工智能会发展出一条既能满足人们需要，又不阻碍人类发展的路，为我们的生产生活提供更多的便利。

同学们，对于人工智能，你们有哪些憧憬与想象呢？欢迎来信与我们交流。