ChatGPT爆火,人工智能会给眼视光行业带来哪些影响?

2023-04-29 01:09:22刘哲宇
中国眼镜科技 2023年5期
关键词:眼视光人工智能人类

刘哲宇

人工智能正在把我们带入一个新纪元,2022年底推出的ChatGPT 一夜爆火,成为人类历史上使用人数增长最快的应用,进入2023年,ChatGPT从科技圈“出圈”,引燃了社交媒体。微软CEO纳德拉甚至认为对于知识型工作者来说,这无疑是一场新的“工业革命”。

语言的解决带来了交互方式的革命

当今,人工智能已不陌生,人们习惯在生活中多个领域依赖人工智能,那么ChatGPT为何能如此火爆?很可能是因为它“说话”的方式, ChatGPT为何具有很强的自然语言处理能力,即“理解人们所说的话”。过去,电脑和手机里的计算单元并不能直接理解汉语、英语,或者任何自然语言,整个数据的世界都需要大量程序员来搭建需求和程序之间的桥梁,把人类想要完成的任务转化成机器所能理解的代码。而今天,你只需要像与人聊天一样,一问一答,即可轻松实现与人工智能的交流。

有人把ChatGPT比作互联网的“有损压缩”——在开发过程中,它大量学习开发人员“投喂”的各种知识,随着训练量越来越大,它从不同文字的出现频率中总结出了规律,相当于获得了一个互联网信息的压缩版本,信息有所损失,但是足以应付一般的对话交流。随着硬件算力的不断提升,训练数据量的进一步增加,人工智能总有一天能穷尽互联网上所有的人类知识,久而久之,它将变得比绝大多数人都聪明。

角色转换:从判断式到生成式

以ChatGPT为代表的新一代人工智能的一大突破,是从“判读式”发展为“生成式”。“人工智能生成内容” (Artificial Intelligence Generated Content,AIGC)的概念开始得到认可。它既区别于之前的用户生产内容 (UGC) ,也不同于更早期的专业机构生产内容 (PGC)。可以这样理解:最早只有报刊、杂志等专业机构才能发布新闻、传播资讯,是PGC,随着互联网时代的来临,每个人只要注册账号,自己就能成为自媒体,在社交网络中成为信息传播枢纽,即UGC;而今天,人工智能将可以搜集资讯,进行一定程度的事实甄别,并总结成合理清晰的资讯进行传播。

笔者试着将不久前刚结束的第二十一届中国(上海)国际眼镜业展览会上光学仪器设备厂商的新品资料和宣发内容进行了搜罗整理,“投喂”给了ChatGPT,并试着问它当前的发展趋势是什么,ChatGPT如此回答(见下图)。

可以看出,其回答仍然有着许多原始资料的行文风格和语言习惯,但已很好地起到了传播资讯和信息的作用。这只是用了短短十分钟整理资料后投给ChatGPT的结果,它的聪明程度、完成任务的质量,跟人类输入的资料和提示词(Prompt)有很大关系,如果你想它为你的新产品写一段广告语、为你的总结报告制作一个PPT、为你的培训课程更新一个新的大纲,只要你问得够清楚、够巧妙,ChatGPT都能做到。

更具体的专业化运用场景

人工智能技术对于眼科及眼视光行业来说早已成为常规生产力的组成部分。例如,眼底照相机可以拍摄眼底视网膜血管,通过判读照片,眼科医生能发现高度近视、青光眼、高血压、糖尿病等的前兆和风险,及时预警和干预。然而分析眼底照相机照片需要时间,人工智能就能在这一领域发挥功效。眼科行业已有十分成熟的AI辅助眼底照片判读方案,可以通过大数据累积,即告诉AI,健康的眼底长什么样,不健康的眼底长什么样,哪种情况的眼底照片对应哪些风险,AI便能以数百倍于人类的速度判读眼底照片,对于其中的近视及眼底病征兆进行预警,已成为眼科医生和视光师们的好帮手。

但这只是单一的、封闭的运用场景,本质上仍然是在提高速度,而非颠覆模式。创新工场董事长兼CEO李开复就曾说,过去的人工智能技术的一大瓶颈,正是其使用和优化都是割裂的,过去的人工智能可以辅助驾驶、识别人脸,甚至可以推荐更符合你兴趣的抖音视频,但每个应用都像是一座孤岛,并没有形成联动。而ChatGPT等新一代人工智能的大语言模型,既让机器理解人类语言成为可能,也为不同应用场景的联动提供了平台。

人类擅长的想象方式是一元的线性增长,即变得更快、更多,但凭借强大的语义理解能力,最新发布的GPT-4能做的远比更快地辨识眼底相片多,它可以跳出一问一答的模式,真正理解人类的意图,并被接入各种系统之中去处理信息并做出决策。

试想,我们将大量儿童青少年的屈光发育档案“投喂”给人工智能,通过大量数据的训练,它便可以总结出年龄、遗传、屈光度、眼轴,乃至身高、体重、地域之间的动态关系,给出更准确的预测和预警。它看过比经验最丰富的视光师还要多几个数量级的案例,扫一眼数据,就能从几百个有着类似情况的孩子身上得出未来可能的发展结果。从众多近视防控产品中选择合适的,甚至是生成一整套多产品、多手段搭配的解决方案,对于它来说也不在话下,它甚至还可以在使用过程中对孩子和家长进行指导,并实时观察和修正解决方案。而要实现以上这一切,家长和孩子并不需要会编程、写代码,只需要在“聊天”中提供孩子的数据即可。

人工智能能够独立完成验光吗?

当然,笔者最为关心的还是人工智能能否独立完成验光,独立完成验光意味着形成了基本的眼健康筛查闭环,让真正的“管家式”或“顾问式”的眼健康人工智能助手成为可能。这一点在目前“一问一答”式的ChatGPT上肯定无法实现,它会告诉你,它只是一个模型,并没有操控专业仪器设备的能力。

笔者就此采访了一位眼镜零售门店的视光师,他表示,现阶段的验光仪器设备相较于过去的手动版本已有了长足的进步,如果能够开放接口给人工智能,自动化并不困难,并且一般意义上的“验光”并不复杂。以眼镜零售店的日常场景为例,如果只是为了给一般近视人群配镜,而不需要任何疑难杂症的筛查,人工智能完全可以胜任。但难的地方不是验光本身,而是如何通过语音或者文字提示与被测者交流,相互理解想法,让其配合进行验光。目前相关的配合测试还都在成年人身上进行,成年人的理解能力和依从性都更强,要给儿童青少年进行筛查和验光便显得困难许多。

这位视光师也许不知道,以ChatGPT为代表的生成式AI,最直观的应用场景就是聊天,以及由此衍生的客服及专业咨询。所以笔者认为,随着人工智能越来越懂得与人交流,甚至擅长扮演特定角色与人交流,以及当前眼视光仪器设备的智能化和集成度不断提高,AI验光将很有可能实现。

人工智能尚需提升的地方:准确性、专业调教

目前ChatGPT也存在一些比较明显的缺陷,比如其数据来源还停留在它最后一次接受训练的时候,即2021年9月左右,对于此后的世界所知甚少。其次它的思维方式并不像人类一样线性,而更像是对于大量数据的提炼,当数据来源存在谬误时,ChatGPT就有可能给出错误的信息,或者在信息来源不全的情况下运用算法去进行“联想”,在人类看来,这就是“胡编乱造”。当输出结果涉及眼科诊疗、出具处方时,事实性的错误将非常致命,将对眼科医生和视光师的判断造成干预。所幸人工智能的训练速度远超人类想象,就在本文写作过程中,OpenAI发布的GPT-4和新版的ChatGPT,改善了信息源不全的情况下的可信度。

除此以外,前文提到了人工智能完成任务的效果与人类给到的提示词(Prompt)关系很大。Prompt,直译为“提示”或“驱使”,在机器学习和自然语言理解中,它通常以文本的形式被输入到训练好的模型中,使其执行任务、输出内容。比如,“用随和、可爱的语气与小朋友沟通,让它们配合你进行眼部检查”,或是“根据以下资料,预测案例中被测者未来2年的近视发展情况”“生成一张产品海报,包括以下内容”,都是Prompt的一种。

对于医疗场景中,因人工智能的不准确性所致的风险,ChatGPT自己也有清晰的认知,并给出了建议

在自然语言人工智能的时代,Prompt的重要性堪比代码,熟练使用Prompt语句,可以让AI画出与毕加索、梵高一样风格的原创画作,可以让AI写出海明威口吻的小说,或者谱出莫扎特风格的乐曲,也可以让它设计一套包含多个参数、多台设备,可长期追踪和互动的眼健康系统。Prompt工程师正在成为一个新兴的职业。如果我们想要借助人工智能来帮助眼视光行业,就需要既懂得调教人工智能,又懂得眼视光专业知识的人才,或者是能够同时理解双方,扮演需求转译桥梁的人。最理想的状态是,经过充分调教的人工智能,将成为老师,为眼视光人才培养带来巨大帮助。有人说当今比拼的是信息检索的理解能力,而未来比拼的可能就是最大化利用人工智能的能力。顶端人工智能人才正在涌入金融、互联网等行业,眼视光行业想要培养出既懂专业,又懂机器的人工智能型人才,笔者认为至少还需要5家以上的行业巨头持续性投入以及2年乃至更长的时间。

眼镜行业的从业者将不会被人工智能所替代,而且我们一定能借助人工智能,让眼视光行业变得比想象中还要好很多倍。

猜你喜欢
眼视光人工智能人类
人类能否一觉到未来?
天津醫科大学眼视光职业培训学校
人类第一杀手
好孩子画报(2020年5期)2020-06-27 14:08:05
天津醫科大学眼视光职业培训学校
1100亿个人类的清明
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能与就业
IT经理世界(2018年20期)2018-10-24 02:38:24
探索眼视光 深化专业路 第三届福盛康斜弱视诊断治疗与近视防控论坛闭幕
数读人工智能
小康(2017年16期)2017-06-07 09:00:59
百年精诚 誉从信来——走进四川大学华西眼视光之一