冯群星
现在,我们把目光从AI研究的前沿方向收回来,去看看那些已经成熟、得到应用的AI技术。“千人千面”的精准推送、“一呼百应”的智能家居、随时响应的智能导航……
在一声声“AI请回答”中,普通人正在体验科技的无限可能。
在上海、深圳和北京,《环球人物》记者找到了3位极富代表性的AI应用者。他们与AI的故事,展现了“科技向善”的温暖与美好,足以让人们相信:AI是有温度的。
每天晚上7点左右,从事AI研究30多年的知识图谱专家黄智生会打开自己研发的“树洞机器人”。从操作上看,这只是一次简单的双击,就像人们在电脑上打开任何一个游戏或视频软件。然而,双击背后却是一场和“死神”展开的争分夺秒的赛跑。
3分钟内,“树洞机器人”将检索海量的微博信息,通过知识图谱及规则算法过滤掉99%的无关内容,锁定有轻生倾向的用户,并判断他们的轻生风险。
按照黄智生和医学专家共同制定的分级标准,轻生风险包括10级。5级以上的用户已表露出强烈的轻生愿望,7級以上者会明确提到轻生的方式和日期。机器人将这些高风险用户纳入监控通报,人类志愿者随后介入,以小组形式展开干预和救援。
“树洞”这个名字出自一则古老的童话:国王长出了驴耳朵,唯一知晓秘密的理发师不堪忍受内心折磨,把此事说给沉默的树洞听。到了互联网时代,“树洞”衍生为“可以承载秘密而绝对不会泄密的地方”。和互联网上的诸多群体一样,有抑郁症或存在抑郁倾向的人也会聚集在某一条微博下,将其作为吐露心事的“树洞”。
2018年,黄智生注意到这一现象,由此萌生了将AI应用于心理干预与轻生救援的想法。
当时,黄智生与北京安定医院合作已有6年,正在推动AI从实验室走向落地应用。北京安定医院是知名的精神专科医院,这次合作令黄智生关注到了精神健康特别是抑郁症。他告诉《环球人物》记者,因为强烈的病耻感,绝大多数抑郁症患者不会主动寻求医生的帮助,“80%的患者看过一次医生后就不再来了”。
“我一直希望帮助他们,但始终不得其法。网络‘树洞的存在让我找到了一个切入口。”黄智生说,容纳了无数心声的“树洞”如同一个精准的数据库,使得AI的介入成为可能。
仅用了约3周时间,黄智生研发出“树洞机器人001号”。它的知识图谱中覆盖了痛苦表达、时间描述、地点描述、轻生方式、轻生时间等概念。“树洞行动”就此启动。
AI跟传统的大数据分析有何不同?一个关键区别是语义理解能力。黄智生举例说,“我想死”和“我想死你了”都出现了“想死”这一词语,含义却天差地别。基于关键词的数据分析无法辨别其中差异,但基于知识图谱的人工智能可以。
还有大量的人不会明确写出“想死”,但言语间充溢着悲伤与绝望。“为什么活着这么难呢?”“谁能告诉我生命的意义?”“炭已经烧起来了”……AI没有感情,但依靠强大的学习和演绎能力,能在很大程度上理解人类的语言,读懂这些微妙而多样的情绪表达。“借助AI,有时候,我们甚至比轻生者身边的亲人更早发现危险。”黄智生说。
黄智生就像网络“树洞”边的守望者。
不到20岁的南京少年小康,是第一位被“树洞机器人”拉回来的轻生者。
“又割腕了,还是找不到动脉哈哈哈……”连续两天,小康的信息出现在“树洞机器人”的监控通报中,显示轻生风险6级。救援小组立即成立,设法与小康建立了联系。但小康的轻生愿望非常强烈,他对志愿者表示:“劝我的话就不用说了。”一天后,小康告诉志愿者,他吞下了100颗安眠药,并且拒绝透露自己的位置。志愿者转而联系小康的妈妈,终于从她的聊天记录里找到小康的3个地址——警察破门而入时,小康正在床上不停抽搐。由于救助及时,他最终在医院里苏醒过来。
5年下来,近6000次的潜在轻生被“树洞机器人”和救援小组“暂时缓解”。“阻止一次轻生不见得是我们的功劳,之后的情况也无法保证。现实中常有轻生者被救下后二次轻生的情况,因此只能说是‘暂时缓解。”黄智生解释,相对于AI的快速识别,随后跟进的人工救援是一个漫长、艰辛的过程。志愿者解救轻生者后至少要陪伴他们3个月,有时长达两三年。
影响轻生的因素非常复杂,只有心理危机被真正化解,轻生者才可能走出情绪和人生的黑洞。因此,黄智生也在训练“树洞机器人”掌握更深入的“读心术”,帮助志愿者更好地进行心理疏导。
“许多人对结束生命这样一个反生物本能的做法深感困惑。当我们深入了解轻生者的认知结构后,就会发现在生与死的问题上,他们实际上想得比任何人都要多。有效的心理疏导必须从他们的认知结构分析出发,语义技术就可以帮助进行深度分析。”黄智生说。
拯救生命固然伟大,却不算是AI应用的主流方向。轻生干预和隐私保护之间的平衡,也一直存在争议。曾有学界同行认为黄智生是不务正业、自讨苦吃:“没有回报和支持,你的满腔热情很快会遇上现实的冷水。”
“能救一个是一个。”黄智生自己都没想到,“树洞行动”能坚持至今。
对现实主义的追求和对理想主义的坚持,二者的相辅相成贯穿了黄智生的科研生涯。20世纪80年代,黄智生正在攻读计算机专业博士,中国的科学家们兴致勃勃地畅想AI的光明前景。在这样的时代浪潮中,他投身AI研究,逐步成长为荷兰阿姆斯特丹自由大学人工智能系终身教授,近年来又将工作重心转到上海。“AI本身就是一门应用型学科,空谈理论是没有实际价值的,我们首先要考虑的是如何为社会服务。”
如今,“树洞机器人”迭代到了018号,每天都能发现30到50名需要帮助的高危对象。为了更好地识别救援对象的轻生动机,黄智生在不断拓展机器人的知识库,把校园霸凌、家庭暴力、经济困难等知识也放入了机器人的“大脑”。他还在尝试开发“虚拟劝生者”,期待它们分担人类志愿者的部分陪伴和疏导工作——这些年,尽管救援小组的专业志愿者由最初的不足100人发展到了700多人,黄智生仍觉得“力量有限”,人手不够用。
身处中国的AI发展热潮中,黄智生感到振奋。1999年,还是青年学者的他到瑞典参加国际人工智能联合会议(IJCAI),这是AI领域历史最为悠久的国际学术会议之一。世界各地的人才济济一堂,但其中鲜有华人面孔。“上千人的会议,我碰到的中国学者不超过5位。” 20余年过去,情况已迥然不同。黄智生亲眼所见,在近年的国际人工智能联合会议上,中国与会者人数激增,保守估计占比过半。“人工智能在中国呈现一片繁荣景象。10年前参加学术会议,我们还是以年为单位来研究新技术。现在,这一单位已经变成月份、日期,真正是日新月异。”
2003年从医学院毕业后,张升超经历了从专科医生到全科医生的职业转变,目前是深圳市宝安区中心医院社区健康服务管理中心副主任、航城社区医院负责人。不同于有专业背景的黄智生,张升超对AI的最初认知来自科幻作品。2018年以前,他从未料到自己从事的全科医学专业会那么快和AI产生深度交集。
宝安区的社区健康服务起步于1996年。同年,宝安区中心医院建立起广东省第一家社康中心。作为基层医疗卫生机构,社康机构的主要任务可以概括为“看得好小病、看得出大病、管得住慢病”。
“树洞机器人”生成的监控通报。
一位患者在深圳宝安区中心医院福中福社康服务中心接受AI眼底筛查。
“我国慢性病的患病率呈逐年上升趋势,特别是高血压和糖尿病等。慢性病需要长期的综合管理,过去有一个非常令我們头疼的问题,就是许多患者保健意识不强,用药依从性和自我管理能力不高,从而影响疾病的控制效果。”张升超对《环球人物》记者说。正是在这一背景下,宝安区中心医院于2018年引入了技术相对成熟的糖尿病视网膜病变(以下简称糖网)的AI筛查。
张升超告诉《环球人物》记者,有关数据显示,截至2021年,中国糖尿病患者人数达1.41亿,相当于每8人里就有1名糖尿病患者。帮助他们进行健康管理是医院的重要任务之一。
AI介入带来的治疗变化,一是快速,二是直观。糖网是糖尿病的并发症之一,也是中国工作年龄人群致盲的首要眼病——没错,糖尿病早已不是人们传统印象中的老年病,有大量工作年龄人群患病。宝安区中心医院目前在管的糖尿病患者就有1.9万余人。糖尿病导致的眼部损伤不可逆,但早期又没有明显症状。在我国,眼科医生与糖尿病患者的比例约为1:4000,增加了疾病筛查的难度。AI筛查的普及,使得负责日常检查的社康机构能够帮助患者更早地发现糖网病变。张升超说,近3年来,他们医院就用AI辅助完成了1.2万例患者的眼底筛查。
2023年12月,张升超接受本刊记者采访。(周良波 / 摄)
在宝安区中心医院福中福社区健康服务中心,张升超的同事、中心主任余汉兵向《环球人物》记者展示了AI筛查的全过程——完成眼底照相的患者还没从凳子上起身,系统就给出了筛查结果,全过程不到5分钟。结果界面上,左侧是眼底照片,有问题的区域被框选出来;右侧是具体说明,AI判断这名患者暂时没有糖网的症状,但他的眼底视杯与视盘直径比值接近0.6,有青光眼的可能。
待上级医院的眼科医生返回最终诊断结果后,相关信息也会一并显示在界面上。“从过往病例看,AI的筛查结果与医生诊断基本一致,准确率达97%以上。”余汉兵说。
近年来,AI影像辅助诊断发展迅速,眼部诊断是其中的热门领域——眼底照片的大小和形状比较均匀,因此更适合AI建立相关数据库和应用模型。张升超回顾5年来的探索,笑称自己就像一位“产品经理”,不断地将医生的需求反馈给研发者。而AI的能力提升后,又能辅助医生和医院提高诊断效率。
回想15年前,张升超正是目睹了深圳基本医疗卫生服务的巨大需求,才决定转型成为一名全科医生。在他的职业生涯里,从《“健康中国2030”规划纲要》到《“十四五”国民健康规划》,全科医生日益被重视,被定位为居民健康的“守门人”。宝安区卫生健康局党组成员、副局长韩静认为,AI还可以在“守门人”环节发挥更多作用。
“以我们宝安区的193家社康机构为例,去年考核绩效第一名是最后一名成绩的1.7倍。我们一直在思考用什么方法去弥补这种社康机构之间的差异性,AI应用是一个值得探索的方向,它能够补足全科医生人才的不足。”韩静对《环球人物》记者说,“也许未来会有更多基于AI的基层医疗服务场景,元宇宙也好,虚拟人也好,使得患者足不出户就能按照医生的指令完成问诊,治疗效果更好。”
“新建标签页及记事本,中文输入,www.xxx.com,正在加载页面……”
“5款国产主流大模型PK?谁最好用,谁更懂你?我们帮你试了试。86998链接。国产大模型黑马诞生。1058链接……桌面列表,回此电脑,本地磁盘……简历……”
“键盘。ZHOU。广州的州。姓周的周。大米粥的粥……”
沿着盲道和墙面扶手走进曹军的办公室,持续的语音朗读声和清脆的键盘敲击声立即吸引了《环球人物》记者的注意。曹军笑着说,为了提高效率,包括他在内的许多盲人会将语音朗读速度设置为8倍速,《环球人物》记者这样的“明眼人”可能很难听清楚。
曹军是北京市盲人协会副主席,也是一家科技公司的创始人。公司主攻信息无障碍,简单地说,就是让盲人能像“明眼人”一样自如地使用手机和电脑。他冲记者扬了扬手机:“小米的最新型号,跟‘明眼人同步抢到的。”
因为先天性白内障,曹军自出生就双目失明。1995年,21岁的曹军从北京市盲人学校毕业,面前只有两条路:到北京市按摩医院做按摩师,或者到长春大学攻读中医推拿专业。
曹军哪条路都没选,决定自己创业开按摩店。盲人按摩当时还是新生事物,按摩店开业一周,客人寥寥。曹军绞尽脑汁,推出免费体验活动,逐渐出了名。3个月后,按摩店开始盈利,曹军又接连开了多家分店。
1999年,曹军听说“不懂电脑的人就相当于文盲”,花1万多元“巨资”购置了一台。“这是显示屏,这是键盘……”曹军在妻子的帮助下兴致勃勃地触摸过去,一腔热情却在电脑开机后很快熄灭了。“我看不见屏幕,根本操作不了。后来有客人说,你这电脑闲着太糟践钱,送我一本DOS的书。怎么判断DOS指令输对了没有?我就听电脑风扇有没有呼啦啦地转。学了一段时间,真是索然无味。”
按摩店的生意蒸蒸日上,曹军内心却很迷茫。从小到大,除了家人的讲述,他了解世界的渠道就只有一台收音机。每次跟亲朋聚会,他不能独立夹菜,也不知道该聊什么,总觉得自己很多余。“我的世界是黑色的。仿佛盲人活着就是得过且过,做做按摩,赚点钱,能生存下去就不错了。”
3年后的2002年,一款读屏软件的出现让曹军骤然进入了一个更大的世界——他能听书了。
由于制作成本高、工序繁琐等原因,过去很长时间里,中国盲文出版物数量稀少,而这几乎是盲人全部的阅读来源。小时候,曹军求姐姐帮自己读普通版的《多情剑客无情剑》,姐姐读到1/4就烦了。姐弟俩为此爆发了激烈的“战争”,曹军从此失去姐姐的帮助,再没完整读过一本书。有了读屏软件,曹军把他能找到的武侠小说都“读”了一遍。
曹军对AI的最初想象,来自21世纪初的智能手机——尽管那远不是我们今天所谈论的AI。“盲人可以读书了,能不能发短信、用电脑?我也许能为盲人朋友创造更大的价值。”2008年,曹军不顾家人的反对关掉了8家按摩店,进入科技行业。他在一个Word文档里写下自己的商业计划:“核心原理很简单,把文字、菜单都转换成语音。”
比技术攻关更早到来的难题是招聘。一听说要给盲人做软件,程序员们直摇头,曹军足足见了18位程序员,才找到愿意参与的合伙人。两人一起闷头研究了3个月,软件实现了短信朗读、来电号码播报、联系人查找等功能,用户的按钮选到哪里,就能听到对应的语音播报。一时之间,它成了圈子里的“爆款”,上市首月就卖了1000多套。
曹军为学员讲授信息无障碍课程。
时间长了,盲人有了新的需求,他们还想自由地浏览网页,甚至QQ聊天。公司的客服电话整天响个不停,盲人有什么需求都会打来。
想让盲人用上QQ,需要腾讯开放源代码,这几乎涉及一个科技企业的最高机密。曹军一次次地联系腾讯,最后给马化腾写了一封200多字的邮件,意外得到了回复。无障碍版本的QQ上线了。
“网络打破了残疾和健全的边界,很多盲人朋友通过QQ找到了伴侣,甚至是‘明眼人伴侣。这是我没有想到的。”曹军自此坚定了这条创业之路。
触屏手机问世后,盲人没了实体按键的辅助,很难在屏幕上找到目标客户端。曹军和同事推出读屏软件的迭代版本,让用户可以通过简单的触摸手势实现日常操作。靠着个个击破的毅力,他还与多家科技公司合作,开发了输入法、天气、地图等客户端的无障碍版本。
视障员工王超出生于1996年。因为科技的进步与无数“曹军”们的努力,他的成长之路大大拓宽。王超还记得,用上QQ以后,向来独来独往的他一下有了许多天南海北的朋友,与一些人的友谊维持至今。当AI进入应用阶段,王超率先通过智能家居感受到生活的便利。他家里有台智能电饭煲,可以通过语音控制。而过去市面上的盲人家电通常是在家电按钮上标注盲文,一个按钮可能有多种功能,用起来不太省心。
2023年12月,曹军展示读屏软件的功能。(本刊记者 范雨莹 / 摄)
曹军有类似的感受。有一年冬天,他和另两名视障员工想打开办公室的空调取暖,鼓捣了1个小时也没成功——空调按钮没有盲文,也没有语音提示。接触到智能家居产品后,曹军在手机上安装了万能遥控器,可以直接发送语音指令。去年,他还买了一辆有辅助驾驶功能的汽车,体验了一把初级自动驾驶。
AI也被引入公司的读屏软件。鉴于高昂的开发成本,曹军主要是和一些大公司合作,使用其技术接口。谈到最新的AI图像识别,他当着《环球人物》记者的面打开手机照相功能,冲着办公室拍了一张照片。《环球人物》记者很快听到了清晰的语音播报:“眼前是一间办公室,一位男性坐在电脑前工作。他穿着白色衬衫、黑色裤子……”
曹军说,刚推出拍照识别功能时,公司很快收到了一位北京大爷的语音留言,“特有意思”。盲人出门不易,大爷以前常为做饭头疼,现在他能够在软件辅助下上网买菜、点外卖。拿到外卖一拍照,软件播报“这是西红柿炒鸡蛋”,还细致描绘了菜的外观。“他很高兴地说,这个功能太好了,他得用一辈子。”
从语音识别到图像识别、人脸识别,相对成熟的AI功能基本上已被曹军“一网打尽”。他目前正带领员工研究“智慧识屏”,让软件能够更高效地识别和朗读那些没有无障碍版本的软件。
“AI对于‘明眼人来说是锦上添花,对我们来说则是雪中送炭。”身为盲人,曹军对“AI改变命运”的体悟比健全人要强烈得多,这也是让《环球人物》记者格外触动的地方。曹军说:“如果没有AI的帮助,我们与你们的差距可能会越来越远,甚至在公共空间彻底消失。”而如今,按摩不再是盲人仅有的出路,盲人播音员、盲人主播、盲人客服都走进了大众视野。
目前,AI研究的一个前沿方向是脑机接口,让大脑通过外部设备与计算机实现信息交互。曹军对此很关注:“桂林、三亚、西双版纳……我去全国很多地方旅游过,却无法想象真正的景色有多美。文字描述和亲眼所见还是有很大差异的。也许未来科学家们能通过脑机接口,把图像信息直接传到我的大脑里,让我‘看到。真真切切地‘看看这个世界,这是我有生之年最大的梦想。”
说到这里,他留下一阵爽朗的笑聲:“我应该可以等到那一天。”
(本文图片除特别标注外,皆为受访者提供)