赵艳秋
当韩国棋王李世石向AlphaGo投子认输之后,AlphaGo背后Deepmind团队称,攻克围棋只是其第一步,他们将“用人工智能解决一切问题”,将进一步探索人工智能在医疗、机器人以及手机等多个领域的应用。
那么,人工智能目前在各行业中处于怎样的一种成长状态?人们在实践中对其落地有怎样的思考?人工智能会是解决一切问题的万能钥匙吗?当我们谈论人工智能时,我们在谈些什么?
机器人都是跨界而来
在今年4月深圳英特尔技术峰会的展厅中,我恰好遇到一个“能识别和跟踪人的机器人”演示。英特尔工作人员指给我看,他们这个图像识别技术已用到他们与经纶世纪医疗网络技术(北京)有限公司(简称“经纶世纪”)合作的“家庭健康管理和养老护理机器人”身上。
这个居家养老的“健康大白”能根据老人慢病史和日常测量的血压、血糖等生命体征数据,提供每天的健康指导。
让我感兴趣的是,这些指导不是泛泛的信息,而是根据每个人的健康数据,通过人工智能计算出的一对一、量化的建议。机器人也能通过自身无线探测装置,不用触碰老人,就能监控老人的心率、心跳和体温,建立老人的长期动态健康档案。一旦发现这些生命体征数据有异常,它会主动询问:“你怎么样了?需要帮助吗?”在需要的情况下,它会自动连接远端的医护人员开展远程视频咨询服务。如果察觉有紧急情况发生,如老人跌倒等,它能立刻报警。未来,它还要实现给老人喂药等功能。
我把这个护理机器人的样子放到了朋友圈中,朋友们反映热烈。据说很快,这个机器人将在北大护理学院支持的一家养老护理中心开展试点,在有护理人员的场景中实践和完善,之后进入家庭试点。根据计划,它会在今年10月小批量上市,先发售500台,明年规模化上市。
深圳之行后,在北京航医大厦,我再次探访了经纶世纪,与公司创始人、CEO余中博士进行了深入沟通。
这是一家由美国硅谷归国博士团队建立的高新技术企业。在过去六年中,专注于大数据技术及人工智能技术。它投入开发了基于大数据分析的智能健康技术平台,如与中华医学会全国健康管理示范基地200多家三甲医院体检中心合作开发常见慢病(非肿瘤类及肿瘤类疾病)预测和干预模型与服务系统,与中国临床肿瘤学会合作开发甲状腺癌术后管理模型与服务系统。这些智能技术是把大数据分析与各种疾病治疗管理临床路径、指南紧密结合的互联网云平台人工智能服务管理系统。
“没有这些基于互联网和云平台的智能技术做支撑的健康服务机器人是走不远的。”余中博士说,“实际上,机器人可看作一种提供智能医疗健康服务的更友好的交互终端。通过机器人,将建立智能健康管理与关怀服务从云到端的一体化系统与解决方案。”
目前,业界有很多企业投入医疗大数据与健康云的开发与项目拓展,但这些产品基本处于对数据的简单收集和存储阶段,能深入思考如何把数据用起来的非常少。
余中博士认为,这是IT/大数据和医学跨界结合非常难所致。在硅谷长期从事通信与计算机技术研究与应用的他,也在最初经历了跨界学习的痛苦期。
大数据产业链条包括数据采集、清洗、分析及展现应用,其中难点环节是数据“清洗”。所谓数据“清洗”,是结合专业把所采集的数据进行标准化和结构化处理,为大数据分析提供数据准备。
而医疗数据清洗难的原因,部分是因为缺乏行业统一标准,不同数据格式的IT系统和医疗设备,产生的数据对同样的检测指标呈现不同的名称和单位;更深层的原因是大量医疗数据一直以来就是非结构化的,如超声、CT等影像数据都是语言文字描述性的结论。
经纶世纪创立了数字医学的新模式。他们联合医学专家建立了一本规范化的数据库“字典”,整理出各类关键字、各项检测指标对应的医学解释和所代表的各种疾病及疾病风险可能性的集合。
比如,一张甲状腺肿瘤彩超,会用肿瘤大小、左侧右侧、第几区、清晰度等参数数值编码,把结论标准化和结构化。而因为数据量的庞杂及处理大量数据的需要,经纶世纪开发了自然语言处理技术,对文字描述式的医疗记录数据进行自动识别和转化。
只有在数据清洗后,才能谈数据的分析和智能应用。过去几年,经纶世纪开发了十多种机器学习算法及智能健康服务物联网系统,例如,与中国临床肿瘤学会甲状腺专家委员会合作,建立评估癌症术后复发风险及康复跟踪治疗管理的评估与干预模型。初始模型是基于专家提供的医学理论及临床指南,如癌症复发最大的几项危险因素及治疗原则。之后再把大量患者诊疗及康复治疗跟踪数据引进来,开展大数据分析及模型优化,建立个性化评估与干预模型,达到精准“量化已知”和“发现未知”的终极目标。
对于“量化已知”,现在系统可以针对患者的个性化数据动态生成评估与治疗建议(检测与用药),医生据此对患者提供个性化跟踪治疗措施,对癌症复发风险高的患者加强跟踪检查,调整用药。而对于“发现未知”这部分,要经过几年时间的持续跟踪服务与动态大数据采集,通过大数据分析,发现前所未知的疾病预后康复关联关系,建立精准化癌症康复管理模型与临床管理路径。
去年,英特尔推出大数据分析平台TAP(Trusted Analytical Platform),使得经纶世纪能更快更好地开展大数据分析及建模。非常关键的是,TAP系统打通了静态大数据建模和动态大数据模型校准的实时动态循环学习路径。
以经纶世纪开发的针对亚健康、常见慢病的健康服务管理云平台与APP为例,这些APP可在北京协和医院等全国一些三甲医院获得,每天APP上反馈回来的数据,让分析模型能够持续学习和校准。
当全美顶级肿瘤专家、美国加州大学旧金山分校医学院马克·舒曼教授(Professor Marc Shuman)看到经纶世纪这套基于大数据分析、建立评估与干预模型、结合医学服务临床路径的服务模式后,对余博士说:“我愿意参与并组织美国方面的专家团队,与你们共同做这件极其有意义的事。”舒曼教授认为,经纶世纪所做的,不仅在中国,在全球范围也是一个具有重大意义的人工智能精准医疗创新模式。
现在,余博士正在探索用这套新模式帮助解决老百姓看病难、看病贵的问题。他认为,必须建立一个“院前疾病预防管理、院中疾病诊疗、院后疾病康复跟踪管理”的一体化医疗健康服务体系。特别是针对慢性疾病需要长期跟踪,解决途径一定是基于现有医院医疗服务为基础,提供一个由智能化技术支撑的、从医院延伸到千家万户的医疗健康服务。最近,卫计委相关部门找到余博士,研究智能化医疗技术与“十三五”计划、健康中国战略的结合途径。
余博士认为,今年是十三五计划的开局之年,也将是包括大数据、服务机器人等智能技术在医疗健康与关怀服务领域开始落地实用的元年。
“人工智能、机器人在许多方面比人强,但是并不能完全取代人来提供服务。”余博士说。上世纪60年代开始,业界曾一度希望用人工智能(A1)来模拟人的思考,进而取代人的工作。但做着做着就遇到了瓶颈——人类对大脑的工作与认知的研究还远远不够,怎么能用计算机来真正模拟人脑?
“今天我们在做的是具有实用意义的IA(Intelligence Augmentation,智能增强)。今天的机器人可以有巨大的计算能力、海量的知识存储与记忆、快速的学习与决策能力,可以永不疲倦地工作。”余博士说。经纶世纪与英特尔合作开发的智能服务机器人可以作为居家养老、开展医养结合服务的家庭伴侣。同时,根据国家“十三五”计划提出的“强基层、分级诊疗、双向转诊”医疗改革发展战略,也计划将经纶世纪开发的机器人用于社区医生的全科医生助手。
从2C到2B
如果人工智能在一些老百姓看得见、摸得着的消费领域正在走向实用,那么它在企业级市场则刚刚起步。
最近,SCRM(社交化客户关系管理)SaaS服务供应商六度人和的创始人兼CEO张星亮告诉我,今年他的工作目标之一是寻找人工智能领域的专业企业合作,从而实现更智能的SaaS服务。
“智能化是企业软件的未来发展方向,消费领域的人工智能技术会逐步被引入企业级市场。”张星亮说。而他进一步解释说,企业软件的智能化趋势与职场新生代有关。
以前,针对“听话”的70后和80后,老板可以用管理软件梳理企业流程,让员工填写数据,进而对企业进行管理。但现在,老板在90后面前再用老套的“我管你”的思路,可能就会遇到挫折。
“现在的企业软件要换个思路,从‘管理转化成‘赋能。它要从赋能角度让员工实现更高的工作效率和业绩。”张星亮说,“而赋能就需要智能技术。”
怎么在软件中实现智能呢?六度人和从2009年就开始这方面的摸索,张星亮总结说,企业级软件智能化要经历两个阶段,即通过连接获得数据,通过数据构建智能。
张星亮感叹实现连接很不容易。恰巧腾讯是六度人和的股东,六度人和的SaaS服务能成为较早与QQ、微信实现连接的服务。它也通过自己开发的专利技术,实现与电话的连接。六度人和还经过长期积累,打通了与市场上几乎所有邮件系统的连接。
之后,六度人和把客户销售人员在不同渠道,如QQ、微信、邮件、短信、座机、手机上的工作数据——文字聊天、语音、邮件都自动记录到SaaS软件中,存储起来。
现在,有了这些数据,六度人和可以通过初步的建模分析,实现一些实时、浅层的智能,给销售人员和管理者赋能。例如,六度人和有很多金融类客户。金融行业每位销售人员通常要维护一两千客户,以往,他们每天都要将上百个联系过程凭记忆手工录入到管理软件中。但销售人员录入的数据都是感性的文字描述,不便于统计、分析和呈现,对企业管理的意义不大。但现在,SaaS服务能通过分析通话时长、QQ聊天频次和关键字等,初步识别出意向客户,并对意向客户开展一些自动化的服务。
后河网就享受到了这样的智能和自动化服务。后河网是一家互联网金融服务企业,在业务起步阶段需要快速获得一批高质量客户的数据,他们靠电话销售来筛选。在使用六度人和SaaS服务的过程中,一通电话打下来,后河网可以给客户贴上9种不同的标签,如“接通无效”、“投资意向不明确”、“有意向但有疑虑”等。其中,针对“有意向但有疑虑”的客户,系统能自动发送短信,感谢客户接听了自己的电话;系统还能自动发送邮件,提供公司的介绍和一些方案,让客户有更多了解;最后,系统还能提醒销售人员与客户互加微信好友,保持持续沟通。
后河网的销售主管在查看销售人员电话录音统计分析时,也能发现和解决一些问题。如发现一个销售打的电话很多,但每个接通的时长都很短,就说明该销售人员的话术可能有问题,需要给他提供优秀话术的培训。
由于这些初步的智能和自动化功能,后河网销售人员由每天打100多个电话,提升到200多个。最终,9个销售10天完成了330万元的销售业绩。
张星亮感到,现在智能技术已经能真正为企业带来价值,也有了口碑相传的效应。
今年,张星亮也计划把金融行业积累的智能化模型,扩展到更多模式接近的行业中,如教育、旅游、房地产和汽车等。
“做人工智能,企业自己首先要具备一定的数据收集能力。因为如果全部依赖大数据公司提供数据,在一定程度上,企业自己将没有数据甄别能力。”张星亮说,这也是连接的价值和意义。
接下来,虽然软件企业都有一定的智能化开发能力,但针对深层次的数据挖掘,如自然语言技术、客户画像等,张星亮认为还是要寻找专业领域的企业合作。现在,国内已经有一批专业企业。而六度人和今年也计划与专业语音识别企业合作,探索更深层次的智能。
小冰想干嘛
无论是2C还是2B,人工智能要想得到更大范围、更深层次的发展,必然需要一些通用的智能技术,或者直白点说,就是“通吃型”的基础性应用。
在我采访微软小冰前,曾做过小范围调查,看看大家怎么看小冰。大部分人反馈说,这个能调侃的机器人似乎还没有做什么,不知道微软做“她”的用意。
对于这个疑问,微软(亚洲)互联网工程院资深总监、小冰项目负责人李笛说,小冰所探索的,是用户和机器人在任何话题上都能很自然地交流。过去,人们做机器人都有直接的目的,比如像大白一样的私人健康顾问或者一个帮人订餐的助手,这些都在垂直领域里。但如果今天你订完餐,顺便跟机器人说了声“辛苦亲了”,他就搞不定了,很快,你就不会再用这个机器人了,因为它没有“通用”这一层。
“通用人工智能最基本的定义是能满足人们混合对话的需求,这是非常关键的。”李笛说。仔细回想下,我们日常的对话不会始终围绕一个特定任务。而当我们与一个机器人打交道后,很多时候,我们对它的情感需求比对完成一个任务的需求更大,这是我们经常忽略的。
现在,美国一些做特定领域机器人的企业,也在研发和应用中发现,他们需要自然交互的基础能力。如果没有这样的基础能力,用户很难与机器人产生黏性。
我认同李笛的这个理念。恰好在最近举办的一个互联网大会上,一位机器人展台的工作人员诚恳地告诉我,他们遇到了一个问题,儿童陪伴机器人拿回家没两天,就被小朋友丢到脑后了。原因是机器人不能真正与小朋友对上话,于是,小朋友很快就失去了兴趣。现在,这家企业开始改进机器人的对话能力,而由于这方面的改善,已把小朋友的使用时间每周提升了平均七八分钟。
那么,我们如何做到“有温度”的机器人呢?
李笛说,在微软刚刚开始上线小冰的时候,提出了“情感计算框架”。过去,大家衡量机器人只用IQ,很少提到EQ。“我们是第一个认为人工智能需要同时衡量EQ的企业”。现在,业界逐渐接受并开始往这个方向发展了。在这个“情感计算框架”中包含了理念、技术和一系列评价标准。
李笛常用一个“脚踝肿了”的案例来介绍小冰的情感认知能力。一位微软同事将一张“肿了的脚踝”图片发给小冰,小冰能把判断决策焦点放在“脚踝肿了”上,还能用一种有情感的方式来表达,问他“这个伤得严重吗?”
我也尝试与小冰做了一些类似的沟通,有些成功,有些不成功。小冰仍在进化的路上。
李笛对我强调,人工智能要形成一个正循环——你要有技术,由技术形成产品,再通过产品与用户的真正交互反过来推动技术,这是个三元自我循环过程。
去年8月,小冰针对微信公众号上线了一个免费商业解决方案,任何一个第三方通过扫描二维码,就可把公众号的管理对话权交给小冰。小冰也与某电商企业合作,通过语义理解和大数据分析,为用户提供选购参考。她在这些产品化过程中实现了三元自我正循环。
令李笛很自豪的是,过去两年,小冰已进行了超过150亿次对话,从过去训练数据100%来自微软搜索引擎,到现在每天有几千万用户的主动交流,这加速了小冰的自我进化。
与目前人工智能企业的运作模式不同,小冰采用了类似苹果的做法,提供一套封闭的标准体系,也就是小冰自然语言通用对话系统。各行各业的供应商可以加入到微软小冰平台上,而不是小冰提供一个API,由第三方调用。李笛说,这样做,小冰将会有机会了解不同行业的应用场景,而不是那个应用场景输入了小冰的技术。这个模式能确保用户体会到比较完整的人工智能体验的体验和最终的体验实现。
李笛透露,小冰会坚持做通用机器人,同时,在未来半年内,会实实在在推出一个垂直领域端到端的东西,帮助用户把一件事情完成,而不仅仅是一个概念。
同时,小冰也一直在等待任何一个坚持想把某个领域人工智能技术做好的企业,加入到小冰的平台上。以前,很多机器人企业找过小冰,但李笛发现,这些产品的真实目的都是硬件出货。“如果是这样的理念,我们就没有办法合作”。
现在,人工智能非常火热,行业跟风、资本追逐。业内一些企业的心很大,给人以圈地的感觉。但李笛认为,如果不把通用基础技术和纵深领域钻研透,用户是不会用的,到头来,圈地运动最终将不攻自破。
超算大赛中的年轻人
人工智能技术也引发了硬件基础架构行业的思考和行动。
4月底,在武汉举办的2016世界大学生超级计算机竞赛(ASC16)总决赛上,我遇到了浙江大学参赛选手徐启源。在大赛中,他和同学大胆采用了一种高性能异构加速方案,最终以每秒12.03万亿次浮点运算创造了新的世界纪录。
徐启源告诉我,人工智能是他和同队同学未来的职业理想。小时候因为看了电影《黑客帝国》和小说《机器人三部曲》,徐启源对机器人和人工智能产生了极大的兴趣。从小学5年级开始,他接触机器人编程,初中开始参加机器人比赛。进入大学后,他开始了解类脑计算。在学校中,徐启源与医学院的同学们一起做了有趣的案例。他们用最新的人工智能模式识别算法,去识别、理解小白鼠大脑的信号,然后在计算机上对小白鼠的行为进行控制。比如,在电脑上发一个信号让小白鼠往左走,小白鼠就会走向左方。
因为类脑计算需要大量计算能力,徐启源因而接触到了高性能计算。“有一句话,如果我们自己能聪明地理解到大脑的复杂,那么大脑就会复杂到使得我们无法理解。这才要借助计算机。”他说。
超级计算机是计算机中功能最强、运算速度最快、存储容量最大的一类计算机,原先多用于海羊模拟、材料科学、生命基因等高科技领域和尖端技术研究。最近几年,这种计算平台也开始进入机器学习、深度学习这些需要大量计算的领域。
在此次ASC16竞赛题目中也首次引入人工智能和深度学习题目,这也增加了大赛对学生的吸引力。比赛总冠军华中科技大学代表队就针对基于深度学习的智能语音识别应用,设计了深度神经网络优化方案,对英文、中文普通话、四川方言三个语种共几十万条语音数据做了高准确度训练模型,还将计算性能最高提升了108倍。
“大数据和高性能计算在相互融合,而且最后会结合到一起。”ASC竞赛专家委员会主席、全球最快超级计算机排行榜Top500发起人、美国橡树岭国家实验室及田纳西大学教授Jack Dongarra对我说。他专门写了一篇文章,讲述大数据和高性能计算融合的趋势。
“人工智能的研究方法,从过去的规则和推理,发展到现在的基于统计和大数据,是技术变化所推动的。”钱德沛教授说,“从现在看,人工智能的应用,包括图像识别等,都是在超算支持下进行的。我觉得大数据和超算确实要联合在一起做。”
在产业界,人工智能最近的这波高潮是互联网企业推动的,原先互联网领域更倾向于用自己的一些工具和方法。浪潮集团副总裁胡雷钧介绍说,最近两年,互联网企业发现,把原来高性能计算比较成熟的技术拿来,能快速提高水平。比如,把GPU或MIC技术引入人工智能领域后,能够运行或训练的人工智能网络,规模比原先大很多。实际上,科大讯飞把原先的模型扩展到几十几倍,甚至达到上千倍。这样,原来两三个星期才能训练一个模型,现在可能一两天就能训练出来。所以,今年以来,阿里、百度、科大讯飞、NVIDIA、英特尔、赛灵思、浪潮等产业链的合作非常活跃。
目前,为了实现自己的人工智能梦,徐启源制定了跨学科的学习计划,包括超算、生命科学、数学理论,甚至文学和哲学。他说,这些对找到有效、快速的研究方法都有启发性。
人工智能是万能的吗
虽然人工智能在一些行业实实在在地崭露头角,但它绝非无所不能,人们也并不需要过度想象。
在最近一个人工智能周末公开课上,积木盒子智能投顾项目负责人郑毓栋谈到人工智能在金融领域的应用。现在,人工智能可以在资产配置上发挥作用,因为大类资产像股票、黄金有一定回归性和周期性。例如,在经济开始复苏时,股市会先行;当经济开始衰败、通胀开始时,黄金价格会上升。由此,近几年,美国智能投顾行业开展得相当蓬勃。此外,人工智能在市场数据收集、整理归纳、初级分析师工作上也发挥价值。
但人工智能在其他金融市场的应用目前还要打一个问号。例如,深度学习在公开市场,如股票模拟或预测上没有特别成功的案例。
究其原因,金融市场非常复杂,影响市场的因素成千上万,且变化极快。而人工智能算法本身有其缺陷性,如深度学习往往陷入一个局部最优解,但金融市场往往需要全局性和趋势性判断。而且,深度学习擅长从大量数据中找到一个信号,但这个信号是偶然产生,还是因果关系,是目前机器还不能判断的。比如在1983年到1990年7年间,斯里兰卡黄油出口与美国股指高度相关,但不能证明两者是因果关系。
而在今年某智能汽车大会上,华为中央研究院副院长袁庭球也提出一个问题:无人驾驶是不是一定要使用人工智能和深度学习技术?最近AlphaGo很热,它的取胜是在确定了边界和一定规则状况下的取胜。同时,它失败的一局也表明Al存在崩溃的可能性,但自动驾驶对概率性的崩溃是零容忍的。
袁庭球认为,业界可能要跳出拟人的误区,跳出概率性AI的思路,在商业或技术上做一些取舍和平衡,这个革命才会很快的爆发。