赛迪智库
智能技术的本质要义进一步丰富,与其它现代信息技术进行交叉融合、深度渗透、广泛应用,实现技术的一体化、群体化、颠覆性突破,为推动我国产业体系智能高端、政府治理精准科学、社会服务普惠于民奠定坚实基础。
2016年是智能技术内涵不断深化、应用初步发展、产业生态开始建立的一年,是政府、企業、学界、民众等对智能技术的关注度和认同度逐步升温的一年。机器学习、机器感知、智能识别、自然语言理解、虚拟现实、区块链等技术取得重要突破。智能技术的本质要义进一步丰富,与其它现代信息技术进行交叉融合、深度渗透、广泛应用,实现技术的一体化、群体化、颠覆性突破,为推动我国产业体系智能高端、政府治理精准科学、社会服务普惠于民奠定坚实基础。
(一) 信息系统集成化推动智能技术取得重大突破
人工智能(Artificial Intelligence,AI),是利用计算机等信息技术对人的意识和思维的模拟,是研究开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新技术,属于计算机科学的一个分支。计算机的技术基础是集成电路,因此,集成电路也是智能技术的基础。大规模集成电路成为信息采集、存储、传输、计算等活动的基本载体。集成电路进步越快,信息的采集、存储、传输、计算能力也就越强,电子产品的智能化程度也就越高。
正是有了集成电路的不断进步,我们才有了性能强大的计算机,越来越轻薄但是却更加智能的手机等终端电子产品,有了越来越复杂的信息系统,积累了数量惊人的海量数据。基于这些高性能计算机、高速度互联网、高智能信息产品的智能技术,才表现得越来越聪明,甚至在很多方面都超过了人的能力。
近年来智能技术的发展,归根结底是由集成电路技术的进步所引发的。摩尔定律是揭示集成电路技术进步速度的一个经验性规律,是英特尔(Intel)公司的创始人之一戈登·摩尔(Gordon Moore)提出来的。其内容为:当价格不变时,集成电路上可容纳的元器件的数目,约每隔18~24个月便会增加一倍,性能也将提升一倍。换言之,每一美元所能买到的电脑性能,将每隔18~24个月翻一倍以上。
20世纪中期以来六十多年的时间里,摩尔定律得到很好的验证,它大体上比较准确地反映了集成电路技术进步的速度。然而,由于目前制作集成电路的硅晶体管已经非常细微,电路线宽已经到了20纳米以下,接近了原子等级,也达到了物理极限,很难再制造出更细的电路和集成度更高的电路模块,人们对摩尔定律能否持续开始怀疑。最近,集成电路领域的专家们对集成电路技术的继续进步表现出了新的信心,认为摩尔定律将在未来几十年继续有效。
目前,国内在人工智能芯片研制方面取得重大突破。2016年4月,中科院计算所研发了多用途深度学习芯片—寒武纪3号,支持k-邻近、k-均值、朴素贝叶斯、线性回归等10种代表性机器学习算法。寒武纪三号的工艺为65nm级,主频为1GHz,峰值性达到每秒10560次基本操作,面积3.51mm?,功耗为0.596W。寒武纪对于机器学习算法运算性能与GPU相当,但面积和功耗仅有GPU的百分之一。
寒武纪芯片的设计亮点主要有运算单元设计和存储层次设计两方面。一是运算单元设计旨在高效完成机器学习频繁的运算操作,重点设计了机器运算单元(MLU),分为计数器、加法器、乘法器、加法树、Acc和Misc等6个流水线阶段。二是存储层次设计能够提高机器学习算法中数据的片内重用,降低片外访存带宽需求,重点设计了HotBuf(HB)、ColdBuf(CB)和OutputBuf(OB)3个片上数据缓存,分别对应最短重用距离、较长重用距离和输出数据的存放功能。寒武纪与TrueNorth芯片的重要区别是寒武纪是面向机器学习的神经网络,包括MLP(多层感知机)、CNN和DNN等,用突触连接的权值表示传递的信息;而TrueNorth则是SNN,用脉冲的频率或者时间表示传递的信息。
(二) 机器学习加快平台化开源化
2016年3月,谷歌公司的机器学习电脑AlphaGO与世界冠军李世石进行了五场围棋比赛,AlphaGo以4:1击败李世石,引起全世界震惊。AlphaGO通过跟棋手下棋或者和自己对弈的输赢情况,自主学习下棋经验,找到更加复杂的应对策略。机器学习(Machine Learning, ML)是研究计算机怎样模拟人类学习行为,让计算机在没有事先明确编程的情况下做出正确反应的科学,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。学习是人类获取新的知识或技能、不断改善提升自身能力的智能行为。机器学习就是让计算机像人类一样具有学习知识和技能从而不断改进提升的能力。机器学习要综合应用心理学、生物学和神经生理学以及数学、自动化和计算机科学,结合各种学习方法如机械学习、传授学习、类比学习、归纳学习、分析学习、事例学习等,从数据中自动分析获得和认知规律,从而达到不断自我完善、自我提高的智能境界。
深度学习是机器学习的一个分支,即构建人工神经网络、模仿人脑思维逻辑方法的机器学习。人类的大脑和神经系统在处理信息时是分层次和级别的,从低层到高层,其对事务的识别和认知能力就越来越抽象和复杂。深度学习提供了一种更智能的技术方法。一般的机器学习中,为了让机器具有认知能力,首先是以某种方式提取某个事物的特征,提取方式有时候是人工设计或指定的,有时候是在给定相对较多数据的前提下,由计算机自己总结出来的。目前以深度学习为核心的某些机器学习应用,在满足特定条件的应用场景下,已经达到了超越现有算法的识别或分类性能。
国内互联网企业大力建设机器学习平台。2016年11月30日,百度公司在2016百度云智峰会上发布了“天智平台”。该平台融合了图像技术、语音技术、自然语言处理等技术,打通了机器学习全流程,内置20多种高性能算法,支持Spark MLlib、用户画像数据、多种应用场景模板,具有开源化、灵活化、高效性、可伸缩,适合研究机构的科学家、研发人员进行使用。endprint
2016年12月18日,腾讯公司联合香港科技大学、北京大学,开发出了基于Java和Scala语言的Angel平台,面向机器学习的高性能分布式计算框架。它采用参数服务器架构,解决了上一代框架的扩展性问题,支持数据并行及模型并行的计算模式,能支持十亿级别维度的模型训练。Angel平台還采用了多种业界最新技术和腾讯自主研发技术,如SSP(Stale synchronous Parallel)、异步分布式SGD、多线程参数共享模式HogWild、网络带宽流量调度算法、计算和网络请求流水化、参数更新索引和训练数据预处理方案等。这些技术使Angel性能大幅提高,达到常见开源系统Spark的数倍到数十倍,能在千万到十亿级的特征维度条件下运行。在系统易用性上,Angel提供丰富的机器学习算法库及高度抽象的编程接口、数据计算和模型划分的自动方案及参数自适应配置,同时,用户能像使用MR、Spark一样在Angel上编程。另外,Angel还支持深度学习,它支持Caffe、TensorFlow和Torch等业界主流的深度学习框架,为其提供计算加速。国内互联网龙头企业加快布局机器学习平台。
(三) 机器感觉和应用取得关键突破
机器学习、深度学习让机器有了大脑,传感技术则让机器有了丰富的感觉。传感技术是利用物理、化学、生物等技术手段从自然界感知并获取所需信息的技术。传感技术可分为光电传感技术、多传感技术和生物传感技术,其中光电传感技术又称为光传感技术,是将光信号转化为电信号的一种传感技术。光电传感技术可用于检测直接引起光量变化的非电量,如光强、光照度、辐射测温、气体成分分析等,也可用来检测能转换成光电量变化的其他非电量,如零件直径、表面粗糙度、应变、位移、振动、速度、加速度、以及物体形状、工作状态等,光电传感技术具有非接触、响应快、性能可靠等特点,目前主要应用于工业自动化装置和机器人技术中。传感器是能够感知和获取信息的技术装置。它能将感受到的信息按一定规律变换成为电信号或其他所需形式的信息输出,以满足信息的传输、处理、存储、显示、记录和控制等要求。当前传感器发展趋势是微型化、数字化、智能化、多功能化、系统化、网络化。传感网是将一定范围内的传感器链接起来所组成的无线或有线网络。传感网具有实时数据采集、监督控制和信息共享与存储管理等功能,通过网络可以实时获取数据信息、监控各种环境、设施及内部运行机理。家电、交通管理、农业生产、建筑物安全、旱涝预警等,都能够通过传感网得到有效的监测,有的甚至能够通过网络进行远程控制。
物联网是通过互联网将更多的传感网连接起来,实现更大范围的物与物、人与物的网络连接。利用局部网络或互联网等通信技术把传感器、控制器、机器、人员和物等通过新的方式联在一起,形成人与物、物与物相联,实现信息化、远程管理控制和智能化的网络。物联网是互联网的延伸,它包括互联网及互联网上所有的资源,兼容互联网所有的应用。物联网的核心和基础仍然是互联网,是在互联网基础上的延伸和扩展的网络;物联网是互联网的延伸,其用户端延伸和扩展到了人与物、物与物之间,进行信息交换和通信,也就是物与物、人与物的相息。由于传感技术、网络技术的迅猛发展,网络接入和应用大面积普及,人人都可以通过移动终端连上互联网,任何物品都可以通过传感网纳入互联网,几乎达到了无所不在的网络、无所不在的感知的状态。借助宽带互联网,人们又可以远程感知、远程控制,机器可以装上“千里眼”、“顺风耳”,地球变成了一个信息透明的“地球村”。感知是生物特有的感受能力,也就是对外界光、色、声、味、力、冷、热、痛等等的神经感觉和大脑体验。没有生命的物品,是没有感知能力的。
但是,信息技术的发展,让人类给机器装上了传感器和感知网,机器就有了类似生物的感知能力。传感器的种类越来越多,因此机器能感知的信息范围也越来越大。而且,由于传感器技术越来越先进,机器的感知能力也越来越精准。传感器一般由敏感元件、转换元件、变换电路和辅助电源四部分组成,敏感元件直接感受被测量,并输出与被测量有确定关系的物理量信号;转换元件将敏感元件输出的物理量信号转换为电信号;变换电路负责对转换元件输出的电信号进行放大调制;转换元件和变换电路一般还需要辅助电源供电。
传感器有许多类别。按被测物理量来分类,常见的有:温度传感器、湿度传感器、气敏传感器、压力传感器、位移传感器、流量传感器、液位传感器、力传感器、速度传感器、加速度传感器、转矩传感器,等等。根据工作原理可分为电阻式、电感式、电容式及电势式传感器,等等。根据能量转换原理可分为有源传感器和无源传感器。有源传感器将非电量转换为电能量,如电动势、电荷式传感器等;无源程序传感器不起能量转换作用,只是将被测非电量转换为电参数的量,如电阻式、电感式及电容式传感器等。感知是对外界事物某方面物理化学或生物特性的基本认识,而认知则是对外界事物本质特征的更深层、更全面的认识,包括综合属性、历史记忆、思维能力、社会属性等方面的认识。
从机器感知到机器认知,是从具体属性感知能力向抽象思维能力提升的关键一步,是智能技术的质的跨越。认知技术是智能技术向高端发展的产物,它具备综合感知、判断识别和抽象思维能力,能完成以往只有人类才能够完成的任务。认知技术不是一项单一的技术,而是综合利用所有的科技成果,尤其是各类智能技术,包括前述机器学习、深度学习,等等。
目前,国内公司重点布局机器视觉业务。北京旷视科技公司专注于人脸识别技术和相关产品应用研究,面向开发者提供服务,能提供一整套人脸检测、人脸识别、人脸分析以及人脸3D技术的视觉技术服务,通过提供云端API、离线SDK,以及面向用户的自主研发产品形式,将人脸识别技术广泛应用到互联网及移动应用场景中。 Face++通过和众多互联网公司合作,并通过“脱敏”技术掌握了500万张人脸图片数据库,互联网图片人脸识别LFW的准确率达到99.6%,合作伙伴包括阿里、360等一批大型的图片、社交、设备类企业。格灵深瞳公司是将计算机视觉和深度学习技术应用于商业领域的科技公司,自主研发的深瞳技术在人和车的检测、跟踪与识别方面居于世界领先水平。endprint
(四) 智能技术在信息密集行业率先商业化
智能技术在工业生产中的应用,引起生产方式、制造方法、商业模式的重大变革,产生了智能制造。智能制造的模式有很多,不同行业也有不同特点。其中,个性化定制就是智能制造的一种模式,适用于消费品行业。以前的生产方式是大规模生產。企业根据市场调研来设计产品,用生产流水线大规模生产组装出标准化的产品,再通过商业批发零售卖给消费者。这种生产方式的特点是效率高、成本低。但是这种生产方式只能生产出标准化的工业品,不能满足消费者的个性化需求。一旦销售不出去,就造成商品积压和浪费。
在智能技术的支撑下,现代工业企业能够采用个性化定制的生产模式,灵活地接受消费者的个性化订单,既满足了消费者需求,又避免了盲目生产的浪费,还能取得较高的利润。例如,在服装行业,消费者可以利用智能手机或智能镜子量体裁衣,通过电子商务向服装企业下单付费。智能的服装工厂接单后才开始选料、裁剪、缝制、包装衣服,并交付物流将货品送达消费者。这个过程中,最关键的技术就是生产工厂所使用的智能技术,能够将来自四面八方、成千上万的订单有条不紊地分解成对工人或机器的简单指令,并将各种物料按时按量从仓库提取出来送达生产车间,工人和机器只需按照指令进行操作即可。没有智能技术,这么复杂的大规模生产是很难有序组织的。
智能技术在生产性服务业中的应用,引起了服务方式和商业模式的重大变革,产生了智能物流、智能设计、创客空间、互联网金融等新型生产性服务业。
智能物流就是利用条形码、射频识别技术、传感器、全球定位系统等各种智能技术改造物流运输环节,促进物流过程中货物与车辆、仓储、配送等资源的优化匹配,实现物流的自动化、可视化、可控化、智能化、网络化,提高物流效率、降低成本,减少自然资源和社会资源消耗。
智能设计就是综合利用三维CAD、虚拟现实等智能设计工具,设计师、工程师、用户、制造工人等多方共同参与、协同设计复杂工业产品的过程。
创客空间是指第三方专业运营的社区化的创意设计工作空间,有共同兴趣的人们围绕一个专业领域的发展目标,在互联网上或线下聚会、社交、开展合作。
互联网金融是指金融业务与互联网的融合创新,既包括传统金融机构利用互联网开创新型业务,也包括互联网企业开展创新性互联网金融业务。前者如互联网保险、网上银行、互联网转账存款贷款,后者如支付宝、微信支付、移动支付、P2P信贷、众筹,等等。
互联网众筹,是互联网金融的一种,发起人通过互联网平台向公众发起筹资,公布筹资人、筹资目的及相关信息,吸引投资者通过互联网投资并获取相应收益。与传统金融方式相比,具有低门槛、多样性、依靠大众力量、注重创意等特点,经常被用来支持某种特定活动,包含灾害重建、民间集资、竞选活动、创业募资、艺术创作、自由软件、设计发明、科学研究以及公共专案等。
智能技术在生活性服务业中的应用,同样也引起了服务方式和商业模式的变化,给人民带来方便快捷的个性服务,有力地改善了生活品质。例如,滴滴出行、智能导航、远程医疗、智慧社区服务,都是已经大范围普及的智能生活服务。
滴滴出行,是流行在中国境内的一款智能交通服务平台,被称为手机“打车神器”,深受用户喜爱。它通过智能手机向用车者和司机提供就近联系、就近匹配的服务。目前,滴滴出行已经开辟了出租车、专车、快车、顺风车、代驾及大巴等多项服务。
智能导航,不仅提供卫星定位和道路、航空、航海等导航服务,还能提供实时路况信息,帮助人们选择最佳出行路线。
远程医疗,就是大医院或专科医院利用智能技术和互联网,对医疗条件较差的边远地区、海岛或舰船上的伤病员进行远距离诊断、治疗和咨询。这是一种能够在较低开支条件下满足偏远地区人们高质量医治需求的医疗服务。现代远程医疗还提供网上挂号、网上咨询、健康监测、居家医护等服务。
智慧社区服务,就是借助智能技术和互联网对社区居民提供个性化生活服务,包括智能楼宇、智能家居、居家养老、城市生命线管理、食品药品管理、票证管理、家庭护理、个人健康、数字学习、社交娱乐诸多领域。智慧社区是社区管理服务的一种新理念,既是社会管理的新模式,也是居民生活的新方式。
(五) 智能识别技术进入产业化阶段
人脸识别技术在身份确认中的商业应用不断加深。谷歌公司正在研发人脸识别手机,致力于通过手机内置处理系统实现人们面部特征的识别,以应用于人脸识别授权交易中。美国纽约机场将利用人脸识别技术对入境旅客与其证件照片进行比对审核。我国部分地区推出了基于人脸识别的ATM机,取款人无需携带银行卡,通过人脸识别验证即可获取金融服务。微众银行APP引入人脸识别技术,作为用户绑定第二张银行卡时的安全确认保障。同时,人脸识别技术将从身份确认向情感识别方向进发。机器可以从人类的面部表情中读懂其心理活动。目前,微软公司推出的Azure云服务可准确识别出人脸的表达情绪。
在强大后台学习能力的支撑下,图像识别技术能力不断增强,其社会角色定位逐步由辅助决策发展为主导执行。一是辅助决策。图像识别技术是人们与外部世界交互的重要媒介,为人们生产生活提供了强大的辅助支撑。机器把人们从繁杂无序的图像信息搜索工作中解放出来,成为人们搜索行为的延伸和践行者。人们在获取机器的图像识别反馈信息后,再做出下一步行为判断。例如,百度识别APP通过图像识别技术可以实现“拍照购物”功能,为用户提供心仪商品的精准匹配功能。二是主导执行。图像识别技术进一步发展为人们作用于外部世界的重要工具,为人们生产生活提供了有力的主导驱动。在帮助人们获取图像信息搜索结果的同时,机器会根据搜索结果作出决策判断,为人们提供成套解决方案。例如,剑桥大学研发了基于图片识别的无人驾驶技术,通过高像素相机拍摄街景照片,系统实时将图片中的路况分成路面、路标、行人等12个类别,从而形成路况信息分析报告,指挥车辆运行。endprint
图像识别技术在安防领域率先打开突破口。安防监控已从简单的画面感知和存储向监控图像智能分析方向发展,能够实时处理捕捉画面。图像识别技术对前端环境感知的灵敏性,以及对后端视频数据分析的精准性成为其彰显商业价值的关键。
目前,海康威视公司推出了Smart2.0“智”系统,该系统为视频监控终端嵌入了“大脑”,监控终端可以实时对视频画面进行行为检测、异常侦测、特征识别、统计分析操作。一旦发现可疑,即可立即向云端Smart平台发送报警信息。飞瑞斯科技也研发了基于人脸识别的视频监控系统,该系统联通了公安人像库和人口综合信息系统,在捕捉视频画面的同时,能够迅速对进入画面的人像进行鉴别,实现对犯罪分子的精准追踪。
生物特征识别已构建起完善的技术体系,形成了生物特征信号传感、活体检测、信号质量评价等十大关键技术。生物特征传感技术是生物特征信息的“转换器”,将指纹、虹膜、掌纹等生物特征转化为计算机可处理的数字信号;活体检测技术是生物特征信息的“判决器”,判断验证提交的生物特征是否来自生命个体;生物特征信号质量评价技术是生物特征信息的“评价器”,对受损低质量生物特征信号进行筛选和排查;生物信号的定位与分割技术是生物特征信息的“追踪器”,能从采集到的生物原始信号中剔除冗余数据;生物特征信号增强技术是生物特征信息的“放大器”,能對提取出的特定生物特征信息进行信号增强处理;生物特征信号的校准技术是生物特征信息的“校正器”,能对参与比对的两个生物特征信号进行平移、尺度和旋转变换等对齐处理;生物特征表达与抽取技术是生物特征信息的“表达器”,用特定差异化特征信息对指纹、掌纹、虹膜等进行电信号表征;生物特征匹配技术是生物特征信息的“测度器”,能够计算两个生物特征样本特征向量间的相似度;生物特征数据库检索与分类技术是生物特征信息的“搜索器”,可以对海量生物特征数据进行分类存储与检索;生物特征识别系统性能评价技术是生物特征识别系统的“评估器”,能够对识别系统进行客观、准确的评价。
(六) 自然语言理解技术进一步成熟
自然语言理解技术是帮助计算机处理和读懂人类语言的技术,涉及机器翻译、语音识别、人机交互、信息抽取等应用内容。自然语言处理技术发展历经了兴起、低谷和再兴的螺旋上升期。一是技术兴起期。20世纪50年代,自然语言理解技术兴起于美国,科研人员认为不同语言是对“同一语义”的不同编码,希望用计算机技术翻译语言。
1954年,美国乔治城大学和IBM公司合作成功将超过60句俄语翻译成英语,实现从一种语言到另一种语言的机器自动翻译。二是技术低谷期。由于1966年发布的一份研究报告指出自然语言理解技术并未达到预期,所以自然语言理解研究陷入了长达20年的低潮期。三是技术再兴期,20世纪80年代以来,研究者发现简单地堆砌语言规则并无法真正实现自然语言的理解。通过引入大量文本数据的自动学习和统计,能够更好解决自然语言处理问题。
目前,自然语言处理技术遇到语料规模不足和语料涵盖不够两大发展瓶颈。一是大规模语料数据库建设难度较大。主流自然语言处理技术的基础是基于统计学习的,因此构建大规模语料库是提高机器语言翻译准确率的必由之路。但是,语料库建设的大部分工作都是由人工完成的,语料资源不足、人工处理工作量大是自然语言处理技术发展的主要难题。二是语料库的内容涵盖性有所欠缺。任何语料库都难以囊括单一领域的全部案例,而且语料库的标注体系往往难以把握:类别划分过粗,就难以全面细致地描述语言;类别划分过细,则标注信息过于庞大,标注效率较低。
自然语言理解方法为机器提供与人类流畅沟通的技术链接。自然语言理解技术的基本方法包括基于规则的处理方法和基于统计的处理方法。基于规则的处理方法起源于理性主义,试图用有限的、严格的规则来描述无限的语言现象,通过对一些特殊语言或语句的研究得到对于人类语言的普适认识。转换生成语法是基于规则的处理方法的代表性算法。而基于统计的处理方法起源于经验主义,侧重于从人们所实际使用的大规模语言数据中提取统计规律。贝叶斯方法、隐马尔科夫、最大熵、维特比算法、支持向量机方法是基于统计的处理方法的代表性算法。基于规则的处理方法在20世纪50年代至80年代期间,在自然语言理解领域占有重要地位。
20世纪80年代以后,基于统计的处理方法开始崛起,推动机器翻译取得重要突破,同时句法剖析、词类标注、参照消解等自然语言理解算法都把统计方法作为标准算法。相较基于规则的处理方法,基于统计的处理方法有一定优势。一是稳定性较好。基于统计的处理方法的纠错能力较强,能够在语言翻译时有效分辨出不符合语法规则的语言。而基于规则的处理方法对于固定语言规则以外的表达则无能为力。二是普遍适应性较强。基于统计的处理方法并不需要大量语言学家、语音学家、各领域专家共同参与构建一个语言规则框架,而只需要得到大规模语料的统计规律,对资源数据的细化处理要求不高。三是灵活性强。基于统计的处理方法可以根据数据统计模型对参数不断进行优化,以更好地提高机器理解语言的准确度。而基于规则的处理方法一旦确定好语言转换的规则,就很难进行动态调整。
语音识别、机器翻译、人机对话等自然语言理解技术深入拓展生活应用场景。在语音识别方面,谷歌公司向全球第三方开发者免费开放了语音识别Google Cloud Speech API,Google Cloud Speech API包含80多种语言,能够在实时流媒体或批处理模式下支持任意应用,为开发者提供全套API,使机器能够看到、听懂和翻译语言。百度公司在自然语言识别方面取得最新突破,发布了手机百度动物语意识别功能,以快速语音识别、高效语境辨析、精准预警分析、及时交互对答等功能实现对生物种类、动物意愿的辨析。宝马集团、三星集团、松下公司与语音识别系统开发商Nuance公司联合开发了车载“智能助理”技术,该技术能够准确辨识车主发出语音的有效性和语言意图。英特尔公司联合语音识别技术公司Sensory,在最新芯片产品中嵌入TrulyHandsfree语音识别技术接口,为智能终端厂商提供语音识别唤醒功能。endprint
浪潮公司与Altera、科大讯飞等公司开展合作,开发了基于深度学习的语音识别方案,利用高级编程模式OpenCL实现语音识别功能从CPU到FPGA架构迁移。在机器翻译方面,微软、谷歌等公司都在研发实时语音翻译系统,能够实现对不同种类语言的快速同声翻译。百度公司发布了融合统计和深度学习方法的在线翻译系统,通过以海量神经元网络模仿人脑理解语言的方式,实现机器翻译质量的显著提升。在人机对话方面,微软公司加快消费类声学产品研发步伐,推出了语音助手微软小娜APP。苹果公司力图拓展Siri在汽车领域的应用,收购了VocalIQ公司。
(七) 智能技术和虚拟现实技术融合发展
虚拟现实(Virtual Reality,VR)是指把计算机技术构建的三维虚拟场景再现于显示设备上的人机交互技术。虚拟现实与增强现实(Augmented Reality,AR)的区别在于虚拟场景的投射物和人的感受不同。一是投射物不同。虚拟现实中虚拟场景投射于显示设备上;而增强现实则把虚拟场景投射于实际环境中。二是人的感受不同。在虚拟现实中,人与实际环境是分割的,完全沉浸于虚拟环境中;而在增强现实中,人与实际环境是融为一体的。近两年,国外科技公司加快了虚拟现实产品的推出速度。微软公司在2014年斥资1.5亿美元从ODG购买了可穿戴设备技术,于2015年发布了虚拟现实影像技术Holograms和设备Holoenns,并最终于2016年推出了Hololens开发者版本。2014年,谷歌公司与高通公司领投头戴式显示器、触摸手套、压缩图像系统等虚拟现实设备生产商—Magic Leap公司。
Facebook公司在2014年投資20亿美元收购Oculus公司,并于2016年对外发布了虚拟现实游戏外设Oculus Rift。索尼公司于2015年发布了可搭配PS4的Project Morpheus虚拟现实显示器。英特尔公司研发了RealSense追踪技术,实现对人们手势和面部情绪的识别。三星公司联合Oculus公司打造了智能佩戴技术设备—三星Gear VR,为用户提供了电影般虚拟现实场景中的浸入式体验。HTC公司于2015年与Valve公司合作开发了设备Vive VR。国内科技公司也加快虚拟现实技术设备研发,同时更注重虚拟现实服务平台的建设。暴风影音公司于2014年推出了虚拟现实设备—暴风魔镜,围绕场景广告、游戏体验、演唱会网络直播等方面为用户提供高品质的内容服务。继2016年3月向Magic Leap公司投资7亿美元后,阿里巴巴于同年4月成立了VR实验室,该实验室将协同阿里旗下影业、音乐等开展优质VR内容生产、VR设备开发等平台建设。腾讯公司于2015年推出了Tencent VR项目,将会开发一款集成传感器和专用屏幕的头戴现实设备(HMD),该设备可与miniStation微游戏构建形成虚拟现实开发平台。乐视公司于2016年发布了虚拟现实战略,力图垂直整合虚拟现实产业价值链中的云平台、内容制作以及终端设备,并联合内容提供方打造虚拟现实内容平台。目前,乐视公司已发布了虚拟现实硬件设备—手机式VR头盔LeVR COOL1。
虚拟现实已初步形成集动态环境建模、立体显示和传感、系统开发工具应用、三维图形生成、系统集成等为一体的关键技术体系。动态环境建模技术是虚拟现实的核心技术,它通过抽取实际环境的三维数据,在信息空间建立虚拟环境模型,实现物质从物理空间到虚拟空间的转换映射。立体显示和传感器技术是用户进入虚拟世界的入口,它通过高灵敏、高精度跟踪用户表情、肢体的瞬时变化情况,为用户提供虚拟现实显示影像的环绕真实感和沉浸感。系统开发工具应用技术是虚拟现实应用创新的载体,虚拟现实系统开发工具的便利性、集成性和可操作性能够为开发者提供简便易行的开发环境和平台。实时三维生成技术是虚拟现实高品质成像的支撑,该技术的关键是在保证三维影像的构建质量和复杂度的前提下,确保图形刷新率高于30桢/秒。
系统集成技术是虚拟现实流畅运转的顺滑剂,系统集成技术包括信息同步、模型标定、数据转换、数据管理模型、识别和合成等方面,支撑了大量感知信息的处理和虚拟模型的构建。
(八) 区块链技术改变人类生活
区块链技术的本质是按一定时间窗口对信息数据进行分块,并以信息出现的时间顺序把信息区块组织成链状连接的信息记录。区块链技术改变了以往关系型数据存储模式(Oracle、MySQL、Microsoft SQL Server)和非关系型数据存储模式(HBase、MongoDb、Oracle BDB)的构建形式,形成了按时间顺序排列事件数据的“时间轴数据存储模式”。
区块链技术的初期应用主要植根于金融领域,致力于推动实体资产的数字化表征,建立一个不依赖中心机构、由全社会集体维护的分布式资产登记、支付交易体系—数字货币。目前,比特币是数字货币较为知名的实际案例。比特币诞生于2008年,是一个完全基于点对点(P2P)的电子现金交易体系,该体系可以由交易双方直接进行交易活动,而不受控于第三方交易服务机构。
区块链技术的本质是数据分布式记录、集体维护的底层数据库技术。该技术除了可承载交易数据外,还可有其它信息形式。因此,区块链的应用并不仅局限于数字货币,还可拓展至医疗服务、资产管理、出行服务等领域。
在医疗服务方面,区块链技术可以把各个医院彼此独立的病人电子病历库连接起来,构建全球共同维护的电子病历数据库。如果医生对病人身体健康信息进行更新,该更新信息就会以区块链的形式进行验证和记录,并向全网进行广播。当该病人的健康记录被再次调取时,区块链就会验证该健康记录是否被篡改过。这样,无论在全球任何地方,人们都可以随时使用储存在区块链的个人病历、生理特征数据、DNA编码序列等信息。
在资产管理方面,区块链技术与物联网技术结合可以对人们名下的房屋、汽车等实物资产进行在线虚拟化,形成“数字智能资产”。一旦债务人出现违约情况,其名下财产即可以区块链形式在线进行分布式授权与全网所有权变更登记,实现资产的一键式划转。同时,知识产权等无形资产也可以免去各种繁琐的认证手续,依托具有时间序列的区块链技术,便捷地进行知识产权的认定、查询和维权工作。
在出行服务方面,区块链技术也可以打造汽车租赁解决方案,汽车租赁只需“点、签、开”等三步即可完成。首先,顾客选择想要租赁的汽车,该交易将会被上传到区块链公共账户上;然后,顾客会在线签署一份租赁和保险协议,同时协议信息也会上传到公共账户上;最后,系统会持续维护该汽车的租赁占用信息直至交易结束。我国人民银行于2015年成立了区块链技术的专门研究团队,并在2016年1月举行了数字货币研讨会。国内企业也在金融领域开展区块链技术的应用拓展。
依托区块链技术,小蚁公司推动物理世界资产和权益的数字化登记和转让,提供基于点对点的在线登记发行、转让发行、转让交易、清算交割、清算交割等金融服务。同时,小蚁公司还可通过“区块链IPO”方式为创业公司募集资金,以完备的市场估值、股权流动性等运营机制为保障,提供股权众筹管理功能,以去中心化交易机制实现公司股权的在线交易服务。井通科技利用区块链技术为企业封装自主沉淀资金和客户信用信息,开发出了“井通企业级钱包”,为海航集团提供了集采购信息获取、资金流转、结算交付等于一体的全流程无缝连接服务,还可为集团供应商向金融机构发起的供应链融资提供支持。endprint