于洋 杨枝茂++孙宗鑫 干书伟
摘要:由于国家城市智能化的大趋势,计算机视觉作为一门新兴的学科获得了越来越多的关注,随着理论算法和技术问题的不断突破,计算机视觉也逐渐迈向了商业化的方向,本文对其关键的技术进行了阐述,并且对其商业化的方向进行了研究,并得到了一些有益的结论。
关键词:计算机视觉;图像处理;商业化
中图分类号:TP39 文献识别码:A 文章编号:1001-828X(2016)024-000-01
计算机视觉是一门综合性的学科,综合了图像信号处理、模式识别、人工智能等领域的专业知识。要实现计算机视觉的目的,首先要完成图像的处理工作,然后要完成对于图像的理解的工作。对于图像处理来说,它属于信号处理领域的范畴,对图像简单的处理包括滤波,分割和融合等。其次,要完成对于图像的理解的工作。
计算机视觉是由计算机和图像处理两个方向的知识的交叉和融合的产物,对于图像处理,主要就是两个层次:1. 像素层次,就是针对图像本身像素的灰度和颜色特征进行处理,包括压缩、分割、增强、复原,都是这一类。这几个方向已经研究的非常成熟了。2. 内容层次,从图像的像素特征找出其代表的内容,包括特征提取,感兴趣范围提取,图像理解等等,这个方面要和应用结合很强,又涉及到模式识别,人工智能,专家知识,机器学习、数据挖掘等方面。
对于图像的理解工作主要是由智能算法来实现的,智能算法比较流行的主要是机器学习算法,机器学习包括浅层机器学习和深层机器学习,常见的支持向量机、Boosting、最近临等分类器都属于浅层学习算法[1-3],而在最近几年,深度学习算法诸如深度卷积网络的算法获得了巨大的成功。其中,包括着卷积和池化两个步奏。对于池化来说,顾名思义,就是将数据分组放在一起。值得一提的是,小米研发人员取得了FDDB全球第一成绩[4]。这项以万韶华博士为首的小米团队研发的新算法就是基于深度卷积检测网络。FDDB是由马萨诸塞大学计算机系维护的全世界最具权威的人脸检测评测平台。它为来自全世界的研究者提供一个标准的人脸检测评测平台,其中涵盖在自然环境下的各种姿态的人脸。该校还维护了LFW等知名人脸数据库供研究者做人脸识别的研究。
近些年,对于只能算法的研究不仅集中在理论上的突破,同时,也有着工程应用方面的前进。在工程应用领域,很多公司也取得了长足的进展,并实现着很多工程实际难题的克服上,其应用的领域包括:1.机器视觉,主要应用在工业自动化的领域,其代表公司有瑞典的ABB公司。2.无人驾驶,主要引用在汽车工业领域,完成汽车的智能化,让汽车看懂并理解一切,其典型的代表包括特斯拉,谷歌和百度等。3.医疗器械,主要通过机器的图像理解来为计算机提供诊断的能力,实现医疗器械的智能化。其典型的代表公司有迈瑞医疗。4.智能视频监控,主要通过摄像头来完成对行人的人脸识别、犯罪跟踪、异常行为分析、甚至是情感检测。这个可以用于智能交通和公安事业用来做人流分析、犯罪预防等。5、农业,主要用于智能农业,可以将患病的饲养动物及时挑出,避免疾病的传染等。同时,也可以装备在无人机上,用来预警和监测病虫害的发生。
跟计算机视觉相关领域的国内公司有以下几个:
格灵深瞳,其公司的目标是打造自然世界的搜索引擎。格灵深瞳是一家计算机视觉与人工智能公司,致力于让计算机看懂世界,用广泛的视觉传感器网络,构建真实世界的搜索引擎。目前公司已将其应用到了安防监控和智能交通领域。格灵深瞳将三维计算机视觉和深度学习技术应用于商业领域,自主研发的深瞳技术在人和车的检测、跟踪与识别方面居于世界领先水平。该公司主推的两种产品行为分析仪和车辆特征分析系统也在很多领域得到了广泛的应用。
彩云天气,其公司的目标是通过人工智能打造分钟级天气预报。彩云天气是用人工智能做天气预报的团队。通过手机定位到用户所处的位置,利用人工智能算法,对覆盖全国的雷达图进行数据分析并预测。用户能随时得知自己所在街道的分钟级天气走势。这也将很大程度上的改变用户的体验,同时对数据分析的精准程度提出了更大的挑战。
Linkface,其公司的目标是打造全球领先的人脸检测。Linkface提供全球领先的人脸检测、识别技术服务,曾获得FDDB(Face Detection Data Set and Benchmark)人脸检测公开测试世界第一,300-W Benchmark 准确率世界第一,LFW人脸识别准确率已达99.5%以上。这个程度的人脸识别准确率已经可以与肉眼的人脸识别率不相上下。人脸识别应用在诸多领域,如身份识别和智能交通等领域。人脸识别技术也是消除用户名和密码的一个重要途径。Linkface 凭借在人脸识别领域数年的技术累积,在大数据和深度学习的驱动下,成功搭建了一套高效稳定的人脸分析系统,囊括了人脸检测、人脸关键点检出、人脸识别、人脸属性分析、活体检测等全套身份认证所需技术。
飞搜科技,其公司的目标是打造最好的在线人脸识别引擎。飞搜科技公司是一个以科技创新,自主研发,把机器学习,尤其是深度学习的研究成果应用到人脸识别、图像识别、视频内容识别等领域的高科技公司。
这些如雨后春笋般崛起的高科技公司,正代表了计算机视觉发展的方向,也将理论研究的结果付诸以实践,通过实践来验证理论研究的结果,并且开辟了许多新的方向。从这些公司研究的方向可以看出,人脸识别技术是非常重要的基础,也是很多人机交互型设备的入口,抢占这个入口,才有可能在此的基础上对技术进行延伸和扩展。
参考文献:
[1]曹莹,苗启广,刘家辰,高琳.具有Fisher一致性的代价敏感Boosting算法[J].软件学报.2013,24(11):2584-2596.
[2]李岳云,许悦雷,马时平,史鹤欢.深度卷积神经网络的显著性检测[J].中国图形图像学报.2016,21(1):53-59.
[3]芮挺,费建超,周游,方虎生,朱经纬.基于深度卷积神经网络的行人检测[J].计算机工程与应用.2016,52(13):162-166.
[4]白彦壮,郭磊,殷春红.企业家精神驱动下自主知识产权品牌成长机制研究[J].2015,32(12):79-85.
基金项目:国家青年自然科学基金(批准号:61501134)和国家青年自然科学基金(批准号:11304056)资助的课题。