人工智能与计算机视觉产业发展思路探讨

2020-03-16 08:27罗术通郝鹏
科技创新导报 2020年35期
关键词:计算机视觉神经网络人工智能

罗术通 郝鹏

摘  要:科学技术的进步为人们探索人工智能领域提供基础支撑,作为人工智能领域中的重要分支,计算机视觉产业的发展愈发受到人们的重视。发展计算机视觉技术,可以让人工智能具备类人似的视觉功能,目前人们对计算机视觉的研究,已经在人脸识别、图片识别等方面取得一定成效,并且在科学技术日益更迭的背景下,计算机视觉的应用会更为普及。本文立足于计算机视觉与人工智能发展的分析,在此基础上阐明人工智能领域中计算机视觉技术的具体应用。

关键词:计算机视觉  发展  神经网络  人工智能

中图分类号:TP393                            文献标识码:A                    文章编号:1674-098X(2020)12(b)-0004-03

Abstract: The progress of science and technology provides basic support for people to explore the field of AI. As an important branch in the field of AI, the development of computer vision industry has been paid more and more attention. The development of computer vision technology can make AI have human like visual function. At present, people's research on computer vision has achieved certain results in face recognition, image recognition and so on. Under the background of the increasingly changing science and technology, the application of computer vision will be more popular. Based on the analysis of the development of computer vision and AI, this paper expounds the specific application of computer vision technology in the field of AI.

Key Words: Computer vision; Development; Neural network; AI

人工智能自問世到世人皆知,期间发展年限较多,但取得的成效十分显著。人工智能的发展不仅是推动社会进步的重要一笔,更是人类迈向智能时代的关键基础。对此,进行人工智能与计算机视觉产业的研究具有至关重要的意义。

1  人工智能概述

人工智能简称AI技术,自问世后便成为我国乃至全世界的关注焦点。随着资本市场的进入,进一步推动人工智能的发展。自2005年到现在,东方财务通过数据调查统计表明,A股榜首为192家相关研究机构,这就意味着各大机构的研究重点纷纷转移至人工智能产业。截止到目前,国内外诸多大型企业已经着手对人工智能产业的布局,如阿里、腾讯、联想、英特尔等。相关公共资料表明,2016年我国在智能硬件等相关智能领域的总投资额超过172亿元[1]。

诸多学者对人工智能的发展做出预测,其中尤瓦尔·赫拉利提出,在未来发展中,人类会依托于人工智能技术来实现身体改造,通过对身体结构的智能改造,帮助人类挣脱出生化反应的限制。这表明未来社会中,新技术与生命科学的融合势必会成为一大研究热点。但是纵观现阶段人工智能的发展,大部分人对人工智能的应用仍缺乏认知,如何借助人工智能技术来转变、优化产业发展,是现阶段我国社会及其产业发展的关注重点[2]。

2  人工智能市场切入点分析

人工智能属于广义的大概念,目前我国对人工智能领域的研究已经取得一定的成效。立足于人工智能驱动角度,现阶段智投资、智能驾驶、智能语音识别均为该领域中热门的研究分支。

以消费金融领域为例,在发展过程中合理引进深度学习算法、大数据技术等,可实现智能控制与智能风险预防。例如互联网金融消费者可依托于模型与算法的应用进行风险评估,以大数据为基础,实现对借款人信用风险的智能评估,达到有效防控金融风险的目的[3]。在此基础上,借助相关智能技术可实现自动转账、数据传输、信用积累等功能的提供。而作为人工智能的重要分支之一,计算机视觉的应用目前已经在多个领域取得成效。自2010年深度学习算法的问世,为计算机视觉的创新与优化打下良好基础,也为计算机视觉多领域、多产业的应用提供支撑。

3  计算机视觉产业及其衍生品概述

尽管立足于技术分类角度上而言,机器视觉与计算机视觉属于同一科目,但是二者存在本质区别,计算机视觉的研究重点在于软件开发,具体是进行算法的研发,进而达到图像分析的目的。而机器视觉则是软件和硬件的综合研究,包括算法研究、镜头控制设备研究、图像采集设备研究等。并且,以不同视角去看待二者的区别,计算机视觉的侧重点在于阅读后进行分析技术的研究,而机器视觉则是以识别为任务进行操作的研究。

现阶段我国对于计算机视觉技术的研究仍处于理论学术阶段,尚无法做到对该技术的规模化。但是因计算机视觉的研究已经经历多年,所以诞生诸多高价值的技术原理与理论依据,例如近几年在计算机GPU等方面已经开始尝试对计算机视觉技术的应用[4]。

纵观现阶段该技术相关的衍生品,其中个别产品的研发效果显著。如2010Kinct在微软诞生,该技术具备拟人功能,即通过运用核心技术进行人体运动的捕捉和模拟,通过对玩家动作的模拟,实现玩家可通过肢体动作来与电脑互动。随后,各大企业开始纷纷在该领域投入更多精力与资源,如苹果、谷歌等企业开始加大对深度应用相机的研发力度。尽管各大企业对基础应用的研究取得一定成效,且进展十分顺利,但是在市场投放时屡遭困难,无法将深度视觉技术作为单一产品实现大规模投放。

再如RGBD摄像机,市面上常见摄像机类型为RGB,其功能体现为可见光三原色的分辨,而RGBD摄像机则可以作为常规相机的强化版,增设深度信息加工技术后可实现主动、被动探取,达到获取深度图像信息的目的。RGBD摄像机在工作时,会依据探测光发射来实现目标的探测,并按照接收信息来完成被动接收,无需通过发射能量来获取目标信息[5]。分析该技术应用原理,主要是将摄像头安设于不同的两个位置,以图像特征点的差异位置为依据来获取信息。此原理类似于人眼感知,但是在实践应用中尚存辨识度低的问题,且必须在标准光线下进行。

4  计算机视觉研究要点分析

针对计算机视觉的研究,目前仍以图像理解为该领域的主要研究任务,包括对视频、单多幅等类型图像的处理,所以计算机视觉产业的发展的主要服务目标也是图像的理解與处理。

不同图像类型的理解方式不同,其中单幅图像的处理囊括目标检测、场景分类、语义分割、图像分类等;多幅图像处理则以三维重建为主;视频图像理解则是以目标跟踪为主。当然,语义分割、图像识别等在视频图像理解中同样有涉及。

(1)场景分类。

场景分类主要是对不同场景的识别,包括室内外、山地与城市、厨房或起居室等方面。

(2)目标识别。

理解时主要目标为图像类别的确定,或者是识别图像是否与某物体、物质、目标之间存在关联。

(3)目标定位。

理解时对目标的位置进行精准定位,此类理解方式多应用于单个目标的理解。

(4)目标检测。

理解时以图像位置的确定为主要任务,在识别过程中确定目标的具体类别,从任务目标角度而言,目标检测为目标定位、识别的综合体[6]。

(5)语义分割。

作为图像理解中的特殊性分类,需要在理解过程中进行图像像素点的针对性分类,做到对每个像素点进行目标类别的精准给定。

(6)三维重建。

所谓三维重建,是指空间物体以视网膜成像的二维图来进行恢复,通过将二维图恢复成三维表面形状来达到三维重建的目的。而在图像理解中,三维重建则是指以单、多视图为依据进行三维信息的重建。

(7)目标跟踪。

主要是依据视频图像序列的处理与分析来完成目标跟踪,基于复杂背景下,进行运动目标的确定,然后预测目标在运行过程中存在的规律,并以此为依据来实现对目标的跟踪与检测[7]。

5  计算机视觉的人工智能应用场景

自深度学习问世后,计算机视觉得益于深度学习的充分应用而取得巨大进展,其分类、检测等方面的精准性因深度学习算法的充分应用而得到提升,以此为计算机视觉技术在各个人工智能场景中的应用打下良好基础。目前,计算机视觉在以下人工智能场景中的应用取得较好成果。

5.1 安全领域

安全领域中计算机视觉的应用,主要体现为智能监控与智能身份识别等方面。目前,我国在视频监控网方面的建设遥遥领先,安设的摄像头数量超过2000万个,以其中的道路智能监控网为例,在具备机动车、非机动车监控功能的同时,能实现对行人的有效监控,包括对行人性别、穿着、身份的识别。以Sense Video系统为例,该系统的功能齐全,包括车辆分类识别、行人监测等,可实现运行期间进进行区域内行人、车辆的实时跟踪、抓拍、检索等,通过强大的数据分析能力,为密集高峰期的车辆识别、抓拍等提供基础支撑。再如Face++系统,该系统的主要使用场所包括火车站、机场等场合,其所具备的人脸识别功能可做到实时的大规模检测。系统运行期间,可实现对人脸的精准识别,正确鉴别出人的年龄、性别等。与此同时,将人脸识别信息与罪犯数据库进行比对,可以实现对罪犯的有效识别,为打击犯罪事业的开展提供帮助[8]。

5.2 营销及其娱乐领域

随着人们对手机照相需求的不断提高,近几年推出各种多功能照相软件,以“faceu美颜相机”为例,该软件可以在照相时为人们提供丰富的贴图、道具功能,如照相时为对象提供帽子贴图,或者是夸张的放大对象的眼睛。而这些功能的实现离不开对计算机视觉的影响。通过为其提供人脸检测、识别技术,实现精准识别对象五官,并在此基础上提供贴纸、放大五官的功能。再如小米手机提供的“一人一相册”功能,此功能主要是依据对人脸的识别来实现相册分类,将云端或者是手机本地存储的相册进行智能分类。

此外,其他企业也依托于计算机视觉技术的应用开发出诸多趣味应用,以“How-old.net”软件为例,首先将照片上传于电脑中,然后利用此软件可实现对对象外观年龄的判断。再如“微软我们”软件,将带有人物的图片上传于电脑中,此软件可通过人脸识别与分析,判断人脸之间的相似性。此外,Celebslike、Fetch等软件也通过应用计算机视觉,为人们提供丰富且趣味的功能。

而针对计算机视觉在营销领域中的应用,以YI+为例,可以实现用户的边看边买,再如优酷平台,充分利用计算机视觉,可实现用户观看电影过程中进行明星同款物品的购买。或者是依据对视频内容的分析,智能投放相应广告等,提升广告投放的契合性,避免用户在观看电影时对广告的投放产生反感[9]。

5.3 金融领域

京东钱、拉卡拉、借贷宝等软件中均存在计算机视觉的身影,通过人脸识别技术、证件识别、身份认证等技术,进一步提升金融软件的安全性,并为用户提供更为智能、多元的金融服务。

6  结语

综上所述,目前我国对计算机视觉与人工智能领域的研究,已经取得初步的成效与成果,人类也因人工智能的不断发展而迈入新的纪元。对此,应继续加大对人工智能与计算机视觉的研究力度,以期通过计算机视觉的广泛普及来推动社会发展。

参考文献

[1] 刘赟,周爽.人工智能与计算机视觉产业发展[J].现代商业,2017(24):20-21.

[2] 王芳芳.计算机视觉在人工智能领域的应用和发展概述[J].科学与信息化,2019(27):15.

[3] 寿伟义,章正平,潘学冬,等.杭州市人工智能产业发展现状及对策研究[J]. 杭州科技,2017(2):11-15.

[4] 黄伟.计算机视觉技术及产业化应用态势分析[J]. 信息通信技术与政策,2018,291(9):66-69.

[5] 陈维维.多元智能视域中的人工智能技术发展及教育应用[J].电化教育研究,2018,39(7):12-19.

[6] 张鹏.亚信软件应江勇:人工智能关键不在技术而是如何结合业务[J].通信世界,2017(31):47.

[7] 陈小亮,陈彦斌.发展人工智能的产业政策存在的问题与调整思路[J].人文杂志,2019(11):25-32.

[8] 胡诚,朱奥琪,李成.关于人工智能在计算机视觉及网络领域中的应用[J].数字化用户,2019,25(16):150.

[9] 卢娜,陈劲佑.人工智能时代计算机视觉中若干问题实现技术研究[J].数码世界, 2020(5):9-10.

猜你喜欢
计算机视觉神经网络人工智能
神经网络抑制无线通信干扰探究
人工智能与就业
危险气体罐车液位计算机视觉监控识别报警系统设计
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定