人工智能与机器学习

2021-05-20 15:29徐跃勇
成功密码 2021年6期
关键词:标签机器特征

徐跃勇

人工智能是当今的一个热点话题。人工智能与机器学习有什么关系?机器是如何进行深度学习的呢?我们一起来了解一下人工智能与机器学习,揭开人工智能的神秘面纱。

机器学习是一种试图让计算机像人类一样学习获得知识与技能,并像人类一样感知世界、认识世界的技术。

小孩在成长过程中,通过接触外部世界,形成对各类事物的认知,例如,当有人跟你提到狗时,你的头脑会想到什么?你的大脑会有一个狗的特征模型,那么我们经过什么样的过程才能在大脑中形成狗的特征模型呢?脑科学家们进行了大量的研究,试图揭开人脑活动的秘密。但到目前为止,对人类的大脑,我们知道的还很少。关于人是如何学习的问题,科学家们看法各异。我们试图从小孩认识狗的过程描绘人类学习的过程模型,以便于理解机器学习的过程。但它还仅仅是一个建立在现有认识水平上的推测模型,人类学习的科学描述需要青年们在未来的研究中去探索。

计算机“能听会看”源于机器具备了学习能力。计算机也能通过对某一对象的图片、声音、文字等内容学习,建立起对该对象的特征模型。计算机建立某一对象的特征模型需要大量技术与方法的支持才能实现。计算机不同于人,并不能自己形成动物的外貌特征模型。我们必须提前设计和开发狗的外貌初始特征模型,然后利用大量的动物图片对计算机中动物的外貌特征模型进行整合,最终计算机才能得到狗的外貌特征模型。

笔者所在的学校于2020年9月创建了人工智能实验室,该人工智能实验室采用的是Intel的机器人,该机器人采用的是linux操作系统,使用python软件编程,自带小电脑,可以直接在机器人上调试操作,也可以远程操作。该机器人能够自主学习,通过识别二维码、实物就可以辨别不同的东西,并能自主导航,还能够对人体结构进行辨别,可用于人脸识别,可以进行二次开发。

人工智能就是通过大量的数据模型的训练,能对未知的事件进行决策和预测,所以具备了一定的人的“智能”。

一、机器学习算法与传统基于规则的区别

机器学习与传统的为解决特定任务、硬编码的软件程序不同,传统解决问题方式的代码是逻辑判断,通过制定逻辑规则来解决问题,不具备智能。机器学习则是用大量的数据来“训练”,通过各种算法从数据中学习如何完成任务。

二、什么时候该使用机器学习

机器学习可以使机器变得智能起来,那么我们应该在什么情况下使用机器学习呢?当一个问题的解决方案很复杂,或者问题可能涉及大量的数据却没有明确的数据分布函数的时候可以使用机器学习。比如,我们没有办法通过以往的编程方式让计算机去识别人脸,也没有办法给时刻变化的问题进行编程,像生产线上的瑕疵检测,股票或者彩票这种数据跟随时间变化的问题,通过硬编码进行解决效果不好,通常这些问题我们需要通过机器学习来解决,使预测效果更优。

三、机器学习解决的主要问题

机器学习可以解决很多问题,总结有以下几个最经典的类型:

(1)分类问题:通过数据训练,让机器能够认识新东西。比如手写数字、人脸识别、物体识别等。

(2)回归问题:通过模型训练,对未知结果进行预测。比如股票预测、房价预测等,通过回归模型可以预测未来房价或者股票走势。

(3)聚类问题:类似分类问题,但是也有很大的区别。分类问题,对于训练和测试的数据类型、数量、名称都是确定的。聚类问题不清楚具体的类型数量以及名称,需要根据经验来分类。常见应用如照片分类等,可以把模糊照片、风景照、人像照形成单独相册。

四、机器学习分类

机器学习是一个很复杂的学科,下面又分为监督学习、无监督学习、半监督学习和强化学习。监督学习、无监督学习和半监督学习是根据训练数据的标签来分的,每一个样本数据都有对应的标签。无监督学习则是没有对应的标签,例如聚类问题,有一堆图片,但是没有标签,通过模型训练,可以将这堆图片根据规则分成两类、三类或者多类,但是每类结果标签不知道。而半监督学习介于监督学习和无监督学习之间,训练的样本只有部分有对应的标签。强化学习跟标签没有关系,强化学习主要是通过智能体状态改变后环境反馈的奖励信息去进行训练。有了大致了解后,我们对每种类型再做一个详细的介绍。

如有三个样本,分别是苹果、梨和香蕉,通过监督学习算法进行模型训练,如果拿一个新的苹果,只要符合苹果的特征,就能进行正确的分类。

计算机进行监督学习形成狗的外貌特征模型需要以下三个核心环节。

(1)准备数据。需要准备大量用于训练的狗外貌特征模型的图片。

(2)训练模型。当我们把大量的图片输入计算机的同时,还要把每张图片标记为“是狗”,计算机会把“是狗”这种标记对应到所有输入的图片上。这些标记过的图片形成了狗的特征模型训练数据。计算机提取训练数据的特征,并且建立特征和标记之间的关系:具有这些特征的图片是狗的图片。给计算机输入图片数据并标记“是狗”的过程就是监督学习的过程。

(3)验证模型。模型训练完成后,我们再给计算机输入不做任何标记的图片数据。这些不做标记的图片数据叫做测试数据。计算机提取测试数据特征,然后与最近一次的狗的外貌特征模型进行对比,判断新输入图片的特征是否在狗的外貌特征模型識别的范围内,根据对比结果输出是否是狗的判断。我们根据计算机的判断结果做出狗的特征模型是否训练成功的结论。

1.监督学习

监督学习主要应用在回归问题和分类问题上,回归反映了样本数据的属性值特性,也就是通过函数来表达样本数据与标签的依赖关系。如可以根据以往每周的股票收益来预测下周的股票收益等。分类主要是将样本数据映射到某个给定的类别中,比如给机器10张猫的照片,告诉机器这是猫,以后机器再遇到猫的时候,就能通过模型得出是猫的结论。再如,根据道路车流量等交通数据的分析对明天交通情况预测。通过比较10元代金券或者75折消费哪个更优惠,可以判断哪种方式更吸引顾客。

2.无监督学习

无监督学习只有样本,没有标签,而如何进行分类需要人为指定,训练是通过样本内部特征的相似性。

比如不同年龄段男女进行游戏充值的情况,我们根据数据分成两类,模型可根据性别信息,或者年龄信息进行分类。

无监督学习通常用来解决聚类问题,如,哪些观众喜欢同一类电影,会根据观众观看电影的信息,对观众进行分类。

3.半监督学习

半监督学习样本只有部分标签,比如有一万张猫的图片,一万张狗的图片,但是猫跟狗的标签都不完全,猫可能有400张图片有对应的标签,狗有600张图片有标签,通过对有标签的样本进行训练,得出模型之后,用这个模型去预测没有标签的图片,然后将预测的结果作为伪标签再去进行后续的训练。

4.强化学習

强化学习,又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。

强化学习可以让机器能够像人一样通过不断地试错积累经验。比如自动驾驶的汽车,在遇到黄灯闪烁的情况下,是刹车还是加速通过?可能经过无数次的尝试以及奖惩机制,可以得出结论:刹车比较安全。

五、机器学习基础算法及相应软、硬件

机器学习现在已经有了很多算法,这些算法在应用领域都取得了非常好的效果。

1.机器学习软件及发展

机器学习中需要对大量数据进行处理和计算,比如复杂的神经网络中可能需要计算十几万个权重参数,同时机器学习的很多算法已经很成熟了,在简单的一些应用上,可以直接使用,这会导致一些算法写很多次。为了避免这些情况,很多大公司都推出了自己的机器学习框架,这些框架中集成了很多机器学习算法,我们只需要调用传递参数就可以了。

人工神经网络和深度学习是实现机器学习的技术。

人体内有大量的神经网络,也叫神经元。神经细胞通过相互联系构成了一个功能强大、结构复杂的信息处理系统——人体神经系统。人们能够思考并从事各种很难的工作,就是因为我们身体内部有许多微小的神经细胞,它起着很大的作用。

科学家受人体神经细胞的启发,把每个神经细胞抽象成一个叫作神经元模型的基本信息单元,把许多这样的信息单元按一定的层次结构连接起来,就得到人工神经网络。但人工神经网络的信息处理能力距离人体神经系统处理信息能力相差甚远。人工神经网络的种类很多,有卷积神经网络和循环神经网络等,不同的算法其实现用途是不同的。

2.人工智能软件(库,框架)

框架将参数计算,神经网络搭建等变成了简单函数,大大降低了人工智能的开发难度,使不具备很专业的人工智能知识的人也能借助框架快速搭建自己的神经网络。

3.机器学习、深度学习硬件

人工智能第一次浪潮因为计算机算力的问题而终止。但是现在,我们有高性能的CPU、GPU、FPGA芯片以及AI专用的芯片组件。这些硬件设备保证了人工智能的硬件环境。如GPU提供了快速的浮点运算,可以大大缩短神经网络训练时间。

机器学习是人工智能领域的核心技术,是使计算机具有人工智能的重要方式。它已经应用在人工智能的各个领域。机器学习同时作为人工智能最有效的实现方式,已经在教育、医疗和工业等众多领域得到了广泛的应用。作为人工智能教师,我们要不断学习人工智能的知识,充分了解并掌握好机器学习和深度学习模式,并应用于教育教学中,为教学服务。

猜你喜欢
标签机器特征
机器狗
机器狗
抓特征解方程组
神奇的独眼机器
让衣柜摆脱“杂乱无章”的标签
科学家的标签
科学家的标签
春天来啦(2则)
标签新闻
抓特征 猜成语