谢德刚
(上海互教智能科技有限公司 上海 201203)
人工智能算法建立于20世纪中期,目前人工智能算法已经发展出许多不同的种类,但有些类型的算法在实际的使用过程中还需要调整与改进。通常情况下,人工智能算法的工作机制为:人工智能算法的控制者向计算机输入一些信息,通过计算机模拟人类的一些想法,计算机依据算法开发者规定的特定程序对信息做出处理,输出相应的指令来解决问题。通过这种运算形式,人工智能算法可以帮助人类解决很多问题。
智能化是人工智能算法发展的前提与核心,尤其在大数据出现以后,人工智能算法的发展速度得到了进一步提升。在当前这一时期,全球大数据数量不断增长,相关人员在处理数据的过程中势必会使用到人工智能算法技术,这在一定程度上促进了人工智能算法的发展。人工智能算法可以高效地对大数据进行处理,大数据与人工智能算法的协同发展,能够在一定程度上引导人类社会的进步。在当前这个全球依靠大数据与高新技术手段发展的时代,人们利用人工智能算法处理数据与其他信息,相关人员在使用人工智能算法的过程中,通过了解与掌握算法的运行机制原理与方法,能够更加高效、快捷地处理工作中的各项问题,同时也能够发现人工智能算法中的不足,合理地对人工智能算法的工作机制等方面做出相应调整[1]。
在使用人工智能算法的过程中,可以将算法视为人们重新了解并认识自己的一种方式,并利用算法来处理不同种类的计算问题,使社会系统更具有规范性。人工智能算法运行的基本机制就是由开发者定义出一个特定的计算程度,在使用算法的过程中,将需要处理的数值与信息进行输入,算法通过计算机等设备按照规定的程序对数值与信息进行处理,输出计算的结果,因此算法具有一定的稳定性。
在实际生活中,也存在着许多种类的算法,例如计算机程序、硬件设备、软件设备以及语言系统等,都属于算法技术。同时,不同类型的算法也可以应用于不同的运算或程序当中,比如:在矩阵运算、多项式计算、近似算法、线性规划、字符串匹配、计算几何学等数学问题当中,这些方面都运用了算法。算法技术在建立之后经历了许多年的发展与创新,在当前这个法制社会时代,人工智能算法在法律的变革等各项活动中起到了十分重要的作用,因此人工智能算法可以在一定程度上影响国家政治策略的制定,影响人们的工作和生活[2]。算法已经深入人们生活的各项活动当中,分治算法的设计过程如图1所示。
图1 分治算法的设计过程图
K-means 算法又被称为K 均值算法,该种算法属于非监督学习当中的一种井点聚类算法,该算法依据核心理念是将相同的事物分为一类,并将其进行标注。K均值算法的运行机制如下:第一步,利用随机的方式选择k个样本作为原始聚类中心;第二步,测算出所选取样本与聚类中心的距离,按照距离的远近程度将样本分配给与其距离最近的聚类中心;第三步,再次测算聚类中心,完成计算工作后重复第二步操作,当样本中的每一个对象都符合最终的终止条件后,方可停止计算。
K-means 算法可以应用在许多的工作当中,在文本识别的工作与图像分割的工作中,都可以使用该种算法进行工作,同时,若在其他可以运用聚类方式进行工作的场景中,也可以使用该种算法对数据以及信息进行相应的处理[3]。
k-NN算法即k近邻算法,属于监督学习中的分类算法,其运行原理是将标注好的信息与数据及进行归类。该算法的运行原理为规定集中对象D,通过计算得出与其差距最小的k 个对象,并将这些数据视为元素编写成集合E=[e1,e2,…,ek],若集合E 中的元素大部分的为一个种类,则可得出结论D也为该种种类。
该算法具体的使用方法如下:第一,选取m个需要分类的初始数据,并规定k 的初始值;第二,将每个数据最邻近的数据编写为集合E={E1E1…Em};第三,判断集合E 中元素的种类;第四,计算误差,规定新的k值,重新进行第二、三步与第四步的工作,当误差率达到预期时,选用误差率最小的k的数值。
k-NN算法通常情况下使用于文本分类工作、模式识别工作、聚类分析工作等,同时k-NN算法也被用于保险等行业的工作当中。
Apriori 人工算法属于挖掘频繁项集算法,GSP、FP-Tree、CBA等其他人工智能算法均由Apriori衍生而来。Apriori算法的运行机制原理如下:第一步,规定支持度阈值;第二步,对数据集中的所有数据进行统计,统计相同数据出现的频率,计算出其支持度;第三步,删去小于支持度阈值的数据,将其余的数据编写成二项集;第四步,重复上述几步的工作,编写出三项集;第五步,重复上述工作,至k项集为k+1项集。
目前,Apriori 算法大量使用于线下购物数据集与网络电子购物数据集等[4]。
按照概率统计对人工智能算法进行分类,人工智能算法可分为隐马尔可夫模型、逻辑回归、最大期望值算法以及PageRank 算法等类型。HMM 隐马尔可夫模型是以马尔可夫链为基础建立的一种统计模型。其运行机制原理为:现今某一时刻,某事物的发生概率,只与该事物在过去的状态有关。在实际的工作与生活中隐马尔可夫模型的运行机制原理存在许多不合理的地方。因此,隐马尔可夫模型算法的开发者在该算法中添加了一些隐含因素,用以确保利用该形式的人工智能算法得出的计算结果更符合事实。例如:在股市的预测工作当中,若前一天情况较好的为A市,但证监会在后一天公布了某些不利于股市的消息,那今天A 市的概率就会随之降低。
当前这一时期,隐马尔可夫模型已经被应用于语音识别工作、天气预测以及DNA测序工作当中。
逻辑回归是利用线性回归计算方式的基本原理,在收集信息与数据并对其进行分类的过程中,使用最小二乘法。在对离散型较高的信息与数据进行分类时,线性回归算法具有一定的局限性,但逻辑回归算法在线性回归算法的运行机制原理中,将Sigmoid函数融合其中,此种方式能够更好地对离散型较高的信息与数据做出处理。
在预测以及判断某些数据与问题时,尤其在一些医学行业工作当中,人们通常使用逻辑回归算法来处理相应的问题。
最大期望值算法是在保留极大似然估计原理的基础之上,对某些计算方式做出一些科学的调整。极大似然估计算法的原理为:若输入该算法中的数据能够最大化地体现样本概率,则将该数据视为真实数据;并且按照已知的条件建立似然函数关系,利用求导的方式计算出参数的数值。
最大期望值算法的运行原理机制与极大似然估计算法有所不同,第一步,使用隐藏变量的方式测算出初始期望值;第二步,建立最大似然估计方程;第三步,将初始期望值代入最大似然估计方程中,并不断重复方程计算出最大期望值。
在参数的优化与求解的工作当中,通常使用最大期望值算法进行计算。
PageRank 算法又称网页排名算法,其运行机制原理较为简单。通常情况下,若某个网页的被引用率较高,则其等级就相对较高;若等级较低的网页被等级较高的网页引用,则被引用的网页的等级将会提高。
该人工智能算法通常被使用于网页排名工作当中。
在当前这一阶段,大数据平台丰富了线上电子商务行业的经营,同时人工智能算法也被应用于该行业与其他高新科技的工作当中。网络平台作为一个信息数量与用户数量较大的平台,需要使用人工智能算法技术对平台用户注册信息与其他数据等进行处理与分类,以保证平台的长期稳定发展。因此,人工智能算法技术若想满足使用者的需求,就需要算法编写人员不断对算法做出完善,利用大数据对各类信息进行分析与处理。虽然人工智能算法可以帮助使用者提高处理数据的效率,利用科学的方式对某些问题进行分析。
人工智能算法随着时代的发展而不断变化,当前,人工智能算法已经被广泛地应用于电子商务行业以及许多网络社交平台。算法的开发者或控制者利用人工智能算法的程序对平台中的各类数据进行归类与分析,保持各平台的稳定与正常运行,使用算法分析得出的结果,精准地向平台用户推送各类信息。因此,人工智能算法正在潜移默化地影响着人们的思想与行为。
人工智能算法利用计算机等媒介,通过对当今事物信息的学习,利用开发者编写的特定程序,能够精准地分析某些问题,尤其在学习以及推送等工作中,算法有着巨大的优势。比如:微信、抖音以及今日头条等网络媒体平台,都在利用算法对平台的内容以及用户的信息进行分析,以保证平台能够精准地为用户推荐相应的网络内容,持续吸引平台用户。人工智能算法技术与传统的新闻媒体时代所应用的推送方式不同,人工智能算法能够高效地结合大数据对信息与数据进行有效的分析,该技术的学习能力与信息处理能力更为优秀,促进了网络各平台的发展。
通常情况下,传统的媒体行业都是通过人工筛选的方式来挑选新闻内容,播出的内容能够体现新闻行业的价值取向。但在网络社交方式出现后,人们需要自主对某些价值取向较差或不感兴趣的信息进行过滤。同时,某些具有不良价值取向的信息也出现在社交平台上,还影响了社会的安定与发展[5]。
对此,相关技术人员利用人工智能算法与大数据相结合,对网络平台内容与用户行为数据进行了科学的分析与处理,分析出每一位平台用户的喜好,为其推荐他们喜欢的视频与新闻等内容。此外,人工智能算法还能够根据用户喜好内容的信息与数据,合理地将平台使用者归类,向拥有不同喜好的用户群体推送相应的信息,使平台使用者可以更加快捷地接收到自己想获得的信息。这种现象与澳大利媒体专家Axel-Bruns的观念吻合,当新闻媒体平台的使用者数量极大时,平台引导用户对新闻进行讨论的能力就会变弱,平台若要生存就必须了解用户的喜好,并向其推送相关的信息。虽然人工智能算法可以实现满足用户需求这一目的,但此种方式在一定程度上控制了人们的思维。
在一定程度上来讲,人工智能算法利用了控制与逻辑,可以被视为编程,其运行机制原理大多数为编写一个能够解决某一类问题的演绎推理逻辑程序,输入问题、信息或数据,人工智能算法利用计算机与大数据等,按照程序解决问题。此种形式使人工智能算法在本质上,通过机器学习的方式对用户信息及数据等进行收集、分析与归纳,再通过固定的模式计算得出一个较为精准的结果。并且,人工智能算法的开发者还会不断依照时代与技术的发展,对算法程序进行更新,这保证了算法能够持续进行学习,保证了算法的精确度。同时,大数据技术的推进,使人工智能算法在对不同种类的信息进行分析时,拥有更加完整且可靠的数据样本,这也推动了人工智能算法的发展。因此,网络媒体平台利用人工智能算法进行数据的处理,能够为用户持续推送符合其兴趣爱好的信息。
人工智能算法技术与传统新闻媒体使用人工挑选信息的方式有本质上的区别。人工挑选信息更注重信息的价值取向,而利用人工智能算法技术向网络媒体平台使用者推送信息,更加注重平台使用者的兴趣爱好,往往忽视了传播内容的质量。并且,通过人工智能算法收集并分析到的用户喜好,是人工智能通过程序计算而出的,并非用户的真实喜好。人工智能算法会将拥有相同喜好的用户分为一类,在推送平台内容的过程中,某些用户可能会接收到该群体内其他用户喜好的内容。
其实,人工智能算法也存在着一定的价值观偏向,这种价值观偏向一般源于人工智能算法开发者的底层逻辑。通常情况下,算法开发者在编写算法的过程中,将自己的层逻辑中的一些思想带入算法当中,而算法的运行机制原理就是通过特定的系统与程序以及对外界知识的机器学习,对数据与信息做出相应的计算与处理,从而解决问题,导致算法在运行的过程中受到开发者底层逻辑的影响,得出的信息与数据会存在一定的价值观倾向。并且,用户在平台中的反馈的信息等也存在主观的价值倾向,这加重了人工智能算法在处理问题时产生的价值观倾向问题。这些问题导致互联网平台使用者在无形之中受到了人工智能算法的价值观倾向的影响,用户的思想与行为在一定程度上受到了人工智能算法的操控。
在对语音、图像以及文本等信息进行处理时,需要将这些内容转化为计算机能够辨识二进制的数据,人工智能算法利用计算机系统对这些数据进行分析与处理,提取数据中具有一定特征的信息,并将这些信息进行分类,在提取数据信息的过程中,出现了许多高效快捷的方法。
特征提取方法通常情况下就是利用二维矩阵转化的方式,将不同的图片数据提取为二维矩阵。比如:灰色的图片会被处理提取为具有一个通道的二维矩阵,彩色图鉴会被处理提取为具有3个通道的二维矩阵。
对于文本信息而言,可以利用统计的方法中的词集和词袋模型、熵概念当中的信息增益法、神经网络当中的词向量模型、独热编码的独热模型等方式,对文本进行数据化信息处理。当前,对文本的数据分析处理,最好的方式为词向量模型法。并且,在处理语言信息的过程中,通常都使用该种方式,对文本数据进行系统化的分析。
在使用特征提取法进行数据的转化与处理的过程当中,通常都会遇到特征分散或范围过大等问题,因此人工智能算法开发者与使用者应改进数据收集与处理的方式,使用SVD 与PCA 等降维方法,以及注意力机制法等关键特征提取方法[6]。
综上所述,人工智能算法的运行机制原理与方法值得人们进行了解与研究。在现今的社会环境当中,人工智能算法甚至能够改变人类社会与人类自身的一些思维与行为模式。现代社会越来越重视技术的发展与使用,在新型技术与人工智能算法的影响下,社会整体逐渐走向了智能化,社会智能化已经成为一种常态。此外,人类自身的发展能够直接影响人工智能算法的发展,人类对智能生活与智能工作的不断追求,是促相关技术人员不断改进人工智能化算法的原因之一。因此,相关人员应更加了解和掌握人工智能算法的运行机制原理及方法,将人工智能算法与其他高新技术相结合,使人工智能算法能够更好地服务于社会。