认知计算与智能设计研究综述

2022-04-25 07:16赵乐杨观赐徐杰王猛何玲陆丰
包装工程 2022年8期
关键词:联网图像模型

赵乐,杨观赐,徐杰,王猛,何玲,陆丰

(贵州大学 现代制造技术教育部重点实验室, 贵阳 550025)

随着“工业互联网”和“工业4.0”的提出,智能制造技术备受瞩目,得到迅速发展和应用[1-2]。《中国制造2025》中指出:要大力推进制造业的发展,加快信息技术与制造技术的深度融合,将人工智能技术引入传统制造业中,实现产品生产自动化和智能化。设计作为一项创造性决策活动,是一个典型的解决定义不良问题的认知过程,认知在创造性设计活动中有着举足轻重的作用。目前,认知科学及其信息处理方面的研究已被列入国际人类前沿科学计划(Human Frontier Science Program,HFSP),设计工程领域的认知计算也因此进入研究者的视线。认知计算(Cognitive Computing,CC)研究人类的认知行为,如记忆[3-4]、学习[5]、思考[6]及问题解决[7],并将人类的认知行为与智能计算方法相融合,进而建立计算认知模型的理论和技术方法,从而能够运用智能算法和大数据技术解决高度复杂的问题[8-9]。认知计算与智能设计的结合,将具有多元化、非完整和非结构性的认知信息转换成设计中所需的结构性的要素,助力于设计的创新已成为学者们关注的重要内容[10-12]。

文中围绕认知计算与智能设计,从用户需求分析、机械创新设计、图像生成、疾病诊断、在互联网上的应用、产品评价共6 个方面,对认知计算与智能设计进行综述,为读者更好地把握认知计算和智能设计的研究现状提供帮助。

1 基于认知计算的用户需求分析

需求分析占据产品设计中的首要地位,在产品设计时,设计者通常会通过换位思考,明确产品设计的方向,设计满足用户需求的产品[13-14]。针对用户需求中的数据采集、数据动态分类处理等问题,学者们提出了一些切实有效的模型(如概念认知计算模型[15-16]、改进概念认知计算模型[17]及基于下落空间概念的新型概念认知计算模型[18])。

文献[16]将认知心理学与工程设计结合起来,建立概念认知计算模型,利用Hopfield 神经网络获得概念设计方案空间中的类似概念解,引入遗传算法生成可行候选解,通过认知计算模型对解析解评估,从而获得设计方案最优解。该方案提高了概念设计的设计效率,实现了设计的自动化与智能化,减轻了设计人员的产品设计压力。然而,该模型框架复杂,系统运行效率低,泛化性能不足。为提高认知计算模型在动态环境下的概念泛化能力,扩大认知计算模型的应用范围,文献[17]针对具有部分标记的动态数据,基于常规的正式决策上下文及多线程技术,提出一种改进概念认知计算模型。该模型在经典概念认知计算模型的基础上,设计了一种新的并发式学习框架,提高了系统运行效率与分类能力,改善了模型的泛化性能。上述研究将认知计算技术引入概念设计中,提高了概念设计的效率,为设计的自动化与智能化提供了新的路径,但其模型的泛化能力与计算成本表现不佳。

为提高模型的泛化能力和计算性能,文献[18]从人类认知过程的角度出发,提出包含知识储存机制和动态学习策略的新型概念认知计算模型,该模型基于概念聚类技术从概率描述与模糊集合角度来阐述知识存储原理的形成机制,提出概念下降空间的知识存储机制。随后将知识存储机制与子概念空间融合,自动更新概念空间,缩小子概念空间,确保在保障模型泛化能力的同时,改善认知计算模型的计算性能。

针对家用电器的用户需求分析,陈敏琦等[19]通过User Generated Content 网站获取家用电器领域的用户评论、意见及用户偏好等数据信息,采用词频统计、特征关系提取与特征权重再分配方法对数据进行分类处理,建立知识图谱完成用户需求可视化分析,获得较为精准的用户需求分析信息,为后续产品设计研发奠定基础。针对电子商务中用户需求分析问题,文献[20]采集电子商务网站用户行为数据,通过数据分析工具分析用户数据行为信息,建立基于用户行为数据的需求供应链(Demand Chain Management,DCM)管理模式,促进产品的销售。

为使产品外形满足多用户差异化感性需求,罗仕鉴等[21]收集并分析用户需求偏好数据,提出基于用户需求偏好驱动的产品造型设计方法。为确定目标客户群并设计出满足群体感性需求的产品,苏建宁等[22]提出面向用户集群的产品设计方法。Chiu 等[23]基于数据挖掘技术和感性工学理论提取产品外形概念设计所需的感性意象词汇,实现产品外形的认知设计。为满足用户多方面感性需求,柳禄等[24]提出基于多目标驱动的产品造型设计方法。刘华等[25]利用聚类分析方法构建产品族典型造型样本库,提出面向产品族造型设计的感性需求分析模型,辅助设计师完成产品的设计决策,提高用户对产品外形的满意度。上述研究多从塑造产品意象特征和用户感性需求角度对产品外形进行分析,实现产品造型的设计,缺乏对产品性能和可靠性等方面的分析设计。

2 基于认知计算的机械创新设计

机械设计是机械工程领域的重要组成部分,是机械生产的首要前提,传统的机械设计主要依靠设计决策者的知识、经验和远见,设计出的机械产品存在较大主观性。基于计算机技术的智能化设计能解决传统机械设计活动中的计算性和推理决策性问题,提高设计的质量和效率,避免设计者的主观判断。

2.1 机械夹具设计

为消除设计决策者的主观性对产品设计的影响,提升设计决策效率,王亚辉等[26]通过深度残差学习网络算法(ResNet)对基于产品造型语义的设计方案数据集进行不断训练,以提高设计决策的准确度,最大限度消除决策者主观偏好对产品设计的影响。针对机械加工所用到的机械夹具的设计问题,徐雷[27]为实现夹具设计知识的重用,建立夹具设计知识模板,提出基于知识元的夹具数据模型方法。侯鑫[28]以夹具设计本体为基础,结合设计重用理论和方法,实现夹具设计知识和夹具模型的检索,完成夹具三维模型的自动获取。为实现夹具元件自选择、自驱动和自装配,文献[29]基于知识工程建立夹具元件模型,实现了传统柔性夹具元件到继承与重用设计知识的智能元件的转变。为实现夹具结构的智能设计,张田会等[30]提出基于本体和知识组件的夹具结构智能设计方法,该方法引入知识组件并建立本体间语义映射关系,形成夹具结构智能设计模式,实现夹具的智能设计。以上研究各有特色,但所述方法局限于夹具设计过程中的某个对象或具体任务,无法有效地组织和表达设计主体、设计需求和设计过程。

2.2 数控机床结构设计

为实现数控机床拓扑结构的优化设计,文献[31]利用有限元分析建立机床进给机构动态模型,实现机床进给机构接合面连接件的位置和结构的优化设计。为提高进给机构动态特性,保证进给机构高精度设计要求,文献[32]采用序列二次规划法对数控机床进给机构进行结构化设计。文献[33]利用计算机仿真技术对机床进给机构进行分析,识别机床结构的关键参数,进而提出提高机床进给机构动态性能的结构优化设计方法。数控机床进给机构在承受工作过程中导轨与滑块、丝杠与螺母等装配元件之间相对运动产生的热作用的同时,也承受重力与进给力等力的作用,即受热与力的耦合作用。上述所提到的机床进给机构动态性能优化设计方法仅考虑受力影响,忽略了温度场和力学性能之间的相互作用,难以获得性能最优的进给机构设计方法。为充分考虑数控机床进给机构间的热-力耦合效应,提高数控机床进给机构的智能设计水平,刘世豪等[34]将灵敏度分析、BP 神经网络和遗传算法引入数控机床进给机构的常规设计中,对进给机构进行多目标优化,提高系统的设计水平。

2.3 医疗器械设计

针对个性化医疗器械的设计,佟矿[35]对患者髋关节进行三维重构,确定截骨位置并还原髋关节,设计髋关节脱位Steel 三相截骨模板,为患者提供匹配性良好的髋关节模型。石琦霞[36]利用数字化设计方法,根据用户需求分析建立人体假肢接受腔模型,设计出个性化和高质量的接受腔模型。Santos 等[37]利用三维扫描、三维建模和3D 打印等智能设计方法完成膝关节定位矫正器的个性化定制,解决康复医学中膝关节定位矫正器的个性化舒适问题。文献[38]运用逆向工程技术,提出基于Geomagic Design X 的个性化医疗护具设计方法,采用人体扫描仪获取三维点云数据,利用Geomagic Design X 软件对获取的数据进行处理、三维建模,并在此基础上对模型进行设计,添加个性化元素,根据患者需求完成个性化医疗数据的设计。上述所设计的个性化医疗器械能匹配患者个性特点,提高预期诊疗效果,但泛化性能不足,导致个性化医疗器械的设计成本高、设计周期长。认知计算技术能提取医疗器械设计中可利用的数据,缩短产品的设计周期,实现个性化医疗器械的智能设计。

3 基于认知计算的图像生成

智能生成内容(Intelligence-Generated Content,IGC)模式已经成为一种新的内容产生模式。变分自编码器(Variational Autoencoders,VAEs)[39]是通过考虑概率分布,基于最大化数据最小可能性实现图像生成的早期图像主要生成方法。两者通过机器学习或深度学习方法能够根据文本描述生成相对应的虚拟图像,实现文本到图像生成。

3.1 文本图像合成

针对智能设计领域中根据文本描述生成真实图像问题,文献[40]设计了一种基于生成对抗网络(Generative Adversarial Network, GAN)的对抗近似自动编码器完成具有对抗近似的潜在代码的推荐,该编码器能灵活地学习自动编码器的特征,并用一个更为简单的生成器逼近潜在空间,加强分布的相似性,避免模棱两可的重构,完成图像的自动生成。由于原始GAN 运行过程中存在的随机噪声,因而会导致生成的图像效果不理想。在原始GAN 架构的启发下,研究人员将条件输入c添加到噪声z中,通过函数G(c, z)定义生成图像,建立能控制图像内容生成的条件GAN[41-42]。文献[43]通过在原始GAN 架构上增加生成器约束条件,建立用于生成指定类别图像的条件GAN(Conditional GAN,CGAN)模型,以解决早期图像生成困难问题。CGAN 仅在原始GAN 架构上增加约束条件,没有对模型的稳定性做出改进,无法达到生成图像的细粒度属性识别。针对CGAN 模型在生成图像无法实现生成细粒度属性识别的问题,Zhang 等[44]通过改进CGAN 的网络结构,提出了由多个生成器和鉴别器组合模型:Stack-GAN[44]及Stack-GAN++[45],所设计的组合模型提高了文本描述下生成图片内容的质量。

融入注意力机制的GAN 可以根据描述生成图像的单词完成细粒度细节和全局句子向量的合成,生成符合文本描述的图像[46]。基于注意力生成对抗网络(Attentional Generative Adversarial Network,AttnGAN)模型的应用,可以通过评估句子和单词级信息计算生成的图像与文本的相似度,消除了CGAN 生成图像不符合文本描述的问题。Xu 等[47]提出了图像到文本特征的注意力机制,扩展了Stack-GAN++,将注意力机制纳入多级精炼管道,建立了AttnGAND 模型,在该模型中每个句子都被嵌入一个全局向量中,句子的每个词汇都被嵌入词向量中,见图1。上述方法能生成效果较好的图像,但图像生成速度缓慢,难以应用到对图像生成速度较高的环境中,如虚拟现实(Virtual Reality,VR)环境。因此,利用认知计算技术,提取图片内容生成中可重复利用的数据,建立图像数据库,可以显著提高图像的生成速度,改善模型的泛化性能。

图1 AttnGAN 的文本到图像生成示例[47]Fig.1 AttnGAN text to image generation[47]

3.2 图像到图像的变换

认知计算技术可以通过图像间的风格迁移,实现各种有创意的想法,辅助设计人员完成产品设计。针对图像到图像变换,文献[48]在网络生成器上添加了L1 正则化约束,提出图像变换模型(pix2pix),该模型能在给定训练数据情况下,将一个图像场景下的表示方法转变到另一个图片场景上。随着图像到图像变换模型的不断完善,科研人员开始侧重于高清图像[49]及视频流的生成方面[50]。早期pix2pix 模型依赖成对的训练数据集。例如对骏马到斑马的图像变换应用,训练时需要提供成对的数据,见图2。在实际任务中成对的数据是很难获取的,针对成对数据集难以获取的问题,科研人员通过改进pix2pix 模型,提出双生成器和双鉴别器的网络架构,其中,生成器G负责转换源域的图像到目标域,生成器F负责将目标域的图像转换到源域,2 个鉴别器分别鉴别源域和目标域图像的真假,不需要成对图片作为训练数据,解决了早期pix2pix 模型适应性不足的问题。双生成器和双鉴别器的网络架构占用大量的计算资源,降低了模型的运算速度,导致图像生成速度愈加缓慢。

图2 CycleGAN 的图像到图像变换示例[51]Fig.2 CycleGAN image to image change[51]

4 基于认知计算的疾病诊断

个性化医学以个人基因组信息为基础,结合蛋白质组,代谢组等相关内环境信息,利用认知计算模型对所提取的信息进行分析,进而辅助医护人员完成疾病的诊疗工作[52-53]。

针对医疗数据的多模态性问题,Acharya 等[54]利用认知计算技术构建深度卷积神经网络模型,该模型能通过认知计算技术收集脑电图信号并进行分类,对脑电图分析,帮助医生完成癫痫病的诊断。由于目前缺乏脑电图数据,因此无法进一步优化算法。文献[55]结合大量电子健康记录及医学研究数据,提取疾病症状和疾病治疗方案,进而为患者制订最佳治疗方案。Thongkam 等[56]利用关联模型数据对直肠癌患者数据进行分析,基于朴素贝叶斯优化的决策树算法删除无关的样本数据,通过数据过滤技术提高预测模型的有效性,帮助医生更好地判断患者是否存在患某项疾病的风险。Kuo 等[57]利用频繁模式挖掘算法,构建用于诊断乳腺癌的检测,推断肿瘤的属性,并进一步判断患者随着年龄增长其肿瘤变化的情况。Nahar 等[58]使用关联规则挖掘算法对个体健康数据进行诊断分析,来识别影响健康的重要特征。Ahmed 等[59]利用K-Means 聚类算法识别并分析患肺癌疾病的相关数据,提出基于AprioriTid 算法和决策树算法的肺癌预测系统,预测个体患癌风险。上述所提算法能根据相关数据,对个体患病风险进行准确预测,但面临着数据孤岛及结构化数据不足等问题。此外,基于自然语言处理的方法生成放射学报告中的标签,会对代表性不足的数据产生偏见,导致算法放大医疗实践中的现有偏见。

5 认知计算在物联网上的应用

为实现设备的智能化与自动化[60-61],科研人员将物联网技术与认知计算结合起来,建立了认知物联网[62],认知物联网的出现,极大地方便了用户之间的沟通交流和信息交换。认知物联网是一种以人为本的设备到设备间的交互网络,它将用户数据和信息物理系统(Cyber Physical Systems,CPS)存储并集成到云端上,并使用智能设计算法实现特定区域的数据请求响应[63-64]。

5.1 数据处理

针对传感器所采集的数据质量参差不齐,文献[65]通过对网络和云空间中大量实时数据的处理和分析,基于高斯混合模型建立了一种能够提供普遍性和可伸缩性的系统,并通过对比实验证明所构建系统在传感器数据处理方面优于其他系统。针对传感器所采集数据的实用价值不足,Puschmann 等[66]阐述了物联网技术中传感器所收集的数据实用价值不高的原因,并建立了基于认知物联网技术的数据分布流框架,同时采用集群机制对传感器采集的数据进行集群处理,通过自我调整来确保收集的数据具有实用价值,从而解决了物联网中大量具有实用价值数据丢失的问题。上述所提出的数据处理方法能有效筛选出有效数据,避免实用价值数据丢失,但忽略了数据安全问题,使用基于大数据的认知计算技术能完成非结构化信息内容的详细分析与精细化理解,自动总结最新不良信息的规律,帮助人们制订安全管控策略,保证信息传输中的安全问题。

5.2 隐私保护

由于认知物联网信道的广播特性,导致认知物联网中的数据容易遭到非法用户的窃听[67]。为实现信号的保护,研究人员利用信道之间的差异性,在信号传输中不间断发送干扰信号,防止窃听者解调合法信号,保护合法信息。针对物联网隐私安全问题及低效推荐问题,杨菊英等[68]提出基于区块链的认知物联网框架,利用区块链技术对物联网中的信息进行加密,保证物联网隐私安全,将认知系统融入物联网中,形成能从物联网环境中交互学习的认知物联网,提高物联网信息推荐的效率和准确性。

为解决认知物联网安全隐患问题,文献[69]将GAN 引入物联网中,提出基于GAN 的认知物联网加密算法,该算法能对图像数据进行处理,利用生成对抗网络,生成带有加密信息的新图像,避免图像信息被泄露。文献[70]根据所收集的历史传输数据,采用数据驱动的深度学习算法训练具有认知功能的神经网络,监控物联网设备的运行情况,主动识别网络攻击和用户恶意行为,确保物联网运行的安全性。文献[71]通过优化Cycle-GAN,提出基于改进Cycle-GAN 视觉图片隐私保护方法,从源头上避免物联网传输中图像信息的泄露。

为避免认知物联网的信息泄露,提高通讯的安全性,文献[72]提出基于GAN 的认知物联网隐蔽通讯智能功率控制算法,该算法利用生成器模拟认知物联网用户,鉴别器模拟窃听者,通过不断进行博弈,达到纳什均衡,获得最优的隐蔽功率控制方案。

总体而言,融合认知计算技术形成的认知物联网的相关研究还处于初级阶段,发展框架和标准体系不够完善,关键性技术不够成熟,研究内容主要以模型和构想为主,部分解决方案也处于模拟和仿真阶段,缺乏面向一般应用的统一解决方案。

6 基于认知计算的产品评价

产品设计评价需提前确定所设计对象的价值,将设计对象实际价值与预先确定的价值进行比较,以表明其价值。传统设计评价方法是依靠人工操作完成的,评价结果在一定程度上受个体经验、直觉及知识等因素的影响,具有较强的主观性[73]。此外,由于智能设计[74]的产品呈现出爆炸式增长的态势,因此人工评价大规模设计结果显然是不切实际的。而利用认知计算技术对产品进行评价可以将设计知识与用户感知等多维内容进行量化,制订统一的评价标准,提高评价结果的准确性与客观性。智能设计研究和应用的重点是将主观模糊的开放式评价问题抽象为数据驱动的封闭式问题,建立统一评价指标,实现更细致的设计分析和评价,提高评价结果的准确性和客观性。

6.1 产品质量评价

早期主要是通过均方根误差(Root Mean Error,RMSE)等类似的评估指标对合成图像质量进行评估。因此由于合成图像与真实图像之间的对应关系不明确,基于均方根误差的图片质量评估方法也不精确[75]。针对生成图像质量的评估(Amazon Mechanical Turk,AMT)可以通过观察判定图像逼真程度,对合成图像和真实图像进行评分[76]。然而,不同观察者之间的主观评价存在差异,仅依靠主观评价难以客观地评价出图像质量。

Inception Score(IS)评估方法通过计算概率分布信息熵来客观完成图像质量的评估。针对图像x的评估,p(y|x)的信息熵越低,分类器对图像内容的评价越高,p(y) = ∫p[y∣x=G(z)]dz具有较高的信息熵,模型可以生成更多类型的图像[77]。Lucic 等[78]利用Inception 对图像进行评估时发现,它对标签先验分布不敏感,难以完成过拟合现象的检测。此外,由于Inception 评分会受类内模式的影响,从而导致初始得分崩溃,不能完成类内变化情况的测量,因此,它不适合用于评估包含多种图像的数据集合。

Fully Convolutional Network Score(FCN-score)[79]采用与Inception 评分类似的思想,基于FCN-score的图像分类方法通过利用真实图像训练出的分类器对合成图像进行分类。然而,基于FCN-score 的图像分类方法未对输入图像清晰度进行筛选,换句话说,该分类方法无法准确完成存在微小细节差异图像的区分。此外,文献[80]研究结果表明,基于FCN-score的图像分类器会受随机噪声的影响,从而降低分类器的准确度。

针对生成图像的质量评估问题,除了IS 和FCN之外,还有Fréchet Inception Distance(FID)[81]、Gaussian Parzen Window(GPW)[82]、Generative Adversarial Metric(GAM)[83]及Mode Score(MS)等[84]评估方法,但图像生成领域应用最为广泛的是Inception 评估方法。Wang 等[85]通过研究发现FID 与生成图像质量间存在负相关,且该方法对噪声的敏感度远小于IS,基于FID 的生成图像质量评估方法能较好限制外界随机噪声对评价分的影响,避免出现检测类模式崩溃问题。总体而言,图像质量评估方法能较好限制随机噪声对图像质量评估的影响,但评价指标单一,不能反映图像的综合质量情况。此外,算法对数据集依赖严重,难以应用到包含多重失真的图片。

6.2 产品价值评价

针对产品价值评价问题,文献[86]设计了一种基于模糊专家系统(Fuzzy Expert System,FES)的产品不确定性管理问题的评价模型,该模型通过准确度和置信度2 个因素完成产品价值的评价。针对在动态变化加工状态下产品评价问题,文献[87]提出一种基于数字孪生模型的评价方法,该方法利用数字孪生模型结构及关联规则构建流程大数据,实现知识流程积累,通过场景模拟相似性计算法过滤不匹配过程知识,提高评价的准确性。针对传统教学评估系统智能化落后及实时性差等问题,文献[88]设计了一种基于互联网和人工智能的专家评估系统,该系统应用人工智能混沌控制方法,利用单项链式网络完成在线教学评估和信息监控识别,提高信息传输和融合能力。产品价值是由需求来决定的,在经济发展的不同时期,构成产品价值的要素相对重要程度有所不同。目前,产品评价处于起步阶段,评价指标单一,缺乏面向一般产品的统一评价方案,难以准确完成产品的价值评价。

7 基于认知计算的智能设计展望

尽管智能设计技术已经取得飞跃发展,但仍存在一些阻碍智能设计进一步发展的问题与挑战。智能设计方法目前面临的公开挑战主要集中在以下3 个方面。

1)智能设计背后存在大量隐藏抽象语义信息,难以在样品数量不足的情况下训练出合适的模型,完成小样本学习。智能设计的未来发展方向是理解设计问题背后的隐藏语义信息,完成小样本学习。

2)大多数的智能设计系统并未阐述模型是如何训练的、训练的模型是怎样工作及输入和结果输出之间存在什么样的关系,这就导致设计师与智能设计系统间存在沟通障碍。因此,提供模型训练、工作及系统参数输入和结果输出过程,消除设计人员与智能设计系统间的沟通障碍是智能设计未来发展方向。

3)在智能设计的内容生成过程中,设计知识大多由经验规则和指南组成,难以将其进行形式化表达,并引入设计模型。虽然跨媒体的角色生成可以根据预先设定的规则创造出精确人物角色,但是该方法需要依赖先进的跨媒体计算和数据融合方法,目前,这些方法的探索仍然具有挑战性。如何将先验/领域知识形式化,并引入模型训练过程中,实现设计内容的智能生成是值得探讨与研究的课题。

8 结语

设计作为一种创造性的决策活动,是一个典型的解决定义不良问题的认知过程,认知在创造性设计活动中有着举足轻重的作用。认知计算和智能设计作为人工智能的分支,是跨学科融合而成的产物,可以完成设计过程中的用户需求分析、智能内容生成及产品评估等诸多方面的挑战。通过认知计算与智能设计的结合,将具有多元化、非完整和非结构性的认知信息转换成设计中所需的结构性要素,助力于设计的创新已成为学者们关注的重要内容。文中围绕认知计算和智能设计的最新进展,从6 个方面总结了认知计算与智能设计的最新进展,并讨论了认知计算与智能设计未来应用中需要解决的问题,助力认知计算与智能设计的创新与应用。

猜你喜欢
联网图像模型
脐橙连上物联网 扫码便知“前世今生”
自制空间站模型
“身联网”等五则
《物联网技术》简介
《物联网技术》简介
A、B两点漂流记
模型小览(二)
圆周运动与解题模型
离散型随机变量分布列的两法则和三模型
名人语录的极简图像表达