国产人工智能平台应用推广

2021-09-17 04:55朱洪斌周春云
电子制作 2021年16期
关键词:算子芯片智能化

朱洪斌,周春云

(扬州万方电子技术有限责任公司,江苏扬州,225000)

0 引言

随着我国高新技术的发展,机器视觉、智能分析、深度学习等人工智能技术在金融科技的发展、国家的治理、工业的推动等方面发挥着越来越重要的作用[1]。

党建工作是国家治理的重要组成部分,党的建设与人工智能的融合,是人工智能重要发展方向之一。党建工作应主动融合人工智能平台发展的趋势,在充分吸收AI(人工智能)技术的前提下,结合党建工作、党建活动、百姓互动的行为特征,给党的建设提供科学化的支撑。人工智能给党建工作带来创新。在党建工作或活动中,可以结合人工智能和大数据分析,创建智能化成教育工作平台,在云端将党建工作、学习、知识等信息和数据进行存储和模型构建,组成知识图谱;在端侧将党员和群中联系在一起,使得AI赋能党建,形成党建工作新局面。

人工智能技术不仅能够服务于工业信息化领域,也能够服务于基层等基层管理平台,为建设智慧型城市提供技术支撑。而随着国产软硬件技术的不断成熟,已具备融合人工智能的应用研究和设计能力,但目前仍处于起步阶段[2]。为适应我国“新基建”概念落地,将信息化、国产化与智能化有机融合,大幅提升电子信息系统的自主安全和先进水平。本文结合国产自主可控和人工智能芯片现状,构建了国产人工智能平台,提出了技术架构和实现途径,面向电子化办公、基层党建管理、工业自动化多个领域进行了人工智能应用推广。其中,在推动智能化党建管理平台建设,可以对信息采集存储,发挥智能化决策和分析能力,辅助党员和群众对党建知识的学习,采用算法模型,加速对自然语言的理解,同时结合网络技术,有效提升党建工作效能。

1 国产人工智能平台

■1.1 国产人工智能发展现状

在我国“十四五”发展规划中,把人工智能作为核心赛道,提出了系列化的要求。目前,我国电子信息化产业的智能化发展正处于一个非常关键的时刻。在传统信息化平台基础上,运用人工智能和数据分析技术,政府部门可以实现党建信息资源融合共享,提升新时代党建工作的科学化水平;工业部门也可以精确化完成质检、分析预测等工作,提升工业智能化水平,推动我国“工业4.0”的创新技术发展。

AI技术(人工智能技术)的发展给自主可控的发展带来了新机遇和新挑战[3]。通过融合国产基础硬件和人工智能芯片,适配基础层驱动和运行环境,打造的一个集数据处理、模型加工、训练推理、智能化应用的基础平台。一方面用于提升国产化计算机和服务器的计算算力;另一方面也是为了充分发掘国产计算平台融合AI模块后的应用潜力,为后续大规模应用提供基础论证和技术服务支持。

■1.2 人工智能平台设计

国产人工智能平台主要由国产化基础硬件(国产处理器+国产AI芯片)、基础环境、AI服务、集成开发环境(IDE)、统一运维管理组成,各模块组件需要结合国产处理器特点,完成各场景模型适配移植、编译优化、测试验证等工作,其技术架构如图1所示。

图1 国产人工智能平台架构

(a)国产化底层硬件平台主要基于国产处理器,融合了人工智能芯片,构建了异构人工智能环境。AI芯片是人工智能平台的关键模块[4],采用百度昆仑和华为昇腾等国产品牌,在国产飞腾平台上开展了驱动适配、环境移植、深度学习框架的适配、算法模型开发、模型验证提优等工作。

(b)提供一站式集成开发环境,包括应用开发/调试/编译、模型转换、网络移植/优化/分析等主要功能,为AI开发带来了极大的便利。同时,还需集成丰富的IDE环境,方便开发者自行编写和调试代码,并按照流程完成模型开发。

(c)提供高性能SDK开发环境,支持图像、视频的快速编解码,提供了计算高性能编程库,同时提供AI自定义算子开发接口,通过SDK充分调度硬件算力,发挥硬件性能。其中,算子开发难度较大,本平台可以提供丰富的算子开发指导,辅助用户进行第三方算子开发,降低了算子开发的门槛,并提高算子开发及调试调优的效率。

(d)为AI应用开发和使用人员提供统一的运维管理功能以及完整的AI解决方案。AI统一运维管理模块提供多种场景部署能力,从多类型虚拟机,内置管理板,到裸机场景部署,支持对于服务器全生命周期管理的要求,从而更好地管理设备;同时支持面向边缘计算、云边融合、边端协同等场景部署。

2 人工智能应用开发流程

人工智能平台主要运行在国产处理器硬件平台之上,主要对内存及硬盘容量、AI加速卡有一定需求。主流国产硬件可选用飞腾2000+、龙芯3A4000,操作系统为国产麒麟操作系统,AI芯片选用成熟的AI加速卡或按需进行封装定制。

人工智能平台属于系统Paas层,是基于国产AI芯片和主流深度学习框架构建,提供较为丰富的开发环境和开发语言支持,满足人工智能开发部署和运行支撑。

开发流程主要面向训练和推理场景,可分为训练开发和推理开发两部分。在开发过程中,首先需进行数据处理、模型建立、模型训练和模型测试等流程。紧接着,需要将模型转换为可在AI处理器中运行的模型格式。推理应用开发过程包含数据处理、模型装载、结果输送或显示等流程。

其中,因国产处理器和国产人工智能芯片对深度学习框架、算子、模型等方面有特殊要求,需要首先对深度学习框架进行适配移植,可选用Tensorflow、Caffe、PaddlePaddle、PyTorch、MindSpore等开源深度学习框架。平台支持多种训练方式,支持在国产龙芯或飞腾平台的CPU以及支持训练的AI卡进行训练。模型训练过程中,可对资源及性能进行实时查看。同时,解决模型开发过程中遇到的算子缺失、框架不支持、模型生成失败等诸多问题。当模型训练完成时,开发者通过模型评估模块对模型进行评估。离线部署需要针对不同的AI卡选取不同的模型转换工具进行模型转换,转为可在目标设备中运行的离线模型。

图2 人工智能应用开发流程

最后,结合实际应用场景,若精度或效果仍未达到预期,开发者可重新修改模型、算法或训练超参数进行重新训练,若精度已达预期,可对模型进行保存。

3 应用场景

围绕提升信息化系统智能化竞争力的迫切需求,新一代人工智能平台的应用部署要以模型为核心,以数据和国产硬件为基础,以提升应用效能为重点,形成开放兼容、稳定成熟的AI应用模式。针对不同应用场景,人工智能平台提供共性基础支撑,仅需进行模型和算子的设计开发,即可完成平台的应用推广工作。

■3.1 遥感图像分类

遥感作为当代高新技术的一个重要组成部分,在国防安全上具有重要应用价值,利用遥感影像处理技术从遥感影像中识别出飞机、舰船等重要目标信息,从而获取敌方军事目标的空间分布、地理坐标等重要情报信息。由于浅层的机器学习分类模型无法充分学习到遥感图像中的复杂信息,因此分类的精度也不高。深度学习技术的出现为遥感图像分类的问题提供了一个新的解决方案。常用的算法有LeNet,VGG和ResNet。

■3.2 目标检测

目标检测应用领域广泛,如人脸识别检测、车道检测、卫星图像物体检测、医学图像病灶分析等,因此具有非常大的价值。常用目标检测网络模型有YOLOv3、SSD、CNN、Fast R-CNN等。通过在国产平台适配移植上述模型,结合场景数据进行训练推理验证,得到较为准确的基础模型。

■3.3 文本分析

语言Bert模型是最典型的NLP(自然语言处理)模型,是文本分析的典型算法模型,在实际场景中应用广泛。通过预训练得到通用语义表示,再结合简单的输出层,应用到下游的NLP任务,在多个任务上取得了SOTA的结果,基于Bert模型,利用昆仑K200卡进行训练,生成文本分析模型。用户利用百度昆仑或华为Atlas卡进行模型推理,完成文本分析应用场景的实现。

■3.4 故障预测

面向故障预测领域进行应用创新,使得国产AI计算平台能够应用于设备运维和故障维护,也是对国产化先进技术的一次良好的应用示范。传统的智能故障诊断方法通常包含特征提取、特征选择和故障分类三个步骤。通过引入AI卡,规避了国产平台中CPU算力不足的问题,从而提高了人工智能应用在国产平台中运行的效率,增强了对国产平台中设备的运维能力,提升了数据中心运维效率,提高了数据中心的安全可靠能力,保证了设备集群的稳定运行。常用的故障预测模型包括LSTM、Xgboost、MLP等。

4 结束语

本文基于国产处理器平台,融合国产人工智能芯片,打造平台化、组件化、一体化的基础平台,并提供训练推理开发环境和开发工具,满足用户训练推理使用。通过重点研究党建电子信息化、智慧城市、党政办公等人工智能应用场景[5],结合算法模型发展能力,形成软硬件一体的解决方案,对各型电子信息化系统智能化起到指导借鉴作用。本文研究成果还可结合容器化、边缘计算等先进技术,应用到手机、平板等边缘端,进一步推动国产人工智能平台的有效发展和推广应用。

猜你喜欢
算子芯片智能化
智能化战争多维透视
芯片会议
迈向智能化:艺达电驱动高端制造之路
探讨智能化技术在电气工程自动化中的应用
论智能化技术在市政工程中的典型应用
Domestication or Foreignization:A Cultural Choice
装错芯片的机器人
QK空间上的叠加算子
逼近论中的收敛性估计
什么是AMD64