基于WordCloud技术的MBSE发展态势研究

2024-01-30 14:52董梦如王国新鲁金直马君达
系统工程与电子技术 2024年2期
关键词:词云云图架构

董梦如, 王国新, 鲁金直, 马君达, 阎 艳

(1. 北京理工大学机械与车辆学院, 北京 100081; 2. 北京航空航天大学航空科学及工程学院, 北京 102206)

0 引 言

在系统工程实施的早期阶段,系统产生的信息均以文档形式来记录[1]。随着系统复杂度的显著提升,基于文档的系统工程难以保证产品数据的一致性等需求[2],并且无法进行早期验证。因此,为了更好地实现早期系统设计验证,提升系统研制效率,国际系统工程协会(International Council on Systems Engineering,INCOSE)提出了基于模型的系统工程(model based systems engineering,MBSE)的概念:“MBSE是建模的正式应用,以支持系统需求、设计、分析、验证和确认活动,从概念设计阶段开始,一直持续到整个开发阶段和以后的生命周期阶段[3]。”

随着数字化建模仿真技术的发展[4-9],MBSE将在系统工程实践中发挥越来越大的作用[10-19],在INCOSE的远景2025报告中,MBSE方法和工具已经被确定为执行系统工程项目的标准。这导致MBSE的研究在新兴的标准、科学期刊和论文[20-30]、国际会议和该领域的学术项目中显而易见[30-33]。

Akundi等[34]通过使用文本挖掘技术,从IEEE Explore、Science Direct、Wiley Publishers、Web of Science中收集了1995年到2020年间与MBSE研究相关的2 380篇文献,对MBSE领域的研究进行了概述。其通过对收集文献的摘要及其出版日期进行分析,主要强调了MBSE中关键术语频率随时间的变化,从频率和上下文的角度总结了MBSE的研究者和实践者最常提到的工具、语言和图表,将文献按照建模语言、建模工具、建模方法类别进行分类,并描述了MBSE文献归入的6个主题。

目前,多种技术可对文献进行分析,词云方法是文献分析的技术之一。词云又称文字云,是对文本数据进行处理,在视觉上突出呈现文本数据中多次出现的“关键词”,形成关键词的渲染,形成类似云一样的彩色图片[35]。利用词云方法对文章进行分析,可以过滤掉大量无用信息,使得文章阅读者只要扫一眼“词云”就可以领略文章的主旨[36],可以在阅读之前帮助理解研究,方便非专业人士读取有效的信息,为领域研究人员提供高质量的信息。

词云在文本数据分析中有着广泛的应用。Abazi等[37]采用词云技术对半个世纪以来计算机科学研究出版物的标题进行分析,更快、更容易地追踪并展示了计算机科学研究主题随时间变化的规律。Jo等[38]提出了一种针对研究论文和报告的可视化方法,应用词云使得用户可以快速掌握文章的关键内容。

关于词云的生成技术,目前网络上有许多词云在线生成的软件,例如“微词云”“文字云”“WordArt”等。虽然这些技术可以快速地制作词云,但存在很多限制,例如:导出的词云图片具有水印;不支持直接导入文件或只支持导入指定格式的文件进行词云渲染;渲染的内容非常有限,如导入的文件大小不能超过2 M;词云乱码现象的产生等;这些限制给用户使用带来了极大的不便,尤其是针对数据量较大的文本,往往无法实现词云的正确生成。WordCloud库是Python专门用来制作词云图的第三方库[39],利用WordCloud库可以快速地进行词云绘制,并且WordCloud库好学易懂、使用较为简单、绘图相对灵活、可自行设置背景图片和指定使用字体[40],既能够带领初学者迅速入门、又能满足技术人员较高的使用要求[41]。相对于在线软件,WordCloud库没有上述限制,可以针对大量文本数据进行友好分析。在词云分析中,使用Python的第三方库WordCloud生成词云的技术已经被广泛使用。汪言[41]采用Python的WordCloud技术生成了《“十四五”规划》的词云,清晰、直观地展现了其中的内容,帮助阅读者迅速、便捷地获取重要信息。唐婷[42]分别以中英文文章为例验证了基于Python生成的词云图片具有良好的效果,能体现词云的优点和价值。

基于此,本文采用WordCloud文本分析法,以IEEE及INCOSE社区的MBSE相关顶刊为基础,对国际MBSE领域的高质量文章进行数据梳理与分析,采用词云图的方式直观地展示该研究领域文章的主要内容,并对MBSE的发展态势进行分析探索。对MBSE的概念进行了阐述,对MBSE的研究内容进行了探索,以及对MBSE常用建模方法、建模语言、建模工具进行了分析归纳,对MBSE的发展态势进行了研究。本文为MBSE的进一步探索和未来研究方向奠定了基础。

1 数据来源与研究方法

1.1 数据来源

本研究的数据源于IEEE及INCOSE社区中与MBSE相关的核心会刊,检索时间截止至2022年10月31日。首先,借助Google Scholar平台,以“Source:“IEEE Transactions”,MBSE”字段为检索条件,共计得到59篇检索结果;以“Source:“IEEE Systems Journal”,MBSE”字段为检索条件,共计得到42篇检索结果;以“Systems Engineering Journal INCOSE”字段为检索条件,进入Systems Engineering INCOSE社区官网,再以“MBSE”字段为检索条件,共计得到99篇检索结果。其次,对检索得到的共计200篇顶刊的PDF格式文档进行下载。之后,对所下载文章与MBSE的相关性进行检验,发现在IEEE Transactions中的59篇文章中有15篇与MBSE相关性较低;IEEE Systems Journal中的42篇检索结果中有1篇与MBSE相关性较低;Systems Engineering Journal INCOSE中的99篇检索结果中有17篇主要是对系统工程期刊的介绍,与MBSE相关性较低。将这些与MBSE相关性较低的33篇文章进行删除,最终保留与MBSE相关度较高的167篇文献,并将其作为研究对象。

综上,会刊名称及其对应MBSE文献数量如表1所示。

表1 会刊名称与对应MBSE文献数量

其中,《IEEE Transactions》下存在多个类别,如《IEEE Transactions on Engineering Management》、《IEEE Transactions on Systems, Man, and Cybernetics: Systems》等。对《IEEE Transactions》中的文献按照类别进行细分,得到不同类别《IEEE Transactions》对应的MBSE文献数量如表2所示。

表2 《IEEE Transactions》会刊分类与对应的MBSE文献数量

由表2可知,《IEEE Transactions》下的多个类别均有MBSE的相关研究,体现了MBSE研究范围的广泛性。

1.2 研究方法

本文采用Python的第三方库WordCloud方法进行MBSE文献的词云可视化分析。

使用Python及其第三方库WordCloud技术进行文本分析的主要研究方法过程如图1所示。

图1 主要研究方法Fig.1 Main research methods

1.2.1 数据转换

数据转换是将数据从一种格式转换为另一种格式的过程。数据转换为数据汇总、分析等活动奠定了重要的基础。本研究中,由于检索所得文献均为PDF格式,为了便于进行分析,使用PDF转TXT在线转换工具将检索最终保留的167篇PDF格式的文献转换为TXT格式的文档。

1.2.2 数据汇总

在数据处理过程中经常需要对大量数据进行汇总,数据汇总是指根据需求将分散的数据汇总到一起。在数据汇总前,一般按照某一标准或要求对所需数据进行分类,之后对所得各类数据按要求进行汇总。本研究中,在将检索最终保留的167篇文献TXT格式化后,首先按照会刊分类标准将其进行分类汇总,之后根据研究内容,分别从文献中的关键词及文献的摘要两个模块进行分类汇总。

1.2.3 数据清洗

数据清洗是对脏数据进行检测和纠正的过程,是进行数据分析和管理的基础[43]。数据清洗包括删除重复的数据信息、纠正数据中存在的错误及缺失值,从而保证数据的准确性和一致性,便于后续的研究。本研究主要对文章中存在的重复值删除其重复信息,如缩略词MBSE后的括号注释(model based systems engineering),并对转换过程中存在的缺失值进行修正,以及对无意义的词进行删除,以保证研究的准确性。

1.2.4 词云图绘制

“词云图”绘制的基本原理为:基于单词库将整个文本切分为不同单词片段,同时对同一单词在文本中出现的次数进行统计;之后根据词频大小,将单词按不同字体大小和颜色以图像的形式呈现,词频越高,单词的呈现方式越凸显[41]。

本研究基于Python环境,引入第三方库WordCloud进行词云图的绘制。Python不仅具有功能强大的标准库,同时还支持近15万的第三方生态库[44],在WordCloud库中,词云被视为一个WordCloud对象,wordcloud.WordCloud()代表一个文本对应的词云。词云的形状、大小、颜色等性质可通过参数配置实现。利用WordCloud绘制词云图的步骤如图2所示。

图2 词云图绘制步骤Fig.2 WordCloud chart’s drawing steps

首先,通过wordcloud.WordCloud函数设置词云对象参数;之后通过wordcloud.generate(text)函数生成词云;最后利用wordcloud.to_file(file_name)函数将词云输出到文件以进行保存。

2 研究过程

针对上述提取的与MBSE相关度较高的167篇文献,从关键词和摘要两个方面对其展开研究,具体内容如下。

2.1 关键词研究

2.1.1 数据汇总

通过Python编程技术将转化为TXT格式的167篇文档中的关键词按所属会刊类别分别进行提取,以防止数据丢失。之后将所有类别MBSE文章的关键词汇总成一个总的关键词TXT格式文档,为下一步处理奠定数据基础。

2.1.2 数据清洗

首先,通过Python编程将汇总的关键词全部转换为小写字母格式。之后将常见专有名词改用缩写形式表示,并将缩写保留大写形式,如表3所示。此外,将这些单词后可能存在的重复注释删除,如删除缩略词MBSE(model-based systems engineering)括号中的注释“model-based systems engineering”。

表3 单词对应的缩写转换

之后,通过Python引入collections库,使用collections库的Counter方法统计得到关键词及其出现频次。合并对MBSE分析具有意义且语义明显相同的关键词,例如“architectures”“architecture”等共计5组,如表4所示,将语义相同或相似的关键词的频次相加。然后,按照关键词出现的频次由高到低进行排序,发现其中前35个单词与MBSE的研究相关度较高,因此取出现频次最高的前35个关键词进行清理和分析。首先删除35个关键词中与本文研究主题重复的关键词,即“systems”“MBSE”“SE”“engineering”“system”共5个;其次删除没有实际意义的词,即“and”“of”共2个;之后,删除对主题分析没有意义的词,即“analysis”“theory”“product”共3个;最终,出现频次最高、语义不重复的25个关键词及其出现频次如表5所示,将这些数据作为生成词云图的基础分析数据。

表4 合并语义相似的单词

表5 关键词词频

2.1.3 词云图绘制

导入Python的第三方库WordCloud,以数据清洗环节中合并同义后的关键词为词云研究对象,对词云参数进行配置,设置词云图显示的最大单词数量为25,绘制关键词词云图如图3所示。

图3 关键词分析词云图Fig.3 WordCloud chart of keywords analysis

2.2 摘要研究

2.2.1 数据汇总

通过Python编程技术将转化为TXT格式的167篇文档首先按照所属会刊的分类,把同一类TXT文档的摘要汇总到一起,之后将汇总的各类摘要TXT文档合并为一个总的摘要TXT文档,为下一步处理奠定数据基础。

2.2.2 数据清洗

摘要研究与关键词研究中的数据清洗步骤类似。首先,通过Python编程将汇总的摘要中的单词全部转换为小写字母格式。随后,将常见专有名词改用缩写形式表示,并将缩写保留大写形式,如表6所示。然后,将这些单词后可能存在的重复注释删除。

之后,对上一步清洗后的摘要中的单词及其出现频次进行统计排序,考虑摘要总词数、单词出现频次以及单词与MBSE的相关度3方面因素,取频次由高到低排序的前400个单词进行清理和分析,对清理后的单词进行降序排序,根据清理排序结果,选取频次最高的前100个单词作为分析的基础。具体步骤为:首先,删除前400个单词中如“the”“and” 等没有实际意义的冠词、连词,以及“system”“MBSE”等重复主题的词,以及其他对MBSE分析无关的词汇,如表7所示;然后,将剩下的单词按频次由高到低进行排序,合并语义相同或相近的单词,如表8所示;最后,取前100个单词及其出现频次作为词云图分析的参考数据,如表9所示。

表6 单词对应缩写转换(摘要)

表7 对MBSE分析没有实际意义的词汇(摘要研究)

续表7

表8 合并语义相似的单词(摘要研究)

表9 摘要前100单词及其频次

续表9

2.2.3 词云图绘制

导入Python的第三方库WordCloud,以数据清洗环节中删除无意义单词后的总摘要的TXT文档为词云对象,对词云参数进行配置,并依据表7添加除WordCloud默认停止词之外的停止词,设置词云图显示的最大单词数量为100,绘制摘要词云图如图4所示。

2.3 词云图结果分析

2.3.1 关键词词云图分析

通过167篇MBSE领域文献的关键词词云图图3可发现,单词“model-based”在图中最为显眼,体现了模型在MBSE中的核心地位,模型是MBSE与传统系统工程的重要区分点。在MBSE中,“模型”是唯一的真相源,反映了系统开发的状态[45]。模型需要体现多个互补的、相互兼容的视角,从多个角度来回答利益相关者的问题。单词“design” 在图中的显眼程度仅次于“model-based”,体现了MBSE方法在系统设计中的广泛应用,如何应用MBSE方法提高系统设计的效率是MBSE领域一直关注的研究话题。

建模语言、建模方法和建模工具是MBSE的三大支柱。从关键词词云图中可以清晰地观察到“SysML”“UML”和“OPM”。SysML是INCOSE和对象管理组织(object mana-gement group,OMG)推出的一种标准化建模语言,统一建模语言(unified modeling language,UML)是软件工程的主流语言,SysML通过对UML进行重用和扩展,形成了面向系统工程的统一建模语言。对象处理方法(object process method,OPM)是一种领先的整体概念建模方法,用于复杂系统、产品、服务和流程的架构、设计和分析[46],是复杂系统建模的推荐方法。观察结果表明SysML是当前MBSE领域最受欢迎的建模语言,与Li等[47]采用计量分析的方法对1993年至2022年与MBSE相关的出版物文献进行分析所得的结果一致;OPM是当前MBSE领域常用的建模方法。同时,单词“tools”和“methodology”的出现也体现了MBSE工具和方法论是当前MBSE领域研究的关键内容。在图4中,尚未观察到建模工具的具体内容,针对不同的建模语言和建模方法论,建模工具种类多样,开发统一的建模工具是建模工具发展的最终趋势。此外,当前正式的MBSE建模工具多为国外工具,开发具有自主知识产权的国内MBSE建模工具具有必要性和紧迫性。

从图4中可观察到“architecture”一词,架构是系统工程的重要概念,设计良好的系统架构以及构建完整的系统架构模型是应用MBSE方法的首要任务。设计的系统架构是否能够满足系统的需求也是检验应用MBSE方法有效性的关键手段。INCOSE指出:MBSE的有效开展,必须建立在对架构的形式化描述基础上。

此外,从图4中可观察到“process”和“management”,MBSE的应用涉及系统的多个过程,反映了MBSE的整体性,系统工程包括技术过程和管理过程两个层面[48]。技术过程层面主要是系统模型的构建、分析、优化、验证工作,在管理过程层面,包括对系统建模工作的计划、组织、领导和控制[48]。在应用MBSE方法时需要注重对建模过程和管理过程的管理,以便更好地应对复杂系统的挑战。

“requirement”在图4中的位置显著,突出了其在应用MBSE方法的过程中正确识别系统需求、利益相关者需求、业务需求的重要性,需求是系统设计的基础,贯穿着系统开发的全生命周期。

“software”的出现,体现了软件领域与MBSE的紧密联系,MBSE方法可以应用于软件、硬件、机械等不同领域的设计,改善系统工程师、硬件/软件开发人员和各种专业工程师之间的沟通。AKUNDI等[49]通过对MBSE的使用和认知的调查,得到如下结论:在软件工程领域,MBSE仅被视为过程支持和改进工具,使用MBSE的好处有提高生产力、系统质量、设计和性能等。因此,在软件工程领域进一步扩大MBSE的使用范围,凸显在软件领域应用MBSE方法的优势,是将MBSE应用于软件领域的发展方向。

图4中还出现了专有名词“SoS”,体系或系统的系统(system of systems, SoS)是面向任务或专用系统的集合,将资源和能力集中在一起,创建一个新的、更复杂的系统,提供比简单的组成系统的总和更多的功能和性能[50]。随着体系复杂度、多学科耦合度的提高,将MBSE的思想扩展到体系,开展基于模型的体系工程(model-based system of systems engineering, MBSoSE)研究,以模型为载体驱动进行开发,可以有效提升研发效率和质量[51]。MBSoSE需要以MBSE已有方法和工具为基础,同时以体系研究为牵引, 倡导跨专业、跨层次、多学科合作的MBSE研究与应用[52]。将SoS与MBSE方法结合形成MBSoSE已经成为体系工程发展的方向[51-54]。

图4 摘要分析词云图Fig.4 WordCloud chart of abstract analysis

“simulation”的出现体现了仿真在应用MBSE方法解决系统设计问题时具有重要意义,在进行需求分析和构建系统架构模型之后,通过基于模型的仿真可以验证系统设计的正确性、合理性和可行性[55]。与仿真紧密相关的是验证与确认,从词云图中观察到“verification”和“validation”,验证技术是验证构建的系统架构模型是否满足内部规定的需求,确认技术是确认构建的系统架构模型是否满足用户的需求。验证与确认是MBSE落地的关键技术之一。相比于传统系统工程,MBSE支持在早期进行系统的验证和确认,从而可以降低风险,减少设计更改的周期时间和费用[2]。一个完整的MBSE过程包括了需求、设计、并行、验证与确认等几大工程,在上述对关键词词云图的观察中,依次观察到了设计、需求、验证与确认的单词,但尚未观察到并行相关概念的出现,说明暂时相对缺乏对MBSE与并行工程的研究,在未来对MBSE的研究中需要更加注重并行工程在MBSE中的应用。

从图4中观察到单词“analytical models”,金长林等[56]提出把系统模型分为描述模型和分析模型两大类,其中系统描述模型用于对系统的架构和行为进行描述,系统的分析模型用于对系统的行为进行分析。DUNCAN等[11]也指出将描述性模型和分析性模型链接在一起,使系统设计者能够快速运行大范围的系统配置,从而可以可视化、分析和优化结果,以满足系统要求。

“complex” 出现在图4中,体现了系统的发展趋势。随着系统需求的不断提高以及大规模系统的集成,系统复杂程度不断增加。而MBSE的出现恰恰是为了解决复杂系统工程的问题,随着系统复杂化程度的提高,MBSE的应用范围也将不断扩大。

“ontology”的出现意味着本体在MBSE领域中的应用。本体是共享概念模型的明确形式化规范说明[57],通过本体语言,可以明确定义系统设计的语义及其之间的关系。在MBSE中应用本体,可以对模型进行规范化的表达,加强模型之间的信息交流。

“integration”体现了MBSE的应用需求。MBSE的实现过程涉及许多不同的建模工具,不同的建模工具支持的建模语言不同,这导致了模型异构现象的产生,实现不同工具、不同模型之间的语义集成和数据集成是MBSE的重要研究方向。此外,将MBSE方法与其他方法,如安全性分析、可靠性分析等进行集成[58],也是不断优化MBSE方法的重要途径。

从图4中观察到了单词“object-oriented”, MBSE的本质是面向对象的系统工程,MBSE的工作流程,应以面向对象为指导原则来进行探索和实践[59]。

词云图中“safety”和“security”的出现,强调了模型驱动的分析方法正在成为复杂系统安全性、可靠性设计所依赖的重要技术手段[60]。同时,将安全性分析应用于系统架构模型,可以在系统设计早期发现潜在的风险。安全性分析与MBSE的集成研究,是未来MBSE的发展方向之一[61-63]。

此外,从图4中观察到单词“knowledge”,采用MBSE方法可以实现知识的无二义性表达,提高知识的可重用性,并且MBSE方法比非MBSE方法更全面地掌握了架构知识[64]。MBSE被确定为利益相关方之间知识创造、知识共享和知识利用的促进者[65]。

单词“digital”的出现体现了数字化的趋势,随着数字化技术的发展,应用MBSE方法促进数字化转型已经成为当前的研究热点[66-67]。

2.3.2 摘要词云图分析

从摘要词云图图4中,发现,“model”“design”“requirements”“SysML”“architecture”“complex”等单词较为显眼,与关键词词云图观察结果一致,进一步验证了关键词词云图分析的代表性。除了与关键词词云图中观察到的单词一致的结果外,单词“development”在图4中占据了显著的位置,随着系统复杂度的增加,在复杂系统开发中引入MBSE方法已经成为系统开发的趋势。从INCOSE对MBSE的定义中可知,MBSE关注系统开发的全过程。在开发过程中应用MBSE方法,可以管理整个开发生命周期过程,有效降低研制成本,加快开发速度[68-70]。

除关键词词云图观察到的“methodology”“tool”外,摘要词云图中还出现了单词“language”“modeling language”,进一步强调了建模语言、方法、工具在 MBSE研究中的重要性。

此外,在图4中观察到了“framework”,体现了对MBSE建模框架以及方法框架的探索和研究,MBSE为解决系统问题提供了一个基于模型的框架。例如,CHONG[71]等基于MBSE方法提出了一种复杂航天器系统综合可靠性设计框架。BOGGERO[72]等提出了一种复杂系统架构敏捷定义的MBSE架构框架,通过MBSE方法简化、改进和加速其架构定义和建模。基于MBSE方法的框架研究已经成为解决复杂系统问题的重要手段,框架也体现了MBSE方法的整体性。

单词“efficiency”“effective”的出现,表明了MBSE方法可以有效提升系统研制效率,提升系统研制效率也是在系统开发过程中应用MBSE方法的最终目的。

单词“lifecycle”的出现,强调了在产品研发全生命周期中应用MBSE方法的重要性。鲁金直等[73]通过对MBSE的应用调查发现,仅有47%的反馈人在产品研发全生命周期中应用MBSE。因此,在MBSE研究中,将MBSE方法应用到产品研发全生命周期十分重要。

“domain”体现了MBSE应用的多领域的特点。引入特定领域模型可以增强MBSE的适用性,并提高其严谨性[74]。但如何解决不同领域模型集成的问题是MBSE亟待解决的问题。

“stakeholders”利益相关者在MBSE方法的实施过程中占据重要的地位。MBSE主要用于系统利益相关者需求和要求的定义和建模,应用MBSE方法的第一步就是要识别系统的利益相关者,收集其需求和开发系统需求,为后面的需求建模、架构设计奠定基础[75]。

在图4中观察到了单词“definition”“decision”,定义和决策是应用MBSE方法解决系统设计问题的两个方面。如何应用MBSE方法进行更好的问题定义、架构定义,支持系统设计决策,是系统设计开发关注的问题。

除了“requirement”,在图4中还观察到了单词“need”,在实施MBSE方法的过程中,需求的正确定义是MBSE用于系统设计开发的基础。由INCOSE Guide for Writing Requirements 2019 V3可知,需求是由概念转化成要求再转化而来的。概念是一种书面或图形表示,简明地表达了一个系统或产品需要解决的问题。要求是将一个或多个概念形式转换为对系统功能执行的一致期望的结果。需求是将一个或多个要求或需求形式转化为系统履行某种功能必须满足的结果。在产品开发的过程中,概念被提出,通过分析转化为要求,被记录下来,再通过分析转换为需求。需求和要求在系统设计开发中具有重要地位。

“functional”和“physical”的出现体现了系统架构建模的主要流程和内容,系统架构建模主要包括功能架构、逻辑架构和物理架构定义。

单词“mission”“scenario”“operation”“function”“structure”“component”“phase”“level”的出现,体现了MBSE方法实践的层级化,MBSE涵盖对使命、场景、运行、功能、结构、组件的定义和描述。

从图4中观察到了“conceptual”“conceptual design”,概念设计是系统设计的初始阶段。概念设计阶段是系统架构评估物理架构概念的关键阶段[76]。目前,概念设计阶段主要存在需求不明确、缺乏仿真验证等问题,如何有效解决这些问题是MBSE方法应用的重要内容。

此外,图4中还出现了单词“assessment”和“evaluation”。由于信息在多个文档之间传播,当出现设计变更时,传统基于文本的系统工程很难对变更影响进行准确评估,这使理解系统的一个特定方面来执行必要的可追溯性和评估变更的影响变得非常困难。采用MBSE方法对系统设计中的要素以及系统特性进行正确评估和优化,是提升系统研制效率的重要途径。同时,将评估方法引入系统建模,应用MBSE方法进行系统性能评估及系统架构模型评估能够显著提高设计优化结果和开发决策效率,降低设计和评估成本[14]。

“cost”“quality”和“time” “constraint”的出现体现了在应用MBSE的过程中,成本、质量和时间的约束对MBSE的重要性、成本的降低与否以及时间的减少与否都是MBSE方法应用的有效性检验标准。降低系统设计开发成本以及减少开发时间也是MBSE的重要优点。而与系统高度相关的质量特性通常依赖于系统架构的设计,系统工程师已经开始通过考虑质量和时间约束来定义最相关的系统架构[76]。此外,在图4中观察到单词“performance”,系统性能是系统设计过程中的重要指标。在系统设计过程中,必须平衡几个相互竞争的目标,如确保设计的可行性、最小化成本、进度和性能风险,同时实现利益相关者的价值,使得设计的系统满足需求[77]。

“formal”是MBSE定义中的核心概念之一。MBSE提供了一个形式化的建模方法来支持系统需求、设计、分析、验证和确认等活动[48]。通过形式化表达,有助于减轻以文档为中心的方法所带来的一些挑战[78]。同时,形式化的建模还为项目利益相关方之间的交流提供了统一的、无二义性的产品,为后续项目的重用和快速改进提供了模块化的模型支持[79]。但形式化建模的背后需要用到建模工具、建模语言和建模方法论来支撑,存在一定的技术门槛。如何更好地采用MBSE方法进行形式化建模,需要关注建模语言、方法论和工具。

“information”和“data”的出现,说明了MBSE模型信息数据之间的交互、共享、重用的重要性。目前,由于MBSE建模语言的异构,如何使MBSE模型信息更好地传递,实现互联互通也是MBSE方法不断优化的重点。

此外,“specification”和“standard”的出现,意味着规范、标准在MBSE研究中的必要性,缺乏正式的规范和标准,很难支持MBSE模型的统一表达和信息交流。满足系统规范也是MBSE的研究内容之一。

从图4中观察到单词“thinking”,结合汇总的摘要进行分析,“thinking”为“systems thinking”系统思维,是早期问题定义阶段的重要内容,MBSE的使用有可能降低在系统思维向系统工程活动转变过程中可能发生的信息失真或丢失。同时,MBSE方法的实践过程也与系统思维密不可分。

“communication”和“understanding”的出现体现了在系统工程活动中,沟通与理解的重要性。沟通是工程系统成功的基础,其使系统的利益相关者之间能够进行互动[80]。应用MBSE方法可以有效改善利益相关者之间的沟通,提高沟通的有效性[49]。

从图4中观察到“failure”和“reliability”,系统可靠性和故障分析是系统维护的关键组成部分,实现系统早期可靠性评估,可以有效降低系统开发成本,提高系统的设计效率。模型驱动的分析方法正在成为复杂系统可靠性设计所依赖的重要技术手段[61]。如何将MBSE与可靠性分析方法有效结合以提高分析的效率和准确性,是可靠性分析的发展方向。

“industry”和“aircraft”的出现,体现了MBSE的具体应用领域,MBSE已经被逐步应用于工业领域,尤其是飞机制造领域。

“comprehensive”“specific”“dynamic”“automated”等体现了MBSE的全面性、明确性、动态性等特点,以及MBSE趋向自动化发展的特点。

单词“heterogeneous”“interoperability”“uncertainty”“traceability”和“transformation”的出现,体现了MBSE应用所面临的挑战。建模语言和技术的异构,导致数据互操作性困难,难以实现需求、模型之间的追溯。在MBSE中,模型转换是解决模型无缝集成问题的关键组成部分[81]。

在图4中观察到了术语“CPS”,信息物理系统(cyber physical system, CPS)的特征是由软件系统和物理系统的交互产生行为[82]。与文献[34]对过去20年的MBSE文章进行研究所得的结果一致,CPS是MBSE领域的常用术语,CPS领域对使用MBSE支持制造和生产工程活动的兴趣日益增加。

在图4中还观察到了单词组“digital twin”,数字孪生用其在数字世界中的数据、功能和通信能力来表示真实的对象或主题[83]。数字孪生作为一种新兴的连接物理和虚拟世界的技术手段,在实现各行业数字化和智能化转型方面表现日益突出[84]。MBSE和数字孪生之间有着密切的联系。MBSE的三大支柱的使用可以作为数字孪生的起点,通过使用 MBSE 技术可以简化流程[4]。工程师可以使用适当的 MBSE 工具和语言创建事件驱动或基于代理的仿真,以研究数字孪生的行为和交互[85]。进一步探索MBSE和数字孪生的融合是当前数字化潮流下MBSE发展的趋势。

图4中还出现了术语“MDD”,模型驱动开发(model-driven development, MDD)被越来越多地用于许多领域的系统开发,MDD为通过模型和模型转换建立可追溯性链接提供了新的机会[27]。MDD可视为MBSE的基础,将模型驱动的方法和系统工程结合形成MBSE,可更好地应对复杂系统的挑战。

词云图中的“SBD”,基于集合的设计(set-based design, SBD)是一种并行设计方法,非常适用于具有显著不确定性的复杂系统[86]。文献[86]通过调查122篇相关的期刊文章和会议论文,对SBD的实践状态进行评估并确定了SBD在需求开发、MBSE方面的研究价值。

3 结束语

3.1 讨论

本文对截止至2022年10月31日的IEEE及INCOSE社区中与MBSE相关的167篇核心期刊文献,运用Python及其第三方库WordCloud技术进行关键词和摘要的词云图分析,总结其与当前存在的国内外MBSE相关综述文章的一致性与分歧性如下。

(1) 一致性

在词云图所得结果中,MBSE与SoS的融合研究,MBSE工具协同、统一的发展方向,在系统全生命周期应用MBSE,与关锋等[87]对各国对MBSE流程、方法、工具和应用的研究的综述所得结果一致。鲁金直等[73]在MBSE应用调查中发现,当前MBSE并没有被应用于系统全生命周期,推断MBSE需要涵盖整个项目的生命周期,与本文通过词云图分析得到需要扩大MBSE在系统全生命周期中的应用的结果一致;通过调查可获知当前MBSE的工业实践在航空领域比较突出,符合在词云图中观察到的“aircraft”的情况。此外,词云图中出现的“reliability”“safety”等与可靠性、安全性分析相关的结果,与胡晓义等[61]对基于模型的复杂系统安全性和可靠性分析技术的发展综述所得到的结果一致。词云图分析中,SysML作为当前MBSE主要建模语言的出现与Li等[47]对1993至2021年与MBSE相关的文献分析以及Dong等[88]对MBSE相关文章的分析所得结果一致。此外,词云图所得MBSE与安全性分析、可靠性分析,CPS、SoS、本体的相关研究也与Li等[47]对MBSE文献的综述所得结果一致。词云图中的SysML与CPS也与Akundi等[34]对过去20年MBSE相关文献的分析所得结果一致。本文与当前存在的国内外MBSE相关综述文章的一致性体现了MBSE发展的特征、运用WordCloud文本分析技术对MBSE顶刊进行可视化分析所得结果的高度代表性,以及对MBSE未来发展方向预测的准确性。

(2) 分歧性

Li等[47]在对MBSE文献的综述中提到了并行工程,但并没有涉及到具体的并行设计方法,本文通过对词云图进行分析,虽然没有观察到并行工程相关单词,但发现并行设计方法SBD,说明SBD与当前MBSE研究具有一定的相关性,而Shallcross等[86]在对与SBD相关的122篇期刊文章和会议论文的调查中,也确定了SBD在 MBSE方面的研究价值。Li等[47]强调了MBSE文献中的ISO标准和规范,本文通过词云图也观察到了标准和规范,但不局限于ISO标准和规范,针对MBSE制定正式标准和规范具有必要性。此外,相比于其他MBSE综述文章,本文强调了时间、成本、质量约束对MBSE的重要性,以及运用MBSE方法进行评估的内容,采用MBSE方法对系统进行评估优化可以有效提高系统设计效率,同时强调了效率的重要性,提高系统设计效率是应用MBSE方法的主要目的。本文与当前存在的国内外MBSE相关综述文章的分歧性将有利于丰富MBSE的研究内容,体现MBSE领域研究的发展趋势以及MBSE的关注点的变化。

此外,通过研究发现,目前国内外针对MBSE的综述文章较少,体现了本文存在的必要性。

3.2 结论

本文对167篇MBSE顶刊采用WordCloud技术进行词云可视化分析,旨在深入了解MBSE领域的研究内容、MBSE建模三大支柱的情况以及MBSE的发展态势。研究发现:

(1) 关于MBSE领域当前研究内容

模型是MBSE的核心,MBSE通过模型的不同视角来满足利益相关者的需求,实现系统的形式化表达。设计良好的系统架构以及构建完整的系统架构模型是应用MBSE方法的首要任务。应用MBSE进行系统架构建模的主要内容包括功能架构、逻辑架构、物理架构的定义与模型构建。

系统设计是MBSE的主要研究内容。需求是系统设计的基础,贯穿着系统开发的全生命周期。一个完整的MBSE过程包括了需求、设计、并行、验证与确认等几大工程,但是通过对关键词和摘要的词云图分析,涉及到并行工程的内容较少,只发现了并行设计方法SBD,因此在MBSE的研究内容中,需进一步加强对MBSE并行工程的研究。此外,基于模型的仿真、对系统设计中的要素以及系统特性进行正确评估和优化、支持系统决策也是当前MBSE的研究内容。质量、成本、性能和时间的约束也成为在应用MBSE进行系统设计的过程中需要考虑到的因素。

MBSE的实现过程涉及许多不同的建模工具,不同的建模工具支持的建模语言不同,这导致模型异构现象的产生,实现不同模型之间的语义集成和数据集成是MBSE当前以及未来的重要研究内容。

(2) 关于MBSE建模的三大支柱

MBSE建模的三大支柱是MBSE领域研究的重点。SysML是目前MBSE领域研究人员使用最多的建模语言,OPM是MBSE顶刊研究中出现频率最高的建模方法,在词云图分析中没有出现具体的建模工具。由于建模语言和建模方法的多样性,导致建模工具种类多样,而不同建模工具构建的架构模型之间存在异构的问题,因此开发统一的、支持多种建模语言的建模工具是建模工具发展的重要方向。

(3) 关于MBSE的未来发展态势

MBSE的未来发展态势可分为如下几个方面:

(1) 随着系统复杂度的不断提高,MBSE的应用领域和范围将不断扩大。建立与MBSE相关的正式的规范和标准具有重要意义。将MBSE方法应用于产品研发全生命周期是MBSE的定位,也是未来MBSE对应用的要求。

(2) 将MBSE与安全性分析、可靠性分析方法结合是优化MBSE方法的重要手段。

(3) 在软件工程领域应用MBSE方法可以提高系统设计效率和质量,但通过分析发现,目前MBSE在软件领域主要作为过程支持和改进工具,未来需进一步扩大MBSE在软件工程领域的应用范围。

(4) 将MBSE的思想扩展到体系,MBSE与SoS结合形成MBSoSE,以MBSE方法为指导,结合体系工程的特点,开展MBSoSE研究,是MBSE的重要扩展方向,也是未来体系工程发展的方向。

(5) 随着数字化技术的发展,应用MBSE方法促进数字化转型已经成为当前的研究热点。MBSE和数字孪生的融合是当前数字化潮流下MBSE发展的趋势。

(6) MBSE已广泛应用于信息物理系统,实现MBSE与CPS的结合,以更好地应用MBSE方法支持信息物理系统的构建是MBSE在CPS应用中的重要发展方向。

(7) 并行工程是MBSE的研究内容之一,扩大SBD方法在MBSE中的应用是提高MBSE应用效率的手段。

(8) 将MBSE方法与本体进行结合是规范MBSE模型表达、提高模型互操作性、提高MBSE知识重用的重要手段,未来MBSE与本体领域的结合研究将成为MBSE研究的重点之一。

本文采用WordCloud技术对MBSE领域的167篇顶刊的关键词和摘要进行分析,从分析的数据来看,当前分析局限于MBSE领域顶刊,仅通过关键词和摘要进行分析,分析范围相对较小。采用WordCloud技术生成词云图的方法可以直观地展示MBSE文献的关键内容,但词云图表达的信息有限。在未来工作中,将在本文的基础上进一步扩大MBSE文献分析的范围,探索更加丰富的技术和工具,对MBSE发展态势进行进一步探索。

猜你喜欢
词云云图架构
基于FPGA的RNN硬件加速架构
基于PyQt5界面的词云制作软件设计
功能架构在电子电气架构开发中的应用和实践
成都云图控股股份有限公司
Web文本挖掘及可视化
黄强先生作品《雨后松云图》
LSN DCI EVPN VxLAN组网架构研究及实现
基于SCI文献分析的呼吸病学发展态势研究
基于TV-L1分解的红外云图超分辨率算法
云图青石板