CAD图纸与BIM一致性的全自动审核方法

2022-05-13 04:43余芳强宋天任
土木工程与管理学报 2022年2期
关键词:图例一致性图纸

彭 阳, 余芳强, 宋天任

(上海建工四建集团有限公司, 上海 201103)

在BIM全生命期应用中,根据设计或竣工图纸建立BIM往往是第一步实质性工作。从图纸建立BIM的过程中,信息一致性是非常重要的,需要进行严格的审核。若BIM对象的信息与原始图纸不一致,将在后续基于BIM模型的管理时带来很多困惑,甚至造成错误决策。但是随着工程项目规模不断扩大,图纸规模、建模工作量和出错数量都会迅速上升。因此,使用人工来做图模审核变得越来越不现实,必须引入计算机自动化的一致性审核方法。

几乎所有的工程图纸都是CAD软件保存的DWG格式。虽然人能够读懂CAD图纸,但在计算机看来,这些图纸仅仅是一些图线和文字的松散集合。这就给自动化的图模一致性审核带来了三方面的困难:(1)绘图时图块放置随意,不同单位的图纸边栏格式也不统一,导致图纸元数据难以提取。(2)通过文字标记来定位CAD图纸中的构件时,难以在大量文字块中寻找有用信息。暖通机电图纸中甚至经常使用不规范的引线标注,导致标注文字与标注对象相距很远。(3)很多细小构件根本就没有文字标注,仅以图例来表达[1]。如何在图线大量堆叠的情况下不遗漏地找到它们是需要研究的。

目前图模一致性审核的研究很少,主要报道的是BIM的合规性审核[2,3]。已有一些研究图纸文字和图形模式的识别,例如采用聚类方法将邻近的图块及附加文字识别成一个整体[4]。对于扫描版的图纸还可以使用光学字符识别(Optical Character Recognition,OCR)技术来提取文字[5]。有研究基于表格纵横线的识别来定位文字[6],或者先取出所有文字再按规则过滤[7]。但是,CAD图纸中的文字对象还含有块参照、坐标、字号等重要数据,本文将充分利用以挖掘更多信息。CAD可以直接提取一个图层的几何形状信息,例如直线、多段线、圆弧等。如何判别这些零散形状构成的有意义模式是图纸检查的关键[1]。已有的研究可以通过文字和图线得到一些有用信息,但不能精确寻找某个特定图块的位置,不适合用于自动化的图纸与模型比对检查。

为了解决这些问题,本文提出了图纸与模型一致性审核的新方法,整个审核过程可以全部用Python实现并自动运行。全自动审核的流程如图1,主要创新点以深色框标出。

图1 全自动图模审核流程

1 图模预处理与元数据审核

1.1 模型预处理

BIM(Building Information Modeling)中的构件名称、坐标、类型等信息都以高度结构化的方式存储,且使用国际通用规范进行数据互用[8],因此审核所需的构件语义信息不难提取出来[9],即使大型的模型也不会有任何障碍。本文使用Autodesk Revit二次开发对BIM进行预处理后,项目全局参数、构件几何信息、族信息、属性集等全部被提取到自研软件平台的数据库。

1.2 图纸预处理

与BIM不同,图纸的DWG格式是不开放的[10],而且不便于代码集成和灵活操作[11]。因此先使用AutoCAD提供的接口自动把图纸批量转化为开源的DXF格式。

图纸预处理中,首先识别国家规范定义的标准图框尺寸,按照预设的比例尺缩放至足尺,然后平移对齐BIM的项目原点。此外还有一个重要问题是,CAD图纸中大量使用块参照,每个块中的元素为上层块的相对坐标,并不能直接比对模型的全局坐标。解决方法是采用递归的方式将所有嵌套的块参照转换成最顶层图纸下的统一坐标,并记录在内存中。

1.3 元数据提取和审核

元数据是项目的一些基本信息。获取元数据最直接的方法是,事先要求制图者将文字写在图纸上的固定位置,然后用程序批量读取[12],但这种方法很难在多个项目的实践中推行。本研究利用CAD的块参照信息识别属性键值对,也就是属性名称 - 属性值构成的二元组。首先定义常见的属性名集合,例如工程名、建设单位、专业名称、日期。然后找到包含这些名称最多的块,其中包含的多行文字即为本图纸的属性。如图2,查找左侧坐标最近且高度大致相同的文字,如果左侧相同高度没有字,则下方文字为属性值。

找到这些属性对之后,进行两方面的审核:(1)专业、人名、图号等重要信息需完全一致;时间值解析成年月日,精确到日期就算一致;一般的属性如版本名和系统名称只需80%的字符一致。(2)涉及项目名称、医院名称、单位名称的属性,使用NER(命名实体识别)模型做提取,与BIM附带的相应名称作对比。

2 文字性设备审核

2.1 两类标记的识别

这一节审核有文字标注的较大型设备或构件。图纸中的设备类型编码和编号通常是分开标注的,例如门编号和型号大致是横向排列,图3中排风机的“EF”和“04-05”竖向排列。由于CAD图纸中的标注方式较为随意,没有严格的规则,故合并顺序很重要。实践中使用横纵坐标的软排序,即纵坐标明显不同时,按纵坐标从上往下合并;差别不大时,只按横坐标顺序合并。

图2 属性键值对的提取

图3 引出式标记的例子

图纸中主要是普通标记,即所注构件就在文字旁边,只需要将邻近的标注文字合并,以提取完整的语义,且构件位置为文字的平均坐标。

同时,机电图纸中也存在大量的引出式标记,用于注记重要机电设备,这时还要识别引线位置(见图3)。如果一块文字附近存在一个随机倾角(非45°倍数的角)的长直线端点,则认为这是一个引出式标记,需要寻找引线另一个端点,记为设备的实际位置。

2.2 图纸标注的编号规则

本研究从企业工程图纸库中收集了约100份建筑和机电图纸,整理出79种标准化的设备编号规则,为图模审核提供了规范。包含暖通、给排水、门窗三个大类,如表1,暂未收录其他类型。如果企业有自己的标准,也可以灵活配置。由于结构图纸的构件数量较少,钢筋的建模又较为专业仅能人工检查,自动审核的需求不大,因此未纳入。每条规则使用正则表达式匹配CAD文字,若有多个匹配,则以优先级最大者为准。无法匹配的则不认为是一个标注。

表1 设备标准编号规则(部分)

图4 本体信息映射和审核方法

2.3 审核方法

如图4,分别将CAD图纸标注和BIM信息映射到同一维度的本体信息。类型信息使用标准编号规则映射;图纸位置从插入点等数据算得,模型坐标来自包围盒的中心点。一致性审核的结论有四种:(1)正确匹配:坐标和BIM构件本体信息同时正确;(2)模型多余:图纸中没有,而BIM在此处建了模;(3)模型缺少:图纸画了但是没有建立相应的模型;(4)型号不匹配:是一种较轻的错误,构件类型和位置都正确,但文字参数有出入。需要指出的是,如果图模的位置不匹配,则会形成“模型多余+模型缺少”的一对错误组合。

3 基于构件图像特征的审核

至此已经解决了有文字标注的构件审核,但CAD图纸还存在大量只有图例没有标记的小型建筑构件,在没有任何附加信息的情况下自动识别它们是很困难的。已有进展大多采用了一些半自动的算法,例如由用户指定图纸上的几个关键点来定位一个柱截面,应用于简单图纸的翻模[13],或者专门识别细长的结构梁轴线[14]。有研究提出将图纸区域切成若干同心圆环来提取特征,可以衡量图形的相似度[15],还有报道以卷积神经网络(Convolutional Neural Network,CNN)应用于图纸形状的分类[16,17],但这些方法本质上是给出整体上的分类概率,也不针对图模一致性审核。

图5 极坐标特征匹配过程

本文提出一种基于构件图例图像特征的审核方法,针对这类数量多、无可靠文字标记、有图例的构件。首先采用DDA(Digital Differential Analyzer)算法,将经过坐标变换的图纸中的直线、多段线、圆弧等对象转化为位图。位图的每个像素只有0和1两种状态,表示此处有无图形。以下定义图例的连续极坐标特征(Continuous Polar Features,CPF)。如图5左,将图例从中心点等分成nf个扇形,每个扇形再等分nr份区域。如图5右上。记录每个区域内非零像素个数占扇形总非零像素的比例,形成nr维扇形的特征编码向量。然后把所有特征编码向量连写两遍,得到的图例CPF就是2nf个特征编码向量的序列。从图纸位图左上角开始,使用可伸缩的矩形窗口族扫描,窗口采用同样的方法计算极坐标特征,但是不连写,而是在图例的CPF上滑动(图5右下),在任意位置的匹配度超过阈值则找到该构件,记录坐标。利用CPF找到构件位置后,可与模型构件坐标对比审核。该算法的特点是能适应任意的图形旋转角度,且较好适应图纸中的缩放。

4 项目应用

本团队开发了全自动图模一致性审核软件系统,应用在上海市某大型三甲医院的全楼层模型,作为本市第一个深度应用BIM进行运维管理的项目,必须严格保证竣工BIM模型里关键设备的位置准确,因此与竣工图纸一致性的要求特别高。自动化图模审核涉及14层的BIM模型和18张CAD图纸,总建筑面积5万m2。一层的建筑和机电2张图纸依序进行了元数据审核、文字性构件审核和无标注图例审核。每张图纸的元数据和文字性构件审核共计约30 s完成。图例审核中取特征参数nf=24,nr=10,图纸位图约为5亿像素,使用多进程加速,在中等配置的计算机上,每层5000 m2的图纸约需各2 min审核时间。估测人工审核一层的图模至少需要2 h,因此本文的全自动方法可以节约96%的工作时间。

为了衡量一致性审核的有效性,定义两个指标:覆盖率Rc=已审核数/需审核总数×100%;准确率Ra=(1-误报数/需审核总数)×覆盖率。

主要审核项目的表现见表2。各类的覆盖率都很高(由于防火门等构件很多,验证覆盖率时仅随机抽样100个),这表明应当检查的构件基本上都被检查过。但有引线的文字标注审核的误报数量较多,准确率略差。以下用几个实例来分析图模一致性审核应用的效果。

表2 部分审核项的有效性

图6,7为文字性构件审核的实例。在审核界面上,红色感叹号为有问题的位置。图6为模型多余问题的实例。此处模型出现了一个软水箱,但图纸中并没有标注。建模人员联系设计单位后,逐一修订了多余模型的参数。这类不带引线的普通标记构件大多数比较容易在图纸中找到,虽然数量众多,但Rc还是可以很高。且文字易于对应到表1的编号规则,因此Ra均超过九成。

图6 模型多余的实例

图7为型号不匹配的例子,这是一个排风机,图纸标注为EF-B1-16,但模型对应位置出现的是EF-B1-17,虽然模型族正确,但编号录入有误。建模方负责对此类错误进行了改正。此类引出式标记存在一些断行、分开标注的情况(参见图3),有时会出现漏检,因此Rc略有降低。且暖通机电图纸的直线元素极多,经常干扰识别引线末端坐标,导致Ra只有八成左右,如何更准确识别引线所指的位置是一个可以改进的方向。

图7 型号不匹配的实例

图8是基于图像特征识别的两个中间结果分析。图8左图是识别双扇门,1-4,2-5,2-7等都是图例旋转90°后形成的构件,可以顺利识别;1-3,2-6尺寸较小,成功匹配了小尺寸窗口;2-3这样的局部干扰区域仍会产生误判。图8右图,吸顶灯这类特征明显的元件识别精度可以更高。综合来看,凭借图例的特征帮助,这类识别图像特征的审核Rc最高。但是容易出现的错误是图纸中不是门扇的位置也报告出来,拉低了Ra。

5 结 语

由于CAD图纸的元数据难以提取、文字标注随意、大量构件缺少标注仅有图例,导致图纸与BIM模型的一致性审核很难自动化进行。为了解决这些问题,本文提出了一套全自动的图模一致性审核方法。首先对图纸和模型进行预处理。一致性审核分为三个阶段,即提取并比对元数据、文字性构件的审核、基于构件图像特征的审核。其中计算图例的连续极坐标特征进行图像匹配的方法是针对大量无可靠标注的小型构件。

实际工程应用表明,建筑和机电图纸的审核能节省96%的时间和人工,且覆盖率和准确度均较好也大大加快BIM建模的审核进度,提升了BIM建模的质量。为综合提升图模自动审核的覆盖面和准确度,未来的工作方向可能包括:增加结构平法、水电系统、详图等其他图纸的审核算法;提升引线式标注的识别精度;采用机器学习的方式对每个企业的图纸绘制标准进行训练优化。

猜你喜欢
图例一致性图纸
注重整体设计 凸显数与运算的一致性
商用车CCC认证一致性控制计划应用
基于区块链的建筑信息模型图纸多人协同创作系统
Why do we celebrate the New Year?
浅谈汽车线束产品图纸管理
看图纸
基于Paxos的分布式一致性算法的实现与优化
找拼图
找照片
如何让学生巧用图例解决数学问题