夏凯旋,赵有龙,苗向阳,洪小迪
(中海油能源发展股份有限公司采油服务分公司 天津 300452)
全球信息化技术发展迅猛,物联网、大数据、云计算等技术逐步在实验室领域发挥重要作用,结合数字化、智能化技术发展“智慧实验室”是实验检测行业的必然趋势。通过梳理中海油能源发展股份有限公司(简称海油发展)实验室数字化建设现状,分析实验检测模式及实验特点,以期为实验室管理系统数字化建设提供参考和建议,助推油气勘探和检测过程的提质增效及高质量发展。
随着国内油田大多已进入开发后期,开采成本高、单井日产量低的问题逐渐显现,而随着世界经济的发展,各国对能源尤其是油气资源的需求直线上升,产需矛盾十分明显。在此背景下,储量丰富的非常规油气资源的勘探和开采显得尤为重要[1]。非常规油气检测实验作为非常规类油气藏勘探开发过程中重要的一环,对评估非常规油气资源的开采价值、开采难度具有重要的指导意义,而非常规油气检测实验记录作为报告的核心内容,其生产效率和记录质量直接影响着报告的时效性和可用性[2]。
非常规油气资源储层地质结构复杂,检测实验也包括多种方向,如储层评价、储层物性、地球化学及含气性等[3]。当前实验记录现状包括:①实验现场手动记录,后期录入为电子版记录;②部分仪器设备的连续数据需要通过文件导出,在Excel中绘制分析图;③记录模板多样,通过多种Word文档形式,分别记录实验过程数据。
实验记录是在实验过程中的数据、图形、视频等的记录过程[4]。通过在线表单设计技术,动态配置实验任务模板,在实验过程中,通过文本识别技术、数据采集技术,实时获取实验过程的原始数据,利用既有的运算分析模型对数据进行分析,从而得出实验结论[5],如图1 所示。
图1 实验过程记录流程Fig.1 Experimental process recording process
在线表单设计技术是一款基于代码生成器的低代码开发平台技术,采用前后端分离架构,支持工业互联网平台技术架构,其强大的代码生成功能可以辅助前后端代码一键生成,引领新的开发模式(在线编码模式→代码生成器模式→ 手工合并智能开发),更关注业务逻辑[6]。
在线表单设计技术在使用过程中需要组件库来支持其设计过程,组件库不仅包括基础组件,还包括高级控件、布局组件和业务组件。基础组件是通用的基础控件,如常见的本文框、下拉框、单选器、多选器等;高级组件是附带一定功能的定制化控件,如手机号、图片上传、富文本等;布局组件用以配置表单的页面布局,支持栅格布局、看片布局及页签[7],如图2 所示。
图2 在线表单组件清单Fig.2 List of online form components
在线表单设计技术提供了基于在线表单组件库的表单设计能力,可以通过拖拽等可视化的方式完成表单的设计工作,让实验人员直接参与表单的设计工作能够更直接地反映业务需求[8]。同时,设计出来的表单模板具有版本管理能力,可以响应业务不断变化的需要。
在线表单设计技术使得表单模板可以存储复用,进而形成在线表单模板库,根据不同的行业及业务类型对在线表单模板进行分类管理[9]。
3.5.1 通过拖拽设计表单
在没有任何专业知识的情况下,通过拖动组件,像搭积木一样,快速完成表单的创建,然后开始数据收集工作。
3.5.2 快速实现与流程对接
通过图形化提升设计能力,使在线设计流程与设计表单无缝对接,快速实现办公申请流程。可以与业务数据绑定,实现设计表单与库表对接,以保持数据同步。
3.5.3 控件丰富,即插即用
默认提供几十个常用控件,一键即可引用,也可以做出非常专业、漂亮、复杂的表单。可以上传图片、上传文件、一对多模型、一对一模型、单表模型等复杂控件。可以在线编写脚步、JS增强、CSS增强,从而实现更复杂的业务场景[10]。
3.5.4 手机支持,多终端支持
设计表单支持多终端,在手机端拥有令人满意的效果,支持单表和一对多复杂模型。自带设计功能支持屏幕调试模式,可以方便地切换手机表单设计风格。
3.5.5 灵活扩展,功能丰富
布局灵活,支持各种排版形式;百变皮肤,皮肤默认颜色可配置;高级查询,准确高效查询业务数据;数据接口,支持自定义接受数据接口;数据导出,数据自由导入/导出;权限设置,支持表单权限、数据权限、按钮权限。
3.5.6 接口规范,易于部署
在线表单设计技术是基于微服务架构开发的,符合工业互联网平台的架构要求,可以部署到应用商店进行版本管理和触发自动更新。
通用文字识别功能提供通用文字OCR 识别能力,借助深度学习算法和自身技术的不断积累,满足用户对于全文识别能力的要求。支持印刷/手写体识别,印刷识别率可达95%以上,手写体识别率可达80%以上,对于复杂汉字识别准确率超过80%,数字识别准确率高达90%以上[11],如图3 所示。
图3 文档识别效果展示Fig.3 Document recognition results
表格识别功能可以自动对表格线进行检测、识别表格图片上的内容,也可以对文字+表格内容一起进行识别。省去了用户手动录入的过程,能够自动完成数据信息的采集,方便对接用户的后台数据系统,带来了极大的操作便利性。通用表格识别技术对表格文字识别准确率可以达到95%以上[12]。
图像切边增强功能能够智能判断照片中主体文档的边缘从而进行切边,增强图像突出文字、识别背景复杂的文字内容、返回文字信息,以及文字的位置信息、行置信度、单字符内容和位置等[13]。
准确性高:文字智能识别技术可自动从文档或图片中定位并识别字段,并且在传统的识别技术中,加入了大数据和深度学习的算法,提高了自动识别的准确率,高达99.1%。
稳定性强:文字智能识别技术已经成功应用于各行各业,接受海量信息的识别和大量用户的使用,同时能够适应复杂且多变的应用场景,为客户提供稳定的识别应用服务,反馈良好。
适用性高:文本智能识别技术涵盖了整个检测识别框架的所有核心算法,支持横向、竖向拍摄,适应透视畸变、光照不均等情况,具备非常高的复杂环境可用性。
简单易用:文本智能识别技术不仅直接可以通过调用全面的API接口,还提供SDK、服务器私有云部署、公有云部署开发服务,同时支持移动端APP和PC网页端的使用,平台兼容性强,使用简单便捷。
应用广泛:文本智能识别技术不仅能够识别规范的印刷体文档,还能实现不规则且多样的手写体识别。除了对标准化的卡证或图文的识别外,能根据客户的业务场景需求提供定置化识别模型,满足多样化的场景应用服务[14]。
随着检测设备智能化能力的提高,越来越多的实验设备具备数据采集能力,通过边缘服务平台,其多种协议支持能力可以对不同的设备进行实时数据采集。通过数据治理,形成统一、规范的结构化数据和可利用的非结构化数据,实现在线实验结果记录及实验记录分析能力[15],如图4 所示。
图4 基于实验室设备的边缘服务Fig.4 Edge services based on laboratory equipment
检测记录无纸化:通过信息技术实现电子实验记录功能,摆脱纸质实验记录,在方便查找历史实验记录的同时也能够通过视频、图片、声音等资料生动形象地还原整个实验过程,从而提高实验效果和分析的精细度。整体实验室的无纸化率达95%以上。
检测模板定制化:通过对实验记录的动态模板定制,减少模板制定时间,提高目标利用率。对于通用性高的模板,可以升级为组织级的模板,以进一步提高组织级的实验效率。通过模板可视化定制,为实验人员制定适应多种实验场景的客制模板,灵活运用。通过表单设计技术的推广,共完成了50 多种实验记录模板的定制工作,并将在后续的工作中不断完善模板。
数据分析在线化:通过数据采集及文本智能识别技术,收集实验过程数据,通过既定的分析模型,可快速得到实验结论,能够大幅度提高实验的生产效率。通过在多个实验室的推广运用,整体实验记录过程缩短50%以上。
实验质量可控化:智能技术提取的数据作为实验记录的原始数据,可以通过版本管理对异常的数据进行过滤,从而确保实验质量的稳定性。
语音录入的导入。现在语音识别技术也逐渐成熟,利用语音识别技术完成部分实验记录的录入工作已成为可能。
实验过程记录标准化。目前,实验过程记录虽然有国家的指导标准,但是各行各业的记录模板差异很大,即使同一行业的不同公司,实验记录模板也有很大差异。为了提升行业创新能力,需要进一步规范实验记录方法及内容,以达到数据共享、知识沉淀的目的,形成具有中国特色的实验标准规范。■