地质档案规范化管理与知识图谱的应用

2022-05-30 00:53王成铖
兰台内外 2022年31期
关键词:数据挖掘图谱规范化

摘 要:在数字时代,地质档案的规范化管理也面临着一些亟待转型的管理难题,这种转型的核心要义就是通过引入数字化、智能化、可视化的管理技术和管理工具,实现对地质档案的高效管理、高效开发、高效利用。现阶段,地质档案规范化管理主要包括“管理过程的制度化”“管理时间跨度上的全寿命周期化”“管理模式的集成化”等几个方面的内涵。同时,地质档案规范化管理也具有知识价值的承载性、知识价值的升值性、知识管理的价值链导向性等特点。地质档案规范化管理视角下知识图谱的应用可以从梳理构建馆藏地质档案资源知识地图、搭建知识图谱数据化管理平台、植入档案数据挖掘技术、动态预测与仿真决策支持系统等方面入手。

关键词:地质档案;规范化管理;知识图谱;档案管理

与其他学科专业的档案相比,“地质档案”有自身的一些特点,例如在表现形态上,它既可以表现为实物档案,又可以表现为电子数据档案、纸质载体档案等,是工程地质勘探领域知识资源最基本的呈现形态。长期以来,在我国工程地质勘探领域,“地质档案”管理一度存在着诸多管理失范问题,例如档案管理人员专业性不强、缺乏专业档案管理知识,地质档案管理硬件和软件缺失或不相匹配,地质勘察工程全寿命周期档案资料归集不齐等问题。当然,在数字化时代,地质档案的规范化管理也面临着一些亟待转型的管理难题,这种转型的核心要义就是通过引入数字化、智能化、可视化的管理技术和管理工具,实现对地质档案的高效管理、高效开发、高效利用。

一、现阶段地质档案规范化管理的主要面向

从人类对档案资源、档案载体的管理历史来看,在农耕文明时代、工业文明时代等不同的历史发展阶段,人们对于档案“规范化管理”的具体内涵具有不同的理解和把握。例如在农业文明条件下,档案规范化管理更多地体现为“归集和分类”;而在工业化时代,档案的规范化管理则呈现出“标准化”的特点。立足于当前数字化经济、知识经济的浪潮中,地质档案的规范化管理则呈现出电子化、数字化、编码化、可视化、全寿命周期管理等典型特点。结合我国现阶段所处的经济发展阶段、工程地质领域发生的显著趋势等,我们认为地质档案的规范化管理主要有这样几个面向:

1.管理过程的制度化

从工程地质档案的产生来讲,任何档案资源的产生都是从勘探工程立项之日起开始的,档案管理的规范化首要的就是要严格按照制度规定的权利、责任、标准、要求、资源保障、人力储备、技术载体等开展管理,实现一种基于制度轨道的正规化管理。这种基于制度化的管理所要克服的是传统的碎片化管理、不成体系化管理、兼职化管理、无标准或者标准较低式的管理。例如,我们以地质档案资料归档时的“编号”为例,一般的制度化要求中,“案卷页号”通常包括这样几个内容:“卷内文件有书写内容的页面均应编写页号”“单面书写文件在右下角”“双面书写文件,正面在右下角,背面在左下角”“图纸页号编写在右下角”“案卷封面、卷内目录、卷内备考表不编写页号,以独立案卷为单位编写页号”等。如果没有这种制度化、标准化的硬性要求,任何工程地质档案的管理都难以实现“海量资源的有序管理”这个基本目标。

2.管理时间跨度上的全寿命周期化

地質档案资料是人们在矿产资源勘探、地质勘探等过程中所形成的一系列档案资源的综合,具有跨主体较多、跨作业面较多、跨工作流程较多、跨时空条件较多等诸多属性。一个工程勘探项目从前期立项,到勘探施工过程中的诸环节再到项目结束,整个时间跨度周期可能达数月到数年之久。因此,基于完整、准确记录和保留这个勘探过程资料的需求,我们在认识和看待“档案规范化管理”这个课题方面应当着眼于“项目全寿命周期”这个视角。

3.管理模式的集成化

人类档案资源管理规范化的一个趋势就是逐步从“分散化”走向“集成化”,它是在地质档案资源管理主体分散化基础上不断利用信息技术、数字技术和特定的管理组织纽带进行档案管理提升、整合、协调、服务的过程。

对于当前我们所处的这个数字化、后现代工业社会而言,工程地质档案资源的管理不纯粹是单一主体对单一业务、单一档案资源的单一性要素管理,而是一个由牵头组织所牵头、多主体合作集成对多元化的地质档案资源风险的集中管理和整体应对。这种管理模式的集成化意味着档案多元管理主体立足于不同的分工、不同的流程、不同的业务单元、不同的岗位职能等对“作为一个整体的档案知识资源开发”进行合作,这就是集成化管理的真正含义。

二、地质档案规范化管理的特点

从档案资源内在的属性角度看,人类产生的档案主要可以分为“公共性档案”“私人性档案”以及“逐利性档案”这样几个类型。地质档案资源由于实际产生于多样化的主体(比如政府部门、私营企业、公益研究院等),因此其特点具有十分多样化的表现力。

1.知识价值的承载性

工程地质档案是客观、真实记录地质勘探等过程中所形成的一手资料,代表着人们在一定的物质条件、技术条件、人力条件下认识地质、实践地质的知识产物,从这一点角度来讲,地质档案资源具有显著的知识性、产权性,并且可以直接转化为生产要素,为特定的主体创造直接的物质财富。尤其是在大数据时代,这些传统意义上静态的、纸质化的档案资源正在面临着数据挖掘、海量数据分析等的技术升级,其本身所承载的价值、知识将会被成倍放大。

2.知识价值的升值性

地质档案的产权属于项目投资方,其承载的知识价值可以帮助勘探者、企业等减少地质勘探、矿藏勘探等过程中的交易成本,同时经过一定的研究、共享、转化等,地质档案本身的知识价值又会逐步增值、升值,进而形成利润,这就是一种知识的套现和升值。当然,在传统的地质档案管理模式中,由于管理的规范化程度较低、数据化程度较低等原因,人们对地质档案本身的价值挖掘、知识挖掘等显得很不充分,地质档案本身的知识价值在“升值”属性上表现得并不明显。进入大数据时代之后,随着一批新兴数据处理技术(如数据挖掘技术、虚拟现实技术等)的加入,地质档案知识价值的升值步伐将越来越快。

3.知识管理的价值链导向性

“价值链”理论、概念等由美国著名战略学家迈克·波特在20世纪80年代提出。这一理论认为,包括地质档案管理在内的各类组织管理行为,由于所处的社会分工、市场分工链条不同,各自所创造的价值也不相同。因此,在开展档案管理规范化方面,应当从一个整体性的价值链出发,围绕着“地质档案价值最大化”这个目标,从各环节入手开展全过程、全价值链的管理,而走向制度化、程序化、标准化、技术化,就成为这种价值链管理的重要支撑。

三、地质档案规范化管理视角下知识图谱的应用策略

在大数据时代,包括地质档案在内的任何档案资源,只有借助于现代数据技术流动起来、流通起来、共享起来才能发挥其最大价值,在这个价值再造的过程中,“知识图谱”(或者称“知识图像”)是一个重要的技术路径,它指的是立足于特定行业内部,对档案资源进行垂直细分进而寻找出一个最优利用档案资源的管理技术路径,它可以帮助档案资源的受众群体勾勒出一幅利用最短的时间、最小的代价去寻找到和开发特定档案资源的目的。

1.梳理构建馆藏地质档案资源知识地图

地质档案资源的“知识地图”应当围绕着组织特定的管理战略、管理目标(比如矿藏资源分布、地质条件规律研究等)而展开。首先,管理者应当基于管理目标摸清地质档案馆藏资源家底,尤其是要从各利益相关主体方获取到关键的馆藏外资源,有针对性地获取到可以服务于管理目标的全部档案资源,重点要厘清档案数据资源的真实性、背景性及档案管理主体的相关信息。其次,管理者要按照编目、编号要求,对归集到的地质档案资源进行造册分类管理,例如,可根据本单位经营管理需求,对库藏档案信息进行分类汇总,形成专题文件汇编。又如,也可以根据管理需求或专项工作要求,通过摘录、缩编、剪辑,重新组织档案信息,形成专题编研材料。

2.搭建知识图谱数据化管理平台

上文指出,没有现代数据技术的参与,地质档案资源很难实现真正意义上的高效流转、高效共享和“可视化管理”。在探索地质档案资源图像化管理的过程中,构建起一个基于大数据跟踪的服务平台可以纠正传统的“非规范化管理”的弊端,确立一种高效的管理体系。数据化管理平台一般也被称为“智慧云数据处理中心”,是大数据时代的一种信息集中共享中心,也有人将智慧云盘称之为“数据规模超出传统数据库管理软件的获取存储管理以及分析能力的数据”。我们认为,为了达到对地质档案价值资源最大化的管理目标,这一数据化管理平台必须具备这样几个功能板块:一是线下档案资源全部实现云端化(涉密档案除外),即以高效率的扫描设备设施将线下纸质档案100%转化为“数据”形式,储存于云端。二是保持一种技术上开放的生态性,根据档案归集过程的动态性来实现多源异构数据的集成化管理,同时在线实现交互式的审批、服务利用。三是具备可检索、可复制、可下载(类似于CNKI数据库)的交互功能。

3.植入档案数据挖掘技术

地质档案资源实现数据化、在线化、平台化之后,需要借助于一定的“数据挖掘技术”才能匹配起高效流通、高效开发、高效利用的管理目的。在这里,“数据挖掘技术”指的是一种基于大数据、人工智能等对已知的、库存的数据资源进行深度加工和分析的过程。在日常科研中,像我们所熟知的“爬虫技术”、cite space软件技术等都是比较典型的数据挖掘技术,它们可以帮助我们在最短的时间内对特定主题、特定领域的档案数据进行集成化管理,从而缩短地质档案资源价值創造的时间。

数据挖掘技术的服务核心资源是共享性的信息资源,而信息资源价值的实现关键在于其流动性、传输性和增值性。作为组织行为、组织管理的一个大数据实现方式,数据挖掘所针对的数据信息具有完整性、一致性、精确性、实效性等显著特点。数据挖掘服务模型是一个信息服务需求——信息收集处理——信息反馈的过程,主要的模型思路见下图2:

4.动态预测与仿真决策支持系统

地质档案资源数据管理系统可以将静态的档案资源转化为可视化的“知识图谱”,但是这充其量只是大数据时代档案资源规范化管理的基础步骤,我们还需要在线植入一个动态预测和仿真决策支持系统。目前在我国档案管理界,常见的数据库类型有DB2类型、Oracle类型、MSSQL类型、Access类型等,这些数据库的一个发展趋势是面向一种能够兼容各种图像、文字、音频、指纹、面部识别、视频的大数据平台发展。收容包纳了各种地质档案资源的基础数据和动态资料之后的大数据平台,可以通过模拟仿真、政策仿真、模型构建等过程实现对这些高智群体的行为预测、绩效产出预测等功能。例如,针对“如何找到页岩气矿产资源”这个管理目标,我们不仅仅需要依托大数据系统调取相关的地质档案资源这种“单一的知识图谱”,还需要借助于理论模型、数据模型、成矿类型等多样化的因子,通过数据连片处理技术等对相关的跨学科档案资源、跨知识边界知识资源等进行调取和分析,这就需要一定的仿真决策支持系统参与其中。

四、结论

对于地质档案资源管理规范化来讲,大数据时代这种规范化的主要内含之一就是走向“数据化”,而“知识图谱”正是这种“数据化”的具体实现形式之一。大数据时代地质档案资源管理的一个显著特点是传播媒介的“新媒体化”——这个过程具有的特点有“技术层面的全数字化、应用层面的强交互性、器质层面的高智能化、传播层面的自媒体化、社会层面的虚拟化、效力层面的全方位渗透以及发展层面的大数据化”等,本文提出的梳理构建馆藏地质档案资源知识地图、搭建知识图谱数据化管理平台、植入档案数据挖掘技术、动态预测与仿真决策支持系统正是基于大数据时代管理转型的命题而来。

参考文献:

[1]闫 冬,张皓晨.档案知识服务研究述评[M]辽宁大学中国档案文化研究中心.中国档案研究.沈阳:辽宁大学出版社,2017

[2]王法昌.提高档案管理科学化水平的策略探究[J].东方企业文化,2015

[3]黄文秀.工程地质勘察原始资料档案规范化管理探讨[J].城建档案,2021

[4]张 晔.地质专业档案领域知识图谱的构建和应用[J].浙江档案,2021

[5]彭 宇,庞景月,刘大同,彭喜元.大数据:内涵技术体系与展望[J].电子测量与仪器学报,2015

[6]吴永亮,陈建平等.地质数据本体构建及其在数据检索中的应用[J].地质通报,2018

(作者单位:广东省核工业地质局二九二大队)

作者简介:王成铖(1986—),男,汉族,山东泰安人,本科,馆员,研究方向:档案管理。

猜你喜欢
数据挖掘图谱规范化
探讨人工智能与数据挖掘发展趋势
绘一张成长图谱
价格认定的规范化之路
补肾强身片UPLC指纹图谱
基于并行计算的大数据挖掘在电网中的应用
主动对接你思维的知识图谱
一种基于Hadoop的大数据挖掘云服务及应用
狂犬病Ⅲ级暴露规范化预防处置实践
高血压病中医规范化管理模式思考
满足全科化和规范化的新要求