基于图像分类技术的数字档案管理探究

2020-11-30 09:09邹燕华
卷宗 2020年27期
关键词:图像分类数字档案档案管理

摘 要:为了提高数字档案分类管理工作效率与质量,本研究简要概述一种建立在图像分类技术基础上的数字档案管理系统,并从特征提取、向量机培训及分类这两个方面入手就系统管理情况进行分析概述。以此为基础就数字化档案管理系统框架、基于统一知识的内容流程及多层可重用知识内容结构等内容进行了探究分析,以此推动数字档案管理工作发展。

关键词:图像分类;数字档案;档案管理

DOI:10.12249/j.issn.1005-4669.2020.27.088

基于图像分类技术的数字档案管理系统涵盖了智能仓库、数字货架、卫星定位等多个子系统,兼具网络传输、资料存储、资源整合等多项功能,能够实现高效完成业务、资金、物流及信息的管理调控工作。

1 基于图像分类技术的数字档案管理系统概述

基于图像分类技术的数字档案管理系统具有离线图像训练及在线图像分类的控制功能,培训组件能够自动筛选检索归档文件中的图像信息,利用经过向量机技术训练的分类器将检索到的图像数据存储到对应位置,图1展示的就是该系统的图像培训及分类管理原理流程。

1)特征提取。处于同一类别的图像资料具有共同性,可以通过对纹理、图形、颜色等特征进行提取筛选,以此提高文档资料归档准确性。以颜色提取为例,首先需要将训练图像像素统一为96×120的标准,在此基础上对其进行4×4的分解處理,并对每个划分区域展示的颜色类别进行直方图矢量计算及向量计算,当出现16个相似度的时候表示颜色提取较为准确。2)向量机培训、分类。向量机培训分类技术是建立在最小结构风险理论知识及二进制分类计算的基础上,该项技术可以在无需额外增加所在领域知识的前提下执行资源分类管理的目的。向量机培训、分类能够对提取数据进行分析与计算,并通过删除极端数据的方式将支持向量融入构建模型系统中,在此基础上获得一个能够展示文档资料图像信息的标准函数:[Label][Index1]:[Value1][Index2]:[Value2]…,其中,[Label]代表图像类别编号,[Index]代表图像资料特征值。

2 基于图像分类技术的数字档案管理探究

数字化档案管理系统是建立在计算机信息技术的基础上,为档案文件的储存使用提供了更为便利的调用方式,为科学研究、学术展览、教育娱乐、数据管理等工作的顺畅开展夯实了基础。就当前数字化档案管理工作现状进行系统分析可知,由于不同机构、部门使用的应用程序、遵循的管理标准存在差异,由此导致文件档案不能相互共享与利用;智能管理系统多是独立开发研制的,由于缺少足够的通用性、集成性,极易造成不必要的资源、成本损耗;文件资料以数据信息的形式进行存储管理,并未以知识级别差异进行类别分析、组织重组,在一定层面上影响了数据信息管理效率。针对上述问题,本研究简要介绍了一个融入了图像分类技术的数字化档案管理系统,这个系统是建立在知识重组、数据集成等专业理论的基础上,目的在于提高数字档案管理智能性、高效性。

1)数字化档案管理系统框架。数字化档案管理系统除了用于管理知识资产外还需要对资源开发、数据保存、信息使用、资源共享等资产取用流程进行管理控制。该数字化档案管理系统有助于对文档资料进行有序管理与控制,该系统框架主要有三个模块构成,分别为统一知识内容流程、知识集成内容管理及多层可重用知识内容。统一知识内容流程能够将使用者与管理项目连接起来,发挥着数据收集、信息转换、资源整合、编辑发布、访问查询等多重功能。知识集成内容管理模块涵盖了一个能够创建词汇库、元数据及内容分层的子系统;一个能够创建、发布与系统资源相关内容的检索子系统;一个能够将创建编辑内容转换为特定格式及网页的发布子系统。多层可重用知识内容主要作用于使用者层面的知识管理与控制,能够将核心、高级、创新元素整合到一起,核心元素涵盖了多媒体对象及语义元数据等基础内容,为知识内容组合管理搭建了基础框架;此模块还能从既定内容中创作编辑出更高级、更创新的内容,以此丰富档案管理流程内容。2)基于统一知识的内容流程。基于统一知识的内容流程设计目的在于创造一个良好协作环境,方便使用者明确重复利用内容特征的同时还有助确保不同部门严格遵循统一标准的工作流程。就企事业单位而言,只有创建统一标准的知识内容流程才能为研发者、管理者及使用者创建一个保持良好协作交流秩序的工作流程。标准系统、重复共享的透明环境有助于研发者的智能编辑及逻辑组织,集成协作的开发环境有助于管理者高效完成数据关联、内容创建、信息发布等工作,简单明了、细致分类的跨领域检索功能有助于使用者对知识内容进行筛选使用、集成管理。综上可知,统一知识的内容流程主要涵盖了数据收集、信息转换、集成编辑、组织发布、检索访问等一系列流程。3)多层可重用知识内容结构。传统的档案管理系统的可重用知识内容能够细分为小节、段落、语句等单元结构,基于图像分类技术的数字化档案管理系统则可以将可重用知识内容细化为文本、图形、音频、视频等单元结构,并能借助内/外部网络途径将相关内容组织、发布出去。在进行多层可重用知识内容结构设计的时候需要考虑以下两大核心问题,一是怎样创建设计出兼具多样化功能及系统性结构的管理模型,二是怎样将研发技术与应用程序进行知识重组,以此提高企事业单位的档案管理效率与质量。若想在多个领域、不同机构间实现资源共享、内容重组,就需要对多层可重用知识内容进行统一表达与管理,并通过合理划分知识范畴的方式提高整个档案管理系统的工作效率。多层可重用知识内容结构在进行规划设计的时候离不开数据挖掘技术,这项技术有助于数据动态检索、信息分类管理,与此同时还能对特定内容及结构进行更改、重组。

3 结语

将图像分类技术融入数字档案管理系统有助于提高档案管理效率,利用图像分割技术将分离区域的图像颜色或纹理效果进行特征提取,在向量机分类器的作用下将文档资料进行分类处理,这种高效、快速的图像分类功能能够确保数字档案管理工作有序顺畅进行。

参考文献

[1]呼俊迪.浅谈大学教学档案规范化管理[J].人力资源管理,2017(6):351-352.

[2]张晓娴.高校档案工作规范化管理实践与探索[J].云南档案,2014(11):40-42.

[3]杨秀红.多媒体软件在档案管理中的应用[J].办公室业务,2016(17):127.

[4]陈博.新媒体环境下数字档案管理的方式研究[J].治黄科技信息,2019(10):78-79.

[5]潘翠芬.基于数据挖掘技术的数字档案管理信息系统的设计与实现[J].城建档案,2020(4):23-25.

作者简介

邹燕华(1973-),女,福建华安人,中专,助理档案管理员,研究方向:档案管理。

猜你喜欢
图像分类数字档案档案管理
档案管理中的电子档案管理
档案管理与企业内部控制关系的思考
数字档案生态链信息流转效率提升策略研究
基于云计算的图像分类算法
研究数字档案信息安全保障体系
基于锚点建图的半监督分类在遥感图像中的应用
健康档案管理的“云”前景
加强工程项目档案管理的有效途径