基于来源的组织机构元数据构建研究

2017-01-17 19:09崔杰杨文刚田伟
档案管理 2017年1期
关键词:组织机构元数据联系

崔杰+杨文刚+田伟

摘 要:来源元数据作为档案元数据核心集重要的组织部分,描述了社会实践主体的特征及背景信息。本文以组织机构为基点建立了来源元数据实体—联系(E-R)模型,并以天津外国语大学为例,阐述了组织机构实体元数据和联系元数据的构成,分析了如何著录两类元数据的变更信息。组织机构元数据模型为档案来源元数据系统提供了数据设计框架,使系统在记录组织机构的历史沿革、提供整理档案的客观依据、提高档案检索利用效率方面具有广泛的应用价值。

关键词:组织机构;实体;联系;元数据;天津外国语大学

依据魂系历史主义思想[1]构建的档案元数据核心集,是一个以“历史”为本原的、由档案历史联系的三维结构要素(来源、事由和年代)及要素之间关系组成的,包括来源、事由和年代三种元数据。本文以社会实践活动主体的主要构成形式——组织机构为基点,将其作为一个实体,提出了组织机构元数据实体—联系(E-R)模型,研究实体和联系元数据的构成及其变更信息,从而构成了档案来源元数据。

1 组织机构元数据模型的构建研究

1.1 以组织机构为基点建立来源元数据模型的缘由。马克思说:“主体,即人,是自身异化的存在物……是作为现实的,活生生的,特殊的个人——就是这种存在物。”主体是有头脑能思维的、从事社会实践活动认识活动的个人或集体,主体可分为个人主体,集体主体,社会主体。[2]在档案学领域,社会实践主体为档案的来源,包括个人、组织机构和国家三个层次。

组织机构是指依法设立的机关、企业、事业单位,社会社团以及其他组织机构。[3]为什么以组织机构为基点来建立来源元数据模型呢?因为一个国家是由众多组织机构构成的,同时每个组织机构中内设了多个部门,在每个部门中又工作着多个个人。作为档案来源的中间层次,组织机构是社会实践活动主体中最典型的存在方式,其自身存在的实体属性及联系属性构成了档案来源元数据。

1.2 组织机构元数据模型。我们将采用实体—联系(E-R)数据模型来设计组织机构元数据模型。实体—联系(E-R)数据模型是基于对现实世界的这样一种认识,世界是由一组称为实体的基本对象及这些对象之间的联系组成。[4] E-R模型力图描述数据的含义,正与我们研究组织机构元数据的初衷不谋而合。

E-R数据模型主要包括实体、联系和属性三个要素。我们将利用实体—联系(E-R)数据模型将组织机构中的实体、联系及属性进行结构化地描述,通过对组织机构实体和联系的分析研究,归纳出实体属性集与联系属性集,随后通过对这两个属性集进行建模推理出实体元数据和联系元数据,最后将实体元数据与联系元数据有机整合在一起形成组织机构元数据,从而实现对档案来源元数据的构建过程。

1.2.1 实体。实体是现实世界中区别于其他对象的“事件”或者“物体”。[5] 组织机构作为一个实体,它内设了多个部门,而每个部门中又工作着多个个人,作为组织机构的构成要素,部门和个人也是实体。组织机构实体包括三个层级,即组织机构、部门和个人。

1.2.2 联系。联系是指多个实体间的相互关联[6],反映了实体间相互作用的状态,可以有效地揭示实体之间潜在的关联。组织机构的联系包括内部和外部联系。内部联系是指在一个组织机构内部,组织机构、部门和个人三者之间的关联状态。外部联系是指一个组织机构与其外部的组织机构、部门和个人的联系。

1.2.3 属性。“属性”是一组对实体内部与外部特征揭示的描述。属性的定义以实体为基础,是从不同方向或维度上对实体相关特征的提炼和归纳。[7]属性分为实体属性和联系属性。其中实体属性是对每个实体本体特征进行的全方位描述和揭示,一般通过一组属性来表示。联系属性可以揭示实体间关联的内容及限定实体间关联的程度。实体属性和联系属性,通常采用“属性名—属性值”的方式进行描述。此时,属性名充当着元数据的角色,属性值为元数据的值,实体和联系元数据构成的集合,构成了组织机构元数据核心集。

组织机构元数据模型勾勒出的组织机构网络,不仅将实体进行了层级划分,而且将实体之间潜在的内部和外部关联有效地揭示出来,随后通过对实体和关联属性的分析,推理、构建出档案来源元数据,为我们今后设计档案来源元数据系统提供了语义模型。

2 组织机构实体元数据及其变更分析

组织机构本身包括组织机构、部门和个人三个实体层级,三者的实体属性不同。但组织机构的实体属性众多,有些属性对于组织机构沿革变化是可有可无,所以我们研究的是组织机构最为核心的实体属性,以此为基础构成组织机构实体元数据。

依据GBT 16987-2002 [8]和GBT 14946.1-2009 [9]中数据采集的要求,结合组织机构、部门和个人实体属性的特点,分别规范出三者的实体元数据。我们用二维表格的形式,列出三者的实体元数据表:元数据名称为实体元数据;元数据取值类型分为字符型、日期型和数值型三类;用M/C将实体元数据分为两类,M 表示必选实体元数据,C表示可选实体元数据。

2.1 组织机构实体元数据。表1列出了24项组织机构实体元数据,其中组织机构代码是指由国家编制并赋予组织机构在全国范围内唯一、不变的法定标识,它是组织机构实体元数据的主标识,用它可以唯一的标识组织机构。例如天津外国语大学,其组织机构代码为401359209,可以用401359209唯一的标识这所大学。

2.2 部门实体元数据。如表2所示,列出了16项部门实体元数据。其中部门代码是组织机构赋予部门唯一、不变的标识,它是部门实体元数据的主标识,用它可以唯一的标识一个组织机构中的部门。

GBT 31287-2014中将组织机构代码和组配码进行组合构成组合码,用于标识组织机构的内设部门。[10]组配码可以根据每个组织机构的特点,由所在组织机构进行设定。例如天津外国语大学,组配码可以由部门分类号和部门顺序号(即两位阿拉伯数字)组合而成。学校内设部门分为党群、行政、教学、教辅四类部门,分为用字母DQ、XZ、JX、JF表示。党委办公室属于党群部门,可以用分类号DQ表示,部门顺序号为01,那么党委办公室的组配码为DQ01,即党委办公室作为天津外国语大学的内设部门,其部门代码可表示为“401359209DQ01”,具体的构成见图2。

2.3 个人实体元数据。如表3所示,列出了31项个人实体元数据。其中个人的公民身份证号是国家法定的证明公民个人身份的有效证件号码,它是个人实体元数据的主标识,用它可以唯一的标识一个个人。

2.4 实体元数据变更分析。如表4,实体元数据主标识分为组织机构、部门和个人三类,它可以准确定位哪个层次的实体元数据有变更信息;实体元数据主标识的值,分别为组织机构代码、部门代码和公民身份证号;实体元数据名称和实体元数据值分别为待变更的元数据项目及现有的元数据值;变更内容表示变更后的元数据值;变更时间用8位阿拉伯数字表示;变更依据为变更所依据的文件号、材料名称等。

现以天津外国语大学为例,说明实体元数据变更情况。表4中第1条元数据变更记录,著录了组织机构层级实体元数据变更信息。其表示天津外国语学院的“组织机构名称”,在2010年3月18日更名为天津外国语大学,依据文件为教发函[2010]6号。

3 组织机构联系元数据及变更分析

组织机构联系元数据,将组织机构内部和外部联系有效地揭示出来,架构起组织机构关联网络,使用户了解其内部环境和外部地位。我们采用实体—联系(E-R)数据模型来设计组织机构联系元数据模型。

实体—联系(E-R)数据模型有特定的图示,矩形框表示实体,框中内容为实体名;菱形框表示联系,框中内容为联系名;实体与联系用直线相连,并在直线上标注联系的类型。联系分为3种类型:一对一联系(1∶1)、一对多联系(1∶N)和多对多联系(M∶N)。

3.1 组织机构内部联系元数据分析。

图3为组织机构内部实体之间的联系,包括组织机构与部门、组织机构与个人及部门与个人三类联系。

3.1.1 组织机构与部门的联系。一个组织机构可以内设多个部门,而一个部门只隶属于一个组织机构,组织机构与部门之间是一对多联系(1∶N)。菱形框中联系名可以定义为内设。例如,天津外国语大学有内设部门43个,而每个部门都隶属于天津外国语大学,即这个组织机构与其内设部门之间是一对多的关系。

3.1.2 组织机构与个人的联系。一个组织机构内部工作着多个个人,而一个个人只供职于一个组织机构,所以组织机构与个人之间是一对多联系(1∶N)。菱形框中联系名可定义为任职。例如,天津外国语大学现有教职员工1800人,而每个员工只隶属于天津外国语大学,即这个组织机构与个人之间是一对多的关系。

3.1.3 部门与个人的联系。一个部门内可以有多个个人供职,而一个个人可以在多个部门中工作,其中在一个部门中主要供职,在其他部门中属于兼职,所以部门和个人之间是多对多联系(M∶N)。菱形框中联系名定义为任职或兼职。例如,天津外国语大学英语学院有50名教工,英语学院书记张三兼任工会副主席,即英语学院这个部门里工作着多个教工,张三同时在两个部门工作,所以部门与个人是多对多的关系。

3.2 组织机构外部联系元数据分析。

图4给出组织机构与其外部的组织机构、部门和个人三类联系。

3.2.1 组织机构与组织机构的联系。一个组织机构可以与多个组织机构存在联系,即组织机构与组织机构之间是多对多联系(M∶N),分为上级、平级、下级及挂靠四类联系。菱形框中联系名分别定义为上级关系、平级关系、下级关系及挂靠关系。

(1)上级关系。上级关系即隶属关系,分为党群组织、行政主管和业务三类上级关系。

例如天津外国语大学,其党群组织的上级部门为中国共产党天津市教育委员会,行政主管上级部门为是天津市教育委员会,业务上级部门为中华人民共和国教育部。

(2)平级关系。指组织机构在国家行政序列中的级别相同,即组织机构在国家的行政序列中占据的位置相同。例如,天津外国语大学与天津工业大学均是局级单位,这两个组织机构是平级关系。

(3)下级关系。指同一组织系统中等级低的组织或人员[11]。例如天津外国语大学附属外国语学校就是天津外国语大学的下级组织机构。

(4)挂靠关系。指机构或组织从属或依附于另一机构或组织[12]。例如,天津市翻译协会挂靠在天津外国语大学,则天津外国语大学就是天津市翻译协会挂靠的组织机构,二者形成挂靠关系。

3.2.2 组织机构与部门。一个组织机构可以与其非内设的多个部门之间存在联系,即组织机构与部门之间是多对多联系(M∶N)。菱形框中联系名可以分别定义为兼管或代管。例如,北疆博物院现隶属于天津自然博物馆,因其坐落于天津外国语大学校内,故受天津自然博物馆和天津外国语大学的双重领导,此时天津外国语大学与北疆博物院形成了兼管关系。

3.2.3 组织机构与个人。一个组织机构可以与多个非专职工作于这个组织机构的个人之间存在联系,即组织机构与个人之间是多对多联系(M∶N)。菱形框中联系名可以分别定义为兼职或借调。例如,天津师范大学管理学院的王红导师,在天津外国语大学研究生院兼职为研究生授课,那么天津外国语大学这个组织机构与王红这个个人形成兼职关系。

3.3 组织机构联系元数据的变更分析。表6给出了组织机构与部门、组织机构与个人、部门与个人、组织机构与组织机构四种联系类型,分别用R1、R2、R3、R4表示;实体元数据主标识值可以准确定位待变更的组织机构、部门和个人;联系名内容类型标注了每种联系类型涉及的具体联系名称;联系名内容表示现有的联系名称;变更内容指更改后的联系名;变更时间用8位阿拉伯数字表示;变更依据为变更所依据的文件号、材料名称等。

下面以天津外国语大学为例,说明联系元数据变更的情况:如表6中第1条变更记录,联系代码为R1,著录了组织机构与部门的联系元数据的变化。其表示天津外国语大学(组织机构代码为401359209)与北疆博物院(部门代码为402609356JX01)原来是兼管关系,于2016年1月1日二者的联系变为内设关系,依据文件为教发函[2016]6号。

4 组织机构元数据模型的应用

4.1 记录组织机构的历史沿革。采用实体—联系(E-R)数据模型,在分析组织机构实体和联系属性的基础上,形成了组织机构实体和联系元数据及其变更元数据。实体元数据相当于组织机构的“简历”,联系元数据就像“所处环境”,变更元数据相当于“演变轨迹”。模型真实详尽地记录了一个组织机构的背景资料和沿革变化,对于档案用户研究组织机构历史沿革具有重要的参考凭证作用。

4.2 提供整理档案的客观依据。作为社会实践主体典型的存在形式,组织机构实体及其内外部联系时刻发生着变化。完整的档案整理方案应随其变化而变更,并能依据它有效地组织案卷、构成全宗、形成全宗群。模型可以提供档案室和档案馆两个层次的整理方案:在档案室阶段可以依据组织机构与部门、组织机构与个人、部门与个人之间的联系组织案卷,构成全宗。在档案馆阶段可以依据组织机构与组织机构之间的联系将全宗组织起来,架构起全宗群。模型提供了支撑档案实体系统存在的骨架,成为一种科学实用的档案整理方案。

4.3 提高档案检索利用效率。目前的档案检索是针对馆藏档案一般特征的检索,而组织机构元数据模型提供的检索,是依据档案历史联系特征的检索,即利用组织机构实体和联系元数据及变更元数据来检索档案的一种特殊方法。模型将隐藏在档案之间的历史联系有效揭示出来,有助于管理者了解组织机构的历史沿革,从而有效地整理及合理地保存档案。同时用户不用浏览档案实体本身,就能完整地获取所需档案信息,提高检索利用效率。

*本文系教育部人文社会科学研究项目《‘魂系历史主义的档案元数据核心集的构建研究》(项目批准号:15YJC870007)的部分研究成果。

猜你喜欢
组织机构元数据联系
财务共享服务中心管理模式优化
现阶段做好工程项目总承包管理工作的分析
元数据与社会化标签在微视频搜索中的应用
高等院校智慧校园建设规划与实现
浅谈平面图与立体图的思维培养
财会信息资源元数据标准的研究
高职艺术设计专业项目教学中心运营模式的实践研究
核电工程建设期间的移交接产管理探讨