我国文化大数据标准规范体系构建

2018-01-10 07:09吴素舫
现代情报 2018年1期
关键词:标准规范标准化规范

吴素舫 柯 平

( 1.北京科技大学天津学院图书馆,天津 301830;2.南开大学商学院,天津 300071)

·理论探索·

我国文化大数据标准规范体系构建

吴素舫1柯 平2

( 1.北京科技大学天津学院图书馆,天津 301830;2.南开大学商学院,天津 300071)

随着大数据技术在文化领域的渗透,设计出能有效指导文化行业大数据具体标准制定方向的框架体系尤为重要。文章通过论述我国文化行业大数据标准规范构建的迫切性及分析我国文化大数据标准体系构建的依据,继而构建我国文化大数据标准规范体系框架,包括基础标准、技术标准、管理标准、应用与服务标准。

文化大数据;标准规范体系;文化大数据标准

简单地讲,文化大数据是指大数据技术、理念和思维在文化领域的应用。文化大数据将是推动未来文化创新发展最重要的变革技术,根据国务院关于印发《促进大数据发展行动纲要的通知》[1]文件精神,文化领域要加快促进文化大数据的发展,充分利用文化大数据的资源与技术优势,为国家文化创新产业的大力发展,为大众创业、万众创新的新形势提供资源与技术的支撑。使文化大数据成为振兴中华文化,推动中华文化走向世界的重要推动力量。随着我国文化大数据事业的快速发展,制定出能够科学有效地指导文化领域大数据具体标准制定方向的体系尤为重要。笔者通过理论探索,尝试构建我国文化大数据标准规范体系,以期对文化领域大数据具体标准的制定有所启发。

1 文化大数据标准规范建设的迫切性

大数据对科学研究、经济建设、社会发展和文化生活等各个领域正在产生革命性的影响。大数据应当说归属信息技术领域,但数据应用,尤其是对已有数据二次或多次开发涉及的就不仅仅是技术领域,还有社会及人文领域,广而言之,涉及更为广泛的文化领域。从网络及信息应用发展趋势看,美国对数据的应用,尤其是数据在文化领域的应用是领先的,而我国文化服务领域对大数据的应用相对有些滞后[2]。各国的政府和文化机构已经充分认识到了大数据的重要性,很多国家都已通过相关立法和规范,形成了相应的大数据战略。目前,我国对公共文化服务以及大数据的发展都非常重视,国家相继出台了若干政策,例如《关于加快构建现代公共文化服务体系的意见》[3]和《促进大数据发展行动纲要》[1]等,尤其是2017年2月发布的《文化部“十三五”时期文化发展改革规划》[4],在规划的专栏8-文化科技融合发展中明确指出要制定文化大数据服务标准规范。由此可见,文化大数据标准化工作已经迫在眉睫。

文化大数据标准规范体系构建是有效开展文化大数据工作的基础,建设该体系的迫切性体现在三方面:1)对现实中文化大数据事业的开展起指导作用,使工作中应该直接引用、修订及重新制定哪些具体文化大数据标准有的放矢。2)对各类数据采集、资源建设、信息安全等领域中已有的相关标准尚有待总结分析和及时更新。分析已有标准以确保文化行业标准化的整体格局平衡发展;文化行业标准的更新速度应与文化产业的快速发展相适应,以使得文化产业能够健康发展。3)结合事业发展需求,提出亟需制定文化大数据标准发展规划。这样,能够更好地推动融合各行业的大数据发展需求及扩展大数据标准化工作的广度,而且实现与文化相关的跨平台、跨领域的数据互通也需要尽快制定文化大数据语义、元数据等方面的标准。

2 文化大数据标准体系构建的依据

要构建科学、完善的文化大数据标准规范体系,一定要遵循国家的各项法律法规及规章制度,特别是与标准化工作密切相关的法律法规以及规章制度,如《中华人民共和国标准化法》[5]、《中华人民共和国标准化实施条例》[6]、《国家标准管理办法》[7]、《行业标准管理办法》[8]等。还应当重点考虑以下几方面:

2.1 与文化大数据发展相关的政策

文化大数据标准规范体系的构建要首先遵循国家有关文化与科技行业发展的相关政策,其中既包括与文化大数据直接相关的政策,例如国务院印发《关于加快构建现代公共文化服务体系的意见》[3]、《促进大数据发展行动纲要》[1]、文化部发布的《文化部“十三五”时期文化发展改革规划》[4]、全国人大发布的《中华人民共和国公共文化服务保障法》[9];也包括与其发展建设的相关政策,如国务院办公厅印发《国家“十三五”时期文化发展改革规划纲要》[10]、《“十三五”国家信息化规划》[11]、文化部印发的《文化部“十三五”时期文化科技创新规划》[12];还包括与其发展不直接相关,但有一定联系的其他政策,如国务院办公厅关于印发《政务信息系统整合共享实施方案的通知》[13]、国务院办公厅关于印发《贯彻实施<深化标准化工作改革方案>重点任务分工(2017-2018年)的通知》[14]等。要将这些政策文件中对文化大数据事业的发展要求和规划体现在标准规范体系框架中。

2.2 已有的国家标准与行业标准

文化大数据发展是我国文化事业发展进程中重要的阶段,同时具有文化行业的属性及大数据技术的属性,因此在文化大数据标准规范体系构建中应注重与现有文化行业及大数据行业已有标准的衔接与统一,对适合的相关标准可直接采用,不适合的可根据文化行业的实际情况进行修改、补充、完善,无相关标准可借鉴的再考虑制定新标准。

2.3 国外大数据标准规范

目前,大数据技术相关标准的研制还处于起步阶段。在大数据标准体系制定方面主要由ISO/IEC JTC1 SC32、国际电信联盟(ITU)以及美国国家标准与技术研究院(NIST)等组织推进。ISO/IEC JTC1 SC32 “数据管理和交换”分技术委员会,主要研制各组织使用的信息系统间全球互操作所需的开放电子数据交换方面的通用IT标准;开发和维护有利于规范和管理的元数据、元模型和本体的标准等。NIST目前正在研制《大数据定义》、《大数据术语》、《大数据需求》、《大数据安全和隐私需求》、《大数据参考体系结构》和《大数据技术路线图》等输出物,均已经形成了初步版本。对于以上大数据相关的标准,在我国文化大数据标准规范体系构建过程中,适当总结、分析、借鉴是很有必要的。

2.4 我国文化事业与大数据事业发展规律与现状

文化大数据标准规范应当反映文化事业与大数据技术的发展规律,才能确保标准规范体系构建的科学性和客观性,才能使这个体系是具有生命力的可实现的标准规范体系,才能充分发挥标准化工作对文化事业发展的促进作用。如2016年柯平、申晓娟编著的《文化行业标准化研究》[15],在其内容组织过程中就是以公共文化行业发展概况及标准概况为基础,分析总结全国公共文化事业发展的现状,经过多次修改、多方参与而形成的。

3 文化大数据标准体系结构

文化大数据标准规范体系框架构建的目的是有目标、有计划、有步骤地建立起联系紧密、相互协调、层次清晰、构成合理的文化大数据工作标准并贯彻实施,为我国文化大数据的科学发展提供全面的标准化支撑,为推进文化领域的发展提供标准依据。

文化大数据服务标准规范方案设计课题组对国内外文化与大数据标准规范体系进行充分调研,根据我国文化与大数据标准化工作已有基础、文化与大数据事业发展现状、未来发展重点及对标准化工作的需求,结合大数据技术框架,文化大数据自身的特点,数据安全周期管理以及借鉴当前各领域推动大数据应用的初步实践,并参考未来大数据发展的趋势,在此基础上,构建了一个多层次的标准规范体系框架,如图1所示。

3.1 基础标准

基础标准主要为整个文化大数据工作提供行业通用的基础性的标准,包括行业基础标准和技术基础标准。其中,技术基础标准主要是关于术语和参考模型等技术基础性标准。文化大数据具有文化行业和大数据行业共同的属性,那些适用于文化行业与大数据行业的标准,也同样适用于文化大数据这一交叉行业,因此,笔者认为应首先使用这些行业通用的基础性标准,尤其是对文化服务或大数据服务网络系统产生重要影响的一些基础技术标准、网络信息技术标准等,更应当尽早地在文化大数据得到应用。

图1 文化大数据标准体系框架图

在已有的标准中,以下三方面的基础性标准文化大数据标准体系可以直接应用:

1)关于文化行业的基础性标准,如文献著录标准、缩微摄影技术标准、动漫格式标准、数字化资源标准等。这些标准同样适用于文化大数据行业。在文献著录标准方面有《古籍著录规则》(GB/T 3792.7-2008)[16]、《普通图书著录规则》(GB/T 3792.2-2006)[17]、《标准文献元数据》(GB/T 22373-2008)[18]等国家标准;在资源数字化加工标准方面有《图书馆馆藏资源数字化加工规范第2部分:文本资源》(GB/T 31219.2-2014)[19]、《图书馆馆藏资源数字化加工规范第3部分:图像资源》(GB/T 31219.3-2014)[20]等国家标准;在各种资源元数据标准方面有《音频资源元数据规范》(WH/T 62-2014)[21]、《电子图书元数据规范》(WH/T 66-2014)[22]等关于各种资源的元数据规范;在缩微摄影技术标准中有《缩微摄影技术词汇第10部分:索引》(WH/T 6159.10-2006)[23]、《缩微摄影技术词汇第1部分:一般术语》(GB/T 6159.1-2014)[24]等。对于这些标准,文化大数据标准体系中不需要再重新制定,直接借鉴已有的标准即可。

2)信息技术方面、信息与文献方面相关的技术类基础性通用标准,如信息技术方面的标准有《信息技术数字版权管理术语》(GB/T 30247-2013)[25]等国家标准;信息与文献方面的标准有《信息与文献都柏林核心元数据元素集》(GB/T 25100-2010)[26]、《信息与文献叙词表及与其他词表的互操作第1部分:用于信息检索的叙词表》(GB/T 13190.1-2015)[27]等国家标准。这些技术方面标准的实际应用还需要紧密结合文化大数据各方面的业务实际,因此,建议文化相关部门在应用这些技术类基础性标准时,可结合业务工作实际情况制定标准的应用指南,以规范对标准的理解与执行。

3)大数据领域的技术标准,如NIST 建立的大数据公共工作组(NBD-PWG),目前正在研制大数据《大数据定义》、《大数据术语》、《大数据需求》、《大数据参考体系结构》和《大数据技术路线图》等等输出物,均已经形成了初步版本。另外,国内的机构如全国信标委于2012 年就成立了非结构化数据管理标准工作组,目前正在开展《非结构化数据表示规范》、《非结构化数据访问接口规范》、《非结构化数据管理系统技术要求》等国家标准研制,同时,正在组织编制《云数据存储和管理》系列国家标准,为推动大数据存储和分析标准研究奠定了基础[28]。

3.2 技术标准

技术标准主要是对文化大数据安全及使用的产品平台进行规范和统一,是文化大数据工作得以正常开展的基础,主要包括数据安全标准与数据库产品和平台两种类型的标准:

3.2.1 数据安全标准

数据安全标准作为整个标准体系的支撑体系,贯穿于文化大数据工作整个生命周期的各个阶段。数据安全标准包含基础设施安全、数据资产安全、数据网络安全、隐私保护安全,其中隐私保护安全又包含数据备份、恢复产品和安全等级三方面。

1)基础安全规范是指文化大数据行业所遵循的一般性、大众化的安全规范,它包括从事文化大数据行业应遵循的法律法规、该行业企业自身所制定的涉及数据安全的通用规章制度、文化大数据行业从业者的职业道德规范等内容,同时包括一些硬件设备的安全。

2)数据资产和数据网络安全是指保证数据在系统及网络环境中的安全性的规范与标准,它包括各类系统及其组件的技术安全机制、通用的网络安全法规与协议、数据安全操作规范或指南等。

3)隐私保护标准是指对文化大数据所涉及的人、事的隐私的保护规范和说明,它包括通用的隐私保护标准和特殊的隐私保护标准,其中通用的隐私保护标准包括涉及隐私保护的法律、从事文化大数据行业企业自身所制定的数据隐私保护措施、从业者在此方面应遵循的职业道德规范、涉及隐私内容的数据在系统和网络环境中的安全规范等;特殊的隐私保护标准是指针对某一特殊情况而制定的隐私保护标准。

3.2.2 文化大数据产品平台类标准

文化大数据产品平台类标准主要针对大数据相关技术产品和应用平台进行规范,这类标准是进行文化大数据工作的工具类规范,是开展工作的前提。包括数据处理平台、各种数据库产品两方面,其中数据处理平台标准是针对大数据处理平台从技术架构、建设方案、平台接口等方面进行规范;测试规范针对处理大数据的产品和平台给出测试方法和要求。

1)各种数据库产品包含有诸如关系型数据库产品、非结构化数据管理产品、商务智能工具、可视化工具、数据处理平台型数据库管理系统,其中关系型数据库产品标准针对存储和处理文化大数据的关系型数据库管理系统,从数据访问接口、技术要求、测试要求等方面进行规范,为关系型数据库管理系统进行大数据的高端事务处理和海量数据分析提供支持;

2)非结构化数据管理产品标准针对存储和处理文化大数据的非结构化数据管理系统,从参考架构、数据表示、访问接口、技术要求、测试要求等方面进行规范;

3)商务智能工具用来帮助用户对文化大数据进行分析决策,商务智能工具标准对商务智能工具的技术及功能进行规范;

4)可视化工具是对文化大数据处理应用过程中所需用到的可视化展现工具的技术和功能要求进行规范;

5)测试规范针对处理文化大数据的产品和平台给出测试方法和要求。

3.3 管理标准

管理标准是对大数据资源建设过程中的规范要求,应包括数据处理、数据质量两方面。

3.3.1 数据处理标准

数据处理标准应对数据采集、数据整理、数据分析、数据质量方面进行规范统一。

1)数据采集标准主要是针对数据采集的技术、方法的标准以及数据在采集汇聚后的初步处理方式、方法的标准,具体包括数据表示、数据注册和数据分类几方面进行规范化。

2)数据整理标准主要针对数据整理的技术、方法的标准,具体包括数据清洗、数据组织及数据录入的技术、方法、算法和工具等要求进行统一规定。数据清洗是对数据进行预处理的过程,其任务是过滤和修改不符合要求的数据,不符合要求的数据主要有不完整的数据、错误的数据和重复的数据。数据组织加工标准则是对各种类型、各种媒体的资源进行数字化、数据化的标准。

3)数据分析是保障大数据环境下数据分析的性能、功能等要求进行的数据规范,它包括数据分析流程的规范、数据分析技术要求的规范、所分析数据的质量规范、分析结果质量的规范。在数据分析标准中,数据挖掘标准是比较重要的,数据挖掘标准可分为数据挖掘过程标准、数据挖掘接口标准、数据挖掘语言标准、数据挖掘WEB标准。过程标准规范数据挖掘的宏观过程;接口标准为不同的数据挖掘方案提供统一的数据交互接口;语言标准规范数据挖掘语言;WEB标准规范网络数据的数据挖掘。

3.3.2 数据质量标准

数据质量标准主要针对各类文化大数据的质量提出具体的管理要求和相应的指标要求,确保数据在产生、存储、交换、使用和发布等各个环节中的质量,为文化大数据的广泛应用打下良好的基础。并对文化大数据全部生命周期的数据进行规范化的管理。主要包括数据质量评价、质量控制、元数据及数据模型规范和数据技术规范四方面标准。数据质量评价标准包括对主要是对数据内容质量评价提出规范,它应包括数据质量评价过程中涉及到的评价方法、评价对象、评价指标、评价结果4个要素。元数据及数据模型规范对元数据类型与功能、元数据规范、数据描述模型提出质量要求与说明,是质量控制的重要依据。文化大数据技术规范标准是文化大数据在组织、存储与使用过程中所涉及的技术、设备的使用工序、执行过程、劳动产品质量的准则和标准。

3.4 应用与服务标准

应用与服务类标准主要是针对文化大数据所能提供的应用和服务从技术、功能等方面以及提供的资源服务内容、方式、效率等方面的规范与统一,包括应用标准与服务标准两大方面的内容的规范化。

3.4.1 应用标准

应用标准主要是用户使用享受服务时产生的行为,包括数据存储、数据传输等方面的标准。数据存储是对经过采集整理后的数据进行规范的管理,长期有效的进行保存,并随时能快速有效的投入运用的标准。

3.4.2 服务标准

服务标准主要包括基础服务、数据访问、数据发布等方面的标准。

1)基础服务是文化行业提供的基础性的服务,包括服务内容、服务质量、服务效率等方面的标准。

2)数据访问是对用户进行访问文化大数据操作需求时进行的规范化和统一化要求,包括数据访问接口规范、数据中间件、共享方式、数据脱密、数据开放等方面。

3)数据发布存在风险,同时也带来巨大的社会效用,关于如何应对其核心风险即泄密风险,国际上已经有了相当多的技术和成果可供借鉴,因此数据发布的标准化研究既有必要性也有可行性。这方面的标准化工作还有很长的路要走,涉及到技术、经济、法律、政治等方面的因素。而我们的数据发布主要针对谁来发布数据,发布什么样的数据,哪些人群应该得到数据这3个问题进行规范和统一,这类标准主要包括数据发布和数据统计两个方面。

4 结 语

大数据的技术发展需要大数据标准的支撑。同样,大数据的标准化工作也需要大数据技术的推动,二者相辅相成,互相促进。大数据已成为经济发展的新引擎,将会为社会的发展带来新的活力。在大数据发展的关键阶段,文化行业应以此为契机,努力推动大数据技术和标准化的协同发展,建立科学的标准体系框架,促进文化行业的快速发展。

从目前发布和在研的文化大数据标准来看,标准化工作与处理技术的耦合度较低,进一步推动大数据处理技术与文化大数据标准的融合是亟需解决的问题。应加快建设文化大数据服务规范的脚步,推进文化资源统一标识、核心元数据、分类编码、数据采集、指标口径、数据质量、技术产品及安全保密等共性关键标准的制定和实施。应建立政府统筹指导,多方协调参与的机制,保证文化大数据工程的有效落实。

[1]中国政府网.国务院关于印发促进大数据发展行动纲要的通知[EB/OL].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm,2017-05-25.

[2] 林青.大数据应用与文化发展趋势——《大数据大文化》研究报告述评[J].江西社会科学,2014,(3):247-255.

[3]中国政府网.中共中央办公厅、国务院办公厅印发《关于加快构建现代公共文化服务体系的意见》[EB/OL].http://www.gov.cn/xinwen/2015-01/14/content_2804240.htm,2017-05-25.

[4]中华人民共和国文化部.文化部“十三五”时期文化发展改革规划[EB/OL].http://zwgk.mcprc.gov.cn/auto255/201702/t20170223_491392.html,2017-06-29.

[5] 中国人大网.中华人民共和国标准化法[EB/OL].http://www.npc.gov.cn/wxzl/gongbao/1988-12/29/content_1481259.htm,2017-05-28.

[6] 中国人大网.中华人民共和国标准化实施条例[EB/OL].http://www.npc.gov.cn/wxzl/gongbao/1988-12/29/content_1481259.htm,2017-06-02.

[7] 中国国家标准化管理委员会.国家标准管理办法[EB/OL].http://www.sac.gov.cn/sbgs/flfg/gz/xzgz/201609/t20160909_216633.htm,2017-06-07.

[8] 中国国家标准化管理委员会.行业标准管理办法[EB/OL].http://www.sac.gov.cn/sbgs/flfg/gz/xzgz/201609/t20160909_216627.htm,2017-06-07.

[9] 中华人民共和国文化部.中华人民共和国公共文化服务保障法[EB/OL].http://zwgk.mcprc.gov.cn/auto255/201612/t20161226_474962.html,2017-06-29.

[10] 中国政府网.中共中央办公厅 国务院办公厅印发《国家“十三五”时期文化发展改革规划纲要》[EB/OL].http://www.gov.cn/zhengce/2017-05/07/content_5191604.htm,2017-06-05.

[11] 中国政府网.国务院关于印发“十三五”国家信息化规划的通知[EB/OL].http://www.gov.cn/zhengce/content/2016-12/27/content_5153411.htm,2017-06-05.

[12] 文化科技司.文化部关于印发《文化部“十三五”时期文化科技创新规划》的通知[EB/OL].http://zwgk.mcprc.gov.cn/auto255/201705/t20170503_493589.html,2017-06-29.

[13] 中国政府网.国务院办公厅关于印发政务信息系统整合共享实施方案的通知[EB/OL].http://www.gov.cn/zhengce/content/2017-05/18/content_5194971.htm,2017-06-05.

[14] 中国政府网.国务院办公厅关于印发贯彻实施《深化标准化工作改革方案》重点任务分工(2017-2018年)的通知[EB/OL].http://www.gov.cn/zhengce/content/2017-04/01/content_5182637.htm,2017-06-05.

[15] 柯平,申晓娟.文化行业标准化研究[M].北京:国家图书馆出版社,2016.

[16] GB/T 3792.7-2008,古籍著录规则[S].

[17] GB/T 3792.2-2006,普通图书著录规则[S].

[18] GB/T 22373-2008,标准文献元数据[S].

[19] GB/T 31219.2-2014,图书馆馆藏资源数字化加工规范第2部分:文本资源[S].

[20] GB/T 31219.3-2014,图书馆馆藏资源数字化加工规范第3部分:图像资料[S].

[21] WH/T 62-2014,音频资源元数据规则[S].

[22] WH/T 66-2014,电子图书元数据规则[S].

[23] WH/T 6159.10-2006,缩微摄影技术词汇第10部分:索引[S].

[24] GB/T 6159.1-2014,缩微摄影技术词汇第1部分:一般术语[S].

[25] GB/T 30247-2013,信息技术数字版权管理术语[S].

[26] GB/T 25100-2010,信息与文献都柏林核心元数据元素集[S].

[27] GB/T 13190.1-2015,信息与文献叙词表及与其他词表的互操作第1部分:用于信息检索的叙词表[S].

[28] 中国电子技术标准化研究院.大数据标准化白皮书[M].2014.

StandardsandRegulationsSystemConstructionofCultureofBigData

Wu Sufang1Ke Ping2

(1.Library,Tianjin College,University of Science and Technology Beijing,Tianjin 301830,China;2.Business School,Nankai University,Tianjin 300071,China)

With the infiltration of large data technology in the cultural field,It is particularly important to design a framework system that can effectively guide the development of specific standards of large data in cultural industry.The paper discussed the urgency of constructing the standard norm of large data in chinese culture industry and analyzed the basis of constructing the standard system of cultural large data,Then,the paper constructed the standards and regulations system structure of the culture Big Data,including basic standard,technology standard,management standard,application and service standard.

culture of big data;standards and regulations system;standards of culture of big data

10.3969/j.issn.1008-0821.2018.01.003

G250.7

A

1008-0821(2018)01-0025-06

2017-09-07

全国艺术规划项目“文化大数据应用规划研究”。

吴素舫(1985-),女,馆员,硕士,研究方向:学科服务,信息咨询。柯平(1962-),男,图书情报专业学位(MLIS)中心主任,教授,博士生导师,研究方向:图书馆管理、知识管理、文献目录学。

孙国雷)

猜你喜欢
标准规范标准化规范
来稿规范
来稿规范
标准化简述
来稿规范
工业锅炉标准规范数据库管理系统实现
标准化是综合交通运输的保障——解读《交通运输标准化体系》
韩国拟修订食品容器和包装标准规范
央行发布两项征信行业标准规范征信机构信息安全
交通运输标准化
橱柜行业标准规范引导发展