多源异构公共数字文化数据治理的构成和机制探析*

2022-02-17 18:59郑建明
图书馆 2022年4期
关键词:异构数字文化

王 涛 郑建明

(1.江苏经贸职业技术学院 南京 211168;2.南京大学信息管理学院 南京 210093)

随着高价值、多结构的海量数据集的产生,数据已经成为一种可以影响组织生态发展的宝贵资源。数据治理是治理概念的扩展和延伸,是数据要素与治理要素的结合体,也是数据和数据系统管理的基本要素。从国家治理和大数据视角出发,数据治理是国家治理体系下重要的治理范式,成为提升公共数字文化治理能力的新视角。数据治理不仅给公共数字文化治理带来了认知方法的转向,还带来了技术基础及顶层设计,共同驱动公共数字文化新治理工具的转型。在塑造公共数字文化服务、传播主流价值观和引领公众精神力量方面,它正在为公共数字文化数据治理提供全新的工具,并凸显出强大的发展潜能。打造数据治理新范式,可以推动公共数字文化数据治理实现更多的外部访问与内部共享。选对数据治理工具,从而挖掘数据资源价值,实现数据驱动创新,赋能公共数字文化服务高质量发展。当前以多源异构数据治理为载体的新型治理模式,正在推动公共数字文化治理实现现代化,这意味着我国公共数字文化利益相关者要获得数据主体参与权,就应建立起一种行之有效的,基于多源异构公共数字文化数据化过程的治理模式,从而为辅助管理者进行科学决策提供治理数据。文章尝试对多源异构公共数字文化数据治理的内涵、逻辑及其运行机理进行理论探索,以此丰富公共数字文化数据治理的理论研究,从而提升公共数字文化服务效能。

1 多源异构公共数字文化数据治理概念解析

1.1 公共数字文化数据治理概念的阐释

公共数字文化数据治理是公共数字文化治理和公共数字文化数据管理的重要组成部分,是公共数字文化管理的新形态、新技术、新体验,由公共数字文化治理和数据治理这两个概念合成。一是公共数字文化治理应用于公共文化治理领域和治理目标的这些元素,是为适应新的治理条件和时代背景而进行的治理工具转型和创新;二是数据治理为公共数字文化治理提供了基本条件,通过一定的技术手段和治理程序达到某种治理目的,将公共数字文化治理与数据治理二者创造性地连接在一起。公共数字文化数据治理是基于数据生命周期内,对公共数字文化数据进行全面的质量统筹与协调管控的过程[1]。其由治理的认知度和治理的协调机制两个维度构成,包含顶层设计、数据治理环境、数据治理域和数据治理过程等内容。公共数字文化数据治理工作就是业务、技术、流程、组织架构、专业人员和专业方法等各项工作的集合,这些工作主要由公共数字文化数据治理工具来实施完成。

1.2 多源异构公共数字文化数据治理概念的内涵

1.2.1 有效集成海量多源异构的空间数据

公共数字文化治理和数据治理提取部分结构,在这一空间上形成自我层创结构。在多源异构数据源的复杂场景下,及公共数字文化数据治理项目落地的基础上,不断提升数据治理能力,可为公共数字文化数据赋能业务及数据催生业务创新打下坚实基础。公共数字文化数据治理的前提是鼓励开放公共数字文化空间并赋予其新的内涵,促成治理效能创新和数字化转型。随着大数据数智技术的发展,数据系统规模出现爆炸式增长,导致公共数字文化数据通常分布在多个数据源中,数据源之间的种类、结构、版本、部署环境等各不相同[2]。因此应从数据、元数据、数据质量管理的角度,对元数据进行收集、存储、查询和更新,以及数据验证、数据清洗、数据维护和数据溯源等。对多源异构数据的提取、解析、模型构建及数据存储进行分析,从而有效集成海量多源异构的空间数据,以方便用户快速浏览查询、三维展示系统和实时更新数据。

1.2.2 确保数据在其生命周期的任何一个阶段都具有高质量

公共数字文化数据治理的主要目标是为了最大化实现数据价值,治理内容是确保数据在其生命周期的任何一个阶段都具有高质量。挖掘新一代技术数据价值,不仅要具有处理大规模异构数据源的能力,还要具有长期治理多个数据源的能力。通过对多源异构数据治理平台进行管控、处置、格式化和规范化,实现全方位、多维度的互联、互通、互动并成为彼此间协调运作的重要保障。目前我们需要对公共数字文化数据治理带来的变革、具体应用及应用的内在逻辑进行探索,实现多源异构数据对公共数字文化治理的全面驱动。公共数字文化数据治理已然成为整个社会数字文化转型的重要方式,其作为基础性工作,影响范围较大,复杂度较高,涉及业务和技术等方方面面。公共数字文化数据治理效能也十分重要,需要我们进一步增强对数据治理工具的认知,助力优化公共数字文化治理工作,潜心研发为数字公民量身定制的数据治理工具,进一步推动公共数字文化数据治理在实践中的研发和应用。

2 数据驱动下的多源异构公共数字文化新治理工具转型

2.1 公共数字文化治理需求驱动提升精准治理质效

2.1.1 创建数据供应链以实现公共数字文化数据驱动

数字是未来供应链发展的决定性力量,实现数字进步是供应链利益相关者的首要任务。数据驱动是公共数字文化治理转型的主线,而数据驱动的基础是建立在高质量数据之上的。实现公共数字文化数据驱动就是要创建一个数据供应链,一个强大的数据供应链系统需要核心要素共同工作,以提供可见性并提升驱动效率。要想保证全过程中的数据质量,需在集成、可见性、洞察力的协作方面推动改进,并且确保合适的时间使用正确的数据,每个过程都有合适的人在为业务目标服务。近年来,我国公共数字文化治理工具面临着需求识别—技术驱动—政策转型的需求,向数据治理转型成为我国公共数字文化治理实践的必然趋势。面对跨机构数据整合的技术壁垒和元数据描述标准的多源异构,系统之间数据兼容的问题开始显现。公共数字文化服务应需求而变,寻求广泛的数据资源,采用多样化的数据处理方式及利用现代大数据技术不断拓展服务功能。随着公共数字文化事业的发展,公共数字文化领域内要进行需求规划、预测分析等,以引导公共数字文化治理做出更加科学的决策并开展有效行动。

2.1.2 实现最大范围内的数字融入,优化社会数字关系

在数字文明时代,从管理到服务、从技术到价值,公共数字文化建设要以社会数字关系的优化作为重要抓手。首先,随着我国公共数字文化服务的不断深入,现代公共数字文化服务体系建设的持续推进,公共数字文化治理内容更加复杂,具体治理问题的指向更加精准。在对多源异构数据进行验证的过程中,就已搭建起了功能完善的多源异构数据治理系统,保证了数据的正确性和一致性。其次,为了提升公共数字文化数据治理实效,需要进一步优化社会数字关系,有效促进数字文明建设,驱动数字经济和数字社会发展。治理过程还需要将更多的影响因素考虑其中,如社会数字公正、数字生态、数据文化、数字安全、数字赋能等[3],实现最大范围内的数字融入。社会数字关系一定要有足够的包容度,因为要面临的是一个更多元、更复杂的治理对象和治理需求,这无疑体现了公共数字文化治理问题的特殊性。

2.1.3 实现公共数字文化服务专业化、智治化、高效化

加快推进数字治理、整体智治与高效协同,实现公共数字文化治理科学化、精准化、协同化、高效化,以满足公众高层次、多样化、均等化的公共数字文化服务需求。多源异构数据治理带来全新的工具和价值,其治理工具也随着公共数字文化事业的公众需求、技术工具和国家政策趋向等因素的变化而不断革新。伴随公共数字文化治理的发展,利益主体的多元化及利益诉求的多元化交织,迫使治理主体寻求更为适合的治理范式和治理技术。实现精准治理、精细治理、全域治理和智慧治理就是利益相关者深度参与公共数字文化治理过程,要求治理手段和治理技术更加专业化、数字化、智能化。公共文化服务机构要提供实时动态的业务监测与管理数据,采用数据驱动的精准治理方式,加快数字化协同治理进程,实现公共数字文化服务整体智治的高效化,从而精准提升公共数字文化数据治理效能。

2.2 公共数字文化技术驱动提供技术创新和开放治理的保障

2.2.1 数字技术将成为强化公共数字文化治理的最有效工具

在新技术发展背景下,公共数字文化相关活动痕迹将以数据形式保存下来,利益相关主体对公共数字文化治理的态度以及期望也会促成多源异构大数据的获取和融合。此外,有关公共数字文化治理活动的数据、治理结构及其变化的轨迹数据等都会被纳入公共数字文化的大数据序列中。随着大数据技术的发展,公共数字文化机构均建立了不同的数据资源管理系统,但公共数字文化的多源异构数据给数据的查询、获取和使用,及数据迭代和维护,系统数据的处理、存储和管理带来了挑战。为了处理大规模数据,数据系统通常采用分布式的体系结构,使数据具有多源、异构的特点,呈现出多样化趋势,将这些数据集成后进行分析与挖掘,有着广泛的应用场景。因此,亟需一种技术或平台解决上述问题,以提高多源异构数据在公共数字文化治理中的集成利用率。在此背景下,数字技术将成为强化公共数字文化治理的最有效工具,会有更全面的数据被治理主体所利用,加上不断成熟的数据采集、清洗、可视化技术也会使数据成为规范的治理证据。

2.2.2 公共数字文化开放治理具有更为完善的技术保障

大数据正在改变公共数字文化数据的采集、处理、存储、开放治理模式,譬如:公共数字文化的海量数据既有结构化、半结构化特征,也有大量的非结构化特征;既呈现出多源性和异构性,也存在相互兼容问题[4]。因此需要将多源异构,甚至跨区域的资源数据、用户数据关联起来,构建可提供精准服务的公共数字文化数据系统,实现多源异构的数据集成。依靠数据画像和数据主体的分析技术,数据处理可以有效从技术层面提升数据治理的公开性和透明性。数智时代的技术赋权可助力公众有效参与数据治理,注重保障公众对技术治理的知情、参与、监督权,以吸引数字空间多样态网络用户为数字技术注入更多人文向度。开放共享是大数据的重要社会属性,但数据开放过程中的透明传递和价值实现是最大的制约因素。因此,有关治理主体需在数据正义的指引下,通过优化公共数字文化数据治理的架构来促进公共数字文化的服务创新,使得公共数字文化开放治理具有更为完善的技术保障。

2.3 公共数字文化政策驱动多源异构数据治理以优化决策

2.3.1 以大数据科学思维优化公共数字文化政策

大数据时代,借助以移动互联网、云计算、大数据、区块链大数据为代表的技术手段应用和综合集成,实现公共数字文化治理能力现代化,已成为政策顶层设计与实施的重点。大数据思维是一种开放共享的思维,是基于多源异构、多样类型的海量数据进行关联分析并创造数据价值的一种智能思维。以大数据科学思维对公共数字文化政策的价值理念、价值排序、价值目标、政策方案等进行优化再造,以大数据技术丰富公共数字文化政策工具,以大数据手段服务于公共数字文化政策全生命周期,可形成基于大数据的能够创造新的公共数字文化价值的公共政策模式。通过构建一种由技术驱动向数据驱动转变,并且向场景驱动跨越的公共决策模式,实现大数据驱动的公共数字文化政策转型。在数据扩展中具体体现为:一是线上线下的多源数据获取;二是目标数据预处理;三是建立模型;四是结果呈现与使用;五是价值体现;六是有力的保障体系。以上这些都需要有相关数据方法和行政规章制度加以明确并给予规范制度保障。

2.3.2 推动公共数字文化制度创新以释放更大治理潜能

公共数字文化治理能力现代化是指公共数字文化治理的价值观可以得到认同,其构建将更加智慧化、精准化和科学化,也是一个价值不断展示的过程,可以根据实际情况调适制度等[5]。能否根据政策需求调整治理工具,从而推动公共数字文化制度创新成为衡量文化治理能力是否实现现代化的标准,治理主体可通过对海量多源异构空间数据进行集成,进一步认识数据之间的联系,寻找其内在规律,以综合应用各级文化行政主管部门的文化数据并为其提供决策支持。近年来国家对文化治理能力做出了顶层设计,同时也对应用以文化大数据为代表的数据化技术做出了规划,通过推动公共数字文化制度创新释放更大治理潜能,这些政策趋向都将直接推动数据治理成为公共数字文化治理的重要工具。

3 公共数字文化治理工具转向多源异构数据治理后的治理逻辑

3.1 公共数字文化治理的价值追求将转向实验正义与设计正义并重

3.1.1 多元公共数字文化价值的特质

公共数字文化治理转向数据治理是一种系统的变革,公共数字文化治理在具体实施过程中的价值追求、实施模式和治理依凭等,具有多元公共数字文化价值的特质。虽然合理的治理形式对治理效果具有重要意义,但治理目标是否符合利益相关者的利益诉求更值得关注,明晰为何要治理才是根本。公共数字文化数据治理将不同利益相关者的利益诉求,以多源异构数据的汇总融合形式展现出来,为治理决策者提供足够的数据支撑。由大数据中提取的有用数据可最大限度呈现不同利益相关者的诉求,决策者可在综合衡量的基础上,可实现决策参与机会和结果的公正性,最大程度体现公共利益,使利益相关者的利益诉求得到合理的表达和体现。

3.1.2 利用现代化机制保障治理的实验正义与设计正义

公共数字文化数据治理整体的价值追求,是以治理过程要素的实验正义来实现治理的设计正义。实验主义治理基于框架性规则制定,以及在不同环境背景下对执行结果的不断修正,以提升公共数字文化治理能力。公共数字文化数据治理过程需要借助数理模型进行实验主义治理,将不同治理方案的治理结果以数据结果的方式呈现,这种通过数据来表达和体现利益相关者诉求的过程有效弥补了实验治理自身的短处[6]。公共数字文化数据治理的设计治理方式可以在最大程度上遵循内容盈余、渠道多元和传播生态创新的要求[7]。公共数字文化数据治理充分利用现代化机制保障治理的设计正义,同时也有效实现了治理的实验正义,使得不同治理主体的利益诉求都能得到有效平衡。

3.2 公共数字文化治理实施模式将转向整体性治理

3.2.1 公共数字文化治理实施模式

公共数字文化治理转向数据治理已成为必然。以数据治理创新公共数字文化治理方式,可以提升公共数字文化现代化治理能力。公共数字文化治理转向数据治理后,其基本的治理逻辑将发生转变,公共数字文化数据治理的首要任务在于相关数据的获取,将数字资源对象和元数据以既定的格式统一提交存储,也可以采用数字对象分布式及云存储的方式,平台可通过统一的数据发现技术来检索不同文化机构的馆藏资源。对于异构的数据资源,平台可以根据不同的用户需求选择元数据映射、数据复用与集成、互操作协议、结构转换、API甚至语义关联数据等不同的数据操作方法[8]。除了自动抓取部分大数据外,还要相关部门提供治理所需的数据材料,以及不同部门之间的数据共享,这本身也促进了各部门之间的协作。

3.2.2 运用大数据实施整体性治理

数据治理体现了以大数据为基础进行分析、决策和监督反馈的治理过程,强调在治理过程中,有关部门将不同类型数据整合在一起,要以整体性的视角看待公共数字文化治理中的问题。运用大数据实施整体性治理的思维、资源和能力,就是从整体性角度考虑治理、技术和公共数字文化的多重逻辑关系,强化数据治理的顶层设计,提升数据治理的基本素养,优化数据治理的基础条件,完善数据治理的运行程序。

3.3 公共数字文化治理依凭转向基于证据共识的多源数据融合治理

3.3.1 公共数字文化数据治理成为治理主体互动的证据

多元治理主体基于严谨、科学的方法形成研究证据,并利用证据进行公共数字文化治理。新时代公共数字文化治理格局强调共建主体的多元化、共治过程的专业化以及共享结果的公正性。公共数字文化治理要把数据作为证据,确立基于共识的行动逻辑[9],这就需要治理主体在互动中形成治理共识,以此建立有利于实现文化治理现代化的体制、机制。多源异构公共数字文化数据治理则是遵循循证的治理范式,围绕科学证据在循证决策中的应用,坚持以证据驱动决策。从循证决策向循证治理转换和进阶,这不仅可以将宏观的治理活动数据化,以数据治理模型推演产生治理证据;还可以将公共数字文化服务等微观层面的活动以数据形式清晰地刻画出来,成为治理主体互动的证据,实现数据价值最大化,逐步提升数据治理能力。

3.3.2 基于证据共识的多源数据融合与治理

数据治理的目的是找到唯一可信的数据来源,所有的标准、规范、流程、方法等都应该围绕这一目的来实现。多源数据融合技术能够在多层次上综合处理不同类型的数据,按照数据抽象程度可以分为数据级融合、特征级融合和决策级融合。公共文化服务机构有着大量以文本、视频、音频、图片、电子书等形式存在的非结构化数据,因此需要把多源的、异构的数据集成到统一的框架与平台下,促进跨部门、跨层级、跨维度的多源空间数据集成与融合,实现公共文化大数据治理的智能协同。在基于证据互动的基础上,消弭不同利益主体之间的利益鸿沟,利用基于大数据挖掘分析获得的证据进行精准决策,更好地支持业务创新,让数据持续流动起来,快速实现公共数字文化多源数据治理。

4 多源异构公共数字文化数据治理的内在机理与外在框架

4.1 多源异构公共数字文化数据治理的内在机理

4.1.1 公共数字文化数据治理从收集感性数据到理性治理

公共数字文化数据治理之所以被称作一种新治理工具,是因为其有一套内在规则在维持自身的运转。公共数字文化数据治理的内在机理是其理论核心,也是治理实施的技术支撑。公共数字文化数治理可以将不同类型、不同性质、不同来源的客观数据转变为治理决策的策略方案,即完成公共数字文化数据治理从收集感性数据到理性治理的程序。随着数据量的激增,新用户数量持续增长,来自数据系统与数字服务平台的新数据类型不断增加,云端数据和边缘数据成为关注点[10]。实时的消息类数据、各类结构化的报表数据和属性类数据、非结构化的文本图片、各类视频语音的流式数据等多源异构数据的汇聚和共享,多源异构数据的汇聚、抽取、清洗、转换和合并,保证了数据治理的真实性和可靠性。这些海量、动态的数据均应纳入数据治理的对象,其产生的数据类型种类多样,有组织机构内部或外部产生的结构化或非结构化数据,有静态数据和动态数据,包括业务交换数据、传感器数据、音频流和视频流数据、空间数据和时空数据、万维网数据等。

4.1.2 建立统一的数据平台,打通数据壁垒,提高数据价值

公共数字文化数据治理的对象应该包括所有业务流程中产生的各类数据,即公共数字文化建设活动中所产生的数据。建立统一的数据平台可解决数据分散性问题,还能降低数据之间互联互通的复杂性,打通数据壁垒,提高数据价值[11]。建立统一的视频元数据标准,积极拓展公共数字文化共享数据的应用范围,吸引用户参与、分享和生产内容。应用新一代的数据技术对公共数字文化资源的元数据和主数据进行收集、管理、整合,进而实现数据发现、挖掘,把公共数字文化创造、叠加、传输、再生价值作为体系化建设的生命线。此外,还要为面向全国范围的公共数字文化共享云服务平台的架构设计和关键技术,提供分布式资源共享、网络分发、业务管理三大核心功能,对涉及的海量数据进行摄取、处理、管理,解决系统面临的共性与关键技术问题。

4.2 多源异构公共数字文化数据治理的外在框架

4.2.1 主体多元化及新型治理互动方式的构建

在公共数字文化领域,为使数据成为生产要素,数据治理应善于运用丰富的数据资源,彻底激活公共数字文化领域的数据。在公共数字文化数据治理的应用上,可通过智能化提升数据要素价值,用数字化转型实现数据驱动,并根据实际需求不断调整和优化,从而实现公共数字文化数据要素的价值。治理主体应更加注重多元化,让政府、市场、社会与公众各界力量参与其中,形成公共数字文化大数据生产的良性生态。由于产生数据的主体较多元化(政府、企业、公众),数据归属权、数据使用权和共享权均需明确。其中,政府在数据治理过程中占据主导地位,并且要与企业和个人交换共享数据并提供数据服务;企业在产生数据的同时,要与政府合作协同开发利用数据整合服务;公众在关注数据各项治理的同时,要帮助政府利用数据以改善公共服务。在新型的治理关系中,政府不再是唯一的实质主体,要素性主体(企业、公众)将拥有充分的自主权和利益表达权等治理权利,同时必须承担对等的治理义务。数据治理主体拥有数据生产者和数据处理者的双重身份,参与数据治理活动既是其权利,也是其义务。

4.2.2 主体与系统互动关系的建立

数据系统是公共数字文化数据治理中的数据处理中心,也是公共数字文化数据治理的技术核心。公共数字文化数据治理所需的数据均要汇聚于数据系统,数据的清洗、结构化、可视化等均要在系统中完成。公共数字文化数据治理以数据系统为中介和核心,各治理利益主体及治理过程都主要集中于数据系统;对于治理利益主体而言,数据系统是其表达和实现合理治理利益诉求的中介,所有的数据和治理诉求都在数据系统进行汇合、实践。公共数字文化数据所需的数据来源于不同的利益主体,对数据治理的主体、活动和对象都提出了新的要求。跨组织的多元主体应进行交流协作,实现数据治理共享与互补,发挥各自的整体协同融合优势。政府、企业、公众都是数据治理的主体,在数据治理过程中应积极协作,参与数据治理的各个流程,实现多维数据联通,共同开展数据治理[12]。为保障数据供给和共享,必须将公共数字文化治理的利益主体纳入治理体系之中,在公共数字文化数据治理互动中,不同主体之间应进行必要的反馈,并且建立新型的互动关系。

4.2.3 主体—系统的实际运行与操作

公共数字文化数据治理的主动治理方式,需要系统自身利用数据抓取技术抓取大数据进行流式处理,并将处理生成的数据进行归类、存储,便于下一步处理和应用。数据治理活动要遵循数据管理活动和数据运动的变化规律,多维度联通活动过程,多维度设计活动流程,多维度产生数据来源,以确定最合适的管理方法和策略。数据的流式处理主要是为了监测公共数字文化舆情,发掘可能出现问题的领域,给予管理者日常管理参考。公共数字文化事业发展规划在确定相关治理议程时,以数据系统为中心,与相关治理主体进行数据互动,为数据治理活动中的数据运转和流动提出了可行性要求及相应解决途径,进而生成具有利益共识的治理策略。当数据开始走向在线化、集聚化和应用化并成为一种动态的流动资源时,相关机构应依托数据技术采集、处理、利用多源异构数据并对其加以高效组织与科学管理,确保数据的准确应用、合理共享与敏感保护。推进多源异构数据的集成应用,则需要确定统一的表示、存储和管理方法,以进一步整合利用公共数字文化数据。

5 结语

公共数字文化数据治理是一种新的治理工具,多源异构公共数字文化数据的应用基本贯穿了从数据输出、数据展示到知识决策的全过程。数据治理侧重于搭建整个数据治理体系,其应用为公共数字文化治理提供了有效工具和新的路径。文章从应用需求的角度出发,为使数据治理更加规范化,根据新时代数据资源对象的多源异构的特点,倡导公共数字文化机制由管理迈向治理,以数字赋能为目标,以数据治理为手段,实现整体性、系统性和智慧化治理。从顶层设计规划数据治理、由权责体系落实数据治理、用数据技术保障数据治理、以分析应用推进数据治理及数据的再利用,同时扩大其社会影响力。通过运用技术赋能,推动多源异构数据驱动创新,借助多元化路径建立数据的融合和关联机制,依托公共数字文化建立品牌精神内核,加速形成大数据的闭环发展格局。公共数字文化数据治理有助于提升公共数字文化服务能力和管理决策水平,能为大数据时代公共数字文化治理实现现代化注入强劲动力。

猜你喜欢
异构数字文化
以文化人 自然生成
试论同课异构之“同”与“异”
年味里的“虎文化”
吴健:多元异构的数字敦煌
谁远谁近?
答数字
异构醇醚在超浓缩洗衣液中的应用探索
数字看G20
LTE异构网技术与组网研究
成双成对