基于信息生命周期理论的公共信用信息管理层次模型研究

2022-09-09 03:16谈天钟鹤翔陈华
电子技术与软件工程 2022年13期
关键词:生命周期信用主体

谈天 钟鹤翔 陈华

(1.江苏省战略与发展研究中心 江苏省南京市 210036)

(2.南京莱斯信息技术股份有限公司 江苏省南京市 210014)

1 引言

在公共信用信息系统项目中,随着各类数据的大量累积和信息应用需求不断增加,面对巨大数据量、多源异构的数据,信息治理面临着多方面挑战。如何有效地存储和管理海量数据,为业务功能和应用系统高效、安全地提供高质量的信息,成为系统建设中一个重点问题。在系统中应用信息生命周期理论,可以规范管理不同阶段的信息,采用适当的资源管理策略,满足应用服务对信息质量和时效的要求,从而以最小成本获得最大效益。本文在信息生命周期管理理论的基础上,提出三维层次模型,并探讨了模型实施的关键路径和保障措施。

2 信息生命周期理论

生命周期一般是指生物经历的一系列阶段或过程。生物的生命周期是从出生、成长、成熟、衰退到消亡的全过程。使用生命周期方法是借助生物生命周期的思想,在不同的阶段依据管理对象的特点拟定适当的管理措施和方法。

信息生命周期(Information Life Cycle)是对信息资源运动规律的描述,一般有信息产生、获取、处理、存储、利用、废弃等六个阶段。在信息生命周期中,信息价值决定着生命周期的长度,并且价值会随时间变化递减。信息采集时效性、整合状况、存储方式、分析深度和应用广度等因素,都会影响信息价值。因此,信息生命周期管理(Information Lifecycle Management, ILM)结合了技术、流程,目的是根据不同运动阶段的信息及其产生的价值,进行有效管理和资源配置。

系统地对于信息生命周期理论的研究始于二十世纪八十年代,1986年,信息资源管理专家霍顿和马钱德首次提出“信息生命周期管理”的概念,将信息生命周期管理分为信息创建、信息采集、信息组织、信息开发、信息利用、信息清理六个阶段。每个阶段的转换都伴随着管理成本和信息价值的变化。随着数字信息资源大量涌现,2000年后,国内外众多学者均对ILM 理论进行了深入研究。Beagrie 和Jones建立了数字信息生命周期模型,霍奇借鉴软件工程中的系统生命周期研究方法,提出了信息生命周期模型。此外,一些信息服务公司将信息生命周期理论模型运用到数据存储实践中,EMC 公司围绕EMC 存储设备进行信息生命周期管理;Oracle 公司提出了信息管理的完全内容周期,包括了信息创造、获取、存储、转换、索引、管理、清理、分布、发布、检索和维护共11 个步骤。国内在2005年后也形成了一定的理论研究和初步成果,将信息生命周期管理的链状模型、环状模型、矩阵型模型、层次模型、C-ILM 立方体模型、TD-ILM 三维模型运用于金融业、工业、医药卫生等行业以及政府数据治理中。

3 公共信用信息

3.1 公共信用信息概念

公共信用信息是指国家机关、法律法规授权的具有管理公共事务职能的组织、人民团体,在依法履行职责和提供公共服务过程产生、获取的信用信息。

按照主体身份划分,公共信用信息分为法人和非法人组织公共信用信息、自然人公共信用信息。法人和非法人组织公共信用信息主要包括法人和非法人组织的基础登记类、生产经营类、行政管理类、社会评价类等信息。自然人公共信用信息主要包括自然人的身份职业类、许可资格类、守信表彰类、失信惩戒类等信息。通过将某一个主体的公共信用信息尽可能多地汇集起来,可以找出主体的特点、规律和联系,综合描述出主体的信用历史、关系网络、履约能力、行为偏好;从生命周期的角度看,也可以描绘出主体的出生(产生)、成长、成熟、衰退到消亡各个阶段的信用行为。

3.2 公共信用信息特点

来源广泛:信用信息的来源非常广泛,包括政府依法公开的信息、法院依法公开的信息、金融机构产生的信息、公用事业单位信息、信用主体自主申报信息、信用服务机构收集的信息、权威机构对信用主体的评价信息等。

权威真实:信息是与客观事实相符的,如实反映信用主体的信用状况;信息由国家机关、法律法规授权的具有管理公共事务职能的组织、人民团体所记录,具有权威性。

准确完整:信息完全符合实际,没有差错、精准无误。信息具有应有的各个部分,没有缺漏或损坏,全面反映信用主体的信用状况。

鲜活有效:信息及时在法定有效期内公示或应用,信息归集符合统一的目录要求,信息应用符合国家制定的标准规范。

合法安全:信息的归集、存储、处理、应用等方面的流程、内容、时效等均符合法律规定,依法保障信息安全,保护国家秘密、商业秘密和个人隐私。

3.3 公共信用信息管理

公共信用信息系统归集多来源多层级产生的信息,对信息进行规范化处理,实施数据全流程质量控制,依据安全管理要求实施数据分级分类和授权访问,从而构建数据资源管理中台;在深度融合应用公共、金融和市场信用信息的基础上,面向政府部门和各类市场主体提供规范化、精准化、社会化的信息应用服务。

4 公共信用信息生命周期管理层次模型

公共信用信息生命周期管理层次模型如图1 所示,X 轴方向为物理存储层,Y 轴为数据业务层,Z 轴为信用监管层。

图1 :公共信用信息生命周期管理层次模型

4.1 物理存储层

从物理存储角度建立信息生命周期管理,根据数据特性实现硬件存储设备策略管理。

物理层信息生命周期管理框架由数据分类、特性分析与存储策略三部分组成。首先对数据进行归纳分类,在分类基础上结合业务与系统实际情况,分析数据特性,最后根据分类、现状和特性制定信息生命周期存储策略,从而保障物理存储策略能够更加符合业务及系统的实际需求,有效地发挥信息生命周期管理的价值。

从数据内容对信用信息进行分类,一般包括信用主体基本信息、资质资格信息、表彰奖励信息、失信处罚信息、其他信息等。再对不同类型信息进行相应的数据特性分析,比如信息更新频率、信息使用有效期、失信信息的严重程度等,同时结合系统实际业务性能要求,控制对外应用的数据量。在存储每条信用数据时除需要保存信用状况记录外,还需要额外存储信息报送来源单位、信息类型、报送批次、报送人、报送时间、记录唯一标识、记录定位信息、记录具体内容、入库时间、处理时间、处理标识(增量、重复、有效、疑问、关联标识)、记录有效期等跟踪信息,便于对整条信用信息进行追踪。

这里引用存储设备上的三个概念:在线存储、近线存储、归档存储。在线存储是指存储设备和所存储的数据一直保持“在线”状态,可供用户随时调取,满足业务系统对数据访问的速度要求。近线存储是指将那些并不是经常用到,或将访问量并不大的数据存放在性能较低的存储设备上。简单来说就是把价值不同的数据分别存放在不同性能(价格)的存储介质上。归档存储是将不再经常使用的数据转移到一个单独的存储设备来进行长期保存的过程,对涉及的数据进行离线存储,以备非常规查询等应用。信用数据的存储,可以依据数据归类设置不同的业务过期策略,系统自动按照业务规则,对超过周期的数据自动进行归档。在底层存储上可以根据信用数据实现的技术架构,对过期的数据字段的从生产环境中移出,比如现有的大数据技术(比如HBase、Elasticsearch)都有相应的数据过期机制,可以很好的结合信用业务实现数据的在线、近线、归档的数据分离。

以归集的社保类数据为例,原则上每个信用主体每月都会产生社保信息,但在信用档案应用时只需展示最近1年或6 个月的数据即可,因此可对近1年的社保信息采用在线存储,超出1年但在3年内的社保信息采用近线存储,其他更久远的数据可以采用归档策略进行存储。如图2 所示。

图2 :物理存储层公共信用信息管理策略

4.2 数据业务层

从业务流程角度建立信息生命周期管理,实现信息归集、处理、存储、应用、销毁等生命周期管理。

数据归集规范化:是将产生的新数据或变更的数据内容汇集到信息系统的过程。就公共信用信息而言,数据归集是指由产生信息的国家机关或组织将信用信息提供给公共信用信息系统的过程。归集到的数据应具备以下三个特征:数据完整性,即数据内容完整客观,并且信息源头部门提供了产生的所有信息,足以支持信息应用;数据准确性,即数据准确描述了信用主体基本信息、信用状况,内容符合逻辑关系;数据时效性,即数据产生后在规定时间内完成信息归集,满足信息应用需求。但信用数据来源广泛,具有多源异构的特征,因此,制定规范的公共信用信息资源目录是实现数据归集应用的重要基础工作,直接决定了后续环节能否顺利进行。在信息资源目录中需要明确基本原则、记录组成格式、归集方式、归集周期等,确保数据权威真实、完整鲜活。

数据处理流程化:归集到的多来源数据中难免存在不规范、不标准的情况,数据处理的目的在于根据信息属性,将海量原始数据进一步规范。只有高质量的数据才能发挥巨大的价值,更是信息生命周期管理的基本保障。数据处理的最终目标是实现数据质量的提升。数据处理手段主要包括数据去重、格式转换、数据校验以及关联整合。数据去重是将当期归集到的新数据与数据库中已有的进行比对,去除重复数据;格式转换是统一数据格式,主要是统一非结构化数据格式,用于数据的统一存储与分析;数据校验是对增量数据进行数据项完整性、数据值合理性、合法性、有效性、一致性、正确性等一系列检查和处理;关联整合则是将不同来源的数据通过标记记录主体的方式构建各类数据之间的联系,形成关联的数据网络,解决“数据孤岛”的问题,实现多源异构数据价值的深度挖掘。

数据存储媒介化:经过数据归集和处理后的海量数据,需要进行数据存储。基于海量数据的存储,是数据共享交换和信息应用的基础,同时应满足对数据进行交叉分析、深度挖掘的需求。可以借助现有主流的关系型数据库架构、大数据库架构等实现不同应用、不同时效的数据存储。例如:处理结果数据为了后续便于应用、统计等,可以优先存储在关系型数据库或者MPP 数据库中,支撑日常查询应用的数据可以存放在Elasticsearch 集群中,历史数据可以存放在HBase,非结构化数据可以存放在基于Hadopp 集群提供的HDSF 文件系统中,一些需要统计及数据挖掘分析的数据可以通过Hive、Spark 等集群实现数据分析,结果可以同步到关系型数据库中。

数据应用多元化:信用信息与社会经济生活息息相关,数据共享应用,是从不同领域整合异构数据,提升决策透明度,促进政府治理能力的提升,为各利益相关者提供创新服务。在信用领域,推动将公共信用评价结果、基础数据和行业管理数据相融合,建立市场主体全生命周期信用档案;在政府监管领域,制定分级分类监管制度,完善行业信用监管预警模型,按照市场主体失信情形、严重程度,依法依规实施信用监管措施,推行以远程监管、移动监管、预警防控为特征的非现场监管;在服务企业方面,打造企业全生命周期的信用服务链条,聚焦企业生产经营活动中的高频事项,从市场准入、投资建设、融资信贷、生产运营、退出市场等全过程,服务好市场主体;在社会生活方面,积极探索给予守信市民免押金、免手续、免证明、免排队、免担保、降费率、降成本等各项激励措施。

数据销毁合规化:通过对数据及存储介质的操作,使数据彻底丢失且无法通过任何方式恢复的过程。任何一条信息都不可能永久存在,对于使用期限届满的信息,需要采取一定措施进行彻底删除。信用数据销毁有两个目的,首先是合规要求,国家法律法规要求超过时效的数据不被使用;此外是业务发展和管理需要。对数据进行销毁的技术工具主要分为两种,一种是逻辑层面的数据软销毁技术,另一种是物理层面的硬销毁技术。数据销毁需要对数据销毁处置的过程进行有效控制管理,并记录全过程信息以供追溯。数据业务层公共信用信息管理策略如图3 所示。

图3 :数据业务层公共信用信息管理策略

4.3 信息应用层

在信息生命周期管理过程中,通过合理规划存储设备,制定有效的信息业务管理策略可以发挥信息价值,但仍不能完全实现真正的信息生命周期管理。信息价值中包含了显性价值和隐形价值,只有将信息上升到人们在社会实践中获得的“知识”甚至是“智慧”,提供决策思路,才能真正体现出信息价值。信用信息的显性价值在于描述了主体的某一时刻的信用状态,隐形价值在于通过某一段时间内对主体的信用状态预测将来可能发生的信用行为。如图4 所示,在信息应用层,一方面需要通过应用服务发挥信用信息的价值,另一方面通过分析信息应用价值调整信息存储和管理策略,最终达到精准化管理公共信用信息的目标。

图4 :信息应用层公共信用信息管理策略

(1)信用信息利用:利用信用信息的显性价值为社会提供信息服务。实现信用信息高效利用的途径有以下3 个途径:

1.建立信用信息基础数据库。构建社会法人和自然人信用数据库,按照统一社会信用代码制度要求,以主体名称和统一社会信用代码为标识,及时、准确、全面记录主体信用行为,整合形成完整的主体信用记录,特别是将失信记录建档留痕,做到可查可核可溯。

2.建立信用信息专题数据库。在信用数据库的基础上,对归集到的有效数据进行分类整合,生成双公示、“信易贷”、信用承诺、合同履约、联动奖惩、重点人群专题库,实现对专题信息的自动更新服务,满足特定用户的信息需求,为基础服务提供数据支撑。

3.提供高效便捷的数据服务。破解“信息孤岛”难题,依据用户权限,提供信用目录、信用查询、数据订阅、接口申请、双公示、“信易贷”、信用承诺、合同履约、统计分析等信息查询服务。在人工窗口同步提供信用信息查询报告、批量信息查询报告、异议处理、信用修复等服务。

(2)信用数据挖掘:挖掘历史信息的隐形价值和潜在价值。通过以上3 种信用信息高效利用的途径只能获得信息的显性价值,而通过利用各类数据挖掘手段对积淀的历史信息进行分析,可以获得信息的隐形价值,这也是信息生命周期管理的重要内容之一。

1.形成多维度信用主体画像。采用智能大数据治理技术,对不同数据类型和模态的主体信息语义检验和分析,实现同一信用主体公共与市场信息的多维度、多模态关联融合,对现有基础数据库中信用主体的信息进行补充,形成更加丰富和多维的主体信用档案和画像。

2.开展信用评价和风险预警。在专题库基础上,利用时序数据分析等机器学习和人工智能技术,强化谱系分析、名单交叉比对、失信记录核查、失信行为跟踪监测、失信行为综合分析、风险事件预警等系统分析功能,构建公共信用综合评价模型,提升信用治理风险防范能力。

(3)信息价值重审:信息价值的重新审定有两种方法,一是通过分析信用信息应用状况,结合客观情况,重新评估信用信息价值,为信息存储管理制定新策略;二是通过分析系统对基础数据的调用时间、调用频率或挖掘产生的应用数据调用时间或频率为维度,评估调整信息的价值和使用有效期。

5 模型实施

5.1 关键路径

对于公共信用信息管理模型的实施,应尽快建立信用信息归集、处理、存储、应用、销毁等各个环节相应业务规范,同时制定相应的规划和计划,包括:信用数据资产盘点、信用数据治理计划、信息应用需求规划等。模型实施的关键路径主要包括:

(1)规范数据的生命周期管理,提高数据的整体管理水平,满足日常信用监管需求。

(2)盘点信用数据资产,明确现有数据存量,清点已有硬件设备,预估未来数据增长趋势,从而优化存储结构、制定硬件扩容计划,有效控制在线数据规模,提高生产数据访问效率。

(3)做好历史信用数据管理,为政府信用监管分析提供数据支撑。

5.2 实施保障

为保障信息管理层次模型顺利实施,还应在信息安全和权益保护方面夯实系统建设的基础条件,提供有力支撑保障。

(1)强化信息安全:在物理存储层和数据业务层实施中,应建立健全信用信息安全监控体系,实行信用信息安全等级保护,明确信用信息查询使用权限和程序;开展信用信息系统安全认证,加强信用信息服务系统安全管理;建立和完善信用信息安全应急处理机制和侵权责任追究机制。

(2)注重权益保护:在信息应用层实施中,应保护信用信息主体合法权益。建立信用修复制度,支持失信主体自我纠错、主动自新,通过公开信用承诺、参加信用修复专题培训、提交信用报告、参与社会公益服务等方式修复信用,形成守信正向激励机制。制定信用信息异议处理、信用修复、投诉办理、诉讼管理制度及操作细则。

6 结语

信息生命周期理论是研究信息资源管理的一种方法论,公共信用信息从产生到消亡是一个完整的生命过程,因信息表现的作用和价值差异可以区分不同运行阶段,所以完全可以运用信息生命周期方法进行资源管理。本文提出了基于信息生命周期理论的公共信用信息管理三维层次模型,对物理存储层、数据业务层和信息应用层三个层次进行了深入详细的描述,以期从多个角度深入理解公共信用信息的全生命周期管理,并提出了模型实施的关键路径。当然,目前对于该模型的研究才刚刚开始,如何更加有效地实施模型、如何进一步对信用主体从产生到消亡的全生命周期进行信息管理尚需要继续研究和探索。

猜你喜欢
生命周期信用主体
论自然人破产法的适用主体
为食品安全加把“信用锁”
从生命周期视角看并购保险
民用飞机全生命周期KPI的研究与应用
信用收缩是否结束
企业生命周期及其管理
信用中国网
信用消费有多爽?
关于遗产保护主体的思考
论多元主体的生成