李 帅
随着经济发展对会计信息化的新的需求,如何通过科学、有效的手段,对行业会计报表数据进行高效的收集与利用,以此来掌握企业的经营和管理现状,发现企业经营管理中存在的问题,预测企业未来的发展前景,已受到了社会各界的普遍关注。有关行业会计报表的信息化问题,采用何种技术,利用何种方法,能够对这些报表数据进行收集并对历史数据进行集成,以便进一步进会计报表数据进行分析利用。
将会计报表数据构建入数据仓库,不仅可以将行业会计报表数据统一管理起来,还可以在此基础上进一步对报表数据进行OLAP(联机分析处理,On-line AnalyticalProcessing)和DM(数据挖掘,Data Mining),从多角度、多侧面观察和分析数据。本文就构建行业会计报表数据仓库模型进行探讨。
鉴于行业组织构架和数据仓库应用的复杂性,本研究采用雪花型模型来设计数据仓库模型,相对于星型模型,可以更准确地反映出各实体之间的逻辑关系,并依据实体的重要程度,将这种关系详细地表示出来。由于目前数据仓库一般都建立在关系数据库基础上,因此,本模型设计过程中所采用的逻辑模型主要是关系模型。利用关系模型不但可以创建指标实体的关系模型,还可以创建概念模型中的维度实体关系模型。
雪花型模型是一种多维的数据关系,它由一个事实表(Fact Table)和一组维表(Dimension Table)组成。每个维表都有一个维作为主键,所有这些维则组合成事实表的主键,换言之,事实表主键的每个元素都是维表的外键。事实表的非主键属性称为事实(Fact),它们一般都是数值或其他可以进行计算的数据;而维大都是文字、时间等类型的数据。雪花型逻辑模型设计如图1所示。
事实表是雪花型模型结构的核心。事实表中一般要包含两个部分:一部分是有主键和外键组成的键部分,另一部分是用户希望在数据仓库中所了解的数值指标。事实表是数据仓库中的最大表,因为它包含了大量的基本业务详细信息。在设计时要注意使事实表尽可能地小,因为过于庞大的事实表在表的处理、备份和恢复、用户的查询等方面需要较长的时间。在实际设计时,可以利用减少列的数量、降低每一列的大小、把历史数据归档到单独的事实表中等多种方法来降低事实表的大小。
图1 行业会计报表雪花型逻辑模型
本文所设计的集团企业会计报表数据仓库逻辑模型,如图1所示,涉及多级主题,而每级主题成员又具有多个,所以在雪花型模型设计中,采用多事实表设计,如资产负债表事实表、损益表事实表、现金流量表事实表、股东权益表事实表和财务分析指标事实表等,而每个事实表采用统一的内部行业编码相关联,组成一个整体,这样的设计,更清晰,更便于对行业会计报表数据仓库的后续研究与应用。而每个事实表中,主键为时间维时间关键字、企业维企业关键字、指标维指标关键字。
行业会计报表数据仓库的逻辑模型设计中,确定了事实表模型后,还需要确定其维表模型。维度表是会影响到决策的因子。如不同企业、时间、指标类别都是影响决策的大因子,通过这些因子决策者可以按照不同企业不同时间不同指标类别进行决策评价。
(1)时间维
时间维模型是许多数据仓库应用中的常用维度,其设计方式与其他多数维表模型有差别,企业集团会计报表的时间因素相对于其他应用的数据仓库较为特殊,非上市公司的会计报表一般编制月报、季报和年报,上市公司必须提供半年报和年报。具体设计时,日期维可以存放以日期表示的5-10年的数据行,也可以将3-4年的数据行作为时间维的内容,时间维设计字属性列为:日期年度、半年度、季度、月等。
(2)企业维
企业是行业或集团企业的基本元素,也是企业集团会计报表应用的基本汇总单位和比较单位。企业维中应包括企业名称、所属行业、所在地、电话、法定代表人、企业性质等。
行业维是对行业企业性质的进一步说明,应包括行业编号和行业名称等。
(3)指标维
指标维是对指标事实表中指标数据的详细说明,在事实表设计时,共设计了五个事实表:资产负债表事实表、损益表事实表、现金流量表事实表、股东权益变动表事实表和财务分析指标事实表等,对这些事实表的指标维度表设计,做统一设计,包括指标名称、指标类型、指标描述、指标类别等。
粒度是指数据仓库的数据单位中保存数据的细化或综合程度的级别。细化程度越高,综合程度越低,粒度级就越小;相反,细化程度越低,综合程度越高。粒度划分的适当与否直接影响到数据仓库中的数据量和信息查询以及更进一步进行OLAP和数据挖掘的效果。通过粒度的划分,决定了数据仓库是采用单一粒度还是多重粒度,以及粒度的划分层次。如果主题的数据量、信息量较多,对主题数据分析细化程度要求较高,就要采用多重粒度进行数据划分,否则采用单一粒度进行划分。
在会计报表数据仓库设计中,由于企业集团会计报表系统主题的复杂性,根据用户对数据仓库应用的需求,我们采用多重粒度划分的策略,用低粒度(细化到月)数据保存近期的会计报表及财务分析指标数据,对时间较远的会计报表及财务分析指标数据只保存粒度较大(细化到年)数据。这样既可以对财务近况进行细节分析,又可以利用粒度较大的数据对财务趋势进行分析。
1.本模型适用于集团企业或行业主管部门,适合集团财务智能化决策的综合应用。
2.本模型采用雪花型模型,传统的星型设计更能适合集团企业组织架构和会计报表元素应用的复杂性。
3.本模型采用多事实表设计,事实表之间采用统一的内部企业编码相关联,组成一个整体,这样的设计,更清晰,将会计报表和财务分析指标同时纳入数据仓库,不但可以在数据仓库中对传统的财务分析方法进行研究,还可以直接通过数据挖掘直接研究会计报表各元素,从而为对传统的财务分析方法进行突破打下基础,更便于对行业会计报表数据仓库的后续研究与应用。