大数据思维下建立例外事项小数据库的思考

2017-11-14 21:20单军亭单昱单晨瞿晶珠
经营者 2017年6期
关键词:数据库大数据

单军亭+单昱+单晨+瞿晶珠

摘 要 大数据是互联网信息时代的发展趋势,小数据是大数据的基础,二者相辅相成,相得益彰。本文通过探讨大数据与小数据之间的关系,建立内控测试例外事项数据库的目的与意义,简述用大数据思维建立例外事项Excel小数据库的程序和方法,以及数据库的使用方式。

关键词 大数据 数据库 建设程序

大数据思維是目前企业关注和热议的话题,正在影响或改变传统的企业模式。运用大数据新型技术从海量的数据库中提取可用数据,通过对结构性和非结构性数据进行全面、关联和快速分析,精准预测未来发展趋势,已成为互联网信息时代的共识和不争的事实。大数据的运行,离不开数据资源的支持,没有各类数据库资源的汇集,大数据就无数据来源。因此,在大数据思维下建立相应的小数据库,不仅是大数据有效运行的基础,更是应用大数据新型技术的保障。

一、对数据、信息和数据库的理解

百度百科和360百科均把数据(data)解释为,数据是对客观事物存在事实或观察的结果和逻辑归纳,是表示客观事物未被加工和处理、原汁原味的原始素材。数据是计算机信息技术的术语,是信息的表现形式和载体,可以是符号、文字、数字、语音、图像、视频等。信息是数据的内涵,数据是信息的表达。数据本身并无意义,只有对实体行为产生影响时才成为信息,数据和信息不可分离。①

笔者认为,数据是对各类事物诞生、发展和消亡等各个时序节点全过程运行轨迹,用各种各样能被人和机器等认识、甄别和记忆,用不同的语言文字、影像图形、符号标识等进行描述汇总和统计分析的一维或多维记录。单个记录的汇集可以形成一组或一个纬度,多个纬度的聚集便可形成一个库。记录数量按照“积水成渊、积土成山”规则,即可形成大、中、小等不同层级的库。由于记录的是各种类型的信息,通常这些信息又被称为数据,所以这些信息数据记录形成的库就被称为数据库。

不言而喻,数据量小的是小数据库,数据量大的是大数据库(介于中间的是中控数据库)。单个或多个小数据库的汇集可以形成大数据库。由此可知,小数据库是大数据库的基础,大数据库是小数据库的集合,没有小数据库就形成不了大数据库,没有小数据就形成不了大数据。

二、大数据与小数据之间的关系

网络技术的不断进步和信息载体飞速发展,为大数据的崛起提供了机遇和平台。数据库是按照一定的数据结构,集成、记录、存储和管理数据资源的仓库,结构性和非结构性信息层级分明,使用方便、操作简单。

(一)大数据和小数据之间存在层级关系

数据库可以分为三个层级:第一层级是集团层面,处于数据库的顶层;第二层级是地区公司层面,处于数据库的中层;第三层级是地区公司所属层面,处于数据库的底层。大数据是小数据的集合,集团层面可视同为大数据。小数据是业内不同部门各相关数据的集成,地区公司所属层面可视同为小数据。小数据是大数据的基础和来源,没有小数据就没有大数据;大数据是小数据的汇集,没有大数据,小数据就没有价值取向,二者相辅相成,相得益彰。

(二)大数据和小数据之间的数据取值不对称

大数据的数据来源于小数据,而小数据是各行业部门投入大量的人、财、物资源,把长期积累的各类资源转换成数据资源的结果,是企业内部劳动成果和辛勤付出的平台和血汗,一般只限制在有权限的内部使用,不会轻易外传。由于受考核指标的影响,不同层级的单位上报数据时,在考虑和权衡自身利弊的情况下,基本都会对关键指标进行加工和处理,对下真实可靠,对上却受到怀疑。这种背景下的大数据,因其数据取值不对称,就具有了一定的欺骗性。

(三)大数据和小数据的数据使用都有权限限制

大数据背景下,业内数据属于内部资料,一般不会对外开放。业外人员要想获得相应的数据,必须经过逐级审批,且有限制权限。比如,人事、财务、合同、采购和审计等部门的非内部人员想获取相关数据,如同非内部人员想查看淘宝、微信、银行或医院等相关数据一样,一般只能在对外开放的平台上查看对外披露的数据,但这些数据都经过了加工和处理。要想收集到最原始的数据进行数据分析和预测,必须有相应的权限,并且经过允许。由此可知,大数据只是供内部有权限人员使用的平台,外部想实现数据挖掘、采集、筛选和运算,用大数据分析和预测,基本无能为力。

三、建立内控测试例外事项数据库的目的与意义

在大数据背景下,集团公司作为国有大型企业,已经建立了一系列的数据体系。由于受使用权限等影响,人事、财务、合同、采购和审计等部门的非内部专业人员一般无法获取相应的数据资料。建立业内小型数据库,能够扩大非内部专业人员的使用范围,为非专业人员提供一个通畅的查询平台。由于各业务之间存在一定的瓶颈,加上内部之间互相涉密,系统间使用的框架、平台和接口不统一,限制了大数据分析者运用大数据算法进行挖掘和统计分析的能力。在此,笔者以本公司内控测试例外事项数据为例,简述建立小型数据库的目的和意义。

(一)梳理存在问题,方便查询分析

按照内控手册要求,公司每年至少开展一次内控测试,查找内控体系设计和运行中存在的问题,修订失效控制,维护内控管理手册。所属单位完成例外事项整改任务后,大多数情况下都不会再去翻阅和查看,给日后使用带来了不便。梳理内控测试例外事项,建立数据库可以为后续的查询分析提供方便。

(二)提醒关注事项,避免重复发生

内控测试例外事项数量是考核内控体系运行情况的一项指标,建立内控测试例外事项数据库,可以提醒岗位人员及时关注相关事项,统计分析和查找存在问题的根源,有利于主管部门结合实际情况制定切实可行的防控措施,从而避免内控例外事项的重复发生。

(三)防范潜在风险,推进控制执行

内控测试例外事项的产生是未能按照控制要求执行的结果,内部控制的关键是控制对应的风险。产生例外事项说明控制措施执行不力或者失效,其对应风险造成的影响,虽然没有立刻显现,但确实存在,如不认真对待,潜在风险一旦爆发,后果和影响或不可估量。内控例外事项数据库对应了风险防范和惩处重复发生措施,为全面提升内控执行力提供了依据和支持。endprint

四、数据库建设的程序方法

搭建数据库的方法多种多样,有系统、有软件、也有表单。如前所述,系统数据库由于内部之间互相涉密,系统间使用的框架、平台和接口不统一,限制了大数据分析者运用大数据算法进行挖掘和统计分析的能力。软件建库需要学习相关的专业技术,Access也要具备相应技能。相比之下,笔者认为还是Office Excel表单结构简单、使用方便。这里,笔者以微软Office Excel为例,简述本公司内控测试例外事项结构性数据库的建设程序和方法,其他不同类型小数据库的建立,如人事、财务、合同、采购和审计等方法与此大同小异。

一是设计数据库结构,整理统一表格。结合年度测试情况,根据需要归类数据内容,把各年度例外事项测试层级、测试主题内容和领域名称,例外事项问题及产生原因、问题根源,问题解决措施,重复发生例外事项惩处措施,提升内控执行力建议等统计分析内容,一并设计纳入数据库结构之中,形成统一的Excel表格,在征求意见的基础上,修订、完善数据库结构,整理设计格式统一的内控测试例外事项数据库。

二是下发统计分析通知,指导表格填写。在公司网页上发布关于开展内控测试例外事项分析工作的通知,明确分析期间、范围、内容和上报时间。组织所属单位开展例外事项统计分析业务培训,指导业务骨干分项填写相关内容,把建库要求落实到基层对应部门,自下而上制定问题解决措施和重复发生例外事项惩处措施,经存在问题的对应部门签字确认后,提交主管领导审核。

三是收集反馈资料,审查对应内容。例外事项统计分析业务主管部门相关人员在规定时间收集所属单位上报的反馈资料,逐一审查对应内容,发现不符合要求等问题及时沟通并返回修订,直至全部合格后,把例外事项统计分析表整理汇总为统一文档。之后调整表格顺序,编制链接库文件目录。

四是制作VBA窗体,测试运行效果。首先,打开Excel数据表,主界面如未显示开发工具,可在Office按钮主菜单下选择Excel选项,之后选择常用,然后选择勾选开发工具;其次,在主界面点击开发工具,之后选择录制宏,完成宏录制后打开开发工具,左侧点击Visual Basic,在视图中点击工程资源编辑器,在对象下点击This Workbook,然后双击并编程;第三,在主界面插入中选择用户窗体,出现窗体和控件工具箱,之后设计窗体,然后双击窗体在UserForm1编程;第四,完成编程后设计图片和文字格式,在主界面运行栏中选择运行子过程/用户窗体,出现运行界面后,输入用户名和密码,之后進入查询导航,然后调试程序并完成测试。

非结构性数据库的建设程序和方法与结构性数据库基本相同,只是编程、表单引用等更加烦琐和复杂。

五、数据库的使用方式

为有效防范潜在风险,全面提升内控执行力,制作完成例外事项统计分析数据库后,可及时在公司网页上发布,所属单位岗位人员进入查询系统后,可进行查询和分析。

综上所述,在大数据思维下建立例外事项小数据库(内控测试例外事项Excel统计分析小数据库),是发展并应用大数据新型技术的前提和基础,大数据和小数据相辅相成,相得益彰。

注释:①百度百科、360百科。

(单军亭单位为青海油田企管法规处(内控与风险管理处);单昱单位为中国石油大学(华东)储运与建筑学院;单晨单位为青海油田井下作业公司试油测试大队;瞿晶珠单位为青海油田社区管理中心物业一公司)

[作者简介:单军亭(1964—),男,本科,毕业于北京科技大学工商管理专业,云南大学经济管理研究生结业,高级项目管理师,青海油田企管法规处(内控与风险管理处)业务部门负责人,研究方向:企业内部控制,综合风险管理。单昱,中国石油大学(华东)储运与建筑学院工程力学专业本科在读。单晨,大专,石油工程专业。瞿晶珠,大专,计算机应用专业。]

参考文献

[1] http://baike.so.com/doc/5387430-7565065.html[OL]. 360百科.

[2] http://baike.baidu.com/link?url=k40A0wYoiB74deIK8UI7sqpkm_xjBpQt4t6jxSj6AlF

ZZ-SOSrx_Y3OjMpvRZCslSGDFXaifIdpySL5MV2UY38CQmTYwqf3lAkl5kQNTYE7[OL].百度百科.

[3] 青山. Excel窗体设计制作方法[OL]. http://club.excelhome.net/forum.php?mod=viewthread&tid=137671&page=1&authorid=76888,2005-12-02.

[4] 单军亭,单晨.浅谈用大数据思维建立内控测试例外事项小数据库[J].青海油田企业文化,2016(2):61-62.endprint

猜你喜欢
数据库大数据
数据库
数据库
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索
数据库
数据库
数据库
数据库