大数据趋势下企业多样化的数据策略

2015-12-27 12:23芮祥麟
软件和集成电路 2015年1期
关键词:数据管理生命周期数据挖掘

大数据趋势下企业多样化的数据策略

为保障企业多样化的数据策略,企业需要考虑大数据趋势下数据应用全生命周期的各个阶段。

大数据趋势下应用的核心是数据资产。数据成为新的价值来源,得益于数据平台和数据即服务,扫除了部分障碍,数据共享和整合得以简化。新的数据共享模式会逐渐淘汰数据所有权这一理念。企业不同的业务部门都将创建、使用并与他人共享数据。

为更有效地对数据进行使用,需要对数据资产价值进行评估。价值评估的关键要素包括数据的效用(即质量、来源、时效性),独特性或唯一性,“生成”(收集、汇总等)数据的难易程度,使用和共享限制,可用性和整合性,可信度,业务需求匹配度,以及从第三方获得数据的支持度等。高价值的数据资产,会成为企业资产的重要组成部分,不仅能间接推动业务发展,数据服务还会直接为企业创造价值。

为保障企业多样化的数据策略,企业需要考虑大数据趋势下数据应用全生命周期的各个阶段。生命周期的第一步应该是要明确组织,明确相应的规划、建设和运营组织。大数据应用的实施有别于传统应用实施。数据科学家、数据工程师等新角色需要被引入项目团队。尤其重要的是数据,科学家角色的引入。数据科学家应该具备统计分析能力、对数据的提取与综合能力以及数据的可视化表示能力。

生命周期的第二步就是做现状评估,评估前进行对外调研、对内客户调研和自身状况摸底,最后对标,做差距分析,找出差异。找出差异后,要给出成熟度现状评估。一般而言,大数据应用成熟度可以划分为四个阶段:初始期(仅有概念,没有实践);探索期(已经了解基本概念,也有专人进行了探索,有了基本的大数据技术储备);发展期(已经拥有或正在建设明确的战略、团队、工具、流程);成熟期(有了稳定且不断成熟的战略、团队、工具、流程)。

有了数据组织建设、了解自身数据现状、差距和需求,我们就可以制定数据的战略目标了。数据战略的制定是整个数据生命周期的灵魂和核心,它将成为整个组织数据发展的指引。数据战略的内容,需要简洁,又要能涵盖公司内外干系人的需求;同时要明确,以便清晰地告诉所有人目标和愿景是什么;还有就是要现实,这个目标经过努力是能达成的。所以从企业现有数据开始采取渐进式的策略,要比激进的“大跃进”更加容易取得成效。

在需求和战略明确之后,基于数据价值的数据定义就是一切数据管理的前提。通过元数据实现数据定义。元数据是描述数据的数据,是为了提升企业信息资产的可用性,对信息资产各个方面特征加以描述的信息。技术元数据、业务元数据和管理元数据。

接下去是数据获取、数据挖掘和分析、数据展示。大数据的种类很多,包括结构化、半结构化和非结构化的数据。数据获取的工具,很多以交互式探索及数据挖掘为代表的数据价值发掘类工具渐成趋势。数据获取的方式有很多,可以通过内部服务、外部API、外部合作批量获取、爬虫等多种手段获取。数据获取的原则一定要以数据价值为导向。

数据挖掘和分析需要集成的数据挖掘和分析平台。平台要满足业务需求,而不是业务要去适应平台要求。集成的平台应该能检索、分类、关联、挖掘、推送和方便地实施元数据管理等。大数据管理的价值,最终要通过多种形式的数据呈现,来帮助管理层和业务部门进行商业决策。大数据的决策者需要将大数据的系统与BI(商业智能)系统和KM(知识管理)系统集成,通过报表、分析、仪表盘、移动端等形式而展现出来的。

最后是数据的治理。数据的治理指的是数据管理层,组建专门的治理控制团队,制定一系列策略、流程、制度和考核指标体系,来监督、检查、协调多个相关职能部门的目标,从而优化、保护和利用数据,保障其作为一项企业战略资产真正发挥价值,其核心是数据安全、数据质量和数据效率。

以上每个阶段都有可能会遇到如何确定新型技术与企业已有科技投资和信息资产有效组合的最佳平衡点问题。短期相对有效的策略就是让他们互补而不是替代。

猜你喜欢
数据管理生命周期数据挖掘
全生命周期下呼吸机质量控制
改进支持向量机在特征数据挖掘中的智能应用
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
航发叶片工艺文件数据管理技术研究
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
从生命周期视角看并购保险
民用飞机全生命周期KPI的研究与应用
数据挖掘在学生成绩数据管理中的应用研究