卢亚茹
(中国石油化工集团公司信息化管理部,北京 100728)
关于在中国石化投资业务中应用大数据的思考
卢亚茹
(中国石油化工集团公司信息化管理部,北京 100728)
投资是推动社会和企业发展的源动力,为保证投资管理工作更加高效、高质量地开展,加强大数据在投资领域的应用十分必要。本文从中国石化投资领域的视角,对其大数据的来源和特征、应用途径和建模流程与技术等方面进行了思考和分析。
投资;大数据;数据建模;风险管控
投资是推动社会和企业发展的源动力。对于中国石油化工集团公司(下简称“中国石化”)这种下属企业众多、业务复杂的大型国有企业来说,投资是勘探开发、炼化、销售等核心业务的基本要素和前提条件。而目前投资规模巨大、项目建设周期长、经济效益突出、不确定因素多、经营风险大等情况,给投资决策和管理带来较大困难。如何科学测算项目的短期效益和中长期效益,统筹衡量短期目标和中长期目标的利弊得失,优化投资项目组合以达到最佳经济效益,成为较大挑战。
大数据的发展是IT行业的又一次技术进步和创新变革,对国家治理、企业决策和个人生活都在产生深远影响。随着社会的信息化程度越来越高,由此产生的大量生产、经营、管理等方面的数据,是企业的宝贵财富。对这些数据合理挖掘分析和合理利用,将助推企业生产、经营和决策水平的全面提高。
中国石化成百上千的信息系统在运行过程中产生着海量的业务数据,这些数据覆盖石油和天然气勘探开发、炼油、化工、油品销售、公用工程、石油工程、炼化工程、科研信息等各方面业务,覆盖面广、数据真实可靠、分析利用价值高。毋庸置疑,这些数据将成为中国石化的重要战略资产,有效利用数据提升企业的战略管理水平、提高投资决策效率、提高投资精准度、降低投资风险,是投资理念和方式转型升级、实现科学管理投资的重要手段。
中国石化的信息化经过十几年迅猛发展,已经在管理、生产、经营的每个业务环节都建立了较为完备的信息平台。目前,已建成了以ERP、数据仓库及辅助决策支持等为核心的、覆盖主业的经营管理平台;建成了集成协同的勘探、开发、生产和石油工程服务等上游专业系统;建成了综合集成的生产营运指挥系统,以及若干个世界领先水平的数字油田和智慧炼化工厂;建成了面向全球、支持多种应用及支付手段的加油卡系统和零售管理系统;建成了现代化的物流体系和全生命周期的质量管理体系;建成了集中的绿色数据灾备中心、安全可靠覆盖全球业务的网络系统;建立了完善的运维支持、有效的信息安全和统一的信息化标准体系。
这些信息化的平台和系统全面支撑总部及企业经营管理和辅助决策,无时不刻在产生着数据,为大数据应用提供了环境。
除了以上信息系统产生的机构化数据外,还有大量通过摄像设备、监控设备、传感设备、交通运输业、调查问卷、地理信息、采购、交换等采集的数据,涵盖了音频、视频、图片、文本、模拟信号等不同格式类型,为研究行为共性、分析行业趋势、判断投资时机等投资相关活动提供数据支撑。
大数据在石油石化行业的应用非常广泛,可以通过大数据反映的信息,提前预测企业的未来及发展趋势、指导投资重点和发展策略、进行风险控制,亦可为市场预测分析、经济活动分析、资源优化配置、绩效考核等提供支撑。在投资领域,大数据被广泛应用于企业投资战略、企业发展规划、投资项目管控、投资风险预警等方面。中国石化在投资领域中的大数据应用主要可从以下几方面进行初步考虑。
2.1 利用大数据,提升投资战略优势
中国石化正在大力实施价值引领、创新驱动、资源统筹、开放合作、绿色低碳五大发展战略,并推动实施气化长江经济带行动、油品和非油品两个业务比翼双飞、科技创新和深化改革双轮驱动、打造三个业务领域的发展平台、打造四个具有国际竞争力的世界级炼化基地等重大发展规划。大数据从不同维度分析研究宏观的、长期性、战略性、根本性的发展方向课题,确定中国石化基本的投资战略、投资政策和投资重点,将是促进和推进战略实施规划落地的重要抓手。在建立信息共享机制方面,利用大数据可以紧跟全球化、国际化发展总趋势,引进与国际石油公司的战略合作,从而建立与国内外权威咨询机构的信息和数据的共享机制。在建立数据分析模型方面,大数据平台能结合中国石化生产经营实际情况,研究宏观形势、产业政策研究,推动多维关联关系的数据分析模型的建立和完善。从公司全局角度看,依据大数据分析研究结果,充分认识和掌握行业资源,开展总体规划、专项规划、区域规划和专题研究,明确投资的方向和重大战略布局,能够把加强资源优化利用,实现总体效益最大化。
2.2 利用大数据,强化投资概算管控
项目总体设计能否规范化、标准化,一定程度上取决于投资项目概算结构、概算指标是否规范和标准。分类的投资项目概算结构、概算指标,为造价参数和指标统一管理、提高造价统一性和规范性,以及投资项目概算控制和统一分析提供了可比性。通过对项目概算、实际核算和决算数据进行对比分析,对项目的实施方案和预期效益进行跟踪评价分析,并结合原材料、产品价格变化情况进行分析,可进一步优化技术路线、产品方案和原料结构,为概算控制提供依据,把投资决策风险降为最低,并为后续造价管理提供经验积累。
2.3 利用大数据,提高投资精准度
通过挖掘和分析以往投资项目成功案例的数据,能够分析出有利于投资的方向和方法,从而应用于新的项目规划和建设过程。例如,在加油站建设方面,先对投入产出高、效益好的加油站进行数据分析,采集和分析其建设位置、人流量、周边经济状况、区域内居民收入情况、加油车辆的类型、不同类型车辆的加油频率等信息;在新投资建设加油站项目时,对目标加油站采集和分析同类型的数据,如分析结果与之前成功的加油站类似或接近,则可提升新建加油站的成功率。再如,在管道项目投资方面,收集和分析成功的管道项目建设经验,通过对成功项目建设的地理位置、建设季节、施工难易程度、用工费用情况等进行分析,将结果用于指导后续项目的建设,保证项目投入合理收益最大化。通过对过往大数据挖掘和分析,把成功经验转化成可重复利用的成功数据,让数据说话,完成从拍脑门投资、靠
经验投资向数据指导投资的转变,提高投资的科学性、准确度和成功率。
2.4 利用大数据,防范投资风险
在投资中,由于投资者所掌握的信息量、数据量以及对数据利用情况不同,造成了对不同项目个体的管控力度差异。可能有些项目管控好且风险低,有些则管控不好且风险高。通过对历史项目进行大数据分析,可以有效借鉴成功经验并防范未知风险,这些管控点和风险点包括成本超支、项目范围不可控、项目建设过程中的腐败现象等。例如,通过大数据检查和比较采购过程中的采购订单、收货、发票的数量和金额是否一致,其中存在较大差异的业务则可能是风险点,可采取相应措施,保证采购业务的一致性和完整性并消除风险;再如,在不同区域、不同项目、不同月份中检测同一工程物料及设备的价格情况,如出现采购价格趋势的异常波动,则要采取措施、查找原因,消除风险和隐患。大数据分析可帮助投资者有意识、有目标地采取一些措施来控制风险和加强管控,以在一定的预期下将风险降到最低。
大数据的数据挖掘建模分为数据理解、数据准备、数据建模、模型评估、模型发布、模型优化等流程。主要内容为筛选所需数据,校验数据质量,了解数据含义及特性,构造最终数据集合,净化和转换数据,选择和应用各种模型技术,校正和优化各种模型参数,评估并解释模型效果,评价其可能的效果,实施发布模型等。通过建模为分析人员提供参考,并给出相应建议,根据模型验证和业务情况进行模型优化。目前,中国石化主要运用的技术方法有两种,即神经网络算法和决策树。
3.1 神经网络算法
神经网络算法是数据建模过程中的典型算法,具有预测准确的特点,可以较好地实现以数据驱动决策。神经网络算法的核心思想是信号的正向传播和误差的反向传播,信号的正向传播指,输入样本——输入层——隐含层——输出层;误差的反向传播指,误差以某种形式在各层标示,修正各层单元的权值,直到网络输出的误差减少到可接受的程度。其输入公式为net=X1W1+ X2W2+…+XnWn;输出公式为y=f(net)= 1/1+e-net。模型见图1。
图1 神经网络模型
神经网络算法基本原理在理论上可以逼近任意函数,其基本结构由非线性变化单元组成,具有很强的非线性映射能力。利用输出后的误差来估计输出层的直接前导层的误差,再用这个误差估计更前一层的误差,如此一层一层地反推下去,就能获得其他各层的误差估计。
目前,中国石化在投资领域结合大数据和神经网络算法,通过应用数据模型,期望提高投资的精准度和准确性,降低无效和风险高的投资,达到降低支出增加效益的目的。图2是预测使用数据模型综合分析前后资本支出变化情况。通过模型的建立和应用,各项资本支出都有了较大幅度的降低,较好地节省了资本支出。
3.2 决策树
决策树是对大数据进行分类挖掘的一种技术方法,即依据某一特定对象属性,观察其过去的行为或历史资料,以推估未来的值会是多少,常用于预测模型的演算法。其思想是,通过一批已知的训练数据建立一棵决策树,然后利用建好的
决策树,对数据进行预测。
中国石化投资领域使用决策树决策的过程如图3简单示意。对特定投资标的物,通过对政治、经济、文化、地域、经济技术指标、投资回报预测、风险分析等方面进行决策分析,以判定是否符合投资预期。
图2 资本支出变化情况
图3 投资决策树
2016年,中国石化对全国范围内潜在的石油化工项目进行投资分析,决策树是分析的重要分析方法之一。依据决策树并结合运用经济评价方法,科学测算项目的经济效益指标,指标包括内部收益率、净现金流、项目生命周期内累计实现的税后利润、EVA、投资回收期等,清晰表明效益产出时点及对应的效益值。同时,通过研究宏观经济形势和价格变动趋势,结合国家重大财税制度调整,强化对资源、市场、环境、竞争态势的分析,研究国内外宏观经济政策走势,研判主要原材料及产品价格趋势,并结合实际运营状况,进一步明确投资重点、分年度技术经济指标和投入产出。通过该数据来支持最终决 策,确定了本年的投资重点和投资目标。
大数据可以广泛应用于投资领域,应用的重点在于业务模型构建、数据视图构建、应用系统构建、数据中心建设、多层次多维度的复合人才培养等方面。大数据应用是信息化深入、IT与业务深度融合的必然,是深化应用、提升应用层次、强化集团企业管控的有力技术手段。
随着相关技术的快速发展,企业对大数据的认识和应用将逐步深入,对数据和数据价值的理解和把握也将更加具体。相信随着信息化的深入和“两化”的深度融合,大数据在石油石化行业应用的前景将越来越广阔。
[1] 麦肯锡全球研究院著. 安晖等译. 大数据:创新、竞争和生产力的下一个前沿[J]. 赛迪译丛, 2012(25).
[2] 余建烽,张振宇. 大数据与云计算的关系及发展趋势探讨[J]. 科技传播, 2014, 01: 203+201.
[3] 王星. 大数据分析:方法与应用[M]. 北京: 清华大学出版社, 2013.
[4] 郑军, 尹兆涛. 中国石油应对“大数据”的策略分析[J].石油规划设计, 2013, 06: 27-29+49.The Application of Big Data in SINOPEC’s Investment Business
Lu Yaru
(Information Systems Management Department of SINOPEC, Beijing 100728, China)
Investment is the driving force for social and enterprise development, and in order to ensure the management of investment with higher effi ciency and better quality, there is a great need to increase the use of big data in the investment fi eld. The paper looks into the use of big data in the investment business of SINOPEC, especially the sources, characteristics and applicability of big data and the data modeling process and techniques.
investment, big data, data modeling, risk control
2016-8-16。
卢亚茹(1983—),女,河北省柏乡县人。毕业于燕山大学电子科学与技术专业。工程师,现就职于中国石油化工集团公司信息化管理部。电子邮箱:luyaru@sinopec.com。