张婕
摘 要:随着大数据、人工智能、移动互联等新一代信息技术的发展和应用,金融与科技的全面融合正在提速,传统金融服务面对庞大而复杂的数据必须做出相应的改变,进入新金融时代,数据科学的应用为金融业带来了诸多新的机遇,数据分析已经从传统的“BI数据可视化呈现”朝着“AI建模分析”方向演进,数据科学的发展成为现代金融工程发展的重要推动力之一,本文对数据科学在现代金融工程中的应用、发展历程及发展趋势进行了分析。
关键词:数据科学;金融工程;应用价值;发展趋势
一、引言
在新金融经济时代,根据海量数据预测未来结果,实时指导金融分析与决策,已成为重要趋势。在此背景下,数据科学的重要性由此凸显,金融行业作为最喜欢拥抱创新科技的行业之一,数据科学与金融工程的融合后的应用价值呈现新的生机与活力。
二、数据科学与金融工程的融合应用
(一)方法交融
数据科学家Rachel Schutt, Cathy ONeil在《数据科学实战》[1]一书中认为,一个数据科学团队也需要有既了解科学方法,又有需要哲学与伦理学背景的人,才能更好的理解问题。在金融投资中,模型、编程和业务实现真正的融合虽然离不开诸多理论模型协助预测和优化,但在市场上实现持续且稳定利润的策略却少之又少。归根结底主要是市场其内在规律,往往这些经验也只有亲身经历过才能真正理解,拥有丰富经验的投资者通常都不是数据科学家。数据科学重点强调数据、算法和专业领域知识,从这个角度来说,数据科学的模型、编程和算法与金融业务乃至于投资理念的深度融合是价值所在。
(二)理解数据
数据科学是通过使用各种科学方法、算法和过程从大量数据中提取见解,整个过程的基礎就是数据,这是数据科学和机器学习区别的关键。金融投资基本上是以数据为基础的,但金融市场数据越来越丰富,不仅包括交易、财务等结构化的数据,还包括公司公告、新闻媒体等非结构化数据,均被社会广泛应用。最重要的是反映规律的核心变量会因不同国家、不同市场、不同阶段的异质性而发生变化。因此,若想要充分了解数据,特别是当出现一些新现象或新规律时,需要有敏锐的数据或事件的敏感性。这也揭示了历史数据和统计模型的缺陷。理解数据实际上最重要的是能力,单纯依靠技术能够解决的问题非常有限,通常情况下问题都是纷繁复杂,这时就需要专业分析来抽丝剥茧,选择一个最有效或最擅长的工具解决。相信数据的价值的同时,不局限于某一特定的方法。数据科学在金融工程应用背后的思维方式就是理解问题、相信数据、尊重需求。其中,理解数据是第一步。要想真正理解数据需要做到以下三方面,即数据的尺度问题,数据的业务背景,借助图形协助数据的理解。
(三)构建逻辑
鉴于金融业务和数据业务的学科知识属性的差异,大部分使用数据科学的人通常都对业务不熟悉,没有熟练掌握专业领域知识,因此,必须进入一线对业务熟练掌握,形成数据的理解逻辑。此外,数据收集亦或是清洗均会存在偏差,而这些偏差会直接或者间接地影响模型中数据的输入,从而带来较大的风险。针对这类问题计量中对理论基础、因果逻辑的分析是关键,数据科学中还要求对业务数据和数据逻辑有深刻的理解。
三、数据科学在金融工程领域的发展历程
通过文献综述研究,本文认为金融发展离不开科技与金融的结合。随着科技不断发展,为现代金融业注入了新鲜血液,金融科技的历史演进大致分为三个阶段。
四、数据科学在金融工程领域的发展趋势
(一)从场景出发实现决策自动化
决策自动化是数据分析最理想的效果。若想在未来实现“千人千面”的个性化金融服务目标,数据处理的每个环节,数据准备、数据探索、模型选择、模型评估和模型输出等都需要实现自动化。因此,数据分析正在逐步向高智能化方向迈进。“科技只有落地才能实现价值”。因此,就金融应用场景而言,数据科学技术的核心是人工智能和机器学习,借助先进的 AutoML 和 AutoDL 技术实现端到端的大数据解决方案。人工智能构建门槛和智能数据应用成本得到最大程度的降低,帮助金融业务实现人工智能应用,增强行业竞争力。现阶段,数据科学在精准营销、信用风险管理和量化投资研究等业务中得到了体现,使金融业务对客户在降低成本的同时提高其技术能力和服务价值。
(二)数据科学平台输出数据模型价值
在金融科技3.0阶段,数据科学对金融的变革程度更加深远。以大数据、人工智能和区块链等更为前沿的技术作为支撑,构建以数据为核心且能够适应任何变化企业架构,金融企业才可以在激烈的市场竞争中赖以生存。数据科学平台输出的数据模型通常可用性和可解释性较强,可用性主要是为了帮助客户解决实际问题并投入到日常业务生产中。可解释性主要是为了将所有的决策被解释和说明,方便客户理解。增强型分析、持续性智能和可解释性人工智能势必会成为未来数据分析技术领域的发展方向。
(三)数据科学团队的多层次发展
金融企业中的数据科学家更关注采用何种方法将技术应用于金融场景之中,最终使得内外部价值均实现最大化。从模型的角度出发,金融企业的数据科学家更注重应用级模型的构建,与优化学习算法相比,选择特征和参数比最为重要。此外,数据准备阶段需要花费大量的时间。金融企业的数据科学家更注重对行业的理解,而不是技术因素。如此,才可以真正对业务的困境和难点深入理解。企业级数据科学团队的组建,帮助金融公司向各级机构提供多方位、多角度的数据科学服务。数据科学团队主要由三类人员构成。第一类是业务分析和建模人员。他们同时兼顾传统评分建模和业务分析模型设计能力,了解应用场景,对业务需求有非常准确的把握。第二类是拥有开发数据、执行复杂网络计算、实现数据产品和探索新算法能力的数据科学人士。第三类是具备全栈综合能力的团队负责人,特别在大数据领域,可以同时具有横向和纵向的研发与咨询能力,对进度和质量进行严格把控。
参考文献:
[1] Rachel Schutt, Cathy ONeil著,冯凌秉,王群锋译. 数据科学实战[M].人民邮电出版社, 2015.
[2] 徐璐,卢小宾,卢瑶.金融科技产业创新发展与建议研究[J].中国软科学,2022(01):31-39.
[3] 贝劲松.金融基础设施数据融合应用实践[J].中国金融,2021(03):54-55.
[4] 方陵生.新经济下的数据科学——第四次工业革命的数据科学人才战争[J].世界科学,2020(04):41-43.56F4F5AB-917C-4A80-94D7-8D233EADB91E