介绍智能代码大模型的发展历程和代码编程辅助演进变化,以及当前智能代码大模型金融领域应用实践,根据智能代码大模型在金融领域的挑战提出政策建议
智能代码大模型发展历程与代码编程辅助演进
发展历程
自2015年起,AI模型就已被应用在编程开发场景;2023年初,软件行业大模型覆盖度仅有约10%,随着ChatGPT等大模型的发展,2023年底这个覆盖度已达到约70%;目前智能代码大模型在软件开发场景的平均提效幅度约为30%,从AI参与的维度来看,刚刚进入L3级别,预计2025年底提效幅度将达到90%以上。
代码编程辅助演进
2021年6月29日之前,智能代码辅助工具处于1.0时代,作为简单的代码提效工具,主要面向开发人员,提效幅度有限;2021年6月至2024年4月进入2.0时代,以Github Copilot为代表的基于大语言模型的编码辅助,能够续写代码、提供技术问答等,但仍需较多人工干预;2024年4月至今来到2.5时代,已实现全面编程辅助,以Devin为代表的多智能体软件工程师,能够自我协同完成部分开发任务,但仍未完全替代开发团队;预测到2025年底将实现全流程业务代码生成,多模态、多智能体的大模型将覆盖项目级开发,大幅提升开发效率。
智能代码大模型金融领域应用实践
当前,银行、基金、私募基金、投行、证券公司都已开始使用智能编程工具。同花顺也已自研代码大模型,并应用在整个公司的开发流程中,目前使用人数超1100人,已占公司有效开发人数的60%左右,每月超过30万行代码由AI生成并上线,每月超三分之一的代码由大模型生成,其中全流程金融业务代码的生成能够提升至少60%的研发效率。
智能代码大模型在金融领域挑战及政策建议
代码大模型在金融领域的挑战
一是高质量金融项目、架构、文档、代码数据获取难度高,数量少;二是金融领域对结果精度要求高,但大模型对项目、架构的理解和生成能力较差;三是对使用人员综合能力要求更高,需要既是开发专家又是金融业务专家,并且懂产品和设计;四是对开发团队要求更高,需沉淀标准化业务代码组件;五是对大模型的能力全面性要求更高,包括金融业务知识、取数能力、计算能力、金融逻辑推理能力等。
代码大模型在金融领域的政策建议
一是引导行业数据合作,促进机构间市场公开金融数据的流通共享;二是加大金融领域大模型的算力扶持力度,在所有垂直行业中,金融数据及相关代码数据体量大,获取难度较大;三是针对垂直领域大模型快速发展对该领域造成的潜在影响进行提前干预和引导;四是关注特定垂直领域大模型的安全、信创。
(作者系浙江核新同花顺网络信息股份有限公司首席专家,本文由浙江数字经济百人会供稿。)