构建“(大模型+数据要素)×千行百业”数智化新模式推进沈阳加快形成新质生产力

2024-08-22 00:00:00窦丽莉徐利葛东
辽宁经济 2024年5期
关键词:数据要素新质生产力

〔内容提要〕新质生产力是新时代经济发展的核心驱动力,数据要素×、AI大模型以及生成式AI等新概念及新技术的涌现,为培育和壮大新质生产力提供了坚实的基石与无限的潜力。本文通过深入研究新质生产力、数据要素×、AI大模型之间的内在联系和相互作用机理,揭示数据要素价值化、AI大模型、生成式AI技术对培育新质生产力、推动生产方式智能化变革所产生的决定性作用,结合沈阳市发展定位和资源禀赋,以及在人工智能和数据要素价值化方面的发展布局,提出构建“(大模型+数据要素)×千行百业”的新一代人工智能发展模式,并就沈阳市发展AI大模型产业的路径和策略给出建议。

〔关键词〕新质生产力;AI大模型;生成式AI;数据要素×;数字沈阳

近年来,AI大模型、生成式AI、数据要素×、新质生产力概念兴起并成为社会的关注热点。这些概念从不同的角度,阐述了推动经济社会高质量发展的实施路径,它们相互交织、相互促进,深刻影响并重塑着现代社会的经济结构、生产方式、生活方式乃至社会治理模式。当前,沈阳市正处于推动经济全面振兴的关键期,研究这些新的发展要素以及探索新的发展模式,对于沈阳构建经济高质量发展路径具有十分重要的意义。

一、数据要素与大模型技术对形成新质生产力的作用

生产资料与生产工具是生产力的核心组成部分。数字经济时代下,作为生产资料的数据要素与作为先进生产工具的人工智能技术构成了新质生产力的发展基础。

(一)数据要素是数字经济时代的关键生产资料

数字化时代背景下,数据要素作为一种新型生产资料,是推动生产方式变革、促进经济结构优化升级、提升全要素生产率的重要力量。

首先,数据要素驱动创新发展。数据具有无限复制性、非消耗性以及高度关联性的特点,能够通过分析和挖掘,不断激发新的产品、服务、业态和商业模式的创新,是推动经济转型升级和高质量发展的核心力量。

其次,数据要素促进生产效率提升。数据的深度应用能够极大提升生产、管理、服务等各环节的效率,通过精准预测、智能调度、自动化作业等方式,减少资源浪费,优化资源配置,实现经济效益的最大化。

再次,数据要素促进跨界融合。数据要素的流动性和通用性,促进了不同行业、领域间的融合创新,打破了传统行业界限,催生了跨界合作的新模式,进一步拓展了生产力的边界。

(二)大模型是激活数据要素价值的重要生产工具

数据要素作为生产要素的关键在于如何在生产活动中释放数据的价值,AI大模型技术为数据要素价值化提供了必要手段。

首先,AI大模型使得存量数据价值得到释放。大模型训练令沉淀下来的数据要素得以进一步发挥其生成信息和知识的价值,从而推动海量数据的价值解锁和变现。

其次,AI大模型使得私有数据资产的价值得到释放。许多公司拥有行业中非公开的、高价值的专业化数据,很难直接贡献给行业,有了大模型技术,他们可以用企业的私有数据训练大模型,再为行业提供大模型服务,从而有效地激活企业私有数据资产。

再次,大模型技术加速数据资产的流通和交易。大模型技术可以对数据要素进行智能化的加工和重构,另外,使用AI大模型技术,可以在确保数据隐私和安全的前提下,通过生成隐私保护的合成数据来替代原始敏感数据,保证了数据的安全流通。

(三)“大模型+数据要素”为新质生产力发展注入强大动力

新质生产力的核心,就是通过新技术的推动,实现以数据为核心、以智能化为特征的全新生产力形态。以蕴含丰富知识的海量数据训练的AI大模型,是推动智能化的关键所在,“数据要素+大模型”赋能各行各业,为各行业发展新质生产力注入强大动力。

首先,AI大模型大幅提升知识劳动者的效率。传统AI对辅助和替代人类的简单劳动有所帮助,而大模型的出现,使得AI辅助和替代人类的高级知识劳动成为可能。

其次,AI大模型加速知识发现与技术创新。传统AI主要侧重于重复性、机械性的任务,而AI大模型通过机器学习自动合成新知识和洞见,开始逐渐承担更多的创新性和创造性工作,这对人类的知识发现与技术创新活动形成极大的支持。

再次,AI大模型驱动千行百业智能化升级。ChatGPT的成功,使得行业充分认识到“先通识、再专识”的智能实现路径,尽管公有大模型直接用于企业级客户尚存在一些不足,但是AI大模型展现出来的强认知、强交互、强生成的特征对于垂域领域认知及自主决策的实现至关重要。另外,大模型也大幅度减低了人工智能在企业落地的技术门槛和实施成本,促进人工智能在广大垂直领域的应用,从而大幅度促进社会生产力的提升。

二、沈阳市在数据要素及大模型领域的发展基础和主要问题

(一)发展基础

沈阳市高度重视人工智能产业发展以及对传统产业的赋能。2018年,沈阳市政府发布了《沈阳市新一代人工智能发展规划(2018—2030年)》,为沈阳市人工智能产业的发展提供了清晰的战略导向和政策支持。2021年11月,沈阳市获批建设国家新一代人工智能创新发展试验区。经过几年的发展,沈阳市人工智能产业取得了长足进步,为大模型及生成式AI的发展建立了良好的基础。

一是人工智能算力建设方面已达到国内领先水平。2022年8月,沈阳人工智能计算中心正式上线投入运营,成为东北首个接入全国算力网络的节点。2023年6月,沈阳人工智能计算中心算力扩容到300P,2023年7月,获科技部批准成为首批国家新一代人工智能公共算力开放创新平台。沈阳市人工智能算力已经达到全国第一梯队水平,强大的算力支撑为沈阳开展大模型训练和生成式AI应用提供了坚实的底座。

二是数据要素市场化配置加速布局。沈阳以建成东北数据要素配置首选地为目标,在东北地区率先启动数据交易流通产业生态建设。2022年1月,辽宁工业大数据交易中心在沈阳启动建设,推动辽宁数据要素市场形成。2024年1月,沈阳市大数据管理局印发《沈阳市数据交易工作指南(试行)》,为促进数据依法有序流动,确立了基本准则。2024年3月,沈阳市发布《数字沈阳建设布局规划》,提出重点实施数据要素“1+12”行动计划,并首批针对工业制造、现代农业、商贸流通、文化旅游、绿色低碳五大领域分别发布《数据要素X专项行动计划》。

三是AI大模型领域研发初见成效。沈阳人工智能计算中心建立了基于昇腾技术栈的大模型产业孵化平台,与东北大学、金睛云华、沈阳利连以及小视科技合作孵化“沈阳?太一”“安心大模型”“DrPasteur”“宙初”行业大模型,并部署了11+主流开源大模型。2023年6月,东软集团推出添翼医疗领域大模型,为医生和患者提供对话式交互服务和智能诊疗辅助。2023年8月,东软集团宣布实施“大语言模型系统工程(LLM Systems Engineering,LLM -SE)”战略,通过打造东软LLM-SE通用开发平台,推动大模型在典型场景落地部署及大规模推广。2023年12月,东北大学发布了开源的大语言模型TechGPT2.0。2024年3月,由东软申报并建设的辽宁省大语言模型工程研究中心和沈阳市大语言模型技术创新中心相继获得正式批复并启动建设。

(二)主要问题

沈阳市在AI大模型及生成式AI领域尚处于探索阶段,相较于一线城市和部分AI发展热点地区在大模型及生成式AI领域的快速推进,还有一定差距,还存一些需要重点关注的问题。

一是产业生态薄弱,创新活力相对不足。沈阳市在AI产业链上下游企业的集聚度、多样性方面存在较大不足,尤其是缺乏头部AI企业和成熟的AI应用解决方案提供商,严重影响AI大模型的快速商业化落地和市场推广。

二是数据资源开发与数据开放存在不足。尽管沈阳市作为我国重要的工业基地拥有较丰富的数据资源,但在数据量、数据种类、数据更新速度等方面与数据富集地区存在差距,影响AI大模型训练所需高质量、大规模数据的获取。同时,数据开放共享的程度也存在较大不足,直接影响AI大模型的研发效率。

三是市场认知不足,应用推广进展缓慢。沈阳市本地企业,尤其是传统行业企业,对AI大模型的理解和接纳程度参差不齐,导致AI大模型在实际业务中的应用推广面临阻力。在更广泛的行业和公共服务领域,AI大模型的应用场景挖掘与拓展尚处于初级阶段,需要进一步探索和实践。

三、构建“(大模型+数据要素)×千行百业”的发展模式

国家推动“数据要素×”行动计划,其目的在于充分发挥数据要素乘数效应,赋能各行各业,实现经济社会高质量发展。而大模型正是激活数据要素价值、实现数据要素累乘效应的智能引擎。“(大模型+数据要素)×千行百业”将成为数据价值变现的主要手段,也将成为新一代人工智能赋能社会经济发展的重要模式。沈阳市应基于自身的资源禀赋,坚持“大模型+数据要素”赋能千行百业的发展模式,以大模型在行业落地为抓手,大力发展行业大模型,构建基于大模型及生成式AI技术的行业解决方案,赋能千行百业智能化升级。

(一)积极发展行业大模型

相比于通用大模型所需的广泛数据覆盖和大规模计算资源,行业大模型的开发通常基于通用大模型针对特定行业知识、数据和应用场景进行深度定制,对资源的需求更为集中和有针对性。在沈阳市创新资源以及资本投入方面有限的情况下,应坚持发展行业大模型的目标定位。第一,集中力量研发与本地优势产业紧密相关的行业大模型,可以更高效地利用现有资源,避免在通用大模型研发中的高投入低产出风险。第二,相对于通用大模型的普适性,行业大模型更贴近具体行业用户的需求,更容易找到明确的应用场景和付费客户。第三,沈阳市的企业和机构在面临特定行业问题时,更愿意投资和采用针对性强、效果明显的行业大模型解决方案,这为行业大模型的市场推广和商业化落地提供了良好的环境。

行业大模型有多种形态,如表1所示。从具体的行业大模型发展目标来看,第一,沈阳市可发挥在民用航空、机器人、医疗等行业数据资源丰富的优势,开发领域通用大模型。第二,关注汽车及零部件、装备制造、数控机床等特定行业,发挥行业龙头企业的作用,开发垂直行业大模型。第三,发挥在数字政府、智慧城市、医疗卫生、健康养老等行业信息化解决方案的优势,开发专业大模型,并将其嵌入行业解决方案中,推动既有行业解决方案的智能化升级。第四,可根据机器人、智能汽车、健康养老等重点领域智能场景的需求,开发实时交互式大模型。

(二)强化高质量数据要素供给

大模型的发展,离不开高质量数据的训练。沈阳市应结合政府推行的数据要素“1+12”行动计划,统一规划数据的开发、共享、交易,为发展行业大模型开发提供高质量的数据。第一,构建数据开放共享机制。推动政府、企事业单位的数据开放共享,建立安全、合规的数据交易平台,为AI大模型训练提供丰富的数据资源。第二,提升数据资源加工能力。鼓励和支持建设一批专业化的数据处理与数据标注服务机构,通过建立严格的数据质量管理流程,确保输入大模型的数据准确、完整、一致且实时更新,提供足够且高质量的训练样本,满足AI大模型训练需求。第三,激活企业私有数据资产。推动AI大模型研发机构及企业与传统企业深度合作,联合研发垂直领域大模型,用企业的私有数据训练大模型,并为行业提供大模型服务,从卖数据变成卖模型服务,有效地盘活企业非公开的、高价值的专业化数据的价值。

(三)重点研究大模型行业应用的关键问题

应沈阳市发展行业大模型之所需,引导组织高校、科研院所、龙头企业聚焦大模型行业应用的痛点问题,开展关键技术研究以及支撑平台建设。第一,研究AI大模型应用工程化问题。开展面向行业应用的大模型应用开发框架和方法论研究以及大模型系统工程能力建设,突破大语言模型思维链构建技术、基于知识图谱的知识外挂技术、价值观对齐技术和大语言模型能力质量评估等关键技术。第二,研究大模型轻量化问题。针对大语言模型参数巨大,部署成本高等问题,开展大语言模型轻量化部署和推理优化技术研究,研究轻量化大语言模型应用与部署技术路线和实施方案,全面支持面向行业应用的大模型部署。第三,研究AI大模型与智能体融合问题。智能体(Agent)是指能够自主感知环境、做出决策并执行行动的系统,它能够在复杂多变的环境中独立完成任务。智能体将成为代替行业从业人员实现专业工作自动化的主要产品形态,而大模型驱动的智能体将成为大模型面向行业应用的主要形态之一。同时,大模型与智能体之间的知识共享与累积,将成为缓解大模型幻觉等问题的主要思路之一。第四,研发大模型应用支撑平台。开发和集成适用于各类行业场景的机器学习、深度学习、图神经网络等算法组件,形成丰富的算法库,便于用户根据实际需求快速构建、优化模型。同时,提供数据预处理、特征工程、模型训练、评估、部署等全流程工具支持,降低模型开发门槛,提高开发效率。

(四)以应用场景为牵引,推进大模型向行业赋能

大模型技术能不能成为新质生产力,最终还是要看其在行业落地的成果。大模型必须通过融入场景来展现它的价值,要以行业应用场景为驱动,解决不同行业、不同规模、不同类型企业的具体应用问题,跨越AI行业落地的“最后一公里。第一,要规划行业应用场景。《数字沈阳建设布局规划》中提出,实施数据要素“1+12”行动计划,培育“数据要素×”典型应用场景100个。可结合这些应用场景规划,筛选与AI大模型应用匹配的场景,引导创新主体积极开展大模型及生成式AI创新应用。第二,深入挖掘行业场景需求。通过深入调研目标行业的业务流程、运营模式、技术瓶颈及市场趋势,精准识别并详细梳理行业在智能化升级过程中面临的痛点和需求,结合AI大模型的特点(如大规模、跨领域、高精度等),探索其在目标行业中可能的应用场景,如预测性维护、智能决策、个性化推荐、自动化检测等。第三,实施AI大模型应用示范工程。聚焦重点行业领域,打造标杆性大模型产品和服务,将大模型无缝集成到现有的业务流程和IT系统中,验证大模型的实用效果和商业价值,并通过树立标杆、总结经验、复制推广,加速AI大模型在全行业的普及应用。

(作者单位:1.东软研究院;2.沈阳东软数字经济研究院)

猜你喜欢
数据要素新质生产力
加快形成新质生产力
学习与研究(2024年1期)2024-01-23 08:11:21
以科创基地建设加快培育“新质生产力”
山东国资(2023年9期)2024-01-02 13:49:10
何为“新质生产力”?
领导月读(2023年10期)2023-12-23 15:47:36
支持科技创新成财政提质增效新出口 发展“新质生产力”蕴含投资新机会
习近平总书记首次提到“新质生产力”
“新质生产力”有多重要
新民周刊(2023年37期)2023-10-28 01:15:30
大数据如何更好地服务于国家发展战略
人民论坛(2021年6期)2021-03-15 09:59:40
从多个视角看金融科技安全问题
债券(2021年1期)2021-02-04 08:02:05
习近平数字经济发展思想的历史逻辑、核心要义及其时代价值
理论导刊(2021年1期)2021-01-21 09:44:01
政府数据供应链数字化及其价值研究与实践探索