AI大模型在数字政务系统中的应用开发研究

2024-12-31 00:00:00蒲云鹏
科技创新与应用 2024年35期
关键词:数字政府人工智能

摘" 要:随着人工智能技术的飞速发展,AI大模型正成为推动数字政务现代化的重要技术之一。该文首先概述AI大模型的概念、特点和发展脉络,分析其在数字政务系统、数字政府中的应用场景,对AI大模型应用建设思路、开发技术和业务类型等进行分析研究,同时针对大模型应用建设中可能遇到的风险挑战提出对策建议。

关键词:人工智能;AI大模型;政务大模型;数字政府;数字政务系统

中图分类号:TP18" " " 文献标志码:A" " " " " 文章编号:2095-2945(2024)35-0022-05

Abstract: With the rapid development of artificial intelligence technology, AI large models are becoming one of the key technologies driving the modernization of digital government affairs." This paper" first outlines the concept, characteristics, and development trajectory of AI large models, analyzes their application scenarios in digital government systems and digital governments. It conducts research on the construction ideas, development technologies, and business types of AI large model applications. Additionally, it proposes countermeasures and suggestions for potential risks and challenges in the construction of large model applications.

Keywords: artificial intelligence; AI model; government model; digital government; digital government system

在数字化时代的浪潮下,人工智能技术特别是AI大模型技术正在全球范围内迅速崛起,并在自然语言处理(NLP)、图像识别、音频处理等诸多领域展现出卓越的能力。本文探讨AI大模型在数字政务系统应用的机会与挑战,对AI大模型应用的建设思路与应用开发技术进行研究。

1" AI大模型概述

1.1" 概念

AI大模型是指使用深度学习技术,通常采用大规模神经网络架构(如Transformer架构),包含大量参数和海量数据进行训练的一类人工智能系统。狭义的AI大模型主要指大语言模型(Large Language Model,简称LLM),用于处理和生成自然语言文本。广义的AI大模型属于通用大模型(General Large Models,GLMs),不仅涵盖自然语言处理,还包括图像处理、音频处理等多种数据类型处理,其为实现更高级的理解、交互和生成任务提供了可能,也促进了通用人工智能的发展[1-2]。

1.2" 特点

AI大模型具有以下几个显著特点。

1)大规模数据训练:通常采用庞大的数据集进行训练,包含了丰富的文本、图像等信息。

2)深度学习架构:采用深度神经网络架构,具有庞大参数数量和复杂的网络结构(从数亿到数千亿以上)。

3)自监督学习:通常采用自监督学习方法,通过预测数据中的缺失部分来学习数据的内在结构和规律。

4)强大内容生成:训练过程中充分利用大量数据,能够生成高质量的文本等内容,并有丰富的语义理解能力。

5)多模态处理:不仅可以处理文本,还能处理图像、音频等多模态数据,实现跨模态能力。

6)通用性和泛化性: 不同于传统针对单一任务训练的模型,AI大模型展现出更强的通用性和泛化性,能够通过少量的示例或指令适应新任务,并在多样化的领域和场景中发挥作用。

上述特点让AI大模型在教育、金融、医疗、交通和政务等很多领域展现出巨大的应用潜力。

1.3" 发展历程

AI大模型的发展历程可以概括为从早期的深度学习技术诞生到现代的大型预训练模型,再到当前GPT-4等超大规模模型及多模态大模型的发展。

1)早期阶段:自20世纪50年代约翰·麦卡锡提出“人工智能”概念以来,人工智能逐渐转向了机器学习,2006年,杰弗里·辛顿提出了深度学习的概念。

2)沉淀发展阶段:在深度学习的基础上,预训练模型开始崭露头角。2017年Google研究团队提出了基于自注意力机制的深度神经网络Transformer架构,解决了处理长序列数据的难题,显著提升了模型的训练效率。基于Transformer的预训练模型如BERT、GPT等进一步推动了自然语言处理的能力。

3)爆发阶段: OpenAI发布ChatGPT(基于GPT-3.5)和GPT-4标志着AI大模型进入了超大规模时代。这一时期,多模态大模型技术也迅速发展。2024年中GPT-4o、Claude 3 Opus、Gemini 1.5 Pro等具备多模态处理能力的大模型纷纷亮相,展示了巨大潜力。

需要指出,AI大模型技术目前正处于飞速发展阶段,全球各大企业和研究机构相继推出了各自的AI大模型。国外主流的AI大模型包括OpenAI的GPT系列、Anthropic的Claude、Google的Gemini、Meta的Llama系列等。国内,百度的文心一言、字节跳动的豆包、华为的盘古、腾讯的混元、阿里的通义千问、讯飞星火和智谱AI等也纷纷成为行业中的佼佼者。国内大模型在中文场景下正展现出了优势。

2" AI大模型与数字政务系统

2.1" 数字政务系统发展

数字政务系统是指政务领域的各类信息系统,不仅涵盖面向公众的服务平台,还包含内部办公系统和各类业务系统。

政务数字化的构想源于20世纪90年代的电子政务(e-Government)理念。我国的政务数字化演进历程初期电子政务阶段开始起步、经过多年发展,正从“互联网+政务”阶段,逐步迈入现今的数字政府阶段,并在飞速发展中。

近年来,一方面随着《“十四五”推进国家政务信息化规划》和《数字中国建设整体布局规划》等一系列政策的出台,明确了数字政务及数字政府建设的路线图和目标。另一方面,随着云计算、大数据、人工智能等技术的广泛应用,推动了数字政务系统建设向更高效率、更加智能的方向转变。数字政府建设是我国推动国家治理体系和治理能力现代化的重要抓手,用数字化思维推进管理流程再造、业务协同,完善数字基础支撑体系,加速数据的融合、利用,提升数字政务系统的“智能化”水平对于建设高质量的数字政府是非常重要和有意义的。AI大模型技术的潜力不仅能提升政务服务的质量和效率,还能推动治理体系和治理能力的现代化发展[3-4]。

2.2" 数字政务领域应用场景分析

AI大模型在内容生成、智能问答、数据分析等方面具有广泛的潜力。通过结合政务领域的知识和数据,可以形成垂直领域的政务大模型,能够在政务服务、城市治理、政府协同办公等多方面发挥作用。

知识库检索:可以帮助构建内部知识库,帮助工作人员高效检索所需信息。

公文写作辅助:帮助自动生成格式规范、内容准确的公文,提高写作效率。

信息提取与解读:能够从复杂的文件中提取关键信息,便于工作人员快速了解文件内容,也能帮助为公众提供政策的智能解读。

智能客服:提供更加自然和精准的语言交互体验,实现对公众提问的自动回答能力,提升政务服务效率。

辅助办理服务:通过掌握政务服务知识和相关数据,通过意图识别,为工作人员和公众提供办理服务。

城市治理辅助:能够帮助快速响应民意诉求,智能分类问题,并高效处理事件工单,提升城市治理的智能化水平。

数据挖掘与辅助决策:通过对政务数据的深度挖掘,依托大模型逻辑推理能力为政府决策提供有力支持。

此外,通过AI大模型技术,可以对已有各类信息系统中的一些处理流程进行改造来提高自动化、智能化水平,减少人工干预,有助于提高工作效率和准确性。

3" AI大模型应用建设分析

当前,国内政务大模型领域的发展正在逐步推进,华为、百度、科大讯飞等众多企业已经开始积极布局和提出应用方案,各地也在加快推进政务大模型的落地应用,例如北京、上海、深圳等地通过发布场景清单或分步拓展应用场景的模式开展示范试点[5]。

AI大模型应用的核心在于“大模型+应用”,即通过底层大模型提供智能支持,结合上层应用来解决具体业务场景需求。针对政务领域,我们可以采用两种思路建设AI大模型应用:一是基于成熟政务大模型产品或解决方案,进行上层应用开发;二是建立个性化的开发流程,根据业务需求灵活构建“合适”的政务大模型,并基于此开展应用开发。这两种方法在灵活性、成本等方面存在差异,需要根据具体需求进行选择。考虑到通用性和灵活性,以及目前市场上还缺乏能够直接满足各类政务场景的成熟大模型产品,本文重点针对第二种思路进行研究。

3.1" 应用建设流程

建设个性化的AI大模型应用流程可以概况为:选择基础模型,进行数据准备,建立领域向量知识库与模型微调,部署模型,应用开发等步骤,如图1所示。

1)选择基础模型:根据需求选择合适的基础模型(底座大模型)。基础模型是已经预训练好的开源通用大模型(如Qwen等)或者是在政务领域已经训练过的大模型。选择基础模型需要考虑模型性能、训练数据情况以及安全、成本等因素。

2)数据准备:是构建政务大模型的关键步骤之一,包括数据采集、清洗和预处理等操作,目的是通过领域数据让模型能适应相关领域。

政务领域的数据来源广泛,包括政府部门、公共机构等各类数据,例如文件、报告、业务数据等。本阶段需要进行数据筛选、转换和标注,以更好地适应政务领域的特定任务。同时,要注意数据的准确性和完整性,以确保训练出的模型具有可靠性。

3)构建领域向量知识库、微调模型:在数据准备工作完成后可以构建领域向量知识库以及对模型进行微调。需要指出的是,构建领域向量知识库和微调模型是两种不同的方法,但共同目标都是增强AI大模型对政务领域数据的学习、理解能力。简单地说,构建领域向量知识库是将数据置于模型的“外部”,而微调模型则是将数据融入模型的“内部”。

领域向量知识库:将政务领域的知识转化为向量形式进行存储和管理,从而提升模型对这些知识的理解与利用能力。向量化技术简化了复杂数据的处理和存储,提高了数据处理的效率,并且是构建基于检索的增强型模型(RAG模型)的基础。

微调模型:使用政务领域的特定数据对基础模型进行微调(finetune),以使其更加适应政务领域的特殊任务需求,进而提升模型在该领域的实用性。例如,为了提高政府公文写作、报告生成方面的生成质量,可以使用政务文档进行微调,让模型学习政府文件的写作风格和专业术语。通过细致的微调,AI大模型能够在不牺牲通用性的前提下,显著提高在特定政务任务上的表现[6]。

微调过程考虑到难度、成本、效率等因素,通常建议采用参数高效微调(PERT)等技术,例如LoRA等[7-8]。微调完成后还需要对模型进行评估,可以通过测试数据集来计算模型的准确率、召回率、F1分数等指标。

4)模型部署:将微调后的模型部署到计算环境中。

5)应用开发:基于已部署的模型,使用各种开发工具和中间件来开发具体的AI应用,以满足具体业务场景的需求。

6)维护迭代:进行定期的维护和迭代。包括数据更新、模型优化、应用技术升级等。

3.2" 应用建设架构

从技术角度,可以通过分层和抽象来构建模块化、分层的AI大模型应用平台,其总体架构(图2)可以表示如下。

1)AI基础设施层:提供GPU硬件、网络、存储等基础设施支持,满足模型训练、推理和应用的使用。

2)模型层:包括底层大模型、存放经过微调的政务大模型的模型池、模型训练、评估和优化的相关工具。

3)服务开发层:提供应用开发的中间件和工具支持,包括各种Agent组件、RAG组件、向量数据库、开发工具链以及提供相关应用接口服务。

4)应用层:基于AI大模型能力开发的各类应用。

3.3" 应用开发技术分析

AI大模型的应用开发技术可以分为以下几类。

1)Prompt工程(Prompt Engineering):是一种直接使用大模型进行任务的方式,通过输入有效的提示词(Prompt)来引导大模型理解用户意图并生成回答或执行操作。这种方法的优点是简单易用,通过精确设计的提示词与大模型直接进行交互。但其缺点是可能无法单独处理复杂的任务场景。

2)Function Calling:是一种将大模型和外部世界及业务系统连接起来的方式。大模型本身存在一些“缺陷”(如数学计算、时效性等),可以通过Function Calling功能来完善。例如,接入互联网查询信息、调用外部业务系统的接口访问特定数据等功能,从而克服大模型知识和能力的局限性。Function Calling将大模型的输出用作触发特定外部系统或工具API调用的输入,让大模型可以和外部世界交互来实现更复杂的任务。

3)检索增强生成(Retrieval-Augmented Generation, RAG):是一种结合了检索(Retrieval)和生成(Generation)两个过程的技术架构,它结合了检索系统和大模型生成的能力。系统通过使用检索系统(比如向量数据库)从外部大量数据中(例如政务系统的知识库)检索信息,然后将检索到的信息融合到大模型中,通过大模型的能力来生成基于检索信息的详细回答,以产生信息量更丰富、更准确的结果输出。检索增强生成是一种解决大模型“幻觉、私有领域知识”不足的方案。

4)人工智能智能体(AI Agent):Agent是指一个自主运行的软件程序,能够感知其环境,并根据这些感知采取行动以实现特定的目标。在AI大模型应用开发中,人工智能智能体是一种能够感知环境并(针对各种任务)采取行动达成目标的智能体[9]。

简单来说,人工智能智能体结合了“大模型+环境观察+决策思考+执行任务+经验记忆”等多个要素,它将大模型视作一个智能代理,能够通过决策过程调用相关工具来执行任务。其核心理念在于将复杂的任务分解为若干步骤,并逐步优化结果,这种处理方式与人类解决问题的思维模式相类似。人工智能智能体的优势在于能够处理更为复杂的任务,并灵活调用多种功能,但同时,它要求使用者对大模型的功能有深入的理解,并且需要编写额外的代码来管理和协调模型与工具的调用。

需要指出,上述开发技术不是完全独立的,大多数应用需要考虑同时采用多种技术组合来满足具体、复杂的需求。例如在智能问答系统中,会结合Prompt工程、Function Calling和RAG等技术来为用户提供实时、准确和更专业的服务。

3.4" 应用业务类型分析

从业务协同角度可将AI应用的业务类型分为下面几类。

1)助手模式:AI大模型应用充当了“助手”或“副驾驶”角色,与用户协同工作,类似GitHub与OpenAI合作推出的编码助手Copilot应用。Copilot可以在程序员编写代码时提供建议、补全代码片段,自动生成整个函数或类,但不会完全自主编写整个程序,而是与人类程序员紧密合作以提高编程效率。在业务场景中,助手模式可以在用户需要时提供帮助信息,比如在政务服务网站中智能客服可以帮助公众回答和处理服务的问题等。

2)嵌入模式:大模型能力被封装成API或服务,嵌入到现有的业务系统中,实现AI能力与原有业务流程的集成。用户在使用业务系统时,可能并不知道后台流程正在使用AI大模型来处理工作。例如,在业务审批系统中嵌入AI大模型来优化对材料的检查和处理。

3)智能体模式:这是AI应用研究实施的热点之一。应用中构建一个或多个执行任务的人工智能智能体,可以根据任务目标和外部环境的信息自主决策,自动化完成一些标准化的流程任务或执行更复杂的任务。例如,业务系统中的一些工作流程可以构建人工智能智能体来自动化处理;在数据分析和监控、预警等场景中自动监控数据并在检测到异常时采取措施。

4" 风险挑战与对策分析

AI大模型应用建设可能面临诸多风险挑战。

AI大模型的不足:需要认识到AI大模型存在“能力不足”,一方面大模型存在“幻觉、时效性、私有领域知识缺乏”,在特定领域可能无法充分满足专业性和精准性的需求。另一方面政务领域应用系统不仅涉及大量领域知识还存在很多复杂的业务场景。在AI应用建设中,需考虑结合系统特点和需求来“嵌入”AI大模型,并通过RAG或微调等技术来提高其在特定任务上的效果,还可以结合传统知识图谱,为大模型提供丰富的领域知识,并采用多模型方式,将多个模型集成,以提高综合能力。

数据质量和安全性:数据质量和安全性对于AI大模型应用至关重要。一方面需要加强数据管理和质量控制,精心设计并执行数据清洗、预处理等步骤,建立数据治理和数据质量监控机制,以确保数据的准确性和完整性。一方面需要高度重视安全性保障,数字政务系统中会涉及大量敏感信息,如个人信息、经济数据等。需要实施严格的数据访问控制、数据脱敏和加密措施,加强网络安全防护,以保障数据的安全性并确保遵守相关数据保护法律法规。此外,还要注意大模型使用中存在的提示注入攻击防御、提示泄露等安全问题[10]。

模型部署和算力资源:AI大模型的训练和推理需要大量的计算资源,尤其高性能GPU算力需求巨大。政务领域建设AI应用需要高度重视数据安全与隐私保护,通常需要进行本地化私有部署或政务云,这增加了部署的复杂性。

因此对模型部署和算力资源方面需要仔细规划,避免系统面临环境问题。在模型部署方面,需要充分考虑软硬件环境兼容性、安全性和可扩展性;在算力资源方面需要根据需求进行合理评估所需的算力资源。

技术快速发展的挑战:AI大模型技术发展日新月异,随着大模型相关技术的快速发展和迭代,保持应用系统与大模型开发技术的同步更新是一个重要挑战。

一方面建设实施大模型应用,需要考虑构建模块化、分层的架构平台,通过分层在底层大模型和上层应用间构建“隔离层”,让应用通过统一的服务接口和相关中间件与底层大模型通信,减少对上层应用其他部分的影响。此外,AI大模型开发平台可以考虑与数字政务系统中已存在的中台或应用支撑平台相结合,以实现资源的高效利用、服务的快速开发和应用的稳定运行。

另一方面,为了满足需求和技术的变化,AI应用开发适合“小步快跑”,通过短周期、迭代式开发,快速响应并及时收集使用需求和反馈,不断优化和改进系统功能和实施效果。

模型可解释性和透明度:AI大模型的可解释性和透明度至关重要,这里可解释性指用户能明白模型的决策过程,透明度是指用户能了解模型的内部工作机制。由于大模型技术的复杂性,提升可解释性和透明度是一个持续改进的过程,可以通过一些方法来提升可解释性和透明度。

理解模型工作原理:教育用户了解大模型的局限和正确使用模型输出。

数据和训练过程透明化:适当公开数据集信息,例如数据来源、收集和预处理方式,以及模型训练的参数。

模型简化:使用模型蒸馏等简化模型结构的技术降低复杂度,或根据需求选择更简单的模型。

使用解释性工具:研究利用LIME和SHAP等工具来解释模型预测,帮助识别影响决策的关键输入特征。

建立评估和反馈机制:定期评估模型输出以确保其满足预期。

法规和合规性:2023年7月国家网信办联合各部门印发的《生成式人工智能服务管理暂行办法》对生成式人工智能技术的发展、治理等作出指导规范,旨在促进生成式人工智能健康发展和规范应用,提出了需从法律遵守、数据管理、服务规范、透明度和质量控制等多个方面入手,确保生成式人工智能技术的健康发展。

需要通过深入理解相关法规要求、建立合规性检查机制、加强数据安全管理等措施,来有效提升AI应用的合规性水平,保障其安全、稳定、高效地服务于政务工作。

5" 结论

综上,AI大模型技术为数字政务领域发展带来了具有巨大潜力,相信随着技术的不断演进,大模型技术的运用将更加广泛,有望实现更智能、更高效的数字政务系统,为推动数字政府建设和数字社会发展提供强有力的支持。

参考文献:

[1] 任福继,张彦如.通用大模型演进路线[J].科技导报,2024,42(12):44-50.

[2] 肖仰华.生成式语言模型与通用人工智能:内涵、路径与启示[J].人民论坛·学术前沿,2023(14):49-57.

[3] 王骏涛,徐斌.数字政务信息系统的技术架构方案和发展趋势研究[J].网络安全技术与应用,2023(8):100-101.

[4] 董超,王晓冬.生成式人工智能在数字政府建设中的探索、挑战及建议[J].数字经济,2023(11):36-39.

[5] 李帅峥,钱正,董正浩,等.政务大模型的技术应用路径及发展建议[J].信息通信技术与政策,2024,50(6):76-82.

[6] 武朝尉,乔旺龙,徐玮彤,等.利用私域大模型生成政府工作总结的探索与实践[J].数字经济,2024(5):55-59.

[7] 张钦彤,王昱超,王鹤羲,等.大语言模型微调技术的研究综述[J/OL].计算机工程与应用,1-22[2024-08-06].http://kns.cnki.net/kcms/detail/11.2127.tp.20240611.0941.002.html.

[8] 丁鑫,邹荣金,潘志庚.基于高效参数微调的生成式大模型领域适配技术[J].人工智能,2023(4):1-9.

[9] 王亚珅,葛悦涛,鞠卓亚,等.2023年深度学习技术主要发展动向分析[J].无人系统技术,2024,7(1):50-58.

[10] 赵月,何锦雯,朱申辰,等.大语言模型安全现状与挑战[J].计算机科学,2024,51(1):68-71.

猜你喜欢
数字政府人工智能
我校新增“人工智能”本科专业
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
深圳建设“数字政府” 为城市治理现代化赋能
数字时代视域下政府服务转型研究
学理论·下(2018年8期)2018-10-24 11:03:12
人工智能与就业
IT经理世界(2018年20期)2018-10-24 02:38:24
如何打造“数字政府”
小康(2018年24期)2018-08-28 02:35:30
数字政府视角下网上行政审批的特点、困境与突破策略
理论导刊(2018年12期)2018-02-14 09:43:54
贵州“数字政府”当家 “一网通办”解难题
数读人工智能
小康(2017年16期)2017-06-07 09:00:59
打造政府数据共享平台,加快“数字政府”建设