助力重庆数字经济发展!重庆首个自主研发的大语言模型发布

2023-08-25 11:31王淳
企业界 2023年14期
关键词:精调上海交通大学调用

王淳

7月13日,上海交通大学重庆人工智能研究院“兆言”大模型发布会在西部(重庆)科学城召开。活动现场发布了该研究院最新研发成果——“兆言”大模型产品(下称:“兆言”),这也是重庆首个自主研发的大语言模型。

据了解,兆言大模型是上海交通大学重庆人工智能研究院基于全球领先的AI大模型技术研发出的最新成果,其建立是通过积累海量数据,辅以独特的数据处理和AI训练技术,以达到精准、专业的文本输出,并且能够实现以自然语言选择、调用应用程序的能力,助力打造个性化的智能产品。

发布会上,上海交通大学重庆人工智能研究院院长、首席科学家金石介绍,和通用大模型相比,“兆言”大模型拥有“领域精调效率高、训练推理成本低、人机交互能力强”的特点。

通用大模型在行业落地面临许多困难。比如,未经行业精调的通用模型在行业应用中表现不佳、通用大模型需要的算力资源不易进行私有化部署、自然语言转API调用不稳定等。“兆言”大模型较好地解决这些问题。

“兆言”大模型由齐鹏博士领衔,沈国阳、潘杨分别负责技术和产品。该模型采用启发式数据过滤及增强、模型预训练和精调自适应比例混合、人工和自动评测相结合等方法对模型进行垂直领域精调,解决了精调中的数据质量差、模型原有能力遗忘、模型答案出现幻觉、模型训练效率低等行业难题,使得模型答案质量有很好的保障。

模型研发还把小型化部署作为重点,大幅降低模型训练和推理成本。在商业化所需特定任务上,模型回答质量不降低,而调用成本仅为小型化前的四百分之一,从而保障了以模型为基础的产品在市场上的竞争力。为解决在自然语言转应用程序接口(API)调用任务上模型发挥不稳定的问题,研发团队还建立了专有的自然语言调用语料和指令数据集,从而实现了大语言模型对其他系统的精准调用。

发布会上,上海交通大学重庆人工智能研究院还与华院计算技术(上海)股份有限公司、重庆赛迪工程咨询有限公司、重庆誉存科技有限公司、中国移动通信集团重庆有限公司、北京流金岁月传媒科技股份有限公司、重庆赛宝工业技术研究院有限公司进行了现场签约,将发挥各自优势,促进大模型技术在制造业、金融、农业、文旅、教育、医疗、司法等场景落地应用。

未来,上海交通大学重庆人工智能研究院将根据重庆主导产业布局需求,通过不断优化和升级,将“兆言”大模型产品应用到各个领域中,为推动重慶数字经济的发展和助力西部(重庆)科学城的建设做出贡献。

猜你喜欢
精调上海交通大学调用
上海交通大学
核电项目物项调用管理的应用研究
上海交通大学参加机器人比赛
LabWindows/CVI下基于ActiveX技术的Excel调用
轨检小车在高速铁路轨道检测及精调中的应用
高速铁路接触网精调关键技术浅析
基于系统调用的恶意软件检测技术研究
转炉自动化炼钢装置副枪设备的安装与精调分析
高速铁路轨道精调的探讨与研究
利用RFC技术实现SAP系统接口通信