果麦AI事业部:出版业向人工智能挺进

2025-01-13 00:00:00金凡
出版人 2025年1期
关键词:编校事业部金字塔

投石问路,果麦AI事业部率先在出版行业大模型上取得突破。

作为业内最早进军AIGC(人工智能生成内容)领域的企业之一,果麦文化(以下简称“果麦”)AI(人工智能)事业部开发的大模型“金字塔”通过了上海市生成式人工智能服务备案,成为国内第一个出版公司开发且成功备案的AI大模型。果麦文化AI事业部开发的人工智能校对工具“AI校对王”和AI动漫智能创作平台“爱漫阁”也于2024年投入商业化使用,奏响了出版行业向AIGC挺进的号角。

果麦是一家有互联网基因的公司,其创始团队核心成员大部分和互联网行业有很深的渊源。自2022年AIGC应用大爆发以来,果麦文化在出版行业应用AI方面进行了一系列有益探索。

随着行业对AIGC认识的深化,从业者对基础大模型的需求也开始逐步被侧重提供解决方案的行业大模型取代。果麦AI事业部抓住这一机会,率先在出版行业大模型上投石问路。2024年12月2日,由果麦开发的核心大模型“金字塔”通过了网信办“生成式人工智能服务”备案(备案号:Shanghai-JinZiTa-202409230018)。截至目前,上海市完成备案的大模型仅60款,在AI校对领域通过备案的大模型,全国也仅有数款。

大模型“金字塔”是果麦在通用语言大模型开源框架的基础上,结合自研算法调整和自采语料进行了二次开发,打造出的一款深度学习的自然语言处理(NLP)模型产品,广泛应用于中文批改、文章润色、文案生成等人工智能文字辅助处理任务。

开发大模型的机构很多,果麦何以对自己的大模型如此自信?他们表示,“金字塔”拥有堪称“壁垒级”的训练数据。为了搭建这一大模型,果麦在自身近20年出版事业所积累的海量校对文稿数据与编校经验的基础上,通过与30余家知名出版机构的深度授权合作,采购了海量真实图书编校人员对图书文本所做的编校流程。迄今为止,“金字塔”已深度学习了超过百亿字的中文出版物“三审三校”的校对数据,涵盖了各主流内容领域,并且处于持续更新状态。这些数据均经过了专业的采集、清洗、标准化、规范化流程处理,在高精度的监督训练下,大模型深度理解并更好地掌握了出版物校对的理念、技术、标准、范式,为实现高精度、低误报、只校对、不乱改的“出版物质检级”人工智能校对提供了可能性。

在中文处理上,其架构特别优化了中文的语言特性。首先,模型对汉字和词组分别进行了嵌入标识,允许它在多义性高的中文环境中,更好地抓取上下文的细微差别。此外,模型还采用了多尺度的卷积层和自注意力层相结合的结构,使其在处理中文的复杂语法结构时表现尤为突出。

果麦推出的人工智能校对工具“Al校对王”,能在复杂多义的中文语境里更好地聚焦上下文的差异,理解有文化背景和历史典故的文本,解析长句,分析复句,在字、词、句的多层次上实现更精准的语义理解,对自然语言文本做出符合语言规范要求的修订建议,以专业文字校对人员和资深编辑的标准和方法进行“语义级”内容纠错。

与此同时,果麦还深度投资并直接参与研发、运营了AI动漫智能创作平台“爱漫阁”。作为国内AIGC领域早期通过网信办算法备案的AI平台之一,“爱漫阁”主要面向漫画师、动画师、插画师、设计师等专业用户及动漫爱好者,支持文生图、图生图、参考生图、AI模型训练等功能,重新定义漫画创作流程,帮助所有人释放创作超能力。

近期,“爱漫阁”已与上海电视台东方卫视正式达成深度合作伙伴关系。果麦基于“爱漫阁”策划、制作的系列图书也即将面市。

猜你喜欢
编校事业部金字塔
“金字塔”
环球时报(2022-09-19)2022-09-19 17:19:22
A Study of the Pit-Aided Construction of Egyptian Pyramids
天邦股份种猪事业部
猪业科学(2021年6期)2021-08-12 06:43:00
徐工道路机械事业部
中国公路(2020年16期)2020-10-14 06:32:56
海上有座“金字塔”
中国空间技术研究院通信卫星事业部
卫星应用(2019年4期)2019-05-22 03:08:14
把编校质量的弦绷得更紧
传媒评论(2018年10期)2019-01-17 01:33:34
Finite-time Synchronization of Memristor-based Neural Networks with Discontinuous Activations
神秘金字塔
童话世界(2017年11期)2017-05-17 05:28:25
编校手册
现代出版(2014年6期)2014-03-20 13:37:24