关键词:《辞海》;辞海学;《辞海》网络版;辞书出版;辞书版权;数智化转型
《辞海》是中国最具权威性和影响力的大型综合性词典,初创于1936 年,由中华书局编纂出版,舒新城等主编。1957 年毛泽东采纳舒新城建议,决定启动《辞海》修订工作。1958 年成立中华书局辞海编辑所,专门负责《辞海》的修订工作。1965 年出版《辞海》(未定稿)两卷,是为第二版。1978 年中华书局辞海编辑所改为上海辞书出版社。[1]自1979 年《辞海》第三版起,形成了“十年一修”的制度。至今,《辞海》出版至第七版,并推出《辞海》网络版。
《辞海》是我国重大的文化工程,体现了我国的文化形象,代表了我国的文化软实力。[2]《辞海》的历次编纂修订,不仅反映了现代文化发展的最新成果,也见证了中国近现代历史的变迁。一代代《辞海》编纂者们通过对条目的增删、修订和更新,记录时代的发展、科技的进步、文化的传承,形成了“一丝不苟、字斟句酌、作风严谨”的“辞海精神”。
数智化时代,人类知识的生产、传播和创新都发生了改变,包括《辞海》在内的辞书出版面临诸多机遇和挑战,辞书的数字化转型已成为必然趋势。《辞海》在这一过程中也积极探索和实践。一方面,通过构建数字出版平台,实现辞书内容的数字化、网络化和交互化;另一方面,利用大数据、人工智能等技术手段,提升辞书的编纂效率和用户体验。
近年来,《出版与印刷》期刊始终关注《辞海》编纂和数字化发展方面的学术研究,自2017 年发表巢峰先生的《做出版工作需要“辞海精神”》[3] 以来,已经陆续发表了10多篇相关文章。在组稿过程中,得到上海辞书出版社、辞海编纂处的大力支持和专业指导,萌生了共同组织学术研讨活动的想法。经过前期讨论和准备工作,研讨会由《出版与印刷》编辑部、《辞书研究》编辑部联合承办,邀请上海市辞书学会等担任主办单位。研讨会还得到上海市社会科学界联合会的支持和指导,并列入“上海市社联第十八届(2024)学会学术活动月”项目。
一、研讨会概述
2024 年11 月15—17 日,由上海市社会科学界联合会指导,上海市辞书学会、上海辞书出版社、上海出版印刷高等专科学校共同主办,《出版与印刷》编辑部、《辞书研究》编辑部联合承办的“《辞海》编撰与数智化转型研讨会”在上海出版印刷高等专科学校成功召开。来自全国各地的约50 位专家学者、科研人员和《辞海》编纂人员汇聚一堂,共同探讨数智时代辞书出版高质量发展。
开幕式由上海出版印刷高等专科学校副校长杨爱玲主持。上海理工大学党委副书记、上海出版印刷高等专科学校党委书记朱坚民,上海世纪出版集团副总裁、上海辞书出版社社长秦志华分别致欢迎辞。上海世纪出版集团副总裁彭卫国作主旨发言。
专题报告环节由上海辞书出版社副总编辑张敏主持。北京师范大学数字出版研究院执行院长,教授、博士生导师万安伦发表题为《数智时代辞书出版高质量建设路径探索》的报告,中国传媒大学教授、博士生导师李频发表题为《辞海学及价值初探》的报告,腾讯云智慧传媒行业中心技术总监曾亮发表题为《基于大模型知识引擎,构筑专业出版新一代知识服务》的报告,中国社会科学院语言研究所词典研究中心研究员杜翔发表题为《科研引航 反映时代——以〈现代汉语词典〉编写修订为例》的报告,知识产权出版社编审刘睿发表题为《辞书数智化出版中的版权保护困境与对策》的报告,商务印书馆编审吕海春发表题为《对辞书编纂数智化的一点思考》的报告,西北师范大学历史文化学院教师陈来虎发表题为《知识社会史视域下1936 年版〈辞海〉的编纂出版》的报告,上海辞书出版社副总编辑童力军发表题为《〈辞海〉网络版的演进历程与未来设想》的报告。
主题发言环节由上海市辞书学会秘书长郎晶晶主持。与会专家就《辞海》出版与辞书研究的热点问题展开了深入的研讨与广泛的交流。《出版与印刷》编辑部执行主编靳琼作大会总结。
本次研讨会的召开关注新时代辞书编纂和出版面临的新情况和新问题,通过开启《辞海》研究,助力《辞海》数智化转型,传承并发扬光大“辞海精神”,推动我国辞书出版高质量发展。
二、《辞海》 研究和“辞海学”
1936 年,《辞海》第一版诞生于上海。2016 年12 月29 日,习近平总书记致信祝贺《大辞海》出版暨《辞海》第一版面世80 周年,指出:“《辞海》和《大辞海》是大型综合性词典,全面反映了人类文明优秀成果,系统展现了中华文明丰硕成就,为丰富人民精神世界、增强人民精神力量作出了积极贡献。”[4] 深入学习、深刻领会习近平总书记系列重要讲话精神,总结《辞海》《大辞海》编纂出版经验,开展《辞海》研究,开启“辞海学”求索之道,是重要的时代议题。
围绕《辞海》研究和“辞海学”的主题,研讨会主要从以下三个方面展开讨论。
1. 《辞海》研究与“辞海学”的价值旨归
关于《辞海》及其重要价值,可从“四个唯一”中窥见一斑:我国唯一的集字典、语文词典和百科词典主要功能于一体的大型综合性辞典,唯一的一部确立“十年一修订”制度的辞典,唯一的一部受到历任党和国家领导人亲自关心的图书,唯一的一部销售突破500 万套的大型辞典。因而,《辞海》的编纂修订,与国家、民族的命运紧密相连。彭卫国回顾了《辞海》的编纂修订历程,认为自《辞海》出版以来,在修订工作的持续推进与落实中,《辞海》从结构到内容、从制作到传播等各方面日臻完备,逐步形成了可供辞书出版作为标准的模式。在这一过程中,围绕《辞海》开展的研究不断深入。巢峰、杨祖希、徐庆凯等辞书工作者均对此做了积极的探索,使辞书编纂的相关理论和方法得以丰富和发展。
《辞海》研究的最终成果应该是形成“辞海学”,而“辞海学”的发展又将反哺《辞海》的质量提升乃至产品转型,为其提供强大的引领力、凝聚力与感召力。巢峰先生在为《辞海论》(徐庆凯、秦振庭著)所作序中首次提出建立和发展“辞海学”的必要性:“有了‘辞海学’,《辞海》的编纂工作才能在科学的、全面的、系统的、与时俱进的学问体系指导下实事求是地进行,进而取得优质高效的成果。”李频强调,数智时代重提“辞海学”,一方面是对巢峰等开拓《辞海》研究的前辈的致敬,另一方面是深化《辞海》研究的核心主张,即以《辞海》为起点,阐释《辞海》与中国现代化的知识关系,研究《辞海》以传承并发扬光大“辞海精神”的理论主张。
2. 开展《辞海》研究的着力点
《辞海》研究并非以《辞海》为孤立的研究对象,而是“以《辞海》为起点”、观照“《辞海》的编纂、出版、阅读所反映的时代”。李频强调,要深入挖掘“辞海学”在数智时代的编辑学、出版学意义和上海出版史意义。陈来虎通过梳理《辞海》研究概况,指出目前相关研究主要涵盖两个方面:一是以《辞海》中的某条词目为对象,从内容或意义上进行质疑、辨析、求证,此类研究大多属于语言学范畴;二是作为《辞海》生命周期中的参与者(编纂者、出版者、阅读者等),提出所见所闻、所思所想,此类研究提供了大量宝贵资料。总体来看,现有研究过于依赖前人的探索路径,存在重复化、匮乏化等问题。
因此,开展《辞海》研究应注重采用新视角、新理论、新方法、新材料,以形成新见解、新发现和新知识。彭卫国从理论联系实际、研究助力发展的原则出发,提出关于《辞海》研究的六个着力点。①《辞海》与社会发展的关系。《辞海》的内容反映社会发展、文明进步,《辞海》的修订编纂与社会发展进步息息相关,《辞海》的修订编纂既是出版活动,也是社会活动。②《辞海》的内容组织与编纂方式。在知识生产、知识组织、知识服务的视域下,可对《辞海》内容组织、编纂方式进行深入研究以获得新的启示。③《辞海》修订编纂的组织工作。《辞海》修订编纂的工作特点可以概括为“三分编写,七分组织”,其中,如何组织是大型出版工程共同面临的问题。④《辞海》修订编纂的智能化。智能化是在技术演进下的新发展趋势,但绝不仅仅是技术问题。关于海量数据与精准知识之间的边界等问题,还需要进一步的思考。⑤《辞海》编纂修订史。“以史为镜,可以知兴替”。历史的回顾、经验的总结,辞海精神的提炼与弘扬,都可以为《辞海》工作提供精神养料。⑥辞书编辑养成。人才是出版事业的核心要素,在数智化时代,辞书编辑的基本素养、基本能力应适应技术的变革和时代的发展。
3. 推动《辞海》研究进而形成“辞海学”的实践路径
《辞海》研究有待进一步深化,“辞海学”理论体系的建立亦非一日之功,“不积跬步,无以至千里”。因此,从基础做起,注重针对性和实效性,可视为《辞海》研究的基本原则。李频结合辞书的修订体制,深入阐释《辞海》的中国当代知识演化史意义;陈来虎从历史学角度解读《辞海》的新知识生产模式及其物化与传播,进而反映时代、社会、思想等的变迁,均体现了这一思路。
基于此,彭卫国提出《辞海》研究的三条可行路径。①辞书编辑的实践性研究与科研人员的学理性研究相结合。全国有众多的辞书出版机构,也有众多的出版、语言、文字类的科研院所,两支队伍围绕一个或者一类问题联合进行研究,或可带来事半功倍的效果。②自发研究与集中研究相结合。鼓励专家学者围绕《辞海》相关问题进行自发研究,同时,辞海编纂处可以组织专题研究,集中两路大军,集体攻关。③搜集整理相关资料,组织撰写《辞海史》。可以逐步开展已有档案资料的收集和整理、《辞海》老编纂人的口述材料收集、《辞海》研究的相关文献搜集等基础工作。适时出版《〈辞海〉档案》,推动相关研究的持续深入开展。在此基础上撰写、出版《辞海史》。
在建成文化强国、建设习近平文化思想最佳实践地的大背景下,开展《辞海》研究,推动“辞海学”发展,以研究成果助力《辞海》的高质量修订出版,打造传世精品,是开展理论研究的最终目的。
三、辞书出版数智化及面临的挑战
辞书出版数智化是一个复杂而系统的过程,这种转型不仅涉及技术层面的更新,还包括内容生产、传播方式、用户互动、多元主体协同等多方面的变革。面对新时代的挑战和机遇,辞书出版单位需要不断创新和探索,以适应互联网时代市场需求的变化和社会知识生产发展趋势的要求。
1. 《辞海》网络版建设
《辞海》网络版于2020 年12 月试运行,2021 年5 月27 日正式上线;2022 年9 月,《辞海》网络版2.0 版发布,初步实现了《辞海》内容编纂、管理、发布、运营等全流程的数字化和网络化;2024 年3 月,《辞海》网络版3.0 版发布,从内容、服务、技术三大维度进行迭代升级。目前,《辞海》网络版包括网页版、App 版、微信版,覆盖PC、移动设备等各类终端设备,满足用户随时随地、随手可查的需求,使《辞海》从一部综合性工具书,升级为一个综合性知识检索平台。[5] 据童力军介绍,目前的《辞海》网络版以《辞海》(第七版)纸质版的内容为基础,新增了条目的注音、笔顺、源流、书法,添加关联条目、构建知识导图,融合多媒体资源、呈现立体百科,建立知识专题、提升学习质效,赋能线上知识检索、扩大内容传播力。未来,《辞海》网络版将建成具有中国特色、达到世界一流水平的高标准知识体系和知识服务体系,成为我国标志性的文化基础设施。
2. 辞书出版数智化的现状特征
《中国辞书市场三十年》[6] 将中国辞书市场近三十年的发展历程分为三个阶段:发展期(1992—2002 年)、成熟期(2003—2015 年)和转型期( 2016—2022 年) 。据该文统计,发展期纸质辞书出版总量达7764 种,年均706 种;成熟期纸质辞书出版总量达 9519 种,年均 732 种。转型期纸质辞书出版总量为3536 种,年均505 种,出版规模明显缩减。近年来,随着出版深度融合发展,辞书出版也走向了数字化和融媒体化。《新华字典》《现代汉语词典》《辞海》《中国大百科全书》等品牌辞书纷纷推出网络版,与传统的纸质辞书相比,读者更青睐App 版、微信小程序版等网络版辞书。
吕海春认为,用户使用辞书的需求发生了变化。一是查阅方式的转变,因为智能手机的广泛应用,网络版辞书成为用户查词的首选;二是查询需求的变化,用户对内容实时更新的需求强烈,查得率优先于查准率;三是免费使用的习惯,用户更倾向于使用免费的网络资源,而不是购买纸质辞书或付费的数字辞书。因此,辞书出版单位应利用先进的技术手段,实现对辞书内容的快速更新和智能化处理,在提高辞书质量的同时还要提高内容更新和传播的效率。而辞书出版数智化的核心在于从传统的以编者为中心转变为以用户为中心,在辞书编纂过程中需要更加关注用户需求,优化辞书内容和服务,不断改善用户体验。
万安伦认为,数智时代的辞书出版具有集成性、研创性、交互性和协同性等显著特征。[7]97-98①集成性。数智时代辞书出版可集成海量资源,支持多模态呈现,提供定制化检索,打造一站式检索平台,提高知识获取效率。②研创性。一方面,辞书作为一项知识产品,是由众多学科专业人才深度参与、共同研发的学术成果,数智时代的辞书出版,还需要计算机科学、信息科学等跨学科专业人才的深度参与;另一方面,数智时代的辞书出版通过对知识内容的再组织和再利用,为语言学、历史学、文化学等多学科领域提供新的研究思路,可以作为学术研究工具发挥重要作用。③交互性。数智时代辞书通过为用户提供个性化检索服务,支持多场景应用,鼓励用户参与编纂修订,优化界面设计等,满足用户多样化需求,优化辞书使用体验。④协同性。数智时代的辞书出版主体呈现多元化,由出版单位、科技公司以及科研团队等共同参与、协同开发,用户在使用辞书时提供的反馈和建议也推动辞书不断完善。
3. 面临的挑战
新时代,新质生产力的发展为辞书出版带来了深刻变革。大数据、人工智能、云计算等新兴技术的广泛应用推动了出版业的创新,也改变了传统的辞书出版模式。数智时代新形态辞书在给用户带来便利的同时,也面临着一系列挑战。
童力军针对《辞海》网络版提出了三个亟待破解的问题:①入库条目数量不足,用户群体单一;②知识呈现方式相对简单,更新速度滞后;③学科框架和知识结构不够完善。
吕海春从产业层面梳理了辞书数智化的痛点:①目前辞书出版的运营盈利模式制约着辞书数智化发展;②辞书出版行业缺乏共建共享的数据底座;③辞书出版单位在数智技术应用方面高度依赖外部协同;④我国辞书出版产业的商业模式还不明晰,数智化缺乏成熟的参照体系。
万安伦强调数智时代推进辞书出版高质量建设的意义重大,“中国辞书的编纂出版和不断发展,见证了汉语言文字的源远流长、博大精深,更是中华文化生生不息、历久弥新的明证”。数智时代辞书高质量发展面临的主要问题包括:①辞书内容质量参差不齐,辞书出版相关人员的数字素养有待提高;②盗版侵权现象泛滥,应通过技术和法律手段强化版权保护;③固有盈利模式亟需转型,合理定价策略尚待探索;④辞书出版存在同质化现象,品牌建设与国际传播稍显不足。
四、数智时代辞书版权保护
随着辞书数智化出版的持续推进,新技术的应用在带来工作方法的改变、传播渠道的调整和营利模式的创新之时,也为版权保护带来新的难题,加之数字技术支撑下的辞书出版智能化往往面临着人力、物力、财力方面的巨大投入,这意味着一旦被侵权,损失也将不可估量。因此,辞书版权保护成为当下必须直面的问题。
围绕辞书版权保护的主题,研讨会主要从以下两个方面展开讨论。
1. 数智化时代下辞书版权保护面临的挑战
刘睿认为传统的辞书版权保护已形成一套基本思路,涉及是否构成著作权法意义上的作品、构成何种类型的作品、著作权属于谁、权利如何保护等常规问题。在辞书数智化出版的情境下,基于以往的基本思路,版权保护主要面临四大困境。
第一,作品的属性。辞书的内容通常是公有领域的已有作品、不受著作权保护的客观信息、作者原创信息等多种客体的集合,[8]而在互联网环境中,这类集合作品通常又呈现为单个词条等分割后的单个信息,对其原创性的判断造成困扰。
第二,版权归属。辞书出版往往参编者众,角色分工复杂,具体又涉及合作作品、汇编作品、委托作品、职务作品、法人作品等不同情况,权属纠纷是其维权时的常见问题。
第三,网络侵权证据搜集。在以信息源头多、开放程度高、传播速度快、覆盖区域广为特征的互联网时代,侵权成本低、维权成本高是网络侵权行为频发的重要原因,权利人调查取证不易。
第四,纠纷解决方式。维权成本高、耗时长、花钱多是权利人普遍面临的难点。就维权风险大小和胜诉后投入产出比大小而言,辞书网络版权维权性价比并不高。
2. 数智化时代辞书版权保护的对策
正视数智化时代辞书版权保护面临的挑战,刘睿总结自己从事知识产权服务的心得体会,提出四点解困之道。
第一,正确理解我国著作权法关于作品属性的规定。突出作品的“独创性”,即作品必须是由作者独立创作完成的,且具有一定的创造性。这种独创性是著作权法保护作品的重要前提,也是判断作品是否能够受到著作权法保护的关键因素。
第二,依法定或依约定明确大型工具书的著作权归属。针对合作作品、汇编作品、委托作品、职务作品、法人作品乃至新生的人工智能生成物等,可通过对以往的权利主体结构的梳理,设计合理的权利架构,明确版权归属。
第三,在专业人士指导下运用成熟技术抓取并固化侵权证据。可采用基于区块链、数字认证技术构建的电子证据存证服务,通过“法律解决方案+技术解决方案”,提高电子证据认定质效,提升维权性价比。
第四,在法律规定框架内寻求纠纷的多元解决。具体包括协商、调解、仲裁、诉讼等方式。归根结底,应注重证据扎实,方法得当,以及维权成本与获益评估恰当。
出版单位要高度重视版权保护之于稳健经营的保驾护航作用,有效评估互联网时代大型工具书版权保护的风险,多措并举预防网络版权侵权,从法律和技术等多维度着手,选择恰当时机采取合法维权手段,保护并运营好有效数字资产,以高质量的大型工具书的出版与传播助推出版单位的高质量发展。
五、数智时代辞书出版高质量建设
党的二十大报告指出:“高质量发展是全面建设社会主义现代化国家的首要任务。”万安伦深入阐释了辞书作为知识的载体,具有书写民族记忆、形成共同认知体验、增强民族凝聚力、构筑精神家园的作用。与会专家一致认为,数智时代推进辞书出版高质量建设的意义重大,并以不同的视角展开讨论。
1. 实践路径
杜翔以《现代汉语词典》为例,着重阐述了以科研引航是高质量辞书的根本保证。吕海春提出应加强辞书品牌建设,加强原创辞书词目库、资源库的建设,向文化和教育两翼发展的建设策略。万安伦特别强调,新时代在习近平文化思想的指引下,在新质生产力推动下,要以“两个结合”推进辞书出版高质量建设,从四个方面系统阐述了数智时代辞书出版高质量建设的实践进路:①建立辞书质量控制体系;②加强版权技术防护和监管;③设计科学合理的新形态辞书商业模式;④ 提高中国辞书知名度、信誉度和美誉度。[7]100-101
2. 《辞海》网络版提升计划
《辞海》网络版将以高质量内容生产为中心,以领先技术为支撑,以用户需求为导向,开展与互联网公司和科研机构的深度合作,优势互补、资源共享,持续探索数字时代知识生产、查检、阅读、探究等的新形态、新路径。童力军介绍了至2035 年《辞海》网络版提升计划。提升计划分为两个阶段:第一阶段,从现在至2030 年。《辞海》网络版基本建成,有效对接知识服务重要应用场景和软硬件,形成有较高市场覆盖率和美誉度的《辞海》知识体系和知识服务体系。第二阶段,从2031 年至2035 年。《辞海》网络版将建成具有中国特色、达到世界一流水平的高标准知识体系和知识服务体系,能够全面对接、支持各类数字化知识应用和服务,实现通用知识在线查检“一站式”解决,形成可持续迭代升级的“辞海”数字化发展生态系统,成为我国标志性的文化基础设施。
探索人工智能等技术的应用是《辞海》网络版提升计划的工作重点之一。在《辞海》网络版的建设过程中,将结合生成式人工智能、“对话式”大型语言模型等技术,持续提升网络版的生产和服务能力。曾亮从技术视角介绍了目前大模型在出版业的应用场景,以及提高模型输出准确性的三大技术:一是通过使用少量样本提示(few-shot prompting)的方法,提升模型输出的准确性;二是利用检索增强生成(retrieval-augmented generation,英文缩写RAG)技术构建专业知识库;三是通过微调(fine-tuning)技术,对模型进行精细调整。提出了从模型精调到知识库增强的解决方案,建议出版单位充分利用数据价值和可信内容供应优势,开发专属智能体,提供RAG 知识服务,帮助客户快速创建基于大模型的企业级知识服务应用。
六、结语
本次研讨会围绕《辞海》编纂修订与数智化转型,以及我国辞书出版高质量发展进行了深入探讨,提出了开展《辞海》研究以建立“辞海学”的核心主张,并针对辞书出版数智化的现状和存在的问题提出了数智时代辞书出版高质量建设的实践路径,为我国辞书出版以及相关研究提供了一定的理论引领和实践指导。未来,《出版与印刷》将持续关注《辞海》和辞书出版方面的研究,搭建学界与业界沟通的桥梁,为相关理论研究和实践探索提供交流平台,推动我国辞书出版事业不断向前发展,为建设文化强国、出版强国贡献力量。