徐 蔚
(作者单位:江西教育出版社)
21世纪,互联网的时代已经到来,人们的阅读习惯和兴趣发生了很大变化。《2021—2022年中国数字出版产业年度报告》指出,2021年,传统书报刊数字化收入增幅持续上升,电子图书、数字报纸等数字化产品的总收入相较于2020年,增幅为7.59%,高于2020年5.56%的增长幅度。这种阅读方式的改变自然导致大众查阅习惯和方式的改变,许多人不再通过翻阅纸质词典的方式来解决遇到的问题,而是通过便捷的网络检索来查阅资料。2021年以来,出版业融合发展进一步全面深入推进。中国出版政府奖的音像制品、电子出版物和网络出版物类奖中,屡见数字化辞书的身影,辞书融合创新呈现喜人的新格局。辞书具有较高的文化价值和文化地位,又因为辞书本身的特点及其专业性,辞书的数字化转型与传统图书的数字化转型有着很大的区别。面对汹涌澎湃的数字化时代、大数据环境,辞书编纂数字化正是当务之急,多家出版社也正在尝试辞书的数字化转型。
正如《牛津英语词典》的主编所说,电子辞书是未来的辞书,它也将是未来大多数人查阅的辞书形态。随着媒介融合的深入和新媒体多样化的发展,出版业从创作主体、出版机构、呈现形式、发行渠道等方面也开始了媒体化的尝试。辞书出版的数字化、网络化呈现百舸争流,一派繁盛的景象。如何将传统和现代融合,在数字化转型中驾驭好新技术,成为辞书出版者需要解决的课题。
21世纪初,网络版辞书逐渐兴起,人们通过电脑或移动终端实现在线查阅功能。彼时,国内用户使用较多的在线工具书多为技术公司免费提供,例如:百科知识类的维基百科、百度百科;英语类的金山词霸、有道词典;汉语类的汉典、中华在线词典、在线新华字典,等等。这些网络工具书,有的和传统辞书出版社合作取得授权,也有许多是由技术公司甚至个人开发的产品。这些产品存在着诸多问题,例如:百度百科、维基百科等网络版辞书具有开放式的互动属性,在遵守一些简单规则的情况下,任何用户都可对其条目进行创建和更改,因为由网民直接参与编写,内容质量良莠不齐,甚至存在一些错误,给读者带来错误的引导;再如,有的互联网公司甚至个人网站有意无意地侵权盗版。开发新产品时,相当一部分内容直接抄已经出版的纸质辞书,对其进行增删、混编,甚至改头换面,导致内容支离破碎、漏洞百出,这些未经辞书出版社授权的盗版辞书手机应用程序(Application, App)凭借免费下载和使用来吸引用户,靠弹窗广告来博取点击率和广告费,并获得了可观的用户下载量[1]。这类数字化辞书无疑侵害了出版社和著作者的利益。
近些年来,一些传统辞书出版机构不断地投入相当大的人力和物力,相继推出各种“重量级”产品。传统辞书出版社出版的数字辞书以权威底本为依据,自带光环。传统工具书词条规范、权威,具有公信力,收词具有系统性、科学性[2]。用户出于对传统辞书出版社品牌的信任,更加偏向于选择传统辞书出版社开发的数字辞书。
例如:商务印书馆推出的百种精品工具书数据库,以及牛津高阶英汉双解词典、古代汉语词典、现代汉语词典、新华字典、成语大词典、涵芬等App;上海辞书出版社的辞海数据库及其App,以及汉语大词典、现代汉语通用规范汉字典等App;中国大百科全书出版社的中国大百科全书数据库;外语教育与研究出版社的各类外研双语App、双语百科词汇类App等。除了以上有分量的数字产品,其他出版社也相继出版了大量的数字辞书。这些具有更高门槛的传统出版单位成为出品质量的保证[3]。
电脑网络版辞书是相对较早出现的辞书形式,中国知网(CNKI)的中国工具书网络出版总库于2006年立项,是较早的网络百科知识库。该库于2022年11月进行了全新升级,并与上海辞书出版社、商务印书馆、中华书局等500余家出版社长期合作,收录了1.3万余部工具书,约2 000万词条,并含有“《汉语大词典》&《康熙字典》(知网版)”、商务印书馆·精品工具书数据库、CNKI中小学工具书库、建筑工程造价预算与规范数据库等独立子产品。升级后的CNKI工具书总库,突破了传统工具书的使用方式,增加了资源特色类型导航、行业导航,使资源多维度精准定位;使用知识图谱的方式扩展词条的语言知识、相关词知识,并使内容结构化呈现;增加栏目、附录、关键词检索等功能,使资源检索更加多元化;增加字词翻译、成语接龙、格言谚语等特色功能,提供免费增值服务。
词典笔,就是形态像笔的便携式词典,其内容涵盖常用工具书,集查询、听读、纠读、翻译、练学等功能于一体,一扫、一划就能进行查询。词典笔具有双语学习功能,以英语学习为主,依据使用对象分为学生版和专业版,以满足更多场景的需求。学生版以辅助学生学习为主,依据不同年龄段学生的不同需求,设置不同的型号,提供不同的功能,具有不同的价位。专业版依据场景不同,增加不同语种、引入更多专业词典,适应高阶学习者及商务人士使用。
词典笔的配置由低到高,以适应不同的需求。硬件方面来说,存储空间由小到大不同,其可视化屏幕尺寸也由小到大不同;软件方面来说,可查译语种不一,词汇量也不等;其他快查、自然拼读、写作语法纠错等不同的功能,也依据不同的型号进行设置。其中最主要的区别是其内含词典的区别,基础词典笔通常包含现代汉语、古汉语等常用语文类词典,以满足翻译及查询释义等基本需求。依据产品消费对象及其使用需求的不同,内含词典不断扩容,增加了更多专业化词典。词典笔的价位也随配置的高低而变化。
这是科技公司与传统出版社的战略合作,将传统出版社的优质数字化词典产品收录高科技产品之中。科技公司有着研发和创新的能力,但在词典这一专业领域,缺乏优质内容。对于传统出版社而言,数字化是大势所趋,需要迎难而上,而如何将优质的内容以更便捷的方式融入学生的学习中,词典笔就很好地解决了这一问题。这就是一站式解决用户对辞书的个性化需求,或者说,根据不同用户对象,提供基于辞书的知识服务解决方案[4]。科技与内容的结合,为更多的使用者带来了便捷。
“一部手机走天下”,生活中的方方面面已离不开手机。辞书数字化最早以单一纸书辞书直接转化为手机App的模式为主,上文已有列举,不再赘述。而涵盖多部辞书、阐释多项释义,涵盖多种功能的综合类App,渐渐成为数字化辞书的发展趋势。以商务印书馆的涵芬App为例,涵芬集商务印书馆出版的20余部权威辞书于一体,涵盖字典、词典、语典等,为用户提供智能快捷的查词体验。该App除具备与工具书深度融合的字典、词典智能查询功能外,还融合了多种助学功能。
聚典数据开放平台是由上海辞书出版社研发运营的工具书数据开放平台,该平台收录了100多种工具书,词条数超400万条。但聚典平台并不是一个独立的查词应用,而是服务于其他阅读、资讯、学习应用的平台,用户需要在第三方应用中体验。用户只需在这些应用的阅读界面,选取查检内容,发起调用请求,查询结果便能够即刻呈现在用户界面,方便快捷。从商业模式上看,聚典打破了以往数字化辞书的形态,以“B2B+B2C”(Business to Business的缩写和Business to Customer的缩写)模式呈现。使用该平台时,C端用户无须付费,B端客户付费得到增值服务。也就是说,聚典模式在商务流上是B2B模式(指企业与企业之间通过专用网络或互联网,进行数据信息的交换、传递,开展交易活动的商业模式),而其在数据流上,采用的是B2C模式(指直接面向消费者销售产品和服务商业的零售模式)。该模式很好地解决了读者在数字阅读过程中的痛点,内容数据保留在出版机构自有平台,版权安全有保障;下游企业以软件开发工具包(Software Development Kit, SDK)方式调用平台数据,极大减轻企业自身的开发工作,减少资源浪费;用户能高效便捷查检权威的知识内容,阅读体验增强。此外,聚典平台让专业的人更加专注于其擅长的事:出版机构能专注于优质工具书的内容生产和数据维护,互联网企业能专注于产品运营和用户维护,同时也很好地平衡了各方利益。聚典是一个真正以互联网思维开发的数字出版产品,为出版行业提供了一个创新范本,为工具书出版提供了一个切实可行的数字化转型整体解决方案,亦为出版社在数字化转型过程中面临的技术管理难题提供了新的解决思路。
辞书数字化之初要以纸质本为基础,但纸质辞书已不能完全适应时代的发展,数字化辞书不再是纸质版的附庸,数字化辞书和纸质版辞书各自有消费者市场,二者可以相辅相成,彼此促进,共同发展。
一部纸质辞书出版后,会进行周期性修订,这也是纸质辞书的共性。进入网络时代,这种周期性修订的模式已很难适应用户的要求,因此在线的实时修订模式将成为未来修订辞书的新常态。在线修订除了能够快速更新辞书的内容外,其篇幅也不受限制,可以增加任意功能、版块及词条,还可以将义项分得更细,或将词典的容量扩充。在修订的方式上,编修人员与用户的互动将成为未来辞书出版的新动向之一,用户需求是编修的原动力,用户质疑也是促进辞书质量提升的因素之一。在这方面《牛津英语词典》已有创新之举,其在线词典对来自世界各地用户的意见和建议十分重视,每三个月更新一次数据,每次更新数据时,都会增加上千个词条。上海译文出版社的《英汉大词典》(第三版)提出“读者融入”的思想,将“搜集”和“采用”的程序分开,通过互联网邀请读者提供语料素材,这些语料素材成为更新信息的有效来源。同时,读者在线查询的频次也成为编纂的参考[5],编纂团队综合“搜集”有效信息,最后确认是否“采用”。
通过数据库对大数据进行分析,出版社能够清楚地知道一本辞书卖出多少册,什么类型的辞书最受欢迎,是什么人(性别、年龄、学历、收入等)什么时间购买,不同的辞书所指向的主要消费群体等信息。这些信息对今后的市场研发非常有价值。通过分析大数据,编纂团队可以知道大众关注的社会热点是什么,搜索的高频词是什么。通过互联网等途径,可以搜集和积累语言资源,这类语言资源为词典的编纂提供了丰富的知识来源和充足的语料。将收集到的这些数据进行挖掘,找出规律,加以利用,就能创造更大的价值。因此,挖掘并提炼出有价值的词汇知识,对词典编纂工作来说相当重要。当然,在充分利用大数据的同时,也要懂得去粗取精。例如,聚典平台基于用户的知识查检行为,发布“聚典知识搜索榜”,从字、词、人物、作品等类别中,选取每类查检频次最高的前30名,并从数据中总结出查询频次高的字几乎为二级字,说明全民阅读能力的提升,以及二级字在生活中的使用非常广泛;查询频次高的词为双音节词,大多出自古典文献;通过对人物和作品查检频次的分析,得出大众阅读呈现多元化的同时,优秀传统文化和经典作品的阅读需求占据明显位置。通过这些数据,可以更好地了解用户的需求,总结其阅读规律,更好地服务用户。
在融媒体时代,辞书已不局限于纸质载体,其文本要与各种媒体相融合,运用“全媒体”的信息表现手段和不同的媒介形态进行传播,这种学科的交叉融合性对辞书的编纂者提出了更高的要求。编纂者除了要具备深厚的语言学理论基础、辞书编纂的专业素养,以及丰富的经验外,还需要具备媒体融合意识,能深度了解辞书数字化工具的原理及使用方法。首先,从国家层面来看,人力资源和社会保障部发布的《中华人民共和国职业分类大典(2022年版)》,将“数字出版编辑”纳入其中,明确了相关职位职称的工作内容和职责,积极推动了融合出版的人才队伍建设。其次,从出版层面来说,需增加技能培训,重视融媒人才培养。对传统图书出版人员适当增强技能培训,使他们对更多现代新媒体发展的方法、理念、技术、特点等知识有更多的认知,从而能够在工作中对图书产品进行融合创新。同时,出版机构也需要革新管理模式,营造良好的工作氛围,对具备融合出版能力的复合型优秀人才,制定特殊的管理措施,给予一定的激励,促进优秀人才在融合出版领域取得更好的成绩。最后,相关高等院校要设立词典学专业或方向,配备具有词典学资质的教师,更好地助力专业的复合型人才培养。
李宇明指出,我国确实可称得上“辞书大国”,但显然还不是“辞书强国”。近年来,辞书数字化已成为辞书发展的新方向,不论是呈现形式,还是盈利模式都发生了巨大的变化。虽然我国的辞书编纂和出版在数字化和媒体融合的道路上迈出了一大步,但是目前还存在许多亟待解决的问题,如针对辞书编纂的大数据集成和自动分析技术还不成熟,语料库和知识库的开发规模不够,专业的数字化辞书人才缺乏等。只有切实满足读者之需,整体提高数字化辞书出版水平,才能实现“辞书强国”的目标。