?数字人文环境下“安徽四大文化圈”研究

2019-09-04 09:45邱源徐方邱章乐
新世纪图书馆 2019年7期
关键词:数字人文图书馆

邱源 徐方 邱章乐

摘 要 论文对“安徽四大文化圈”进行数量和数量关系研究,构建数字人文的运作模式,可以进一步揭示其演化、形成、发展的规律及特点,有助于其他数字人文研究者借鉴迁移到自己研究的领域,快速作出一个优良的项目设计方案,达到事半功倍的效果。

关键词 图书馆 数字人文 分层框架

分类号 G252

DOI 10.16810/j.cnki.1672-514X.2019.07.011

Abstract This paper studies the relationship between quantity and quantity of the “The Four Cultural Circles of Anhui” and constructs the operation mode of digital humanities, which can further reveal the laws and characteristics of its evolution, formation and development, and help other digital humanities researchers to learn from and migrate to their own research areas, and quickly make a good project design plan, so as to achieve twice the result with half the effort.

Keywords Library. Digital humanities. Hierarchical framework.

近年,中共中央办公厅、国务院办公厅印发了《关于实施中华优秀传统文化传承发展工程的意见》,并在通知中要求各地区各部门结合实际认真贯彻落实,数字人文正当其时。为响应中央号召,我们着眼于数字环境下“安徽四大文化圈”的开发研究,萃取精华、赋予新意,将人文研究从经验思辨和解释叙事的哲学领域带进实证科学领域,对其内涵和外延进行了更为科学的深入分析和研究,有了更为清晰的认知。

1 “安徽四大文化圈” 数字人文研究困境

数字人文在史学研究中的渗透让我们看到了计量史学;在地理演化中的渗透让我们看到了计量空间……那么,运用现代计算机技术,对安徽四大文化圈进行全方位的数量和数量关系(无论是显性的还是隐性的)研究,是否可以进一步揭示其演化、形成、发展规律及特点,在梳理四大文化圈的内部结构、流派和主要成就等学术范畴时显示出独特优势?答案应该是肯定的。虽然文献计量被一些习惯于定性分析的人文学者诟为“无表情的镜子”,但并不能否定文献计量分析的科学性。运用文献计量分析方法的确为我们研究安徽文化圈提供了一条富有價值的定量研究的新思路、新范式,这一范式的可贵之处在于大多数情况下研究结果可重复验证。也就是说,它将人文研究从经验思辨、演绎推理和解释叙事的哲学方法带进实证科学领域[1]。

淮河文化、皖江文化、庐州文化、徽州文化是构成安徽文化的四大代表性文化圈。其史料详实、系列整齐、内容深邃、特色分明、跨度广博,全息囊括了安徽社会经济、文化、生活、语言与社会的各个领域和基本内容。其中,徽州文化深切透露了后期中国封建社会文化之谜,被誉为与敦煌学和藏学并列的中国三大走向世界的地方显学[2]。据悉,一些高校专门研究所、图书馆和各地文化部门也相继建立与徽州文化、淮河文化、庐州文化、皖江文化相关的数据库,使传统人文学者从浩瀚的纸质文献资料中解脱出来,通过数字技术介入的方式,把海量的人文资料转化为数字文本和易复制的图像。但这还不能说他们进入数字人文时代,只能说他们目前尚徘徊在数字人文的大门外。有一个数据很能说明问题:只要打开中国知网,以“数字人文”“人文计算”为主题词进行搜索统计,2017年学术论文总计才37篇,其中大多数是图书馆学方面的内容,涉及徽州文化、淮河文化、庐州文化、皖江文化的更是廖若晨星。为什么人文数据没有有效展开?究其原因,主要是我们对数字人文缺乏足够的研究。

关于传统的人文研究,胡适有一句名言:“大胆假设,小心求证”,一般遵循“发现问题—提出假设—求证、验证”的思路,是“假设驱动”的研究范式。人文数字研究不同,它从大数据理念出发,通过对文献的统计、运算和数据分析,发现人文史实中的问题或现象,再以此为基础,重构我们对区域文化的认知与理论,是一种“数据驱动”的研究新范式。也就是说,安徽四大文化圈的数字人文研究是一个既受制于人文素养,又受制于信息技术的艰难过程,需要人文学者与数字专家共同孵化。但目前人文学者与数字技术工程师之间存在“互盲”现象[3]。人文学者面对“数字人文”多少有点尴尬,不仅体现在数字技术上,还体现在不会以数字化方式和数字工具提出新命题、解决新问题。而数字技术专家对“史、地、哲、艺”这些人文学科的内部结构和内涵知晓得又不那么广博和深邃。这种“互盲”使得数据人文处在相对凌乱而复杂的窘迫状态。

2 “安徽四大文化圈” 数字人文研究框架

早在10年前,我们就通过政协渠道向中央提出抢救徽文化的提案,该提案得到肯定与支持,并成立以省政协副主席刘光复为组长的考察组,随后多次到婺源、绩溪、歙县、黟县、休宁、祁门、屯溪、徽州等地研讨过关于数据源、结构和格式的各种可能。同时,我们考察组里的人文学者和数字专家开展相互“扫盲”活动,因为人文学者的短板恰是我们数字专家的长处,反之亦是。人文学者给数字专家讲自己的课题,让他们了解“安徽四大文化圈”实际需求,补缺相关知识;让数字专家通过工作坊帮他们建立个人图书馆,使之增长数据集、数字工具方面的数字技术。在他们用共同的语言交流,一道孵化人文数字的互动交流过程中,促进了“安徽四大文化圈”的研究进度。大规模的数字化项目最为人所知的是“徽州记忆” 以及 “徽州基本古籍库”。我们还尝试进行精品数字人文研究的先期实验,例如2016年,我们用数字人文手段剖析淮河文化的代表性巨作《淮南鸿烈》(《淮南子》),提取167个成语雏形,为淮南市成功申报“中国成语典故之城”提供实证性元数据。近年我们采用数据驱动模式的手段参与了国家社科基金重大招标项目“中国传统家训文献资料整理与优秀家风研究”(项目编号:14ZDB007-X40008),对徽州400余座古祠堂所藏家训进行相似相关度研究,通过运算归并同类项,提炼出徽州家训经典。这些实践为我们构建数字人文研究模式提供了一个基本框架。

如图1所示,该框架由两部分构成:基础层有“安徽四大文化圈”之器物文化、行为文化、制度文化、精神文化构建的基础数据库,由基础数据库派生出目标数据库、核心数据库和最易度量的数据;运作层即有数据挖掘层—假设层—工具层—计算层—分析层—交流评估层构成。现在我们需要进一步完善框架设计,具体解决以下两大问题: 一是四大文化圈的基础库如何搭建?其起点和抓手在哪?二是对目标数据、核心数据模型和最易度量数据的具体操作程序是如何一步步运作的?

3 四大文化圈数据库的基础层构建模式

图书馆是各类资源的最佳整合器。图书馆原本就具有数字资源、数字技术和基于网络环境的空间的优势[1]。通过“引渡”,让人文学者与数字专家一起在图书馆安营扎寨,为安徽四大文化圈的研究奠定数字基础。

首先在基础数据库之上构建分支功能库,形成基础层。基础层外包四大文化圈的文化资源。其次将零散的、无条理的、碎片化的文化资源信息提升到功能库,把冗余信息删汰掉,把对人文研究有价值的数据提炼出来,使之在分析过程中具有价值,有利于印证人文学科的一些论断或者能够提供知识发现的线索。

在功能库建构模型中,对于核心数据目标数据及易度量数据等都是数字文化库的灵魂,是数字人文研究的基础。人文学者应当将这类过往学术成果代入数字文化库系统结构中。只有人文学者从专业角度的介入,才能把整个文化数据合理切割成富含逻辑的若干子系统,每个子系统负荷一个固定的人文内容,每个子系统之间用带箭头的线连结,表示它们之间的数据流动和控制关系。这样才能构成适合人文学者掌控和理解的结构图。

3.1 基础层的的核心数据

安徽四大文化圈的内容较为复杂,不少學者认为它至少拥有器物文化、行为文化、制度文化、精神文化等四个层面[4],这还没有囊括心理体验和价值观念。如果器物文化、行为文化和制度文化是“文化的外在表现形式”,那么精神文化、心理体验和价值观念就是“文化的内化形式”。文化外层的演化变革是非常活跃的,而内层文化却相当坚固。当内层文化被消灭或被侵蚀替代时,即意味该文化死亡,古巴比伦、古埃及就是例子。因此,一个文化圈的核心价值观之提挈,将是“上穷碧云下黄泉”的过程。以徽文化为例,其外在形式十分宽泛,包括新安志学、新安朴学、新安理学、新安医学、新安建筑、新安科技、新安教育、新安画派、新安工艺、新安艺文,还有徽州文房四宝(墨、砚、纸、笔)、徽州民俗、徽州方言、徽派雕刻、徽派盆景、徽州竹编、徽州漆器、徽州烹饪等。如果不确立相对稳定的基本要素,徽文化就是不着边际或模棱两可的,从而影响到构建徽文化数据库的路径选择。因此,在建构安徽四大文化圈的结构中,只需抓住核心要素。如果有多个核心要素,则需抓住其中最关键的。例如,如果将传统文化佛、道、儒、法与四大文化圈相匹配的话,其对应顺序应是皖江文化、淮河文化、徽州文化、庐州文化。抓住北宋二程(程颢、程颐) 、朱熹代表的新儒学,就抓住了徽文化的核心;抓住老子、庄周为代表的道学,就抓住了淮河文化的核心。

3.2 基础层的目标数据

数字文化库的结构框架是由建库的目标决定的。一方面考虑近期要达到的重点目标,如徽文化人物朱子、戴震、胡适、汪华、朱升、程大位、郑复光、程晋芳、陶行知、赛金花等等举不胜举,但是我们近期如果将朱子、戴震、胡适梳理了,也就将封建昌盛时期、社会转型时期和现代社会代表人物廓清了。只将九龙瀑,一沟三状元、三丞相的程元凤、曹文植、曹振镛廓清了,官宦人物的画面也就有了;另一方面我们将远程目标锁定在历史上所有与徽文化有关人物的传记资料上,并将其人物关联用数学模型表达出来,公诸学术之用。再者从历史纵深角度来囊括资料。徽文化是对中原文化的包容整合,它初兴于北宋后期,崛起于南宋,鼎盛于明清,这一演化过程延续约800年之久。因此,从历史量化角度,东汉、西晋、唐末、北宋四次北方强宗大族的南迁,也应预留在框架结构中。

近期目标要着眼于文献中的细节或不易察觉的蛛丝马迹,起到“显微镜”的作用[1]。例如,将淮河文化中的土语与天津土语的细节关联,可以推测清朝淮军北上驻留天津的史实。远期目标要素要锁定洪量文献中的概貌、脉络或各种关联,实现所谓“遥读”,起到“望远镜的”作用。远期目标往往由近期目标引发。如淮军北上驻留天津的史实得到证实,并由此想推导出大清朝命运陡变的宏观要素,则需由 “显微镜”转而变为“望远镜”,研究的是有长度的史实或有宽度的空间关系。

从上述目标数据意义上说,对于目标数据的模型设计,也就必须跨越人文与数字学科的边界和壁垒,融合双方的成果和力量,让人文学者和数字技术专家充分了解彼此,用互相听得懂的话阐释数字文化库的内涵结构问题。从分工角度,程序设计人员为建立数字文化库提供开放的运行程序和数学模型;人文专家应在文化框架方面解析结构要素,搭建不同文化圈的平台。这样建立起来的数字文化库才有方便检索的庋藏功能,更重要的是能够向人文研究者提供便于科学统计、分析和评价的计量范式。

3.3 基础层的易度量数据

几乎所有的哲学家都赞同古希腊毕达哥拉斯学派提出“万物皆数”的观点;几乎所有的测量家都赞同桑戴克所说的“随便什么东西,只要存在的,总存在于数量之中”的判断[5]。无论哲学界还是科学界都试图借助物的量化理论,将人文研究纳入可度量的范畴。人文学科最易度量要素莫过于基于人、地、时、事四种。

3.3.1 人物可度量信息

人物本体具有历史性、社会性和现实性,是提炼人物精神的重要过程[6]。人物的密度、广度、比配等是人文数字最基本的度量项。以徽州文化为例,“连科三殿撰,十里四翰林”“父子丞相,同胞翰林”等佳话生动地描述了徽州地域人杰地灵,翘楚频出的状况。更明晰的是在数量上进行记载,如明清两代出了168位进士、17位状元;《中国人名大辞典》共收集清以前历代名人4万人,徽州就有800余人等等。比配关系更能强调和突出稀缺性和特异性,例如被评为中华杰出历史文化名人的前30名中,徽州就占了六位:朱熹、王茂荫、戴震、黄宾虹、陶行知、胡适。研究人物的密度、数量、比配等可度量的元素,可以直接为徽州文化的研究注入新鲜的血液,促进和推动徽文化的深入研究。

3.3.2 地理可度量信息

安徽四大文化圈從地理空间看,各有特色。庐州文化限于合肥及合肥周边地区,地理面积不大,呈点状,但由于合肥是安徽政治文化中心,其文化辐射面大,具有穿透力;徽文化地理由多个块状团绕纠缠而成,呈面状,尽管跨越了省际区划(婺源归划江西),其内在文化纽带非常牢固;皖江文化和淮河文化都呈带状,文化元素如大河滔滔,极其活跃。地域本体模型主要以地图为表现形式,整合机构在地图上标出某地区的档案文化资源,用户可以通过点击感兴趣的图标来获取该地区的信息。由哈佛燕京学社、格里菲斯大学和复旦大学共建的中国历史地理信息系统(CHGIS)为研究者提供GIS数据平台、时间统计以及查寻工具和模型,目标是建立可度量的地理数据库。整合机构甚至可以将智能定位技术与移动媒体结合开发,当用户达到某地点时,整合机构就可以通过移动媒体推送相关资源。

3.3.3 历史可度量信息

时间轴可以直观地展现资源的年代跨度,这种系统化、完整化、精确化的表达方式非常适合厘清各文化的时间顺序和发展历程。从历史长度看,皖江地区和淮河文化的历史渊源最久,如和县猿人遗址、银山遗址、水阳江旧石器遗址,位于淮河中游的下草湾遗址、位于淮河下游的桃花涧遗址和青莲岗文化遗址等[7]。庐州文化和徽文化与其相比要晚许多,周武王封国,按照公、侯、伯、子、男等级爵别进行分封,庐国为“子”爵,故称“庐子国”,真正有史料见证的只能说其建自先秦。徽文化历史更短,它是一个移民社会,严格算起来应从宋徽宗宣和三年(1121年) 改歙州为徽州起,至现今800多年而已。但从文化密度看,徽文化就可称之为四大文化圈之翘楚,被誉为是“后期中国封建社会的典型标本”[8]。宽度、长度、密度等度量要素本身就含有数量成分,是数字人文的元数据,因此数据库框架设计伊始就要高度重视之。

3.3.4 事件可度量信息

以史为鉴,基于事件的本体模型可以揭示密度与客观真相,例如淮河文化中频频发生的战争就是重大事件。早在商周时期,位于淮河下游的淮夷方国与商周统治者对峙,结果就是连续数百年战争,导致殷商的覆灭和周王朝的衰败。春秋战国时期的齐鲁长勺之战,宋楚的泓水之战、魏晋以后的南北之战、宋金对峙使寿春、睢阳、彭城和鲁城成为著名古战场。陈胜、吴广、项羽、曹操、朱元璋都是出生于斯,从戎于斯的历史名将。朱元璋诗中写道:“年年杀气未曾收,淮南淮北草木秋”,这就足以想象出淮河流域战争的频繁程度。从某种意义讲,淮河文化就是战争文化或抗争文化。

4 四大文化圈数据库运行层的建构模式

为满足四大文化圈数据库的运行,应并列建立两个结构完全相同的数据库,一个做正规数字文化库用,归专门人员管理,用高级权限的密码才能打开;另一个做录入数字文化库用,没有密码,可以任意输入和输出。对两个数字文化库,都提供查询、输入和编辑的功能,查询时可根据信息类型或关键字段单独查询,也可利用关键词进行关联查询,并利用PHP语言建立两者之间的相互关联。通过这样的管理就实现了数字文化库的开放建设,大大减轻了建设数字文化库的成本,缩短了建成数字文化库的时间,提高了数字文化库的运行质量,并且保证了数字文化库内容的权威性。四大文化圈数据库的运行大致包括数据挖掘、假设、工具计算、分析、交流与评估等六个层面。

4.1 数据挖掘层

数据挖掘层是采用数字挖掘技术对四大文化圈数据库的数据进行关联分析,找寻未知的、隐秘的、或模糊的人文信息,并将其消化、整合、概括为假设依据。数据挖掘的主要方法有神经网络方法、遗传算法、决策树方法、粗集方法、统计分析方法和模糊集方法等[9]。最常用的是神经网络方法。由于神经网络方法其自身具有良好的自组织自适应性、分布存储和高度容错等特性,比较适合解决人文信息分类、预测和模式识别以及联想记忆和信息反馈方面的问题。决策树方法也是一种常用的数字挖掘技术,便于我们从中找到一些潜在的有价值的信息,其分类直观,描述简单,对初学数字挖掘技术者大有裨益。

4.2 假设层

如果说传统人文学与数字人文有交集,那么这个交集点就在假设层。传统的假设来自思辨,数字人文来自数据挖掘或“数据驱动”。假设层就是将关联数据、分类数据、问题数据、匹配数据、反馈数据作为命题假设的依据,是一个目标定向的思维过程。需要强调的是,最后的假设往往要在数据挖掘层与假设层之间不断回环。因此,充分的数据挖掘是实现高质量人文项目的起点。另外,假设尚未清晰时,还可以利用模糊集合理论对假设进行模糊评判、模糊决策、模糊模式识别和模糊聚类分析。模糊集合理论一般是用隶属度来刻画假设的亦此亦彼性。假设尚未成熟时,还需要进一步整合有关信息,反思、完善模糊意向,运用促进性信息来进一步完善假设,运用抑制性信息来进一步改进假设。这两类回环实质上都是对假设的检验过程。

4.3 工具层

从挖掘层、假设层上升到工具层,是数字人文区别于传统人文研究的标志,这不仅需要研究者有深厚的人文素养,同时还需要对信息技术有较为娴熟的掌握。工具层体现的是人文学理与数字技术高度融合,是实现高质量数字人文项目的关键。举一个简单的例子:通过神经网络挖掘技术,发现常用的文言虚词有19个:而、之、乎、者、何、以、所、于、也、乃、则、其、若、然、矣、与、为、因、焉。接下来要认真想一想这些虚词数据对什么命题有什么用。用数据回环技术,挖掘到有人利用虚词“作为分辨作者身份的参照物(或者说文学指纹)”,那么可否用虚词检索来检验作品作者到底为何人呢?验证这一假设,接下来就将这一假设带进工具层,下载一个可以抽样和统计字、词的小工具软件,然后通过抽样工具建立样本,将电子版的样本切割成若干独立的txt文档,再分别用这个小工具统计这些虚词在每个章节出现的频率。如果频率无明显差异,则假设成立,如果频率有明显差异,则假设需要重新验证。当前,有6种数字工具常被数字人文引入,一是抽样工具,二是中文分词工具,三是GIS空间测定工具,四是同类术语分析工具,五是时间或人物密度分析工具,六是网络新词梳理工具等等。这些技术工具可灵活组配,可不断丰富数字人文研究的命题假设。随着数字人文的进一步实践,会有更多新工具面世。

4.4 计算层

工具层与计算层毗邻,有时工具层就能完成简单的计算任务。前面例举的虚词在每个章节出现的频率,可以在工具层进行计算,但更为复杂的运算就不得不在计算层进行了。例如,用虚词频率检测《红楼梦》,先将全文分成前80回和后40回,以及前40回、中40回、后40回两种场景,通过非参数检验来进行全面计算。对于前80回和后40回需采用Mann-whiney U检验(如表1),对于前40回、中40回、后40回需采用Kruskal-Wallis检验和Mann-whiney U检验(如表2、表3)

4.5 分析层

在计算层的数字基础上,人文学者结合本学科身的学理进行思辨、比较,印证相关假设或发现新的知识。仍以虚词频率为例,对计算层计算的结果进行分析,我们可以得出这样的结论:《红楼梦》后40回无论是和前80回做比较,还是和1~40回,41至80回做比较,虚词都指向了差异显著的结论,只有30%不到的虚词分布差异不显著,因此最后的40回应该是一个独立的作者,而前80回是另一个作者完整写作的。从非参数检验来看,可以得出《红楼梦》应由2个作者写成的结论。

经过数字洗礼,分析层也可使研究者回归人文学科自身的逻辑。作者生平探究、场景描述差异研究、影射投射比较等人文学者娴熟的思辨或人文情怀,都可以在这个层面淋漓尽致地展开。经过数字检验的分析无疑增加了研究成果的信度和效度,上升到了科学层面。

4.6 交流与评估层

交流与评估层既是成果发布平台,也是面向数字人文项目的交流平台,更是成果的检验平台。数字人文与传统人文研究的根本区别就在于前者是可以重复试验的,是实证科学,后者则停留在哲学思辨层面。但是,交流与评估层并不一概排斥人文学者习惯了的经验研讨方式。对数字人文成果的评估形式多种多样,概括起来,大致有三种基本类型。

(1) 符合性评估。用来确定某人文项目研究结果与历史客观发生的事实是否相符。例如,淮河流域与天津的文化交集是否是因李鸿章10万淮军驻留而生发,只要查清户籍就可验证。由于人文学科受制因素复杂,其符合性检验相对较慢。这方面的极端例子是红楼梦辞法检验结果的可信度和可靠度。

(2) 包容性检验。在某些情形下,传统经验研究的东西与数字文化引导的成果不一样。这虽然“反常”,但并不可怕,因为数字文化在初始阶段都会被“反常”所包围。包容性检验主要“用于确定在什么情形下该成果仍然成立”[10],也就是承认数字人文研究成果存在局限性。

(3) 数学模型检验。以主要矛盾为主来对该实际问题进行适当的简化,并提出一些合理的假设,可以为数学建模带来方便,并完成检验。人文研究结果必须是可信的,有信度的人文研究结论才有意义。信度又叫可靠性,在检验理论中,信度被定义为:一组数据量的真变异数与总变异数(实得变异数)的比率,用公式表示为:

rxx(信度系数)=真变异数·

根据数量误差来源的不同,数字人文信度常用的检验模型有再测信度和分半信度。再测信度检验时间的间隔对结果的影响,故又称稳定性系数。分半法是将同一时间的项目分成对等的两半,求得两半分数的相关。这些数学模型大多来自心理测量理论。心理学原本属于哲学范畴,他们借助数学等自然学科的引渡,已从传统哲学中脱胎而出,自由游弋在科学领域,人文学科一定也行。

5 结语

“安徽四大文化圈”的数量和数量关系研究,仅仅是数字人文技术领域的一个尝试。搭建具有普适性的数字人文的运作模式,有助于其他数字人文研究者借鉴并迁移到自己研究的领域,快速作出一个优良的项目设计方案,达到事半功倍的效果。数字人文的后续课题还很多,图书馆可凭借其丰富的人文信息资源、先进的技术设备、高技能的人才,为数字人文提供更为适宜的科研环境及服务,推进数字人文更上一个台阶。

参考文献:

孙辉.数字人文研究框架探析与思考[J].情报理论与实践,2018(7):7-12.

刘雨薇.徽州口头和非物质文化遗产保护的问题及根源[J].华人时刊,2013(1):70-72.

于亚秀,李欣美.国高校图书馆的数字人文服务实践:以加州大学洛杉矶分校为例[J].图书馆论坛,2018(2):23-26.

欧阳志远,吕楠.热话题与冷思考:关于生态文明与社会主义的对话[J].当代世界与社会主义,2013(2):34-36.

THORNDIKE E L. The seventeenth yearbook of the national sociey for the education[M]. Public School Publishuing Co.,1918.

張卫东,张天一,陆璐.基于数字人文的档案文化资源整合研究[J].兰台世界,2018(1):17-20.

刘建超.从中国旧石器时代遗迹现象初探古人类行为[M].太原:山西大学出版社,2016.

李玫,项桂娥.长江三角洲城市群规划背景下皖江城市带银行业发展战略:基于PEST-SWOT分析模型[J].科技经济市场,2016(10):34-36.

姜淑芳,常勇.数据挖掘的应用研究[J].科技经济市场,2011(10):18-21.

邱章乐,程跃.智慧信息[M].北京:光明日报出版社,2013:207-212.

猜你喜欢
数字人文图书馆
图书馆
数字人文时代公共图书馆经典阅读推广研究
数字人文目标下图书馆信息服务模式研究
气味图书馆
欢迎到图书馆做客
数字学术与公众科学:数字图书馆新生态
跨界与融合:全球视野下的数字人文
跨界与融合:全球视野下的数字人文
大规模古籍文本在中国史定量研究中的应用探索
去图书馆