数字人文视域下的历史客观性理解问题

2018-05-04 08:39
图书馆论坛 2018年4期
关键词:主体价值文本

钮 亮

0 引言

数字人文研究近年获得极大的关注,研究者引介数字技术到人文领域,试图开辟出人文领域研究的新天地。就目前应用情况来看,比较突出地是将文本挖掘、社会网络、空间统计、数据库等技术应用于人文研究,以期为人文学科提供新的研究方法[1-4]。具体到史学方面,有学者认为可以通过数字技术获得依靠传统文献分析方法难以发现的“新史实”[5],也有学者认为数字技术可以解决史学家面对大规模群体型、连续性材料繁琐的考证泥潭[6]。尽管数字人文已经有了一定的发展,在技术体系方面包括数据管理技术、数据分析技术、可视化技术、虚拟现实/增强现实技术、机器学习技术等,但数字人文研究方法论方面的文献还不多见[7]。在大数据兴盛的今天,人文研究必然会受到影响而发生变化,产生“信息转向”效应。尽管很多时候传统人文学科在面对新的科学方法时表现得不太情愿,但用布罗代尔的话说:“无论情愿与否,在人文科学之中,没有一门学科能够不直接或间接地受到其他更活跃的学科的进步的影响。”[8]布罗代尔的说法在19世纪的社会科学和自然科学的互动过程中得到过证实。受自然科学解释世界成功的影响,社会科学纷纷沿用自然科学的思考方法,最明显的是牛顿力学对19世纪社会科学范式的影响。那时的社会科学竞相沿用牛顿力学的类比和同源思考方法。例如,美国经济学家凯里提出“人必然会倾向于受其同胞吸引”的社会引力原则;瓦尔拉提出“商品的价格与供应量成反比,与需求成正比”的牛顿式经济学定律;涂尔干认为“社会大众(质量)和密度的增长决定了劳动分工的进步和文明的发展”的社会学原则[9]。之所以社会科学沿用自然科学的方法,目的是获得概念上的确定性和观察上的可验证性,达到对世界的客观理解。

科学研究的演化过程经历了经验科学、理论科学、计算科学、数据密集型科学四个阶段。数据密集型科学是围绕大数据产生的从关系出发的科学研究方法,被称为第四范式。它由传统的假设驱动向基于数据进行探索的科学方法转变。它的特征是“样本=总体”“关系替换因果”“5V特点”“整体论代替还原论”“可验证性”[10]。如果人文研究能够沿用大数据的方法,那么大数据诉诸的可计算特性也会作用于它。可计算性手段使得人文研究能够满足确定性和验证性要求,实现对世界的客观性理解,从而获得理论的科学地位。波普尔说:“衡量一种理论的科学地位的标准是它的可证伪性或可反驳性或可检验性。”[11]

人文学科中的史学在应用大数据分析的时候可能更复杂一些。柯林武德说:“历史学是为了人类的自我认识”,“历史学的价值就在于它告诉我们人已经做过什么,因此就告诉我们人是什么”[12]。人的复杂在于他不仅行动,更重要的是带着价值行动。赫拉利说:“从认知革命以来,智人一直生活在双重的现实之中,一方面我们有像是河流、树木和狮子这种确实存在的客观事实;而另一方面我们也有像是神、国家和企业这种想象中的现实。”[13]这种想象中的事实是赋予人价值和意义的东西。在历史事件中,历史主体行动的理由往往和历史主体行动的价值取向有关。按余英时的说法,历史是由作为符号材料的“基本事实”和作为价值取向的“历史事实”构成的。只有考虑历史主体的行动价值来说明历史的变化,才是历史所关心的。当然两者不是彼此偏废的关系,而是互相依赖的关系[14]。按照波普尔说的科学理论要求重复性检验的标准,史学中的“基本事实”的客观性毋庸置疑是满足要求的,然而“历史事实”中历史主体的价值如何也能够满足重复性检验标准,这是回应波普尔质问的关键所在。因此,本文后续的开展以重复性检验为标准,梳理传统史学在实践客观性理解方面的研究思路,并探讨数字人文史学何以可能实现对史学的重复性检验。由于遵循着这个共同的标准,数字人文下的史学与传统史学是继承和发展的关系。

1 史学的客观理解

历史正如柯林武德说的是人类在过去的所作所为,是“活动事迹”(Res gestae)。在历史构成中,存在着历史主体遗留下来的符号材料和历史主体行动的价值取向。历史研究依赖于对符号材料和历史主体价值的揭示。符号材料的揭示在保证客观性上大致是没有问题的。例如,名物制度、训诂校勘、地理沿革、人物生卒等材料一旦获得了解,便不会随着时代而变动。历史理解重要且困难的地方在于历史主体的行动价值如何也能得到客观的理解。如果自然科学的客观性是可控实验的重复验证,那么历史理解的客观性在保证材料客观的情况下,就是让历史主体的价值实现类似可控实验那样的重复验证,其中的一个途径是历史主体的价值能够在认识者心灵里得到重演。柯林武德的历史哲学提到了这种心灵重演的可能。他说:“历史知识是关于心灵在过去曾经做过什么事的知识,同时它也是在重做这件事;过去的永存性就活动在现在之中。因此它的对象就不是一种单纯的对象,不是在认识它的那个心灵之外的某种东西,它是思想的一种活动,这种活动只有在认识者的心灵重演它并且在这样做之中认识它的时候,才能被人认识。对于历史学家来说,他所正在研究其历史的那些活动并不是要加以观看的景象,而是要通过他自己的心灵去生活的那些经验;它们是客观的,或者说是为他所认识的,仅仅因为它们也是主观的,或者说也是他自己的活动。”[15]柯林武德这段话中表达的心灵有两个维度,一个是历史主体,一个是认识者。他要想达到历史知识“在认识者的心灵重演它并且在这样做之中认识它”,则须设定历史主体和认识者价值同一,且历史主体和认识者处于同一种心里学条件之中,共享一个意义整体。通过历史主体在认识者心灵中的重演,历史得到了客观性理解。

以柯林武德为代表的历史主体和认识者价值同一为参照,认识者和历史主体在处理价值关系上出现三种面向:(1)悬置认识者和历史主体的价值关系,仅从史料角度出发论证发生事件前因后果关系的历史,简称悬置价值的历史。(2)认识者和历史主体价值同一的历史,简称价值同一性的历史。(3)历史主体价值蕴含在文本之中,而与认识者无直接关系的文本即历史,简称文本即历史。这是在大数据背景下提出的新历史观。

2 悬置价值的历史

如果不考虑历史主体的行动价值,也不将认识者所处时代的价值附加到历史主体上,只处理材料问题,那么这种历史知识的处理就是悬置对价值的处理。悬置价值处理的典型是以兰克为代表的史料派。史料派强调第一手资料的收集,历史研究的可信与否受原始材料和同时代或接近此时代的史料决定,而不涉及对历史主体的价值判断。年鉴学派扩展了兰克学派的研究范围,将人类社会这个复杂系统当作一个整体来考察,提出“整体的历史”观念,并将历史这门学科向自然科学的方向改造。主张通过模式的归纳对社会历史运动中的深层结构、特别是“长时段”结构加以揭示和分析。为了实现这些目标引入社会学、地理学、心理学、经济学等诸多学科作为辅助,大量运用数学工具和计量手段。年鉴学派形成的标志是1929年吕西安·费弗尔和马克·布洛赫创办的《经济与社会年鉴》。费尔南·布罗代尔在《菲利普二世时代的地中海和地中海世界》中总结了年鉴学派的历史观点和方法,规定了历史研究的方向。之后又发展出对传统史学中常见的定性论断中隐含着的模糊的数量判断明晰化的计量史学,力求揭示历史变迁的深层结构[16]。计量史学是系统地运用现代数学和统计学来研究历史现象和历史过程的方法,它对人的心理和思想研究不作讨论,认为精神的东西很难用数量关系来精确地加以概括。由于依靠自然实验的设定,能够做到不同的认识者对历史都能够得出相同的结论,实现了类似科学的受控实验,满足了对历史的客观性理解要求。因为历史主体的价值被悬置,认识者的计算结果就是历史主体的行动结果。麦金德的地缘政治学也是这种研究的体现,他说:“在计算时,地理的数量比起人文的数量来可以更好地测定,更接近于稳定不变。因此,我们应当期望能找到既可用于过去历史、也可用于当前政策的公式。各个时代的社会运动,基本上都是围绕着相同的自然特征进行。”[17]在悬置价值的历史研究中,历史主体和历史认识者不存在价值理解关系,这种研究的图示见图1。

图1 悬置价值的历史关系图

3 价值同一性的历史

价值同一性的历史是在考虑史料真实性的情况下,历史主体的价值也得到客观性理解。历史主体能够被客观理解的条件是他在认识者心灵里实现了重演。在认识者心灵重演一般有两种类型,一种是以柯林武德为代表的唯心论史观,一种是以马克思为代表的唯物论史观。柯林武德认为历史学家所做的工作是“在他自己的心灵里重演他所叙述的那些行动者的所做所为的思想和动机”[18]。因为历史主体在认识者心灵实现重演,就满足了被客观理解的条件。这种情况之所以可能是预设了历史主体是一个活生生的心里意向性对象,与认识者共享相同的心里结构。历史主体的意向性向外部世界投射和构建的过程与认识者相同,反之亦然。在相同的心里结构下认识者和历史主体的价值没有差别,例如作为人性重要构成的权力的意识和逐利的意识今人和古人没有什么变化。这种基于心里意向性而形成的认识者和历史主体的价值同一是以主体间性哲学为前提的,它经由胡塞尔提出的自我和他人的立场的相互交换性,再到海德格尔的自我和他人共享“此在”这个世界结构来得到说明。当历史主体和认识者以世界为条件时,他们就能够彼此理解了。世界的存在超越时间,它的本质其实是语言,语言是连接历史主体和认识者理解的纽带。

作为唯物论的马克思的历史观是将历史主体和认识者划归到阶级之中。阶级是意识形态的发明,阶级的作用是把个别的意识统一成集体意识。它表现在个体不仅通过相同的社会结构投射了相似的心里动机,而且在精神层面借助于原则、观念、范畴确立了行动的正确或谬误的标准[19]。如果历史主体和认识者属于同一个阶级,那么历史主体和认知者的个别意识就被统一成集体意识,历史主体的思想动机和认识者是一样的,那他就能够在认识者这里得到重演了。金观涛等认为,中国社会的长期稳定发展是因为分布在上层、中层和下层的社会组织者共享同一套意识形态,在古代为士大夫,现在是政党党员,他们以社会整合为己任,成为政治文化的载体[20],中国历史发展的超稳定结构就是这种载体作用的结果。

由于设定了历史主体的价值与认识者的价值是同一的,历史主体的行动就在认识者心灵得到了重演的可能,因此历史主体和认识者的关系是强关系。这种研究的图示见图2。

图2 价值同一性的历史关系图

4 文本即历史

上述两种历史观无论是采用价值悬置还是价值同一性,它们满足历史主体在认识者这里重演的条件是假设性的。从经验的立场来看认识者毕竟是主观的,受其所生活时代的影响,他与历史主体之间历史距离的不可跨越导致他产生的认识无论如何都难以是客观的。为了克服历史距离问题,还原历史主体的价值选择,我们采用文本即历史的观念。历史主体的价值通过其产生的文本自行展示,无需借助于认识者的移情代入。这个立场类似于老子的“以身观身,以家观家,以乡观乡,以邦观邦,以天下观天下”[21]的立场,我们是“以文本观文本”。采用“以文本观文本”的史观要求历史主体产生的文本满足总体性和情景关系特征,而大数据的方法论也恰好以总体性和情景关系为出发点,因此文本即历史所依托的基础是大数据方法。由于大数据的可计算特性就保证了文本即历史的重复检验要求。

4.1 文本世界与历史主体世界逻辑同构

解释“文本即历史”的客观性理解同样会遇到处理历史主体的价值问题。如果保留历史主体,那么对历史主体的认知就需要通过认识者的移情来达到,但这种移情会受认识者所处时代的影响无法做到客观真实。如果历史主体的行动世界与文本世界是同构关系,则可以通过处理文本来达到对历史的客观性理解,这样做的好处是它避开了历史主体和认识者关系的论证假设,进入到文本处理的可计算的经验领域。但是单纯处理文本和史料派的区别在哪里?区别在于它处理的是总体文本,而史料派处理的是认识者选定的有限文本。在有限文本上运用统计方法往往“需要对变量之间的关系和分布引入许多较强的假设。尽管很多假设并非直接针对数据的局限性,但是有限的数据往往限制了研究者对假设合理性的检验,从而增加了研究结论受研究者选择方法的主观性影响的风险”[22]。总体文本是历史主体活动留下的全部语言,这个总体文本和历史主体行动世界是同构的,它和大数据的方法论也匹配。这样就可以用文本来代替历史主体的活动,而无需处理历史主体的价值意义问题。这个想法得到语言哲学的支持。维特根斯坦认为:“意义理解的衡量标准并不是某个人类意向,而只是有待理解的语言的逻辑形式。”“由于语言分析代替了认识论,从而主体及其意向、灵魂等等之类的问题在某种程度上变得多余了”[23]。“我的语言的界限意味着我的世界的界限”[24]。这样总体文本就代替了历史主体的行动世界,为历史的客观分析提供了基础。

4.2 历史文本转换为关键词

当历史蕴含在文本中时,对文本的分析最终落在了对构成文本的词项分析上。一个历史阶段的观念总是不断重复地被表达在特定的关键词中,因此分析历史观念可以通过选定的关键词来执行。与文本分析中产生的一般技术词是不同的,这些关键词应该具备历史的效应,它们承担起了历史基本概念的作用,成为政治和社会词汇的不可替代的、无可回避的一部分。这些关键词融合了行动者各式各样的经验和期望,在既定时代最紧迫事件的形成中变得必不可少。只有获得这样的地位之后,这些基本概念才会结晶为单独的历史词汇,如“民主”“革命”“国家”“自由”等历史词汇。这些词不仅仅是单纯的言说,而重要的还有行事的能力[25]。

历史词汇的获得在技术上可以通过文本挖掘的主题模型来实现,然后再借助TF-IDF和齐普夫定律等相关的评测标准来选定[26]。获得历史概念的词汇一直充满争议,因为充满争议的人群一直在用它,将时间序列和其他词项加诸其上可以揭示这些词的起源、定型和变迁过程。由于关键词的计算是通过总体文本(一般是数据库中的大量文本)得到的,可以避免认识者选词的主观局限问题。

4.3 关键词意义变迁问题

由于关键词是构成历史叙事的基本概念,了解它意义的变迁非常关键。关键词的意义变迁是在时间轴下与其他词的交互影响下得到体现的。当我们能够捕捉到一个词与其他词之间的互动关系时,那这个词的意义也就得到说明了。一个词的意义不是通过解释这个词的定义来决定的,我们理解这个词是通过关系勾连出的家族相似来得到的。如果某个关键词与其他关键词经常共现在历史文本的某个段落或语句中,则这个关键词的意义就可以通过与它共现的其他词项得到说明。David Hall等通过分析词汇及其变化来揭示1978-2006年间计算语言学的历史趋势,揭示这个领域的观念变迁,实证了库恩提出的范式转变,其中词汇变迁是观念变迁的重要指示器[27]。

在历史文本的词项构成中除了表达观念的词汇外,还有一类词是“人物名称”词。这些人物对观念也有着说明的作用,如果某些关键词与他们共现在一起,则说明这些词项和人物所代表的观念相关,词项的意义也得到了说明。例如,Taylor Arnold,Lauren Tilton使用LDA分析16-20世纪哲学家维基百科语料中的关键词分布情况,并进一步通过将关键词和哲学家作多维标度分析来确定关键词的意义分布,发现克尔凯郭尔处于存在主义与普通哲学这个主题之间,而哥德尔却位于逻辑这个主题附近[28]。

在历史事件的推进中,文本中“人物名称”词构成的网络结构展现出一幅清晰的可“看”图像,观念的变迁借助于网络被直观地呈现。莫莱蒂说:“我从网络理论得到的是它的基本形式的形象化。戏剧情节的时空流能被转化成一系列二维的符号:端点和边,这样,有关情节的观念可以在一瞥之后迅速被捕获。”[29]有了社会网络的直观呈现,进一步可以追问是何种观念、何种人物特质、何种社会背景、气候、地理条件促成了人物网络关系的形成?这些因素对理解历史是很重要的。正如毛汉光所说:“研究社会史最重要的是探讨人与人之间的关系……几经考虑,觉得欲研究官僚政治,先得明了社会背景以及社会中人物的特质,否则便仅能知官僚的空架而无法深究其内涵。”[30]可见人物特质对理解官僚政治的重要性。但毛汉光所说的社会背景以及社会中人物的特质是如何影响官僚政治的,他没有给出客观测度。指数随机图模型可以解决这个问题。“指数随机图模型是以关系为基础的模型,是为了理解社会网络关系是如何出现以及为什么会出现的”,“一旦研究人员把社会理论转换成以关系、定量形式表达的假设,指数随机图模型就提供了一个可以用来进行统计检验假设的分析框架”[31]。有学者以《水浒传》中108人的身份特质(官、商、民)作为个人属性,任一两人之间的座次排名的差异作为二人属性,以及三角形、边、k角星这三个常用的作为图形属性,通过指数随机图来预测水浒人物的网络形成关系,计算发现两个人如果在投奔梁山前同样是官,他们在梁山建立关系的概率是随机情况下的301%[32]。这个结果为理解梁山何以能够聚会提供了测度,进而也可以推测何以梁山最终选择了诏安,因为他们的出身是官的原因,容易形成一致意见。同时,如果筛选出的影响网络形成的参数中存在地域要素,可以通过空间统计的手段来寻找地域下的人物集聚情况。包弼德通过空间统计手段比较南宋、北宋进士的地理集聚情况,发现宋时期知识分子大体分布在两浙东西、福建、江南东西和西川这几个圈子[33],这为了解宋代思想观念的活跃和衰落提供了空间测度。

“文本即历史”的研究确立了对历史理解的客观可能,因为它的实施过程大部分是通过计算机手段来完成的。认识者需具备程序员的能力,同时还需要将信息技术产生出来的数据作深入细致的解析梳理来编排成一种历史叙事,以供他人阅读理解。他与历史主体并不建立直接关系。这种研究的图示见图3。

图3 文本即历史关系图

5 结语

本研究围绕史学的客观性理解问题展开论述,分别讨论了悬置价值的历史、价值同一性的历史和文本即历史三个方面。它们达到客观性理解的标准是实现重复性验证。价值悬置的历史借助于统计手段实现重复性验证,价值同一性借助于在认识者中心灵重演实现重复性验证,而文本即历史借助于对代表历史观念的关键词和人物的计算实现重复性验证。对前两个方面史学研究已经有相关的成果给予说明,而文本即历史的提法是探索性的,因此还有一些问题需要说明。

(1)量化数据库。文本即历史的方法论是“以文本观文本”,它要求文本具备总体性和情景关系特点,因此作为史料文本数据库的完备性和数据清理的科学性决定了研究的可信程度。比如,在追溯某些现代观念的起源和变化轨迹的历史研究中,除选定《新青年》《少年中国》《新潮》《每周评论》《建设》《努力周报》《向导》《解放与改造》《醒狮周报》《甲寅》《现代评论》《星期评论》等12个新文化运动的期刊[34],还需要考虑包括《晨报》《大公报》《申报》《私国报》《时报》《神州日报》《湘江评论》《天津学生联合会报》等报纸,这样就不会造成所选关键词存在样本偏误的问题。同时,与这些进步思潮激战的旧派势力报刊,如《国故》《新申报》《东方杂志》《公言报》也要顾及。因为主流观念在推进过程中与非主流的种种层次常同时叠压在一起,形成竞争状态,里面有很复杂、很精微的相互依存关系。历史研究要将这些层次关系展示出来,利于“史实的建立”“价值的参照”[35]。基于这种考虑的史料数据库才完整。

史料文本要经历一个扫描识别、转化入库的工作,因此制作中因字形差异,校核不精,错行错页、脱行脱页的情况会导致出现无用输入、无用输出现象(Garbage in,garbage out,GIGO)。为了克服这种现象,在史料入库过程中一方面要严格把关,一方面系统在保留文句的过程中要能够实现自动交叉验证,同时启动开放的纠错接口,允许研究者在研究过程中发现错误,提出改错意见,系统完成改正。

(2)整体论视角。文本即历史的研究依托海量数据进行分析,它采用的是一种整体论的视角,该视角避免了认识者仅仅选取代表性文本进行分析时产生的局限。它与大数据“样本=总体”的方法一致。因为“样本=总体”的思维方式的变化,之前样本的独立性检验让位于依赖性检验,因果论证让位于关系分析。样本独立性设定是将个体从其所在的社会情景中剥离开来,而关系论证和依赖性的设定却是情景主义的,这符合以文本观文本的立场。

关系分析是大数据时代的重要方法论,直接导致数据密集型科学范式的产生,甚至因果分析也只是关系分析的一个特例。“关系分析本身意义重大,同时它也为研究因果关系奠定了基础。通过找出可能相关的事物,我们可以在此基础上进行进一步的因果关系分析,如果存在因果关系的话,我们再进一步找出原因。这种便捷的机制通过严格的实验降低了因果分析的成本。我们也可以从相互联系中找到一些重要的变量,这些变量可以用到验证因果关系的实验中去”[36]。这种以关系为主,关系带动发现因果机制的大数据思维对史学工作者发现隐藏的“历史事实”,确立历史基本概念有很大帮助[37]。

(3)数据驱动而非模型驱动。传统社会科学研究中对于社会规律的发现基本源自于理性驾驭经验的能力。这种能力扎根于康德的认识论立场。通过理性为经验立法,历史变迁的发生学便通过理想类型构造起来。其中典型案例就是韦伯用理想类型模型处理新教伦理同资本主义的关系。受这种立场的启发,很多社会科学工作者试图发明一种理想类型来解释历史长程变化。例如,苏秉琦发明“满天星斗”模型来解释中原地区只是独立发生发展但又互相影响的六大区系之一,从而对历史考古学界根深蒂固的古中原中心、汉族中心、王朝中心的传统观念提出挑战[38];赵汀阳提出“旋涡模式”解释商周至清朝这个长时期的历史性,认为产生漩涡的向心吸引力形成是由于中原创造了一个完全开放的、可以普遍共享的、人人可以分享的精神世界[39]。然而无论如何,这种理想类型的思想实验无法脱离认识者的主观设定,它们的论证过程是基于后果推断的。这种围绕模型的方法势必会导致历史材料的选择会依照模型的需要而收集,失去客观性标准。文本即历史是数据驱动的史学立场,它从经验角度出发“以文本观文本”。即便之后形成某种历史规律的判断,提出一种理论,那也是在数据作为论证的客观性上推断出的。例如,谭凯在写作《中古中国门阀大族的消亡》时建立的“唐五代人物传记与社会网络数据库”,从传记、宗谱以及超过3000多个墓葬碑文中获得3.2万多个人记录[40],为他推断中古门阀大族的消亡提供了坚实的基础。随着历史材料的不断数据库化,面对TB级数据的历史,研究者不可能穷尽。庄子说:“吾生也有涯,而知也无涯。以有涯随无涯,殆已。”这个困境在大数据计算手段下或可解决。大数据时代史学研究出现定量计算的趋势,但并不意味着传统史学研究的失效,而是它的存在让史学研究的理论建构具有了客观的、可测度的依据。

[1]李文娟,傅学庆,李仁杰,等.基于空间统计方法的李杜诗词文学空间模式的比较研究[J].河北师范大学学报(自然科学版),2016(1):80-87.

[2]夏翠娟.中国历史地理数据在图书馆数字人文项目中的开放应用研究[J].中国图书馆学报,2017(2):40-53.

[3]柯平,宫平.数字人文研究演化路径与热点领域分析[J].中国图书馆学报,2016(6):13-30.

[4]刘炜,谢蓉,张磊,等.面向人文研究的国家数据基础设施建设[J].中国图书馆学报,2016(5):29-39.

[5]梁晨,李中清.大数据、新史实与理论演进——以学籍卡材料的史料价值与研究方法为中心的讨论[J].清华大学学报(哲学社会科学版),2014(5):104-113.

[6]金观涛,刘青峰.历史的真实性:试论数据库新方法在历史研究的应用[J].清史研究,2008(1):90-108.

[7]刘炜,叶鹰.数字人文的技术体系与理论结构探讨[J].中国图书馆学报,2017(5):32-41.

[8]费尔南·布罗代尔.论历史[M].刘北成,周立红,译.北京:北京大学出版社,2008:27.

[9]伯纳德·科恩.自然科学与社会科学的互动[M].张卜天,译.北京:商务印书馆,2016:26-34.

[10]邓仲华,李志芳.科学研究范式的演化——大数据时代的科学研究第四范式[J].情报资料工作,2013(4):19-23.

[11][29]陈晓辉.大数据时代的文学研究方法——基于弗兰克·莫莱蒂文学定量分析法的考察[J].文艺理论研究,2016(2):70-77.

[12][15][18]柯林武德.历史的观念[M].何兆武,张文杰,译.北京:商务印书馆,2004:38,307,176.

[13]尤瓦尔·赫拉利.人类简史:从动物到上帝[M].林俊宏,译.北京:中信出版社,2014:33.

[14]余英时.十字路口的中国史学[M].李彤,译.上海:上海古籍出版社,2004:77-78.

[16]高树博.远距离阅读视野下的文类、空间和文学史——弗兰克·莫莱蒂文论思想研究[M].北京:中国社会科学出版社,2016:7-15.

[17]哈·麦金德.历史的地理枢纽[M].林尔蔚,陈江,译.北京:商务印书馆,2015:70.

[19]曼海姆.意识形态与乌托邦[M].黎鸣,李书崇,译.北京:商务印书馆,2000:56-71.

[20]金观涛,刘青峰.中国现代思想的起源[M].北京:法律出版社,2011:16.

[21]老子[M].饶尚宽,译注.北京:中华书局,2006:130.

[22]梁晨,董浩,李中清.量化数据库与历史研究[J].历史研究,2015(2):113-128.

[23]卡尔-奥托·阿佩尔.哲学的改造[M].孙周兴,陆兴华,译.上海:上海译文出版社,2005:13.

[24]维特根斯坦.逻辑哲学论[M].贺邵甲,译.北京:商务印书馆,2005:85.

[25]Hartmut Lehmann,Melvin Richter(edited),the meaningofhistoricaltermsand concepts:new studieson begriffsgeschichte[M].German HistoricalInstitute,Washington,D.C.,1996:64-65.

[26][27]Hall D,Jurafsky D,Manning C D.Studying the history of ideas using topic models[C].Conference on Empirical Methods in Natural Language Processing,2008:363-371.

[28]Taylor Arnold,Lauren Tilton.Humanities Data in R:Exploring Notworks,Geospatial Data,Images,and Text[M].New York:Springerpress,2015:162-170.

[30]毛汉光.中国中古社会史论[M]上海:上海书店出版社,2002:4.

[31]迪安·鲁谢尔,约翰·科斯基宁,加里·罗宾斯.社会网络指数随机图模型:理论、方法与应用[M].杜海峰,任义科,杜巍,等,译.北京:社科文献出版社,2016:9,12.

[32]羊肉烤包子.结构与能动性的悖论,梁山的例子[EB/OL].[2015-05-10].https://www.douban.com/note/498409957/?type=like.

[33]Peter K.Bol.GIS,prosopography and history[J].Annals of Gis,2012,18 (1):3-15.

[34]金观涛,刘青峰.中国近现代观念起源研究和数据库方法[J].史学月刊,2005(5):89-101.

[35]王汎森.关于《执拗的低音》[J].读书,2013(11):140-145.

[36]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代:生活、工作与思维的大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2012:87.

[37]韩炯.从计量史学迈向基于大数据计算思维的新历史学——对当代西方史学量化研究新发展的思考[J].史学理论研究,2016(1):65-74.

[38]苏秉琦.满天星斗:苏秉琦论远古中国[M].北京:中信出版社,2016:VII-XI.

[39]赵汀阳.天下的当代性:世界秩序的实践与想象[M].北京:中信出版社,2016:135-154.

[40]谭凯.中古中国门阀大族的消亡[M].胡耀飞,谢宇荣,译.北京:社会科学文献出版社,2017:11.

猜你喜欢
主体价值文本
文本联读学概括 细致观察促写作
论自然人破产法的适用主体
何谓“主体间性”
作为“文本链”的元电影
在808DA上文本显示的改善
基于doc2vec和TF-IDF的相似文本识别
技术创新体系的5个主体
略论意象间的主体构架
一粒米的价值
“给”的价值