大数据引发的思考
——哲学界相关讨论的启示

2017-01-28 11:43何嘉荪浙江大学信息资源管理研究所张淑霞国家档案局档案科学技术研究所
浙江档案 2017年6期
关键词:德里达档案学

何嘉荪/浙江大学信息资源管理研究所张淑霞/国家档案局档案科学技术研究所

今日社会已经绕不开关于大数据的话题。关于它们,存在着多种意见。然而最困扰我们档案工作者的却是它们的属性:它们也都是档案吗?或者其中有的是,有的不是?它们也应该作为档案进行管理吗?面对上述问题大家议论纷纷、莫衷一是,至今没有众人都能接受的、足以一锤定音的结论。然而,这却让笔者想起了发生在上个世纪八、九十年代西方哲学界的一场关于档案问题的讨论,也令我们觉得有必要重新思考档案事业在整个社会中的地位。

1 焦点何在

什么是大数据?对此社会上并无太大的歧见,认为它们是一种规模大到在获取、存储、管理、分析方面大大超出传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征[1]。

据此,我国有不少人主张,它们当然也是档案。其中有的人比较直截了当,如河南省南阳市林业技术推广站的陈明洁著文指出:“在信息化时代,记录即是档案,数字化的记录一旦生成便变成了不可删改的档案。广泛应用于社会实践的税务管理系统、户籍管理系统、车辆交通管理系统等实时地将‘记录’转化为‘档案’,而每一条记录都将变成具有长期保存价值的档案,这些单位价值密度低的记录信息将作为不可分割的整体来发挥档案的价值。”[2]有的人在这个问题上则不是那么直截了当和有所保留,比如宝山钢铁股份有限公司的邹晔则仅仅指出,企业在运营管理的顶层设计中应注入档案要素,树立“大档案观”理念,“将一切具有利用价值的信息记录都可视为档案,而不论其所处过程、载体、类型、格式、媒介、保存期限如何”[3]。

与此同时,更多的人并不认同“泛化”档案的观点,在他们看来,大数据并非都是档案。上海大学的于英香认为:“档案数据与大数据的实时与动态性特征相异”,“大数据的‘大’不仅仅是数量上的大,还由于动态性与实时性所带来的数据加速度增长。档案数字资源更多的是滞后的、静止的、稳定的数据,比如已归档电子文件,档案数字化文件等数据信息,尽管其总体数据量也是巨大的,但是其增长速度,实时采集、动态获取能力与大数据所指向的相差甚远”。不仅如此,她还认为“档案数据与大数据的决策与预测性特征背离”。她说,“决策与预测是大数据的核心功能”,往往建立在实时随机产生的“全数据”基础之上。而“档案数据是经过鉴定后筛选的数据集,与大数据要求的‘全数据’特征相背离,因此,这些数据不适宜作为实时决策或者预测的基础数据。”[4]

两种观点哪一种正确?如何才能正确判断?我们想关键可能仍然必须聚焦于已经在中国档案界讨论了几十年的老问题:“什么是档案?”就是说首先必须思考大数据的特点是否套得上我们所共同认知的档案概念。很明显,这个问题关系重大!因为如果认为大数据都是档案,那么接下来的问题便是:对大数据的管理和开发,是否也属于档案工作?无疑,关于这个问题光是由我们档案界的人暗自讨论、私下偷爽不行。为此,笔者想向诸位介绍国际上哲学界关于档案问题的讨论。请注意,是哲学界而非档案界对档案问题的讨论,也就是说想向诸位介绍:那些专门研究宇宙的性质、宇宙内万事万物演化的总规律、人在宇宙中的位置等等最基本问题的学者,是如何认识档案的。这也许有助于我们档案工作者理解社会上其他界别的人士是如何看待档案事业的,并引起我们的反思。

2 哲学界的关注

关于哲学界对档案问题的研究,笔者与一位青年教师合作已经写了两篇介绍文章发表在《档案学通讯》[5]和《档案学研究》[6]上,第三篇也即将问世,这里只想做个简述。

为什么西方哲学界会对档案问题感兴趣?如果追溯历史,可以发现从近代以来,人世间信息的沟通交流(Communication)过程和手段,既包括我们的感觉器官、语言、文字,也包括所有各种传统的以及现代的记录手段和媒介通讯交流等方式,比如报纸杂志图书、电影电视、新媒体等,它们是如何塑造了人类知识和行为问题的讨论,已经成为一系列学术和其他领域关注讨论的中心。在此背景之下,文件和档案作为语言、书写(包括电脑录入)、摄影摄像等沟通交流手段运行的成果和存在形式,近几十年来亦受到了关注,因为文件档案是人类社会中最早产生且使用范围最广、最重要的沟通交流手段。无可否认,人们记录、交流、储存信息的需要,促成了文件档案的诞生。而这正是孕育、催生社会文明嫩芽的基础,因为人们所需信息在人体之外的储存和不断积累增多,最终导致了社会文化和文明的诞生与发祥。不仅如此,档案更是沟通过去与现在,沟通历史与现实的最重要、最可信赖的媒介。档案以及与之相关的人类行为,究竟是如何构建人们对周围世界历史和现实的认知的,成了学术界,尤其是后现代哲学界研究的一个焦点。一些哲学家、社会学家因此在论著中涉及了档案问题,其中最著名的是《档案热病——弗洛伊德印象》。这本书实际上是世界著名的后现代主义哲学大师J·德里达在维也纳弗洛伊德纪念馆(博物馆)开馆仪式上系列演讲稿的汇集,他利用演讲的机会,对弗洛伊德提出的用精神分析法探查(Access)人们潜意识内‘心灵档案’问题进行了评论,借此提出了自己的‘档案观’,既涉及什么是档案的问题,也涉及档案化的问题[7]。

全世界知名的心理学家弗洛伊德创立的精神分析法,事实上承认所有的人类记忆,哪怕仅仅存在于人们的潜意识之中,都是档案。德里达则坚决不同意把仅仅存在于人们脑海中或心灵深处的记忆也称为档案并进行了批驳,这也就成了他的上述著作的主题。

他说:“档案概念自身,当然庇护的是对所谓本原(Arkhè)的记忆。然而,它也从它所庇护的记忆,庇护了它自身:归根结底,也拯救了它所要忘记的它自己。这没什么可意外或惊讶的。从某种意义上来讲,这个术语确实如有人所确信的那样,指的是本原(Arkhè)在物理、历史或者本体论上的含义,即指向的是原初,最先、最主要的、最原始的,简而言之即开始。” 他又说:“档案不可能既不与其物质载体相关,也不与存储场所相关。”他认为:“那些并非总是散乱无章文字的文件,仅仅在档案的头衔之下凭借特权的拓补结构而得到保管和分类。它们常放置在不寻常的地方,即法律与特权交织进行选择的地方。”德里达强调指出:“就这样,决定了住所,决定了软禁的场所,档案也就诞生了。”[8]结论就是:“第一,档案必然是一种外在于人体的物质,也是其形成者社会活动的产物,它与‘本原’概念相对应,集‘开启’与‘戒令’两种原则于一身;第二,它必须在一定地方得到存放,在那种他所谓的‘拓补学和法理学交织,位置与法律交织,物质载体和权威交织的地方’。”[9]“如果没有置放的地方,没有复制技术,没有一定的外部性,就没有档案。档案都具有外部性。”[10]

与此同时,德里达还将世上所有个人的、社会的、机构的以及技术上的信息交流过程(Communications Process),全部归结为“是一种档案化(Archiving)过程,或者即他所谓的‘档案化’(Archivization)”[11]。他说:“The archivization produces as much as it records the event”。此地the event,我们认为可以泛指(人类)“活动或事件”。因此这句话可以直译为“档案化生产的与它所记录的活动一样多”,如果意译,就可以译成:“档案化就是对人类活动的记录”。也就是说,如果“Record”用作名词,在相似的语境(或在档案学文献)中,在德里达看来,就完全是档案化的成果,是所有的在人体之外有形载体上得到记录的信息或人类记忆。而要将这些信息或人类记忆有效地记录下来,就必须依靠一定的技术工具或复制技术(Technique of Repetition),这也就是德里达所谓的技术结构。为此德里达创造了一个词汇,将利用这些技术或工具进行Archiving的现象、过程或成果,称之为Archivization。他甚至将这些技术工具自身也概称为“档案机器”(Archival Machines), 他说:“不,档案化档案的技术结构也决定了档案内容的结构,甚至紧密嵌入其现状并关系其未来面貌。档案化生产的就是它记录的活动。这也就是我们对所谓新媒体的政治经验。”[12]

依据以上叙述,可以认为德里达实际上主张,只要是具有“本原”性的、在人体外得到记录和存放的信息,就是档案;而世上一切以人体外物质为载体的通讯交流过程都可以归结为档案化。

3 大数据都是档案

笔者觉得德里达的上述观点与我们和我国许多学者的主张,是相吻合的。我们主张:Records(也就是“文件”,这是我国档案界的主流译法)是“一切具有原始性的、在人体外得到记录的信息, 它是作为人们进行社会活动的工具而形成的。”正是从这个意义上,中国人民大学的陈兆祦教授和笔者,以及不少学者 “认为一切信息资源(不管是载录在胶片、磁带、磁盘、光盘等现代载体中或者储存在网络云端及计算机等现代信息工具中,还是记录在纸张以及其他原始物质载体之上的信息),包括图书、报刊、情报、广播信息、电视信息、电影以及个人的信件、笔记、日记……等在内,在它们形成之初,都首先经历了文件(Records)的阶段。然后‘原件’归档,其他的‘重复件’‘复制件’等等则作为情报、图书、资料、大众传媒信息、电影……等传播出去。”[13]也就是说,世上一切在人体外得到记录的信息,亦即档案化的成果,在其开始阶段都是“文件”(Records),然后有的(其正本或样本)得到保存成为“档案”(Archive);有的(大多为副本)则进一步向外传播,成为图书、报刊、情报、电影、广播电视等;而它们在必要时又都可以再转化为‘档案’”。

那么,大数据是档案吗?首先,它们肯定都是在人体外得到记录,具有“本原”性并且存储于电脑网络云端,因而符合德里达描述框定的档案观念。至于有些同志认为,档案必须是“滞后的、静止的、稳定的”和“经过鉴定后筛选的数据集”,我们觉得这仅仅是我国部分学者面对档案现象的个人感悟,并非在世界各国通行的标准。

altitude mountainous areas in the middle part of Heilongjiang Province LI Qiang(21)

笔者认为,问题的关键可能首先在于:这些“实时的”“处于变动之中”的大数据,是否得到了记录?包括反映其变动状态、过程在内的数据,是否都得到了记录,并且它们也都在一定的地方得到了存放?如果是的,那么为什么它们就不应该被看作档案呢?它们当然既能服务于对历史,尤其是变迁、动态历史和趋势的研究,更能同样用作决策和预测。这是档案数据发挥应有社会功能的重要方面,档案工作者完全没有必要受传统观念束缚而自我设限。

其次,关于档案必须是“经过鉴定”的命题,如果翻查一下分别在世界各国通行的档案定义,可以发现:极少有国家明确将这一条写进去。通常的做法是,规定档案必须具有一定的保存价值。但是,正如笔者曾一再著文强调的那样,“价值”事实上是一个颇具弹性、也极难直接度量的概念。在档案工作领域,人们通常用“保存期限”作为衡量的它的尺度。 但是除了美国等一些国家将“永久保存”规定为档案的价值尺度,其他国家(比如我国)在这个问题上则都笼统以对。

于是问题来了,究竟具有多长时间保存价值的文件(Record),才应该作为档案保存?我国由于规定了文书档案应于产生形成后第二年归档,故而其保存期限应该大致不少于一年左右吧。法国、西班牙等广大拉丁语系国家,则将档案的头衔也授予了刚刚产生形成的现行文件。在这些国家,文件(Records)与档案(Archives)概念常常混用、不加区分[14],因为所有的文件只要形成了,都至少有保存一刹那时间的价值,即得到了暂时的保存,故也可以称为档案。在浙江大学档案学专业留学的韩国研究生告诉笔者,在韩国语言中“文件”和“档案”概念更是共用同一个词汇“”(记录)。也就是说,在韩国并不存在对“文件”和“档案”概念的区分,韩国语言中也根本没有与汉语词汇“档案”直接“一对一”的词汇。只不过近年来随着档案专业界国际交往的增多,为了便于外国同行的理解,韩国官方才将需要永久保存的 “”(记录),翻译成了Archives(档案);其他的则保留“”(记录)的称呼,翻译成英语则是“Records”,译成中文则有时为“文件”,有时干脆直接译成“记录”或“记录物”(

)。与此同时,永久保存记录的机构——韩国“国家记录院”也就翻译成了中文的“国家档案馆”和英语的“National Archives”。也正因为如此,这些国家的档案定义中都基本没有必须具有“保存价值”的规定,当然更不可能规定必须经过鉴定。正因为如此,1994年笔者之一在西班牙的档案部门当访问学者的时候惊讶地发现,那里的鉴定程序都是在文件获得档案称号以后若干年才展开的。2001年11月浙江大学信息资源管理研究所曾经举办了“OA系统与电子档案管理——理论与实践”国际学术研讨会,与会的国际知名电子文件管理权威戴维·比尔曼先生(David Bearman)就干脆主张,鉴于电脑及其网络具有海量存储功能,今后电子文件存档的时候可以考虑不必再进行价值鉴定,而是全部保存。

4 重新思考定位

综上所述,按照德里达的思路走下去,也根据笔者以及我国不少档案学者的观点,大数据都是档案。我们想对于这一点,除了我们档案工作者自身略感犹疑以外,社会上绝大多数人士都是可以接受的。然而,接踵而至的问题便是:管理、开发它们的工作是否也可以看作一种“档案工作”?国家档案管理部门也应该对它们实行监管吗?这句话迎来的极可能是嗤之以鼻的质疑:档案工作有那么“伟大”吗?太夸张了吧?!

这里先引用笔者刊登在去年《档案学研究》第3期上的文章《后保管时代档案学基础理论研究之四——档案化问题研究》中的一段话:“德里达既然将世上一切信息交流过程概括为档案化过程或他所谓的档案化,正如奈史密斯教授[15]所评述的,在德里达心目中档案工作或档案事业事实上处于整个社会生活的核心。此前,弗洛伊德就强调了在生活的一切方面,档案(当然是他心目中的档案)至关重要的核心位置。德里达以及其他后现代主义哲学家的论著更加强了国际学术界对此的认识:在广义档案的世界中,档案事业也处于我们社会生活的核心,这应该能极大地鼓舞档案工作者关注我们自己的工作、自己的事业的重要性。”[16]是的,不必妄自菲薄。既然所有得到储存的数据信息,就是档案,都是我们社会的宝贵财富,那么大数据的管理和开发也列入处于社会生活核心位置的档案事业,并不为过。

当然,这样说并不意味着大数据现在就也应该交给档案部门管理。事实上以目前我国档案部门的人员知识结构和设备状况,绝无此种可能。在当前情况下,由(获得政府有关部门支持并与之签订协议的)大型科技网络公司经营的云端平台收存、管理大数据,更为合理。我们可以设想,将档案工作区分为狭义和广义两种。狭义的,就是传统的、我们一般意义上理解的、得到国家档案行政部门监管的档案工作;广义的则可以如德里达思考的那样,包罗万象。这样认知问题的益处,主要在于提升整个社会的档案意识和研究未来的前景。

注释与参考文献:

[1]转引自:周峰、季雪岗. 大数据背景下档案利用方式研究与实践[G].中国档案学会.大数据时代的档案工作.北京:中国文史出版社,2016:299-304.

[2]陈明洁.大数据时代对档案现代化影响和要求[J].档案管理,2013(6):48-49.

[3]邹晔.大数据、大档案、大价值——大数据时代企业档案工作的转型思考[G].中国档案学会.大数据时代的档案工作.北京:中国文史出版社,2016:295-298.

[4]于英香.档案大数据研究热的冷思考[J]. 档案学通讯,2015(2):4-8.

[5]何嘉荪,马小敏. 德里达档案化思想研究之一——从档案概念说起[J]. 档案学通讯,2015(4):23-27.

[6]何嘉荪,马小敏. 后保管时代档案学基础理论研究之四——档案化问题研究[J]. 档案学研究, 2016(3):4-11.

[7]参见何嘉荪,马小敏. 德里达档案化思想研究之一——从档案概念说起[J]. 档案学通讯,2015(4):23-27.

[8]Jacques Derrida. Archive Fever: A Freudian Impression, trans. Eric Prenowitz.Diacritics, Published by: The Johns Hopkins University Press ,Vol. 25, No.2(Summer, 1995), 9-63.

[9]何嘉荪、马小敏. 德里达档案化思想研究之一——从档案概念说起[J]. 档案学通讯,2015(4):23-27.

[10]Jacques Derrida. Archive Fever: A Freudian Impression, trans. Eric Prenowitz.Diacritics, Published by: The Johns Hopkins University Press,Vol.25,No.2(Summer,1995), 9-63.

[11]Thomas Nesmith. Seeing Archives:Postmodernism and the Changing Intellectual Place of Archives. The American Archivist, Vol. 65 ( Spring /Summer 2002 ) : 24-41.

[12]Jacques Derrida. Archive Fever: A Freudian Impression, trans. Eric Prenowitz.Diacritics, Vol.25, No.2 (Summer, 1995), 9-63. He wrote:“No,the technical structure of the archiving archive also determines the structure of the archivable content even in its very coming into existence and in its relationship to the future. The archivization produces as much as it records the event. This is also our political experience of the socalled news media.”

[13]何嘉荪,史习人. 凡是具有原始记录性的文献都是文件[J].浙江档案,2003(3):8-11.

[14]何嘉荪. 从世界范围研究文件与档案的本质区别——从电子文件的网络实时归档说起[J]. 北京档案,2000(7):15-18.

[15]托马斯·奈史密斯教授(Professor Thomas Nesmith),加拿大马尼托巴大学(University of Manitoba)档案学专业教授.

[16]Prof. Thomas Nesmith wrote to us in his E-mail on 18 Feb. , 2014: “Freud provides Derrida an opportunity to reflect on archives in the broad allencompassing way I mention above (which does include the more conventional archives we archivists denote when we use that word.) Indeed, Freud's work seems to have underlined for Derrida the vital centrality of archives in all aspects of life, and thus we archivists can be encouraged that our part of that broad archival world is also at the centre of our societies' life. Of course, that one of the leading philosophers of our day -- Derrida --has seen this and has prompted similar discussion in many fields -- should encourage archivists greatly in regard to the importance of our work. But that also presents greater challenges for archivists as well. ”

[17]http://www.donews.com/article/detail/4089/9927.html(科技好文章2017-06-05 10:26:08).

猜你喜欢
德里达档案学
历史追溯与革新路径:中国档案学基础理论研究的特征阐释
青岛市档案学会举办2020年档案学优秀成果和优秀论文评选
德里达前期隐喻思想的存在论维度
德里达的解构主义文学观解读
——以《在法的前面》为例
近十年来国内德里达研究的三条路径
雅克·德里达的解构与马克思主义哲学方法论
浅析德里达的解构翻译思想
档案学学科入门指导课程专题设计探讨
德里达论隐喻与摹拟
档案学本体论研究