陈 建 丁 越
(山东大学历史文化学院 济南 250100)
“众包”这一概念是由美国《Wired》杂志的记者Jeff Howe 在2006年6月提出的,他认为众包是“一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的大众网络的做法”[1]。众包模式在许多行业得到迅速应用,图书馆、档案馆、博物馆(Library,Archives and Museum,以下简称LAM)领域也不例外,近年来,国内外许多LAM 机构依托馆藏丰富档案资源,开展了丰富多彩的档案众包活动。国外较为成功的档案众包项目如伦敦大学学院图书馆边沁手稿转录项目[2]、美国国家档案馆公民档案工作者项目[4]等。其中,边沁手稿转录项目是2010年由英国伦敦大学学院图书馆发起的针对英国著名哲学家、法学家、经济学家杰里米·边沁的手稿转录众包项目,公民档案工作者项目旨在号召公众参与收集、转录、标注与美国历史相关的档案资料,二者都取得了较为成功的效果;国内档案众包的典型代表是上海图书馆的盛宣怀档案抄录项目[5],项目于2017年发起,旨在通过众包鼓励公众抄录洋务运动代表人物盛宣怀的档案,与类型相似的边沁手稿转录项目相比,边沁手稿转录项目仅用10天就转录了近两百份手稿,吸引了全球91 个国家的档案转录志愿者参与[6],而盛宣怀档案抄录项目从发起至今只完成其中23 个任务,且任务进展比较迟缓。导致这一差异的原因有很多,比如公众参与意识、管理水平、激励机制、质量控制、宣传推广等,笔者认为,这些因素与信息交流都存在不同程度的关联,由于档案众包面对的是非特定的广大公众,因此公众在参与工作前或许对于工作本身甚至是LAM 机构都一无所知,如果想要得到满意的工作结果,良好的信息交流在其中就发挥着十分重要的作用。
根据马费成对于信息交流的定义,信息交流指的是信息在不同的空间和认识主体之间借助相应的符号系统所进行的信息传递与交流过程[8]。档案众包模式中的信息交流具有依托网络、注重反馈、信息质量要求高、围绕工作的目的导向等特点,对于档案众包模式的成败至关重要,应当引起LAM 机构的足够重视。通过文献梳理可知,目前国内对于档案众包模式的研究主要围绕实践经验介绍、国内外对比、应用分析、实施路径等方面展开,还没有学者从信息交流的角度对档案众包模式的信息交流行为进行专门细致分析。基于此,本文从信息交流的角度出发,结合国内外档案众包实践案例,尝试构建档案众包模式信息交流的逻辑架构,探讨众包模式信息交流中存在的问题并提出完善进路,以期为提高LAM 机构众包模式成功率提供可行建议。
信息交流理论认为信息交流需要具备信息发送者、信息接收者、交流通道、支持条件等要素,信息交流可以分为信息产生、信息发布、信息接收等阶段[7]。以此为指导,档案众包模式中信息交流的核心要素包括LAM 机构、众包平台、众包工作者、外部大众以及合作条件五个方面,信息交流阶段可以分为信息产生、信息发布、信息接收以及信息交互四部分,档案众包模式中信息交流的逻辑架构如图1所示。
图1 档案众包模式中信息交流的逻辑架构
档案众包模式中的核心要素包括LAM 机构、众包平台、众包工作者、外部大众以及合作条件。
档案众包项目的组织者主要为LAM 机构。它又可以细分为需求者和发布者两部分,需求者提出众包需求,发布者对外进行项目发布。LAM 机构往往人力财力等资源有限,而档案众包恰恰能以较低成本集成最大范围内社会认知盈余,挖掘档案内容、促进档案开发利用、缓解档案工作者压力[8]。如上海图书馆、美国国家档案馆等LAM 机构想要转录或标记馆藏档案资料,但这些档案众多且杂乱,仅靠LAM 机构自身的力量难以完成,通过分析发现众包是解决问题的最佳方案,因此提出并对外发布众包需求,需求者和发布者由于其不可分割性被视为同一主体。
LAM 机构可以选择将众包信息发布在自建平台、专业众包平台、社交媒体甚至是其他合适平台上。自建平台指的是LAM 机构依托官网设置的独立众包网站;而专业平台一般指专门发布众包任务的平台,如Zooniverse、Kickstarter、阿里众包等;社交媒体则指的是Facebook、Twitter、博客、微博等,可以接触到更大群体,也是发布众包工作信息的重要渠道。
众包工作者也可以称为众包参与者。众包工作者即最终进行工作的群体或个人。众包工作者按照要求完成众包工作,其中最优秀的工作者将会获得奖励,但奖励不一定是实物奖励,例如在边沁手稿转录项目、公民档案工作者项目中,平台对于工作者不发放实物奖励,只给予个人积分荣誉,但工作者仍会出于自身对边沁本人的兴趣、对于美国历史的兴趣参与进来。
外部大众即没有直接参与众包过程的社会大众。外部大众虽然不直接参与众包工作,但仍然接收众包项目传递出的信息,并且可能会对项目提出一些意见和建议,其意见和建议有利于帮助LAM 机构改进众包的方式。
合作条件分为内部条件和外部条件两部分。内部条件即双方的合作意愿、双方的合作能力等,例如边沁手稿转录项目中隐性要求了参与者对于边沁本人的兴趣以及阅读书信、识别文字的能力等。外部条件包括技术条件、法律法规、行为道德等。
档案众包模式信息交流架构的整体流程可以分为信息产生、信息发布、信息接收以及持续进行的信息交互四个阶段。
LAM 机构根据自身需要提出工作需求并对外发布工作内容和相关信息,这便是信息产生阶段。LAM机构需要在项目主页对项目进行一个细致描述。例如公民档案工作者项目首页给出了详细的项目概述以及工作者须知,边沁手稿转录项目页面提供了关于边沁、边沁项目概况、相关组织机构以及相关活动等的详细介绍。信息产生阶段作为信息交流整个流程中的第一阶段,其提供的信息质量直接影响到后续信息交流的质量和整个项目的工作质量。
信息发布阶段LAM 机构可以选择自建平台、专业平台或者社交媒体来发布众包信息。如边沁手稿项目依靠伦敦大学学院官网建立自建Transcribe Bentham 平台,盛宣怀档案抄录项目也自建了上海图书馆众包系统,而美国国家档案馆不仅依托档案馆官网建立了公民档案仪表盘平台,还同时运用专业平台Zooniverse 发布转录任务,同时利用Flickr 社交媒体进行照片标注。
信息接收可能是有意的也可能是无意的。事先有明确意向从事档案众包工作的众包工作者会在相关平台或社交媒体上有目的地进行查找,来获取相关工作信息,结合自身情况进行选择。事先没有意向从事众包工作或者是没有明确工作内容倾向的工作者可能会在浏览过程中无意发现自己感兴趣的工作,然后根据自身情况做出选择。
信息交互在工作者接收工作信息以后开始并持续至工作结束,主要通过平台预留方式和社交媒体等渠道进行交流,边沁手稿转录项目、公民档案工作者项目和盛宣怀档案抄录等都会在平台给出邮箱、社交媒体等联系方式,同时也存在诸如发布会、宣讲会等辅助渠道。信息交互的必要性体现在,众包工作者在选择工作的过程中可能会存在一些疑问,他们会通过LAM 机构预留的联系方式来与组织者建立联系并提出相关疑问,然后根据交流结果决定是否选择这份工作。如果工作者接受了这份工作,也需要在工作开展过程中开展进一步的交互,一方面,工作者可能存在很多问题需要沟通,否则会使工作无法正常进展;另一方面,LAM 机构一旦发现工作方向严重偏离了要求或者工作者对工作存在误解,需要及时给予工作者指导,否则很难获得满意的工作结果。
按照交流对象的不同,档案众包模式中的信息交流主要分为三种类型(见图2),即LAM 机构与工作者的信息交流、工作者之间的信息交流以及项目内部与外部大众的信息交流:
图2 档案众包模式中信息交流的类型
LAM 机构与工作者之间的信息交流是持续的、双向的。LAM 机构首先要向工作者传递工作需求信息、工作内容信息、工作要求信息等,并在众包工作进行中及时向工作者传递新的工作内容信息或工作要求信息,众包工作者接收信息并进行工作,在工作过程中反馈有关自己工作进展或工作疑惑的相关信息。LAM 机构与工作者的交流伴随众包工作的始终。
在档案众包模式中,虽然工作者之间在工作量排行上可能存在一定竞争关系,但大多情况下工作者之间往往需要密切的信息交流来协作完成工作任务,许多工作者也非常乐于与志同道合的人共建社区,分享工作心得和交流信息。例如在盛宣怀档案抄录及边沁手稿转录项目中,虽然档案转录项目是个人工作,但工作者之间仍然存在交流,在其主页工作者均可以看到其他工作者的工作成果,但二者的设置存在一些差别,盛宣怀档案抄录项目主页不能与其他工作者进行交流,但边沁手稿转录项目主页则可以点击访问其他工作者主页查看他参与的所有项目及向他发送信息,工作者可以根据反馈对工作进行修改。
最后,大众传播贯穿众包过程的始终。外部大众虽然没有直接参与众包工作,但他们也在有意或无意地与众包组织者或工作者进行着信息交流,在上述各项目的主页,均有工作者积分排行榜等公开信息供大众参考,边沁手稿项目还会组织优秀的工作者进行活动和演讲,发布月度通讯。众包工作传递出的各种信息会影响大众对于该项目的看法,大众可以通过项目主页预留的联系方式与LAM 机构取得联系,大众对于众包的看法也会影响LAM 机构以后的工作组织方式和众包工作者日后的工作方式和工作选择。互联网具有开放性,众包过程始终处于大众的监督之下,这一方面有利于信息的传播,可以吸引更多的人参与进来,扩大影响力,另一方面也对参与工作的双方提出了要求,对于LAM 机构来说,需要认真撰写要求,积极提供工作配合,按时给予奖励来保持自己的形象,工作者也需要认真完成工作来维持良好的声誉。
档案众包项目的成功与其良好的信息交流有着密切关系,成功的边沁手稿转录、公民档案工作者等众包项目都十分重视信息交流问题并采取了一系列促进信息交流的措施,而开展不利的众包项目则在信息交流方面问题多多,结合项目调研结果,档案众包模式中信息交流的现实问题总结为以下三个方面:
信息忽视主要体现在信息发布阶段和接收阶段,指的是LAM 机构发布的工作信息并没有成功吸引到合适的众包工作者,可能是没有清楚表达工作需求,或者选择了错误的宣传方式或众包平台。边沁手稿转录项目曾经在权威报刊《纽约时报》刊登项目文章,该文章还得到了《纽约人》报刊的推荐,使该项目注册用户增加了两倍以上。而盛宣怀档案抄录项目则没有和权威媒体进行合作,目前可见仅南京大学相关网站简单刊登了与盛宣怀档案抄录项目合作的信息,在上海图书馆网站、微信公众号等平台均未检索到其他相关报道[9]。另外相比于英国伦敦大学学院官方网站,上海图书馆网站的知名度欠缺,宣传效果差。在工作信息表达方面,边沁手稿转录、公民档案工作者等项目建立了专门的详情介绍网页对项目的情况及意义进行阐述,甚至附有视频短片,而盛宣怀档案抄录项目页面简单,虽然也有项目介绍但只是单纯的文字阐述且没有放在明显的位置。完整的信息交流要求同时具备信息发送方和信息接收方,任何一方都不能缺失,如果LAM机构发出的众包项目信息没有有效地传递给公众,就会造成众包信息的忽视,从而无法达成有效的信息交流。
信息阻塞发生在信息交互阶段,指的是LAM 机构与工作者没有进行有效的信息沟通,具体表现为LAM 机构没有积极与工作者进行沟通,或者工作者闭门造车没有与LAM 机构建立交流,主要原因可能是双方主观上没有建立交流意识或者客观上不具备信息交流的条件和环境。信息交流条件和环境是首要条件,一方面,好的信息交流环境和条件往往可以启示和激发交流的意识和主动性,另一方面,如果没有良好的信息交流条件和环境,即使工作者想要和LAM 机构进行交流,也往往碍于交流难度而止步。因此,是否具有便捷的交流方式以及良好的交流环境至关重要。在公民档案工作者项目中不仅在页面留有邮箱联系方式,同时还开通了Twitter、Facebook 等渠道,并且构建了工作者之间相互交流的社区,积极举办线下的如演讲、培训等交流活动,同时还积极利用Flickr 等社交媒体众包平台的评论功能,工作者以及外部大众在不需要注册登录的情况下都可以查看针对每一张照片的评论。相比之下,盛宣怀档案抄录项目平台的信息沟通渠道相对简单,工作者仅仅通过页面中“我的通知”模块来获取项目最新动态,通过“我的反馈”功能来提出意见或进行举报,且均需要使用读者证件注册登录后才能进行查看,也未举办过有影响力的线下交流活动。
档案众包成果是由网络大众基于双方或者三方协议以LAM 机构提供的档案资源为素材进行的二次创作,档案众包成果在版权归属方面往往存在一定的异议[10]。随着社会的发展和人们素质的不断提高,公众对于版权的保护意识越来越强烈,众包项目中多个阶段都涉及版权保护的问题,如工作者使用的素材是否属于版权保护的客体;如何处理工作者提交的创造性作品,是否与公众共享;这些作品经过筛选、整理、汇编、挖掘等,最终形成具有独创性的成果,成果版权如何界定,这都需谨慎合理的应对[11]。LAM 机构在开展众包活动时给予详细的版权说明不仅仅是为了避免法律风险,也是在对外传递认真负责的信号,公众感觉到LAM 机构对于自身工作的尊重和保护,会更愿意参与到项目中来。调研发现,大多档案众包项目均将版权问题作为最重要的因素并放在项目介绍中的显眼位置,但也有个别项目网页中对于版权问题没有给出明确说明,公众并不清楚自己的成果所属,从而引发版权问题的不确定性,一旦发生严重版权纠纷,将对项目形象带来重大负面影响。
参照中外档案众包模式中信息交流的经验和不足,结合信息交流对于交流主体、交流通道以及交流条件等方面的特定要求,现对档案众包模式信息交流提出以下几点完善建议。
信息产生和发布作为信息交流的中上游阶段,在整个信息交流过程中起到决定性作用,工作声明和任务指南是LAM 机构对外发布信息的最主要载体,清晰准确的工作声明和任务指南是信息交流的基本前提和保障,是任何一个成功众包项目的必备要素。工作声明指的是LAM 机构对于自己以及众包项目或相关人物、事迹等的详细介绍,任务指南是工作者如何开展工作的具体指导,二者缺一不可。如边沁手稿转录项目首先提供了关于边沁本人以及众包项目的详细介绍,同时提供了清晰的转录指南,包括标题、页脚如何处理,如何添加、删除文本,如何处理无法识别的内容等具体详细的操作信息。要想提供一份详细的工作声明和任务指南,一方面需要认真布局,在工作声明中解释这项工作到底要做什么,在任务指南中确保工作者了解工作流程,说明工作报酬,提出加分项和减分项以及总结验收标准。另一方面也需要注意信息传递的方式,为了帮助工作者加深理解,可以在页面添加一些图片视频等,必要时还可以针对个别条款撰写更加详细的说明书。
为了应对信息阻塞问题,LAM 机构需要创建良好的信息交流条件和信息交流环境。交流条件指的是提供丰富便捷的信息交流渠道,包括工作者与组织者的交流渠道以及工作者之间相互交流的渠道。工作者与组织者的交流可以通过邮箱、微博、微信公众号等,一方面,组织者应保证及时反馈和回复工作者提出的问题,另一方面,应积极主动对外推送项目消息、最新进展等信息。通过张轩慧、赵宇翔以盛宣怀档案抄录项目为研究案例的随机抽样调查发现,用户参与意愿影响因素中非常重要的一点就是任务信息的及时更新与推广,几乎所有受访者都谈到了如果项目发布方能够定期通过微博或微信公众号给他们推送一些有意思的相关信息,这样更能够增强他们对该项目的黏性[12]。工作者之间的交流通过创建社区或者工作者主页留言等功能实现,工作者之间的良好交流互动有利于增强工作者的归属感。在边沁手稿转录项目中可以看到活跃的工作者交流社区,工作者之间可以相互查看、留言。美国国家档案馆甚至提供了专门的沟通平台“历史中心”来方便工作者进行交流和问答,营造工作者之间交流讨论的环境。
此外,档案众包项目也要注重与外部大众的交流。信誉和形象是组织者和工作者均应维护的重要因素。与外部大众的交流同样是双向的,LAM 机构需要对外传递良好的信号,同时也要主动去了解大众的评价,收集大众的反馈。对外传递良好信号即树立项目的良好形象、积极展示项目成果等。可以借鉴边沁手稿转录项目与媒体开展合作,如《纽约时报》对于边沁手稿转录项目的宣传以及《纽约人》报刊对于项目的推荐,同时该项目还积极组织马拉松等活动,定期发送通讯汇报项目成果等等,这些方式均有利于对外释放良好的信号,吸引更多的工作者参与进来。而大众反馈可以通过不定期发放调查问卷,进行随机采访,建立留言区等方式获取,LAM 机构根据大众的评价和反馈来不断进行自我完善,可以提高项目的可持续性。
作为信息交流的渠道,用户在参与众包任务的过程中最先、最直接接触的就是众包平台,它们极大地影响着用户对众包的参与意愿和满意度[13]。LAM 机构每一种平台都有其优势与劣势,没有完美的平台,LAM 机构依靠官网构建的平台具有真实性、纯洁性、安全性[14],能够提供更加丰富的工作信息,提高项目可信度,但需要组织者具备建立和运营平台的专业技术。专业平台的优势是拥有召集群体的渠道,能提供关于众包的专业技术支持,同时提供记账、打分、数据分析等辅助功能,局限性在于模式比较固定缺乏灵活性,可能会增加额外的平台费用等。社交媒体专业性和可靠性相对欠缺,但作为网络2.0 时代以来信息交流的重要渠道,可以获得更好信息传播效果,可以用来开展一些任务简单的众包。大部分LAM 机构倾向于利用自身官网的影响力和公信力来自建众包平台,例如伦敦大学学院图书馆、美国国家档案馆等均主要通过自建平台来开展众包,但不可否认的是,利用专业众包平台和社交媒体等也不失为好的选择,如美国国家档案馆在利用公民档案仪表盘进行档案转录、标记的同时,还将部分转录项目交由Zooniverse 平台进行展开,同时利用Giphy、Flickr、Foursquare 等社交媒体收集主题相关的照片以及对照片进行标记、评论等。由此可见,LAM 机构不必局限于某一种众包平台,可以综合利用多个平台,采取自建平台与社交媒体结合、专业平台与社交媒体结合等方式,结合不同平台的优势,提高众包成功率。
信息首先需要传递出去,才能被工作者接收。档案众包是较为新兴的模式,再加上LAM 机构与公众又存在一定距离,这些不利因素均要求对众包项目进行积极主动地宣传,并与相关机构建立合作关系,让项目工作信息走近公众视野。信息忽视不仅仅发生在项目发布阶段,它有可能发生在项目的任何阶段,因此项目宣传不仅指项目最初的宣传活动,还包括项目进展过程中随时对外汇报项目进展、成果等一系列宣传举措。在边沁手稿转录、公民档案工作者项目主页我们都可以看到详细的媒体合作信息,表明这些LAM 机构对于媒体合作和宣传的重视。此外,除了大规模广泛宣传以吸引更多参与者以外,还应进行一些有针对性的宣传,如在边沁手稿转录项目中,除了与权威报刊《纽约时报》合作以外,为了吸引更多高校的教师和学生,边沁手稿转录项目在大量学术论坛和网站投放广告,组织在校学生参观边沁手稿转录项目,这些宣传举措都起到了非常好的效果,吸引了更多专业人士参与到项目中来。
针对众包中容易发生的信息风险问题,LAM 机构需要在工作前就提供一份清晰的版权说明,避免在后续工作中引起不必要的纠纷。1914——1918 在线项目具有很好借鉴意义,其主页清楚说明了上传材料的工作者有责任获得版权所有者的书面许可,该书面许可副本要同材料一起提交,未经此类许可收到的所有材料都有被排除在出版范围之外的风险,另外,所有工作者需要同意平台规定的“作者协议”,协议中详细规定了使用权授予、权利保障、协议生效等具体条款。边沁手稿转录项目对该问题也给出了很好的处理,在其网页可以看到明确的隐私条款、版权说明及相关处理办法,包括工作者姓名出现在转录文本的元数据中等明确说明。由于工作者的版权意识和能力水平参差不齐,LAM 机构需要给出的往往不仅是简单的版权说明,在众包工作正式开展前LAM 机构可以进行公开的版权知识培训,提高工作者的版权意识,同时给出详细版权说明并显示在项目主页的明显位置,必要时可以在工作前与工作者签订版权协议,在工作过程中严格执行相关规定并加强审核,最终形成的成果也要严格按照规定注明版权所有者,避免任何可能干扰项目成功的信息风险。
档案众包是互联网时代LAM 机构开展数字资源建设的新兴方式,LAM 机构要想真正发掘出众包的巨大潜力,必须重视信息交流在其中发挥的重要作用,构建融合信息交流各核心要素和流程阶段的信息交流逻辑架构,采取有效措施解决信息交流中存在的各种隐患,不断优化众包模式信息交流行为,提高档案众包成功率。