文/雷 荣 尹 君
本文立足于基层企业管理环境,利用Python的中文分词工具,分析文档信息形成的特征和文档信息利用的特点,探寻文档信息形成场景和利用场景之间的规律,构建用户画像和文件之间的关联,实现文档信息的智能服务
档案管理部门管理对象多样化,包括纸质档案、电子档案和业务系统中在线归档的档案数据。“几乎可以肯定的是,未来文档管理一定是处于多态并存的局面,因而对管理对象的态势感知显得尤为重要,不同态别的对象需要与之配套协同的管理手段和方法。”[1]面对多态的管理对象,档案管理需要采用精细化的管理方法和手段,探寻智能化的利用服务方式。虽然档案利用逐步实现了电子化和网络化,但是仍局限于以文件为单位的利用服务,档案数据的深层次开发缺乏需求导向。档案工作者需要掌握一套快速、准确的响应用户的需求,提供档案信息智能服务方法和能力。
在企业运行较为成熟的办公自动化系统中,提取该系统中核心业务数据进行词频分析。在实际的公文处理活动中,公文的数据可以分为发文形成的数据和收文形成的数据。选择公文标题和责任部门(形成部门和承办部门)两个维度,分析公文数据的形成和处理情况。
在规范的公文标题中包含发文机关名称、事由和文种这三个要素,其中“事由”信息揭示了公文的主要内容。通过数据清洗剔除公文标题数据中的“发文机关名称”和“文种”信息,对“事由”信息进行分词和统计。
利用Python的结巴中文分词,对公文标题中的“事由”数据进行分词处理并统计出高频词汇。按照承办部门分类统计收文的词频结果,按照形成部门分类统计发文的分词结果,选取人事部门和财务部门在一定时期内形成和处理的公文数据,经过分词、统计词频及数据的可视化后结果见下图:
财务部门和人事部门的公文数据中“事由”涵盖了部门基本职能,其中高频词反映部门的核心关键业务。通过文件标题“事由”部分的词频分析可以看出:在职能活动中形成了与岗位、职责高度匹配的文件信息。在企业组织环境中,组织中的岗位和职责赋予了文档形成和使用者(简称文档用户)鲜明的特性,正是这些因素构成了文档用户特有的工作场景。他们在职能活动中处理各种各样的文件,同时在职能活动中生成各种各样的文件。
正如上图财务部门和人事部门在各自的职能活动中,既需要处理大批与其职责相关的文件,也产生了文档信息的利用需求。部门业务活动中形成的公文数据,能够展示出这个业务活动的前因后果,也反映出部门履职过程和业务完成情况。例如:
关于开展某某活动的通知——起因
关于印发《某某活动方案》的通知——经过
关于上报《某某活动总结》的报告——结果
在职能活动中,用户对文档信息的需求来源于当前工作场景;同时需要再现和还原过去相关社会活动的时间、人物、行为、背景、情景关系等一系列场景信息。
场景思维就是利用场景来对问题进行思考,从需求行为产生的时间和背景等角度,对用户需求从不同角度和不同维度进行分析和理解,探寻本质性的需求,并据此提供符合需求的产品或者服务。文档利用工作者一方面积极挖掘企业文档中包含的场景信息;另一方面从企业生产经营活动场景出发分析文档信息需求,挖掘用户在特定业务场景中文档信息需求;最后将文档信息场景和业务活动场景相匹配,提供符合场景需求的文档信息,推送相应的文档信息,提高信息需求和信息产品连接的效率和质量,实现文档信息利用的智能化。
在复杂的人类社会实践活动中形成了档案,档案是社会活动的原始记录,档案记录各种各样的社会职能活动。档案记录了社会活动时间、空间、目的、用途等一系列场景信息。业务活动中形成了其特定职责、业务范围内的档案信息。
党和政府机关在办理公务活动中形成了具有特定效力和规范格式的文件和档案。这些文档数据一般由“时间、部门、人员、事件、主题”等要素组成,反映了公务活动起因、经过、结果。可见,档案形成于社会实践的各个场景中,记录和保存了当时的场景信息。
档案信息的收集、整理、保管、鉴定、统计和提供利用管理工作,都是为了确保档案信息的完整、准确、系统和安全,维护档案的原始性。文书类电子文件元数据方案明确了文书类电子文件形成、交换、归档、移交、保管、利用等全过程中元数据的设计、捕获和著录要求[2];元数据描述记录了文件的背景、内容、结构,包括文件生成和管理的全过程的数据,包括文件、机构和人员、业务以及其关系等数据[2]。这些元数据记录了文件形成场景信息,包括文件形成时的组织机构、时间、人员、业务、行为及其相互关系等。文书类电子文件元数据的管理过程,既确保元数据的规范和完整,也维护了文书类文件场景信息的准确和完整。可见,档案工作也是对档案形成场景信息规范管理的过程。
档案利用的过程是通过查找、使用或检索档案信息、获取档案信息的过程。实际也就是指档案工作者通过一定的方式、方法,将档案信息提供给利用者的过程。档案利用活动包括档案管理者、档案和档案利用者这三个主体。档案管理者通过一系列的管理工作保持档案信息的原始性,通过利用工作来满足利用者对档案信息的需求,实现了档案的价值。档案利用者需要通过各类档案信息还原历史活动的真实情景,指导当下的社会实践活动。
但是在传统以“关键词”查询为主的利用活动中,档案部门守着浩瀚的文件资料却不能满足用户的需求。这是因为传统的档案工作是以“文件”为单元,以检索为目标,通过收集、著录、分类、编目、提供利用活动开展工作。这种利用方式不能满足用户对文档内容信息多维度的智能化需求。特里·库克认为传统的档案工作重点是档案实体的保管,在后保管时代档案工作关注重点将转为:档案的来源、档案信息的形成过程、档案的形成目的、档案之间的关联关系和来源部门(单位)之间的职能业务关系,档案形成部门(单位)、形成者的职责范围等[3]。
当用户以一定的角色首次登录业务系统时,系统根据用户基本信息(如岗位、职责)结合业务系统中已有的相似角色或历史角色信息,分析构建这个用户“画像”。系统定期分析该用户在系统中形成的信息和处理的信息,不断地修正用户“画像”。系统将具有相关职责的用户活动信息进行分析,形成一定主题或一段时期内相似的用户群的“画像”。这样在相对稳定的组织场景中,通过分析特定职责用户信息记录,积累形成用户的信息需求特征。
改变传统的以检索为目标的信息收集和采集方式,注重背景信息的收集。利用信息技术,挖掘用户在业务活动中形成和处理文档信息的规律,利用信息技术,分析数据特有的场景信息,以此构建以特定要素为基础的文件群,通过特定的算法为每一个用户推荐其高度关注的文档信息。
在用户日常的业务活动中,通过活动场景触发特定的用户画像,完成需求与信息产品的匹配,形成关联性高度匹配的文档信息集合推送给用户,实现档案信息服务的智能化。
在业务活动场景中由职能要素关联用户文档需求。建立职责要素的用户画像,用户在职责要素下形成的文档群,用户在职责要素下处理的文档群;用户在职责活动中触发潜在的文档需求,系统将“形成文档群”和“处理文档群”中相匹配的文档推送给特定的用户。
当然在实际的业务系统中,这里的匹配要素可能不仅仅表现为“职责”,也可以是“专业”“学科”“工作节点”等。根据不同的业务场景具体分析,我们才能够满足用户需求的多样性,满足用户潜在需求。
总之,文档管理部门应转变思维,立足于企业信息化建设中积累的数据信息,立足于多样化的业务场景,运用成熟的信息技术分析用户需求规律,摸索出适合本企业文档信息的开发模式和智能服务方式,实现文档信息价值,改进文档信息服务质量和效果,提升企业档案管理的精细化水平。