戎军涛
(中国人民大学信息资源管理学院 北京 10089)
解决人类知识信息的获取和利用,满足人类的知识需求是信息检索的核心任务,也是国内外图书馆信息学追求的目标。20世纪60年代以来,信息检索领域经历了系统导向模式、行为导向模式,目前正在向认知导向模式转向。系统导向模式将信息检索看成是一种简单的物理或机械式的匹配活动,尽管在不断地改进算法,但由于忽视了用户的存在,因而在检索效率上遇到瓶颈。行为导向和认知导向都属于用户导向模式。行为导向的信息检索更加注重观测用户的信息搜寻行为,引入了用户的心理、情境、需求、情绪等变量,但缺乏对信息资源内容的关注。20世纪70年代以来,认知观的引入给信息检索提供了新的视角。信息检索本质上是一个认知过程,目的是满足用户信息需求,进一步改善用户知识结构[1]。1992 年,P. Ingwersen提出了与情境相关的整体主义认知观,揭示了信息检索的认知转向路径[2]。认知导向的信息检索引入了更多的变量因素,如信息行动者、工作任务、信息系统、信息对象、社会组织情境等,使得信息检索系统越来越复杂,不再仅仅是单维度的、静止的、简单的关键词匹配活动。数据智能时代,以大数据与认知计算为代表的智能技术为信息检索提供了更加丰富的理论技术和应用实践基础,同时也改变了人们对人工智能技术的认知。信息检索系统以更加智能的形态出现,向以知识图谱为基础的智能检索、智能问答系统转变,开始重视人们在信息利用过程中的知识结构和认知能力,强调信息系统和用户双方在认知层而非物理层上交互的重要性。
由于认知信息检索理论引入检索者认知变量,更加符合人类信息检索行为认知过程的实际情况,因此认知信息检索具有良好的发展前景。认知观的引入能详细阐释信息检索交互的相关细节,为信息检索发展提供了新的思路和方法,但是认知导向的信息检索系统尚处于理论观念革新和系统模型构建阶段,尚未验证成熟,人们对认知信息检索框架的认识也较为模糊。本文从认知视角出发,旨在探索信息检索的本质,阐明认知导向内涵,构建动态的认知信息检索的基本框架模型,促使信息检索领域重新定义、精炼和改进,为改善信息获取和利用效果、解决信息检索各种问题提供有价值的参考方案。
信息检索的研究框架通常包括三个基本要素:信息检索者、信息对象、信息系统,其核心问题是人与目标信息的匹配。围绕不同的要素展开研究,会形成不同的理论导向模式:以信息系统为中心进行研究,就形成了系统导向模式;以信息检索者的行为为中心进行研究,就形成了行为导向模式;以信息对象和人的相互作用为中心进行研究,就形成了认知导向模式。
自20世纪50年代以来,系统导向的检索或客体范式是信息检索领域的主流,关注的是如何快速、高效地构建文献信息检索系统,产生了大批有影响力的文献数据库。在此期间,著名的 Cranfield检索评测实验提出了许多目前仍然被广泛采用的检索评价指标[3]。在20世纪70年代到80年代,许多信息检索的理论与模型被提出,如矢量空间模型、概率模型等。20世纪90年代以来,在互联网技术的推动下,信息检索进入以搜索引擎、数字图书馆、网络导航等形态为主的网络信息检索阶段,研究领域扩展到文本检索、自动问答、文本过滤、跨语言检索、主题识别等多个领域。
系统导向模式关注的是技术、算法、模型,其研究目标是按照需求来设计能识别大量相关文献并对其进行排序的算法,研究重点是作者文本、文本表示、提问式与检索技术[4],包括文本分类与聚类、文本索引、关键词匹配、单元词标引、元数据描述、检索相关性、系统互操作等。但是系统导向的信息检索没有考虑使用系统的人的因素,其理论假设是用户需求已经明确,找到文本就能满足的用户需求[5]。因此,系统导向的信息检索系统是单向度的、静态的、固化的,人与系统之间缺乏必要的反馈与交互,难以满足用户知识需求。
20 世纪 70 年代以后,用户导向的信息检索受到关注,侧重研究用户与系统的交互以及信息搜寻行为,主要包括用户的信息需求、获取、查询、交流、利用等行为,因此用户导向的信息检索也被称为行为导向模式。英国情报学家T.D.Wilson于1981年提出了信息搜寻行为的情境模型,1996年再次对其进行修订,1999年进一步提出信息检索、信息搜索与信息行为的嵌套模型,揭示了主要概念间的嵌套关系,其核心思想是:IR 总是处于信息搜寻过程的情境之中,而信息搜寻又是构成整体信息行为的其中一种[6]。Ellis描述了各类社会科学家个体的信息搜寻行为特征,提出了研究人员的信息搜寻模型[7]。Kuhlthau提出信息检索的过程模型,主要包括发起、选择、探索、制定、收集和呈现六个阶段[8]。Spink描述了信息检索过程的交互、循环模型,即每个搜索策略可以包含一个或多个循环,每个循环可能包含一个或多个交互反馈事件[9]。
信息检索的行为导向模式侧重于经验研究,具有较强的实证性和应用性,注重心理、情感、需求、动机等心理因素,采用社会学、行为科学、心理学等学科的理论、方法和实践来探讨信息行为的影响因素,其目标是理解人类信息检索行为,关注的是用户的问题空间、信息问题、请求、与媒介的交互、接口设计及表达方式等。行为虽然反映人类的主观世界,但是行为并不等同于人类的主观世界,它仅仅是主观世界的社会化表现。所以,用户行为并不能完全揭示、反映用户信息需求,但行为本身却是通向人类认知的媒介。
20世纪90年代,信息检索领域开始转向以用户认知为导向的认知范式,更加关注用户认知行为、检索模型及影响因素等,将用户看作信息吸收和利用的主体,情境、任务和相关性等都是与认知信息检索相关的重要概念[10]。Belkin的知识非常态理论[11]、Dervin的意义构建理论[12]、Brooks的知识方程理论[13]等都是经典认知范式模型,其理论假设是人类的主观世界会受到外界信息的输入而改变。Ingwersen在Belkin模型基础上提出了信息搜索的认知交互模型,进一步描述了用户进行信息搜索时,在信息对象、搜索系统与设施、界面、用户的认知空间以及社会和组织环境中会发生一系列的动态认知交互过程[14]。Saracevic基于信息使用的“获得—认知—应用”模式,提出信息搜索行为的分层交互模型,模型从系统、用户到社会情境是动态的交互过程,并有三个交流层:通信层、认知层和情境层[15]。从认知科学角度探索用户认知结构的意义构建过程以及知识创新的认知机理,是认知导向关注的理论基础研究。
认知导向模式是一种主体与客体的动态交流范式,强调知识的主观性、建构性、认知性,重视与用户的互动,注重知识的利用效果,关注用户吸收知识后认知结构的改变,其目的是满足知识需求,推动知识创新。认知导向要求“知识”应当做广义的理解,它不仅仅是一种对象,同时也是一种过程,更是一种体验[16]。因此,知识、信息不再是一种静态的客体,而是一种多元、动态、交互的转化过程。对知识的认识不应当局限于对知识及知识活动的静态描述,而还应表现为以知识、人及两者之间相互作用为核心的一种动态过程[17]。当然,认知导向与系统导向、行为导向的信息检索并不是完全割裂的关系,而是发展、继承和融合的关系[18]。认知导向的信息检索范式应该是以认知范式为主导、同时整合“系统导向”“行为导向”两大范式的综合范式。
认知信息检索是用户认知空间与系统的知识空间发生在知识层面的交互,是与传统系统导向信息检索和行为导向信息检索相区别的检索模式。用户认知导向下的信息检索系统涵盖用户、情境、任务、知识、系统等要素,其内在要求是以问题情境需求为导向,通过人机迭代交互过程来动态构建恰好符合用户问题的个性化知识资源。因此,检索系统模型设计要重点解决的问题是如何通过对信息资源的深加工呈现与用户认知相匹配的结果,促进用户对任务的认知和理解,降低认知负荷,提升检索效率。
用户通常是带着问题来进行信息检索。检索始于问题,问题源于情境。有效的理解知识或创新知识往往是在具体的问题环境中、通过解决问题的过程来实现的[19]。情境基于应用问题和应用目标,蕴含着对知识的需求;同时也对交互过程反馈的知识内容进行解析、解释、关联、转变、重组,为知识内容的验证提供意义基础和处理框架。
认知建构主义认为,人在与任务情境的交互过程中产生了“不连续”的状态,形成了“知识非常态”,产生了信息需求。根据泰勒提出的信息需求层次理论,信息需求分为内在需求、意识需求、表达需求和受限需求[20]。内在需求表示用户还没有意识到的需求,意识需求表示用户头脑中反映出的模糊不清的需求,表达需求表示用户头脑中明确的信息需求,受限需求表示用户表达出来的信息需求。在人类认知世界中,需求通常表现为问题。因此用户需要通过检索行为来解决问题,恢复知识常态,完成人与任务情境的交互。问题是信息检索的逻辑起点,也是信息检索的逻辑终点,能否解决用户问题,满足用户需求,改善用户知识结构,是检索系统设计成败的关键。因此,信息系统的资源组织、检索交互、结果利用等都要紧紧围绕用户问题的解决来进行。
传统的信息检索系统仅仅是文献检索系统,将用户对信息的利用局限在对文献的检索获取上,忽视对用户利用、处理和管理信息的丰富多彩的过程、行为和系统的支持,难以从用户角度来灵活组织和利用信息资源。而认知导向的信息检索系统是知识检索系统,是一种以用户为中心来聚合资源、服务、信息利用活动的动态机制,根据用户在其信息活动中的动态需求来快速和动态地构建、集成、嵌入信息资源与服务机制[21]。因此,知识检索要求信息资源组织与控制必须达到知识层面,形成多粒度、多维度的开放、动态、交互资源体系。
一方面,信息资源需要通过数据化碎化为不同粒度的、符合人类认知的知识对象单元。另一方面,知识单元要求进一步形式化为可计算、可重组、可融汇、可再创造的知识对象,而且可以和使用者进行个性化、动态化的交互以形成新的数据对象和知识内容[22]。知识单元颗粒度有大有小,层次有高有低,强调完整性、独立性、层次性、多粒度性。知识元的排列组合构成了不同粒度的知识单元。每一个知识单元都有明确的定义、属性、内容和载体描述,是一个明确的知识对象,可以被链接、解析、处理、聚合。知识单元符合用户认知习惯,方便用户依据个性化需求自由组合、聚合、融合知识。
交互革命发生于20世纪90年代,是信息检索认知转折的一个重要方面。信息检索本质是用户需求和系统知识的匹配。匹配的过程就是用户与系统交互的过程,交互目的是改变用户的认知状态。人类的认知状态在信息检索和利用过程中随着信息的发现和获取而不断变化演进,导致人类的需求也处于不断变化发展的状态。因此,用户的信息需求情境是一个典型的动态变化的情境,而且受现实环境、技术条件限制,用户需求并不能完全准确地表达。但是信息需求可以通过交互行为而被明确。一次具体的检索过程并不能满足用户的信息需求,若干检索过程交互的叠加才能接近用户的利用需求。交互发生在多个层面和多个维度,涉及任务、内容、界面、技术等要素。这就导致用户需求和知识的匹配必然是交互的、迭代的、反复的过程。具体的信息检索交互涵盖一系列过程,一般包括用户需求、具体问题、检索操作、检索结果、知识利用、反馈迭代等环节。交互的迭代性使人机在认知层面的匹配度不断增强。这种交互的结果对认知系统和检索系统都有影响。交互可以进一步明确问题需求的具体表达,也可以进一步挖掘认知结构中潜在的信息需求[23]。交互性也要求知识服务和知识库的设计要体现动态性。
通过比较、综合信息检索领域的经典模型,我们可以发现信息检索框架一般包括以下几个核心要素:用户认知结构、信息检索系统、界面、信息对象、社会组织环境等。根据用户认知导向的内涵、特征,综合考虑信息检索的诸多复杂要素,我们构建了用户认知导向的信息检索系统框架模型,包括用户认知系统、信息检索系统以及交互系统三部分,见图1。
图1 用户认知导向的信息检索模型
用户认知系统是用户的认知结构形成、建立、演化的空间,包括认知结构和社会环境两大要素。认知结构与社会环境通过互动完成认知建构。用户的认知建构是认知结构社会化的过程。用户认知结构的形成主要受到用户内部认知能力和社会外部环境的影响。认知能力主要包括用户认知风格、认知水平、情感状态、领域知识与检索经验等[24];社会环境是检索活动存在与发生的自然与社会文化背景系统,影响、决定、制约着检索活动的开展。社会环境具有社会、文化或组织特征,与对象、系统、领域以及检索者的工作和日常任务、情感、动机、喜好等密切相关,主要包括社会角色、家族环境、宗教信仰、科学理性、文化传承、风俗习惯、行为规范等一系列要素。用户认知结构的改变与演化则需要检索交互反馈信息的输入。广义地说,交互反馈信息也属于社会环境要素。用户认知结构改变与否,也是衡量检索结果是否达到认知利用层面的重要标准。
认知结构也是一个动态平衡的过程结构。在认知能力、社会环境、交互反馈信息的作用下,用户认知系统一方面通过“同化—顺应”的过程,将有利于其认知结构发展的信息、知识纳入自身结构体系中,不断丰富、改善、发展自身的认知结构状态;另一方面通过信息排斥或免疫机制将不利于(或者威胁)自身认知结构存在的信息清理、筛除,确保自身认知结构的独立和稳定。
信息检索系统属于知识资源服务系统,包括知识资源库系统和计算挖掘系统。知识资源库是信息检索系统的数据基础,承载的是有序知识的集合,提供相应的知识服务。知识库的资源组织以用户行为习惯、认知结构以及问题情境为导向,而不是以资源本身的客体属性为组织依据。知识组织是知识库形成的核心环节,通过对文献内容中蕴含的知识元进行有效识别、抽取、标注、关联和重组,并在此基础上构建知识元体系,实现基于知识元层面的知识组织和发现。基于知识元的文本资源内容组织过程包括知识元抽取、知识元标引、知识元库、知识元链接、知识元集成、多粒度知识库、知识元映射等一系列流程。通过抽取信息资源中的知识实体、属性以及实体关系,进行语义标注和概念关联,形成类似认知结构的语义概念网络,可以多维度、多层次、多方位、多粒度地揭示知识资源。被语义标注后的知识资源在任何粒度层面上(句、段、章、文献)都可以被解析、表征、链接、嵌入、集成、融汇,方便用户依据自身需求灵活地分析、组织、调用和聚合信息内容。
在知识库的基础上,可以开展计算、挖掘等知识服务。知识之间存在着十分复杂的关系,知识之间的语义关系是进行知识之间逻辑推理、挖掘与重组、关联服务的根基[25]。其中,因果关系是推理、问答等智能知识服务最依赖的关键语义关系,多种语义关系可以抽象为因果关系,如作用关系、影响关系、治疗关系、演化关系等[26]。基于丰富的知识网络关系,一方面可以开展多维度的语义检索,实现知识层面的匹配;另一方面,依据知识规则可以对知识库的语义网络进行计算、挖掘、关联、推理,发现潜在的知识关联,进而发现新的知识模式。
交互系统是用户认知系统和信息检索系统进行知识匹配的交流空间。交互系统由场景、需求表达、语义解析、交互模块四部分组成。
场景是用户信息检索、获取与利用行为的具体问题情境。历史情境和实时交互情境(检索会话)共同构成了当前场景,并直接影响认知行动者对当前状态的认识与理解。用户在一定场景下进行检索时,根据问题的特征形成不同的问题定向,采取不同的检索策略来获取信息。
需求表达是指将用户的内在信息需求呈现为规范的、形式化的检索语言。人类信息需求分为强信息需求和弱信息需求。强信息需求是那种问题结构清晰、易于辨别和利用、可以通过对具体文献具体内容的检索、获取和阅读来满足的需求。弱信息需求指那些问题结构模糊、知识范围不清晰、缺乏明确且系统的检索发现步骤、需要动态解构和探索大量文献内容才可能部分满足的需求[27]。明确的信息需求通过需求表达环节可以表示为规范的检索表达语言,潜在的信息需求则需要进一步挖掘,才能成为明确的信息需求。
语义解析负责自然语言与系统知识语言的转换:一方面,将用户交流的自然语言解析为系统的知识操作语言;另一方面,负责将系统的知识检索结果(例如,概念网络图谱)转化为用户的自然语言。
交互是信息检索的动态、循环的过程,在面对复杂和动态变化的研究问题时,需要不断进行交互来挖掘、满足不同层面的需求。在交互过程中,用户通过对获取信息进行判断、修改和筛选等来解决当前的知识异常状态。交互在三个层面展开,分别是系统层、内容层和认知层。系统层交互指用户与系统界面的交互,包括物理硬件、通信设施、系统规则、查询表达等方面的对话处理过程。内容层交互是指用户对检索内容相关性匹配的判断过程,用户通过评价、利用、比较、解释和修改等行为与资源内容互动。认知层交互是指在语义层面的认知判断过程,通过系统反馈、用户修正等环节使检索结果不断接近用户需求,改变认知结构。
根据认知导向的信息检索特征和框架模型,我们以科研活动为场景,设计了一个预期的面向用户需求的知识服务系统作为应用范例,来进一步讨论认知导向的信息检索框架。
面向用户需求的知识服务系统原型系统由三部分组成(见图2),分别是资源层、计算层和服务层。资源层是系统知识中心,计算层是系统运算中心,服务层是交互中心。计算层以服务层数据为导向,对资源层进行检索、查询、推理、运算等操作,返回结果。服务层负责用户与结果的匹配和交互,不断修正结果,完善运算层的算法模型。
图2 面向用户需求的知识服务系统
4.1.1 资源层
资源层是整个服务系统的知识来源,负责提供数据、信息和知识资源。资源库是最底层的文献数据库,收录的资源类型多样,既包括图书、期刊、标准、报告、专利等文献资源,也包括数据、网站、音频、视频、动画等数据资源。经过知识抽取、标注、消歧、关联等处理环节,将信息资源“碎化”为具有一定语义的细粒度知识元,借助本体概念模型和关联数据加以语义聚合,形成具有语义关联的知识元集合,并存入知识元库。资源库和知识元库都有服务接口通向计算层,方便计算层对不同粒度的数据进行抓取。资源库主要提供粗粒度的文献、信息、数据资源,知识元库主要提供细粒度的知识资源。
4.1.2 计算层
计算层是知识服务系统的运算交互核心,负责解析、处理、分析、推理不同的数据,完成数据查询、语义匹配、认知计算等功能。解析引擎负责读取、解析、转换自然语言,形成语义表达。计算引擎依据一定的知识规则进行推理、计算,挖掘知识间的隐性关联,完成知识发现。检索引擎主要负责执行语义查询命令,完成精准的语义检索和数据检索。在服务调度引擎的统一调配下,解析引擎、计算引擎、检索引擎统一协调工作。计算层支持主题导航、语义检索、开放关联、动态聚合、内容推荐、知识发现、情报计量、可视化分析等服务功能。
4.1.3 服务层
服务层是知识服务系统的应用终端,负责灵活构建用户的问题情境,表达用户需求,动态聚合资源,完成知识服务。服务层的功能主要有知识推荐服务和知识定制服务。情境化主题推荐模块主要负责知识推荐功能。用户行为数据通过行为感知模块获取,用户人口统计特征、社会文化环境、问题场景等数据通过情境感知模块获取,经过需求计算后获得用户偏好模型。情境化主题推荐机制在用户偏好模型的支持下调用服务调度引擎,完成知识资源的推荐。在知识推荐交互过程中,用户偏好模型不断被用户修正。
个性化主题定制模块负责完成知识的灵活定制服务。用户将需求表达为问题模式,构建问题空间,进一步通过问题空间定制不同的主题情境。系统依据个性化的定制主题,形成丰富的个性化查询请求,并通过调用服务调度引擎,进行主题资源动态聚合,形成围绕个性化主题的、不同粒度、不同层次的资源集合。同样,在知识阅读交互过程中,用户的主题定制数据不断被用户修正。
我们以科研用户为例,来说明知识服务的运行机制。科学活动的生命周期一般包括了解趋势、产生思路、设计组织项目、设计实验、进行实验、数据收集与组织、数据分析、交流发布、成果保存[28]。在数据智能时代,科研用户的知识需求通常表现为战略性阅读、数据计算与实验、把握前沿趋势、循证决策支持等。具体场景如下:
知识服务系统记录用户的日常阅读、浏览、下载、关注等行为数据,并构建用户偏好模型,形成用户画像数据,并据此定期向用户推送信息。用户通过阅读推送的信息进一步挖掘其内心的想法和需求,要求进一步了解相关领域的前沿、重点、热点、动态等信息,并完成个性化的交叉复合主题定制。系统依据主题定制需求,动态组织、聚合知识内容中的主题、人物、事件、时间、地点、机构、方法、过程、公式、工具、结果等对象,同时聚合包含这些知识的资源实体和对外关联数据,如期刊、图书、专利、报告、机构、网站等,形成“内容—载体—关联”的多粒度、多层次、多维度的资源集合,示例场景见图3。用户通过阅读知识,快速构建知识体系。通过与知识文本互动,及时标注、记录阅读过程产生想法、灵感、启迪性的思想,并通过语义链接,动态完成知识的关联跃迁式阅读,动态解决阅读中随时产生的需求,不断修正主题定制数据。在知识交互式阅读过程中,所有这些知识对象都可计算、可重组、可融汇、可再创造,而且可以和使用者进行个性化、动态化的交互以形成新的数据对象和知识内容,可以满足用户数据验证、试验需求。
图3 关于“知识基本组分”主题的动态知识资源聚合体系
信息检索领域经历了系统导向模式、行为导向模式,目前正在向认知导向模式转向。认知导向的信息检索本质就是客观知识集合与人类精神世界需求集合在认知层面的匹配,涉及社会组织情景、工作任务、用户认知结构等一系列要素。认知导向的信息检索系统设计要求遵循问题情境驱动原则、资源知识化构建原则和交互动态迭代原则。认知导向的信息检索系统逻辑框架包括用户认知系统、信息检索系统以及交互系统三部分。用户认知系统是用户的认知结构形成、建立、演化的空间。信息检索系统是资源服务系统,包括知识库系统和计算挖掘系统。交互系统是检索系统和用户交互的逻辑空间,由场景、需求表达、语义解析、交互模块四部分组成。该模型理论上能够支持用户与系统的灵活交互,帮助用户更好地理解和识别需求,发展认知,支持实践的应用研究。面向用户需求的知识服务系统原型作为应用范例,进一步论证了认知导向的信息检索框架模型的预期服务场景。