◇福建水利电力职业技术学院 吴晓静
参与机器信息行为研究是图书馆深耕用户信息行为研究的必要之举,也是行业适应人工智能时代发展的应有之义。图书馆尝试基于现有的信息行为研究方法来阐释机器信息行为的现象及规律并取得一定进展。不同信息行为模型的的适用性和人机交互是图书馆未来在机器信息信息研究领域的重点。
2019年,麻省理工学院媒体实验室(The MIT Media Lab)研究人员联合来自耶鲁大学等高等院校和谷歌公司等企业研究者,组建了“机器行为”研究课题组,标志着“机器行为学”这门跨专业的新兴交叉学科成为研究热点。机器行为学,顾名思义,主要研究智能机器行为,将智能机器视为一系列有着自身行为模式及生态反应的个体,通过跨学科知识运用,研究机器行为产生的内在机制(算法)和外部环境的特质(算法所在的社会环境),从而增进对人工智能技术的理解。信息行为指主体在不同环境中发现、搜寻、整理和使用信息的系列活动,人工智能时代,信息行为主体由人类延展至智能机器,信息行为是智能机器所表现出的最重要的行为类型。通过深度学习和模拟,智能机器具备类似人类的感知、思考和行动等能力。
机器信息行为就是智能机器在信息输入、存储、运算、处理、输出、反馈和控制过程中表现出来的行为。具体来说,就是智能机器通过传感设备接收外界输入的视觉、听觉、触觉等感知类信息,并将信息存储至存储原件,运用事先设定的程序,调用相应的模型,模仿人类对信息的理解、组织、分析、挖掘和综合利用,实现识别、推理、创作和预测等功能,再通过输出装置传递处理结果,对初始及后续的信息输入产生反馈和帮助,形成工作闭环。基于内置神经网络算法,智能机器具有产生信息行为的内在机制,做出相应的信息行为。同时,受数据采集条件等外部环境的限制,对机器信息行为的理解又不能局限于算法本身,需要理解算法在不同环境以及与人类不同交互模式中表现出不同的信息行为。因此,图书馆参照(人类)用户信息行为研究方法开展机器信息行为研究是理解智能机器信息行为和促进人工智能技术发展的重要举措。
用户信息行为研究一直是图书馆学研究的重点,在人工智能技术出现及推广应用之前,图书馆关注的信息行为主体通常指人类用户,伴随人工智能技术的发展,智能机器具有了类似人类的思维意识和行为能力,信息行为的主体亦被极大延展。智能机器表现出较高的主体意识,以信息交流者、参与者、研究者、发布者、生产者、合作者等多重身份参与信息实践,并日益成为社会信息系统不可或缺的组成部分。可以预见,人类信息行为与机器信息行为将共生共存并交互融合,图书馆信息行为研究面临的是多元分散、多主体并存的复杂新格局[1]。因此,一方面,当信息行为主体由人类用户拓展至人类用户和智能机器时,将信息行为研究作为自身工作重点的图书馆,自然而然有必要与时俱进参与机器信息行为研究。另一方面,机器信息行为改变了信息生态系统,这对图书馆的资源建设和服务内容产生颠覆性影响,图书馆需要积极探索与研究机器信息行为,理解机器信息行为的新内涵,积极应对智能时代新情境为行业带来的机遇与挑战。简言之,图书馆参与机器信息行为研究不仅是传承(深耕用户信息行为研究)的需要更是推动行业适应新时代发展的需要。
机器信息行为研究尝试用研究人类信息行为的思路和方法来观察和解释人工智能,相关研究需要综合运用计算机科学、工程科学、行为科学等多种专业知识,帮助人们从内部系统架构和外部环境交互的角度全面理解机器信息行为,图书馆有能力参与机器信息行为研究并成为重要的研究伙伴。一方面,图书馆界始终关注人工智能等新兴技术的发展,并探索将技术融合应用于创新服务实践,围绕机器智能学习和人工智能技术的应用伦理(算法偏见和潜在误用)、训练数据和计算过程审查等问题开展持续探索,在循证实践中形成了对人工智能较为全面而深入的了解,为参与机器信息行为研究奠定了坚实的基础。另一方面,图书馆在对用户信息行为长期研究过程中,系统地学习了社会学和人类学的相关理论与模型框架,掌握了实验方法、人口统计和抽样、观察性因果推理等相关研究方法和工具的应用,具备参与机器信息行为研究的理论基础和实战经验。
人工智能技术的快速演进对人类生产生活产生颠覆性影响,人们开始尝试全面认知人工智能技术与社会的复杂关系,深入思考人工智能技术带来的潜在风险与挑战。二十国集团(Group of 20,G20)提出了“G20人工智能原则”,强调以人为本和发展可信人工智能,这一原则获得国际社会普遍认同。“可信”反映了人工智能系统、产品和服务在安全性、可靠性、可解释、可问责等一系列内在属性的可信赖程度[2]。发展可信人工智能要求深化对人工智能程序行为(特别是信息行为)的洞察和理解,明确智能机器内部的工作原理、决策依据和决策过程,及其在信息环境中的交互和影响,提升机器信息行为的透明度和可理解性,通过赋予充分知情权,以一种可解释的方式最大限度地保障机器信息行为的准确性及可信赖度。在此背景下,机器信息行为进入图书馆人的视野。《新媒体联盟地平线报告:图书馆版(2017年)》明确指出:人工智能技术是影响图书馆服务与研究的重大技术进展,在优化馆藏、升级空间及变革服务过程中,智能机器的战略价值愈发凸显。于是,有研究者建议图书馆应将智能机器视为新的用户类型加以考虑,这类用户不会取代人类用户,但他们有着明显不同的需求,需要通过不同思维方式来思考和设计针对他们的资源挖掘和利用[3]。这一建议透露以下信号:①明确智能机器的主体性。图书馆用户是指图书馆为之提供产品与服务的对象,人类不再是图书馆资源的唯一使用者,智能机器可以与人类用户一样,成为图书馆服务设计的对象,图书馆需要了解和考虑智能机器对信息资源的需求、读取和使用等信息行为,以及与之相关的行为伦理和道德问题;②了解智能机器信息行为的特殊性。智能机器的信息需求和行为与人类用户存在着本质上的区别,但二者间可以相互影响、相互改造,对人类用户行为的研究可以启发机器用户行为研究,图书馆需要大胆创新,通过借鉴与协作,在新领域探索新服务模型和方法。
2019年4月,施普林格自然(Springer Nature)出版了第一本由机器生成的化学类书籍,同年,《自然》杂志发表了以“机器行为”为题的综述文章[4]。机器信息行为的突飞猛进激发了图书馆界参与研究的热情,图书馆人尝试基于现有的信息行为研究方法,阐释机器信息行为的现象及其发展规律。有学者以威尔逊信息行为模型为基础,通过叠加人工智能模型核心功能,即“模型表征+模型评估+优化算法”,生成初步的机器信息行为模型,分析机器从信息需求产生到最终处理应用过程中的中间变量和影响因素,并从动力机制、中介变量、信息搜寻和处理层面对机器信息行为做出说明性阐释。在机器信息行为研究的起步阶段,图书馆以信息行为模型为起点,以机器产生信息行为的内在机制为驱动,主动参与跨学科交叉研究,为机器信息行为研究提供新的角度和启发,在取得一定进展的同时亦存在几点不足。①机器信息行为研究范畴应包括个体机器行为、群集机器行为和人机交互行为,而图书馆的起步研究只是粗略分析了个体机器由内部特质塑造的行为集,而未考量外部环境,尤其是机器之间交互、机器与人交互对机器信息行为的影响。②以深度学习为代表的机器学习虽然借鉴了人脑多分层结构、神经元连接交互信息的逐层分析处理机制,但并未建立与信息处理过程的自然联系,或者说机器学习的模型表征、评估和优化并不能形成与信息处理过程严格的逻辑关联,对威尔逊信息行为模型的套用略显生硬。③威尔逊信息行为模型缺少对信息创建过程的描述分析,模型本身存在局限性。
机器学习的新发展为机器信息行为研究提供契机,GPT-3基础模型的构建开创了机器学习广阔的应用前景。基础模型旨在从各种来源和渠道提取并积累知识,以有效和可扩展的表现形式进行知识组织,并将其灵活应用至新的情境中,过程与信息的搜寻、管理和应用严格对应,机器信息行为与机器学习间更深层次、更为本质的关联得以正式确立。由此,以机器学习基础模型为切入,图书馆界专家学者进一步应用信息行为理论和框架模型展开分析,帮助厘清信息行为如何影响机器学习这一关键问题,从而更有效地去增强机器信息行为,研究取得了新进展与新成果。①应用信息行为的“十项经验”(假设)探讨如何确保基础模型的合理、公平和无偏见。“正式来源及合理化搜索只反映人类信息行为的一部分”,这促使人们思考基础模型中社会维度的缺失;“背景是信息传递的核心”引导人们关注基础模型中存在的系列问题,包括信息矢量化过程中的去语境化,建模人员的潜在干预性,训练数据的性质等;“更多信息并不总是最好”启发人们思索基础模型的补救措施来更好满足边缘化群体的需求[5]。②应用日常生活信息实践行为扩展模型,增加信息创建过程的描述,理解基础模型的生成和涌现能力,指导信息生成实践。③应用Foster非线性信息搜寻模型来启发基础模型,重新构建衍生工具中用户交互的底层算法。相较研究起步阶段,该阶段的进步明显:一是研究范畴更加拓展。从研究机器内在的信息处理机制拓展到探索社会环境对机器信息行为的影响,探讨智能机器如何认知并理解他们所处的环境;二是研究目标更加明确。机器学习系统是重要的信息系统,图书馆机器信息行为研究回归本体,聚焦信息行为如何影响机器学习;三是研究角度更加全面。机器学习领域新概念和新模型的发展,为机器信息行为研究提供了新的切入点,提高了信息行为模型的适用性,帮助人们全方位理解和强化机器学习,发展以人为本的人工智能;四是研究团队更加多元。图书馆人开始突破自身学科局限,积极参与到机器学习的跨学科对话中,开展协同研究,驱动机器信息行为研究领域取得实质性进展。
人与智能机器在未来会如影随形,共生共存于复杂巨系统中。人类与机器各自存在的优势具有高度的互补性,连接并整合优势能够创造出无可比拟的智能形态。科学家纷纷预测,人工智能(客观智能)与人类智能(主观智能)最有可能演变成为阴阳对立的统一体,从而开启全新的人机融合智能时代,人机交互协同应成为人工智能3.0的关键及核心[6],在高效协作中生成复杂问题的解决方案。当人工智能由初级进阶到高级乃至超级(类人工智能)阶段,智能机器被赋予人的情感、伦理和道德等元素,由此催生用研究人类信息行为的方法来解释人工智能及其信息行为的思路和方法,以人机良好的沟通、理解和协同为目标,机器信息行为研究显得尤为重要和关键。机器信息行为研究能通过内部运行机制与外部交互环境的全面研究,帮助人们更好地理解人工智能技术和智能机器。机器信息行为研究是动态发展的过程,能追踪分析机器随着时间推移而表现出的系列行为,这个过程突破了在单轮对话中生成解释的简单模式,让人类以一种交互、反复和渐近的方式揣摩智能机器的心智、理解机器每一步决策的意图,掌握机器在一定环境中的胜任力和功能性,在可理解、可预测中培养人类对机器的信任[7]。此外,机器信息行为研究关注分析人机交互、多智能体系统中的相互影响和相互作用,能增进智能机器对人类心智及特定解释内容的理解,缩小机器和人类之间的认知思维差异,强化信任感。图书馆对新技术的研究偏重融合应用,对机器信息行为的研究仍处于初级阶段,未来,图书馆有望借助其对人类信息行为的了解,通过跨学科合作研究在“可解释人工智能”“机器学习的神经符号”等方面大放异彩,参与推动人工智能技术的发展。图书馆参与机器信息行为研究的重点方向包括:①重新审视和思考不同信息行为模型对解释不同情境下机器信息行为的适用性;②研究人的信息行为如何通过机器学习来影响机器的信息行为;③聚焦人与智能机器间的交互,不仅需要解决机器学习系统中出现的算法偏见和潜在误用问题,也要完善训练数据、改进基础模型,产生更智能的机器信息行为。可以预见,在机器信息行为研究领域,图书馆机遇与挑战并存,图书馆应关注人工智能技术及智能机器学习发展的前沿动态,积极寻求信息行为与机器学习交叉融合研究的切入点,强化馆员跨学科素养和技能的培育,为机器学习系统中的更多现实性问题提供解决方案和路径,助力实现人类与人工智能的共生共荣。