人工智能技术在公共图书馆信息检索中的应用

2022-03-24 19:43:22陈江淮
科技资讯 2022年17期
关键词:信息检索检索人工智能

陈江淮

(安溪县沼涛图书馆 福建泉州 362400)

大数据时代背景中,公共图书馆不仅需要储存大量的公共教育资源以保障社会群众开展公共教育学习,同时还需要为群众提供信息资源、公共教育以及社会文化等方面的服务,进而导致公共图书馆需要储存、收集、管理的数据资源日渐增多,进而导致信息检索需要面临一定的工作难度。因此,对信息检索进行智能化改革优化能够为用户开展信息检索提供更加便捷的帮助。但是,大多数无序的信息检索实际应用价值相对较小,难以满足用户开展信息查询、高效快捷的需求,因此需要有关部门重点关注人工智能在实际生活中的具体应用。

1 人工智能技术

人工智能技术是一项基于互联网技术的新型技术,能够广泛应用在大多数行业领域中。人工智能技术的研究发展具有一定程度的挑战性与创新性,需要相关研究人员对计算机技术、心理学、语言学、影像学以及哲学等领域知识具有一定认知理解,因此,人工智能技术是一项相对广泛的科学,其中包括计算机视觉以及机器学习等不同种类的专业知识。一般情况下,人工智能的主要研究目的就是使机器系统能够依据人类思维处理一系列比较复杂的任务。但是,在不同的研究发展阶段,人们对于“复杂任务”的定义也不尽相同,但是其本质思想是一直不变的,即通过先进技术使得机器能够依照人类正常思维与逻辑方法进行相关事务处理,计算机与互联网技术是人工智能技术能够实现的核心技术。人工智能技术的发展情况会直接受到计算机技术发展历史的干扰与影响。同时,由于知识内容的表达方法具有多样性与变化性,进而导致人工智能技术具有多种不同的推理方法,通常情况下,人们将逻辑推理过程分成两种,即演绎推理和非演绎推理。

2 信息检索技术

计算机技术能够帮助人们从海量的数据资源中快速寻找到自身所需要的文档信息,极大程度地提高了信息检索的便捷性与效率。从实质角度来讲,利用计算机等技术进行信息数据处理能够为信息化技术进行更加复杂化、深入化的管理创新提供有效保障。在公共图书馆中,将书籍信息或相关文献信息录入信息检索系统中能够帮助读者快速寻找到自身想要查阅的书籍,以此提高读者查阅效率。随着信息时代的到来,人们对于更加注重终身学习,利用公共图书馆开展相关知识学习以提高自身综合能力与素养,因此,人们对于公共图书馆信息资源的储存以及信息检索问题越来越重视。

3 人工智能技术在公共图书馆信息检索中的具体应用

3.1 自然语言处理技术

自然语言处理技术是人工智能技术中一项十分重要的基础性系统,其主要研究内容是人类的通用语言特征,及人类常用的语言习惯、语法等内容,并将语言特征有效转化成计算机语言,以此实现人类与计算机之间的有效沟通交互。自然语言处理技术的主要功能是对垃圾信息进行处理,通过对信息数据进行全面监测,判断信息数据的内容是否为无用的垃圾资源。将特定的语言规则添加到信息数据过滤系统中,并将其镶嵌到信息检索系统中,当系统接收到可疑信息时会将其发送到特定的管理区域,在对信息内容进行全面检索后分析其是否属于垃圾信息,从而执行过滤操作。人们能够对信息进行快速查看,以此判断其是否符合自身预期需求。自然语言规则能够阻止句子对其他句子进行含义理解,而在特定的复杂化处理优化后,能够实现对单个词语、多个关键词或者长段落进行综合分析,从而在读音的语法规则下实现有效的分析判断。

3.2 视频图像检索技术

现阶段,人工智能领域中存在一项新型视频图像检索方法。该方法中,人工智能技术能够有效应用在视频图像资源的整合收集、分类关系以及检索查阅中。视频图像信息的特征选取主要包括纹理分析、影响颜色直方图计算以及利用动态跟踪算法对视频局部信息进行动态跟踪监测,特征选取信息最终形成特征向量。人工智能系统包括自适应匹配算法以及反馈式人工智能神经网络,会依据特征向量对图像视频信息进行分类检索。整个系统的工作区域是一个完整的二维平面区域,人工智能系统会依据不同视频片段信息的特征向量进行分类,从而实现对视频资源的有效整合与分类。当用户查询的过程中,只需要在特定区域进行规则细化,即可将视频资源限制在较小范围内,以此实现快速检索视频图像资源的目的。其具体流程能够分为5 个阶段,分别是系统训练、视频图像资源聚集、视频图像检索、特征向量提取算法以及人工智能算法。

3.2.1 系统训练阶段

这一阶段的系统会进行人工神经系统初始化操作,在系统与用户之间进行交互的过程中进行重复训练,以此使得系统能够适应视频图像资源的特征向量,从而对相关影响资源进行更加精确化、细致化的整合分类。

3.2.2 视频图像资源聚集

在经过训练阶段的人工智能系统将会正式应用在视频图像资源整合分类中,特征向量相似的数据资源会被系统整合到相近区域,而不同类型的视频影像资源则会依据彼此之间的关联程度进行划分[1]。

3.2.3 视频图像检索

视频图像资源在经过整合分类后,用户只需要在特定区域进行详细检索即可快速查询到具体的视频图像资源。人工智能系统对于视频图像进行整合分类主要有两项核心操作:第一,就是对视频图像资源进行特征向量提取,即确定视频资源特征的具体表述方法;第二,就是利用对应的人工智能算法,确保用户能够依据算法快速查阅到视频图像资源。

3.2.4 特征向量提取算法

该技术中使用的特征向量提取算法主要包括颜色直方图提取,即对视频图像资源的颜色信息进行有效分析,从而获取到视频图像资源的全部颜色信息;纹理分析算法,对视频图像模式进行有效分析;对局部信息进行运动跟踪算法,该算法能够进一步提高视频图像资源的分类精确率。

3.2.5 人工智能算法

该视频图像检索技术应用了两种相对成熟完善的人工智能算法,即自适应匹配算法与反馈式人工神经网,自适应匹配算法在实际应用中具有高效化、精准化的特点,能够通过分析输入向量快速查找到特征最为接近的系统向量;反馈式人工神经网能够通过分析分类结果的精准程度对系统内部参数进行反馈,同时依据实际情况进行修正调节。

3.3 网络信息检索技术

人工智能技术应用在网络信息检索系统时,主要功能表现在:基于计算机技术对人类智能进行有效模仿、创新,以及扩展,以此丰富人工智能的技术、方法以及相关理论知识等。现阶段,人工智能在网络信息检索系统中的具体应用主要表现在智能代理以及智能知识服务系统中。智能代理技术最早诞生于20 世纪80年代,是人工智能研究领域中十分重要的研究内容,能够针对网络信息检索中存在的问题进行有效缓解与解决。

智能代理技术是一项软件程序,使用户能够在代理通信协议的帮助下实现信息资源的交换,从而有效解决信息检索问题。智能代理技术具有以下特征:自动化、智能化、动态化、协作化、代理化以及主动化[2]。智能代理技术在信息检索中具体应用表现为智能搜索代理,其能够以用户的具体需求为核心导向内容,进行信息资源的整合收集以及分类加工,会依据用户的特定需求以及近期偏好习惯等作为衡量标准进行信息筛选过滤。在用户界面能够为用户提供良好的自然语言查询功能。当用户具体查询需求缺乏足够的明确性时,智能代理会启动系统中的推理机制,依此判断数据库中符合用户潜在需求的内容,同时依据用户习惯进行近似检索。

智能知识服务系统在实际应用中的主要目的在于帮助人们解决数据资源体量庞大,但是资源获取具有一定难度的问题。智能知识服务系统主要包括数据资源采集系统、智能处理系统、智能服务系统以及资源数据库系统。数据资源采集系统主要负责对整合收集到的数据资源进行加工处理,以此将其有效转变成专业的知识信息。智能处理系统主要负责将采集到的知识信息与资源数据库中现存的知识信息进行关联分类,并将符合条件的知识信息精确上传到资源数据库中。智能服务系统以及资源数据库系统又可以成为智能知识存储系统,是整个智能知识服务系统中最为重要的组成部分,其直接影响到智能知识服务的整体质量与效果。

3.4 信息过滤技术

信息过滤技术主要包括两方面,分别是信息过滤与安全过滤。信息过滤主要包括数据深入挖掘以及搜索引擎过滤等,是对信息资源内容的过滤;安全过滤主要是指对信息资源安全性的过滤。传统的过滤方法主要包括文本过滤、包过滤以及应用过滤等,具有操作简单便捷、灵活性低下、无法有效分析文章语义等缺点。而基于人工智能技术的新型信息过滤技术与传统技术相比,能够有效实现文本内容的智能化过滤,不仅提高信息的安全性,同时还能够有效降低网络管理系统需要进行的过滤负担。

3.5 语音识别技术

语音识别技术主要包括模式识别、信号处理、人工智能、发声与听觉机制以及概论理论与信息理论等,在人工智能技术中具有十分广泛的应用,同时在信息检索系统中能够起到良好作用。其主要功能是将人类复杂多样的自然语言进行有效识别,以此对语言信息进行适当过滤,提取其中的关键语音信息,以此为基础进行信息识别[3]。在识别过程中会将难以有效识别的信息单独处理,在对语音内容进行整体分析加工后,对关键内容进行重新组合,以此检索有效信息。

3.6 异构信息整合以及全息检索技术

异构信息技术在实际应用中能够帮助用户对不同格式化的文件信息进行有效检索,包括XML、HTML、PDF、RTF、TBXT 等常见文件格式;异构信息检索技术同时支持多种非中文语言信息的有效查询检索;支持结构化信息数据、非结构化信息数据以及半结构化信息数据的统筹管理;与关系数据库之间无缝集成;与开放性检索接口之间有效集成。全息检索主要是指支持一切方法与格式的信息检索,从现阶段应用情况分析,异构信息检索以及全系检索等存在较大的发展进步空间,需要对自然语言理解、人机交互以及多媒体信息检索等进行进一步深入研究。

4 信息检索质量中存在的问题

在传统的信息检索模式中,虽然用户因为年龄、职业、兴趣爱好以及个人习惯等因素存在一定差异,导致其对于信息检索的需求不尽相同,但是各领域专家能够有效解决问题。对于计算机系统而言,对用户类别进行精准定位同样是一项相对复杂的工作。各行业领域的高度专业性导致计算机系统难以高效整合信息资源,同时计算机系统缺少专家具备的丰富经验,对专业知识系统缺少正确的理解认知。在信息体量庞大的情况下,信息检索技术通常会使用两种常见的检索技术,即分类技术与整体检索技术。分类技术是指将检索内容依据学科、概念等进行分类,将其规划到对应的类别中。整体检索技术就是指对整体文档或内容进行搜索,但是为了搜索的精准化依旧需要将搜索内容简单地划分类别。但是,随着大数据时代的到来,公共图书馆在日常运行的过程中需要处理海量的信息数据,进而导致传统的信息检索技术难以有效保障检索质量与效率,对新进的信息概念理解不够明确清晰,在数据分类过程中会出现分类错误的问题,进而导致数据信息检索质量相对低下[4]。信息检索相对比较浅显,对信息的分析停留在文字表面,难以有效理解语句中的内在含义,在信息量庞大的情况下,会导致信息检索的准确度出现一定下降问题。

5 人工智能技术在公共图书馆信息检索中的服务应用

5.1 开展个性化服务

个性化服务主要是指依据用户的实际检索需求、用户行为习惯、浏览偏好以及用户个体特征等进行相关的信息检索服务,在个性化服务过程中始终坚持“以用户需求为核心”的服务思想。公共图书馆具有一定的广泛性,用户群体结构十分复杂。在现阶段网络信息服务环境中,用户信息必须进行深化、细致化以及个性化,这一要求直接决定了整个信息检索服务的走向,即在实际生活中需要确保用户能够在检索过程中快速、精确地寻找到自身所需要的有效信息。

5.2 知识服务

由于用户信息搜索行为和搜索内容以及信息服务环境的变化,公共图书馆应当提供良好的知识服务,并对现有知识体系与内容进行创新优化。在人工智能技术应用的过程中还需要为用户提供非智能化与非专业化图书馆所提供相应的公共服务,包括传统模式的信息检索以及相关资源信息的传递等服务。随着人工智能技术的深入推广与应用,用户对于现代化信息检索服务的接受程度越来越高,同时社会群众在开展公共知识学习的过程中更加倾向于专业知识学习。因信息检索的过程中,应当将技术重点放在信息资源获取方法以及知识问题解决方法中,而不是信息资源的获取途径[5]。在信息资源数字化、智能化发展的过程中,应当对信息检索以及相关资源收集整合方法进行简捷优化,以确保图书馆能够高效整合公共教育资源,同时确保用户能够更加便捷、精准地检索到想要的信息资源,从而实现信息检索以及非信息检索的目的。

5.3 细分信息用户结构

公共图书馆与高校图书馆、研究类图书馆以及其他种类的图书馆相比具有较为明显的特征,即公共图书馆的使用量相对较大,同时对于公共资源的需求种类与数量更加严格。在对用户种类进行分割的过程中,主要结合用户群体的具体结构对公共服务方法进行划分,在结构划分后,公共图书馆能够以不同分类的用户需求开展针对性公共服务,从而确保社会群众能够有效进行公共教育学习,享受到个性化、专业化的公共服务,从而有效发挥公共资源的社会价值与教育价值。

5.4 智能代理服务

智能代理服务会随着信息环境的变化而进行适当调整,依据提前制订、完善的策略方案与用户检索需求进行相关信息查阅、筛选以及分类管理等,从而能够有效弥补传统模式中需要等待用户输入指令的缺点。智能代理服务能够在自动化信息资源收集的同时建立索引,经过检索器以及用户查询输入索引库,将最终的查询结果呈现给用户。同时,智能代理服务还能够依据当前环境对用户想要查询的内容和目的等进行有效的预测推理,并结合运行环境的变化情况对预测结果进行调整变动,从而明确用户的检索结果。智能代理服务在运行过程中都会具有完整的智能体系,具有一定程度的问题处理能力以及目标分析能力。

服务器在引入智能代理思维逻辑后,会利用用户反馈机制对信息检索进行完善优化,从而确保信息检索的工作质量与效果,同时能够为用户提供比较复杂的检索服务[6]。用户需要登录特定的个人账号,账号需要对用户的查询检索记录进行记录,当用户再次登录时,检索系统能够依据记录信息为用户提供智能化与人性化的检索服务,提取用户经常查询检索的信息资源,防止出现多次复查的现象。

除此之外,对用户反馈意见进行追踪分析能够获取到用户对于检索结构的满意程度,进一步完善信息检索的质量。由此可见,智能代理服务能够有效保障计算机系统快速、准确地了解到用户的具体需求,从而确保人机合一,实现智能化服务的最终目的。

5.5 自然语言理解运用

自然语言属于人工智能领域中的一项分支科目,其中包含了逻辑学、计算机、语言学等内容,其中主要以语言学为重点内容。利用计算机模拟人类语言,以此代替部分资料查阅、信息编写以及文献摘录等工作。自然语言在实际应用中的工作流程主要为:在计算机系统中输入一定的语法、词语、推理规则以及语义规则等。在用户输入检索内容后,计算机系统能够对检索内容进行逐句扫描分析,结合信息库识别所有的词语以及语法,并对词语进行组合分析,推理检索内容中的大体意义与内容,从而对知识库进行相关信息查阅,将近似语义的结果依据关联程度展示给用户[7]。

自然语言处理技术能够对语句段落进行有效分割与标注,对检索内容进行语法和语义分析,将搜索库中的涉及内容进行识别标注,同时提取其中的关键信息以及搜索特征等,随后对语法含义进行有效识别与分析,并将其形成词典以及知识数据库。自然语言技术在实际应用中需要人工智能技术以及计算机技术进行辅助实施,不需要过多的用户参与,因此在公共图书馆信息检索中具有十分广泛的应用。

6 结语

公共图书馆是确保我国社会公民能够有效进行社会学习的重要场所,在新时代发展中,公共图书馆为优化自身服务质量,提高用户公共阅读体验,应当积极应用人工智能技术对信息检索进行优化改革,以此提高信息检索质量与效率,进而推动公共图书馆向着智能化、科学化方向健康发展。

猜你喜欢
信息检索检索人工智能
2019年第4-6期便捷检索目录
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能与就业
IT经理世界(2018年20期)2018-10-24 02:38:24
数读人工智能
小康(2017年16期)2017-06-07 09:00:59
下一幕,人工智能!
南风窗(2016年19期)2016-09-21 16:51:29
医学期刊编辑中文献信息检索的应用
新闻传播(2016年18期)2016-07-19 10:12:06
专利检索中“语义”的表现
专利代理(2016年1期)2016-05-17 06:14:36
基于神经网络的个性化信息检索模型研究
教学型大学《信息检索》公选课的设计与实施
河南科技(2014年11期)2014-02-27 14:10:19
公共图书馆信息检索服务的实践探索——以上海浦东图书馆为例
图书馆界(2013年5期)2013-03-11 18:50:29