基于移动视觉搜索机制的数字图书馆建设研究

2022-05-17 00:40何佳

信息记录材料 2022年3期

何佳

（西安思源学院陕西西安 710038）

0 引言

当前人们日常工作生活中的信息数据越来越多，且内容形式也变得更加复杂、多样化，例如文本、声音、图片以及视频等，信息数据的爆炸式增长增加了人们检索信息、处理信息的难度。而随着互联网、云计算、大数据等现代化技术的发展，极大地丰富了处理信息的手段，使信息的检索、处理和整合不再是难题。文本和声音信息是人们最常接触到的信息资源形式，处理技术手段也相对比较成熟，然而图片和视频相比文本和声音而言，所蕴含的信息更为丰富，研究价值也更高。移动视觉搜索机制就是一种处理图像数据的技术手段，用户只需要利用手机摄像头对准物品拍照上传，就可以得到物品的所有信息，搜索速度快且准确率高。图书馆拥有丰富的信息资源，是人们获取信息和知识的重要场所，因此如何让用户快速、准确地检索到想要的信息就成为最关键的问题[1]。将移动视觉搜索机制应用到图书馆信息检索过程中，将会为图书馆信息检索速度和准确性带来质的飞跃，极大地提升人们的信息检索服务体验。

1 移动视觉搜索机制概述

1.1 移动视觉搜索机制介绍

移动视觉搜索机制（Mobile Visual Search，MVS）是指利用手机或者电脑等移动电子设备进行图片、视频等视觉数据的采集，并将其作为检索对象上传至视觉搜索引擎，就可以快速反馈得到与之相关联的信息的一种信息检索技术手段。移动视觉搜索机制需要在数据库的基础上，进行特征提取并建立相应的特征索引库，用户在上传图片点击搜索之后，移动视觉搜索机制会对照片进行特征提取，并与特征索引库中的图像特征进行检索比对，最终得到图像的关联信息[2]。移动视觉搜索机制使用户的搜索体验更加生活化，搜索方式也因场景的不同而具有多样性，移动设备也使得搜索方式变得更加智能和方便，搜索过程也变得更加高效；移动视觉搜索机制使人与设备之间的信息交流转变为人与人之间的信息交流，用户在资源搜索过程中充分感受到人性化。

总的来说，移动视觉搜索机制的基本技术框架主要包括建立特征索引库和图像检索两个部分，建立特征索引库是指需要对图像库中所有的图像进行特征提取，根据特征的不同进行分类、整理，并建立相应的特征索引库；图像检索则是在建立特征索引库的基础上，对所查询的图形的特征进行提取，并与特征索引库中的特征进行比对匹配，最终得到相一致的图像信息，具体见图1。

1.2 移动视觉搜索机制的优势

由表1 可以看出，移动视觉搜索机制作为一种新型的搜索模式，相比传统的检索方式而言，具有以下优点：（1）高度智能化。大数据、云计算等互联网技术的发展使得移动搜索装置变得更加智能化，系统会对用户的检索习惯、浏览习惯进行记忆，并根据用户的喜好推送相关的信息；（2）个性化更强。随着科学技术的发展，人们在信息获取过程中会更加关注多样化的个性体验，而移动视觉搜索机制可以根据用户的个性化需求提供高质量定制服务，满足不同用户的不同需求；（3）用户群体大众化。科技手段的不断进步，使得人们对于互联网技术和移动电子设备的依赖性更强，移动视觉搜索机制满足了人们随时随地就可以进行拍照搜索的需求，快捷、便利的信息检索服务使人们对移动视觉搜索机制的认可度更高，它的用户群体也会更加大众化；（4）检索灵活度高。移动视觉搜索机制的检索词可以是文本，也可以是视频、语音和图像等，且往往只需要一次检索就可以得到比较全面的信息资源。而传统的信息检索词仅局限在文本形式，且往往需要多次检索才可以得到准确的检索结果；（5）交互性更强。传统的文献检索往往以图书馆的单向服务为主，缺乏交互性，而基于移动视觉搜索机制建立的图书馆充分考虑了读者需求，不仅检索结果更加可视化，而且用户还可以通过线上论坛进行讨论交流，增加了用户之间、用户与检索机制之间的互动，更有利于提升用户的检索体验[3]。

表1 移动视觉搜索机制与传统信息检索机制比较

2 基于移动视觉搜索机制的数字图书馆的构建

基于移动视觉搜索机制构建的数字图书馆主要包括传输感知层、资源整合层、视觉检索层以及智慧服务层四大模块，见图2。

2.1 传输感知层

传输感知层是指对一些基础信息资源进行获取以及分析和存储的过程，传输感知层是移动视觉搜索机制的基础。基础信息资源通常包括图书馆数字资源和用户情境信息，图书馆数字资源具体包括图书馆的馆藏文献、电子资源以及影像资料等，在对数字资源进行采集上传之后，需要依据一定的处理标准对数字资源进行标引、分类，从而保证上传数字资源的规范性；用户情境信息主要包括用户的基本信息、物理信息以及查询信息，基本信息是指用户的性别、年龄、职业、文化程度、兴趣爱好和手机号等，物理信息是指用户在检索时所用设备、地理位置、网络信号状况以及查询时间等，查询信息则是指用户在检索过程中与检索平台或系统的互动，通常包括注册信息、在线问卷调查以及检索日志等[4]。而对于用户情境获取的方式一般是包括传感器、监控设备、图像采集设备以及全球定位系统等。

2.2 资源整合层

资源整合层是指在传输感知层的基础上，将基础资源数据库（文本库、语音库、图片库以及视频库等）提取、处理和整合，并建立相应的语义特征索引库和用户特征索引库，用户在进行视觉资源检索时就可以快速将视觉检索对象与资源库中的数据信息建立语义关联。而且在用户检索过程中，系统也会将用户的检索行为进行记录，将记录结果转化成模型用以表示和描述用户的相关特征信息，来作为视觉检索过程中推荐数据的依据，这也是移动视觉搜索机制实现个性化服务的重要基础之一。而对于新用户而言，系统可以根据类似用户的相关检索数据对新用户的检索目的和爱好进行预测，这样可以大大提高新用户检索的准确性[5]。移动视觉搜索机制还可以不断地进行智能化分析和优化，通过不断分析用户的检索日志以及用户对检索结果的反馈，不断地更新用户的特征信息，并自动优化推理规则，使搜索精准性不断提高，有效地解决检索过程存在的语义鸿沟问题，由此以用户画像和融合情境为基础建立的移动视觉搜索机制可以更好地为用户提供个性化、智能化服务。

2.3 视觉检索层

视觉检索层是指在用户输入图像进行检索后，系统根据资源整合层的信息基础，采用特定的检索技术检索得到与用户检索目的相一致的检索结果。视觉检索层的重要检索技术手段包括图像的ROI 定位、语义分析、情境建模、资源匹配等。首先，图像的ROI 定位是将用户输入的待查询图像选择一个局部区域进行特征提取，这样可以将对大图像的处理转变成小图像的处理，减少处理的图像范围和计算量，由此缩短检索的时间；语义分析是指对各类图像资源进行语义的抽取和分割，以此来找出语义文本和图像数据之间的关系，并为图像信息赋予语义标签；情境建模是指通过构建的用户情境模型对用户的检索目的和检索需求进行预估，并将其作为一定的检索依据来为用户提供检索服务；资源匹配则是根据上述检索运算，与视觉信息资源索引库中的数据进行特征匹配，从而得到与用户检索图像对象相匹配的各种信息资源。

2.4 智慧服务层

智慧服务层为用户提供了更具交互性的知识服务，用户不仅可以随时随地检索图像资源，还可以对图书馆里的特色馆藏资源进行搜索，通过拍摄相关的实景直接就可以搜索得到相关的数字化内容。另外，移动视觉搜索机制中还有线上讨论平台，用户可以将检索过程中遇到的问题在线上讨论平台上发布出来，与相似情境下的其他用户进行交流和讨论，还可以直接与专家进行探讨解答疑惑，实现线上知识信息的交流与共享。图书馆还可以根据移送视觉搜索机制中的个性化服务，为用户主动推送相匹配的信息资源和相关咨询。而且图书馆的知识可视化服务可以将文字知识以视觉表现形式描述出来，也可以将检索内容与学科领域、资源主题之间建立一定的联系性，这都极大地丰富了知识的表达形式，使用户更乐于去获取知识，并加深对检索结果的记忆和理解[6]。另外，基于移动视觉搜索机制建立的数字图书馆还拥有智能的评估机制，通过不断地统计检索的响应时间、设备的兼容性、检索资源的占用率以及用户的反馈信息，对检索服务质量进行评估，并不断地进行优化，使移动视觉搜索机制的检索变得更加实时、精准、一致和丰富。

3 基于移动视觉搜索机制的数字图书馆建设优化路径

移动视觉搜索机制依托于大数据、互利网等先进的科学技术，是实现图书馆检索技术变革的重要技术手段，因此应该继续加强对移动视觉搜索机制的建设，可以从以下几方面着手：（1）加强对图书馆信息服务人员的培养。当前图书馆信息服务人员缺乏移动视觉搜索理念，且计算机水平和移动视觉搜索机制的技术水平都不高，因此应该加强移动视觉搜索机制相关知识的培养，使信息服务人员掌握一定的计算机技术和移动视觉搜索机制技术。另外，还要积极培养信息服务人员的综合素养和服务技能，提高数字图书馆的服务效益。（2）提高视觉对象数据库的建设水平。视觉对象数据库是移动视觉搜索机制的基础，不断地完善视觉对象数据库数据内容和数据形式，可以有效避免信息资源单一化的呈现，为用户提供更加准确、丰富和多样化的信息资源，可以更好地提升用户的检索体验感。（3）注重“以用户为中心”的建设转型。图书馆是为用户提供信息资源的场所，数字图书馆的建设应以用户的需求和喜好为基础，在建设过程中加强与用户的互动交流，邀请用户参与到建设中，实现数字图书馆的共建共享。（4）完善图书馆数字人文专题资源建设。目前图书馆对一些珍贵的历史文献传播和利用较为欠缺，例如名人字画、真人手稿、典藏古籍以及一些历史影像资料等，由于资料的特殊性，图书馆也没有相应的纸质资料，导致图书馆难以发挥其应有的人文资源优势，移动视觉搜索可以有效地完善这些资源信息，图书馆相关管理人员可以对人文专题资源进行收集，利用数字技术对文献进行存储，用户可以通过移动设备扫描二维码，然后自动跳转相关文本、影像等相关界面，界面还应包括多种方式的资源信息介绍，例如视频、语音以及图片等，从而增强用户的阅读体验，提高图书馆资源的利用率。（5）增强数字图书馆人工智能项目建设。移动视觉搜索系统与人工智能相关技术相结合可以极大促进用户的资源检索效率，并能够让用户获得较好的使用体验。智能检索技术主要包括以下几方面：自然语言处理技术、跨语言相似性检索技术、数据挖掘技术、关联规则挖掘技术等。目前我国图书馆人工智能项目建设大多数都倾向于人脸识别、人机交互等多种传感器的智能服务研究，例如用户可以录入人脸信息，通过人脸识别技术进行图书借阅、归还等操作，提高图书馆的管理效率。

4 结语

图书馆是用户获取知识和进行科研学习的信息资源中心，基于移动视觉搜索机制建立的数字图书馆不仅创新了信息检索的方法，还极大地丰富了信息检索的内容形式，使信息检索变得更加实时、准确和多样化。因此图书馆的有关管理人员应该从加强图书馆信息服务人员培养、提高视觉对象数据的建设水平以及注重“以用户为中心”的建设转型着手，加强对数字图书馆移动视觉搜索机制的建设，实现数字图书馆信息服务的高质量发展。