卢昱佑
摘要:信息检索是信息科学和计算机科学领域中都有涉猎的部分,与用户的交互关系密切。信息科学和计算机科学研究人员对信息检索有不同的认识和理解,所研究出的信息检索工具功能有较大差异。本文主要针对信息科学领域和计算机科学领域的信息检索理论架构进行讨论,为信息检索的发展提供一些思路。
关键词:信息科学;计算机科学;信息检索理论架构
引言:信息科学是一门研究信息运动规律和信息应用方法的科学,计算机科学是一门研究计算机结构、程序系统、计算机语言、算法的科学。二者对信息检索有不同的认识,所研究出的信息检索功能有不同的侧重,用户对同一信息的检索结果可能相似,也可能大相径庭。
1 信息科学领域下的信息检
1.1 信息科学领域
信息科学以信息为主要研究对象,将信息视为一种普遍存在的事物,这是信息科学与其他科学的根本区别。信息检索是信息科学研究的课题方向之一,指用戶查找信息的方法和手段,分为狭义和广义两种,狭义信息检索是指单纯借助检索工具查找到信息目标的过程,广义信息检索带有加工、组织、整理的过程。
1.2 信息检索
信息科学领域下的信息检索理论以信息存储为基础,将信息与其存在的物理角度、认知角度、情境角度进行匹配,才能形成完整的信息内容。从物理角度来看,信息是可以计算价值的一种消息;从认知角度来看,信息让信息接受者对世界的认知产生一定的转变;从情境角度来看,信息在特定社会语境下发挥作用,真实度有所侧重。
2 计算机科学领域下的信息检索
2.1 计算机科学领域
计算机科学与计算、信息处理的关系密切,计算机科学领域中有大量与信息有关的研究课题和方向,诸如信息编码论、数据库和信息检索、网络与通信等。计算机从研发之初就一直被用于处理信息,可以说计算机科学是一门研究信息处理的科学。
2.2 信息检索
计算机科学领域下的信息检索理论不关心信息的多层次性,直接将信息视作事实的观点,或将信息视作一个客观存在的物理事物,比如文字、图片、音频、视频等。
3 信息检索理论架构分析
3.1 信息科学领域信息检索理论架构
3.1.1 用户视角
第一,信息检索原则。信息科学领域中的信息检索原则为最小努力原则,即人们希望付出最小的时间、精力、金钱获得最想要的信息[1]。鉴于此,信息检索相关研究遵循检索功能用户的需求对检索系统进行设计,结合上下文、结果展示等间接影响因素来提高检索速度。
第二,检索迭代过程。由于信息时刻处于丰富、增长的状态之下,所以信息检索也被视为一个动态、变化的过程。用户在不同时间点上对于同一个信息进行检索,能够获取的信息并不相同;信息在不同领域内的表达结果也有所不同。因此,信息检索研究领域为信息检索增添了迭代元素,供用户从时间、从常用程度、从信息发布领域等角度进行信息检索,充分满足用户的信息检索需求。
3.1.2 技术视角
随着信息科学相关技术的不断发展,信息技术可以实现对用户检索首选渠道、偏好的判断,综合用户的日常信息检索内容、浏览网站、语境等其他因素,将信息检索中相关渠道和偏好优先展示。这样的信息检索结果呈现方式在大多数时间内可实现最小努力原则,满足用户的检索需求。信息科学领域的这一信息检索理论支持了当前互联网大数据推荐的技术成果,即用户在搜索引擎中检索学术信息,优先呈现常浏览学术网站的检索结果等。这样的技术提高了用户检索的效率,但也因为不全面展示信息检索成果而存在造成用户信息茧房的隐患。
3.2 计算机科学领域信息检索理论架构
3.2.1 用户视角
与信息科学领域不同,计算机科学领域的研究人员在研究和开发信息检索功能时更多考虑信息对用户的有益性,提供给用户更多的信息。因此,很多信息检索引擎、工具的研发都在探索更多的检索方式,更有效的信息存储方式,更成功的索引方法。虽然更多的信息未必能够帮助用户做出正确的决定,但研究人员认为在用户并不能总是正确权衡信息检索努力成本和收获效益关系的情况下,更多的信息有利于用户。提供更多的信息还是提供更符合用户需求的信息,是信息科学与计算机科学在信息检索理论架构方面的主要矛盾[2]。
3.2.2 技术视角
在计算机科学领域中,用于信息检索的查询线索可以是文字、图片等多种形态,并不局限于字、词或语法命令。查询线索是信息检索的关键一环,直接影响检索结果的排名先后和呈现方式,因此,在计算机科学领域中关于查询改写、查询扩展等研究比较热门。在查询的重要性方面,信息科学和计算机科学的研究人员态度一致。
3.2.3 信息视角
在计算机科学领域中,研究人员同样承认信息环境的重要性,实现了对文本的统计分析、文件集合内的索引,并通过引入概率等数学模型来实现对非文本信息的检索,推动信息检索领域向着呈现更多信息检索结果的方向发展。在对不同信息检索成果的呈现上,计算机科学研究人员更倾向于通过匹配算法来决定先后顺序,而不是文本与检索对象的相关率,这就导致用户可能并不能在前排成果中发现自己想要的检索结果。但同样,匹配算法可有效降低相似程度高的检索结果造成的信息噪声,帮助用户更快找到并不相同的类似文件,扩大检索范围。
结束语:本文对比了信息科学和计算机科学领域中不同的信息检索理论架构,可以发现两个领域中对信息检索的认识有较大区别,且都能够对用户的信息检索需求提供帮助。事实上,用户在不同情况下有不同的检索需求,并非一个领域下的信息检索功能能够满足,信息检索功能的适用性发展还有较长的路要走。
参考文献:
[1]黄庆榕. 浅析信息科学领域与计算机科学领域信息检索理论架构研究[J]. 信息系统工程,2016(12):43.
[2]刘蓉梅. 现代信息检索理论架构研究[J]. 科技情报开发与经济,2015,25(02):132-134.
[3]杨晴.计算机信息检索步骤思考[J].现代商业工贸,2011,23(19)224
[4]刘兴达.计算机信息检索技术的发展及问题研究[J].科技与创新,2018(02)121-122