搜索引擎个性化信息服务探讨

2013-08-21 08:36
图书馆 2013年1期
关键词:搜索引擎检索个性化

(南开大学商学院信息资源管理系 天津 300071)

1 搜索引擎个性化信息服务概述

1.1 个性化信息服务

马忠庚等人将个性化信息服务定义为能够满足用户个体信息需求的一种服务,即根据用户提出的明确要求提供信息服务,或通过对用户个性、使用习惯的分析而主动地向用户提供其可能需要的信息服务〔1〕。个性化信息服务应该根据用户的知识结构、心理倾向、信息需求和行为方式等来充分激励用户需求,促进用户有效检索、获取信息以及有效利用信息等,并在此基础上进行知识创新。刘蕤认为,个性化信息服务,是指针对用户提出的明确要求,利用搜索软件在海量信息库中筛选出符合其需求的信息,或通过对用户个性、使用习惯的分析主动地向用户提供其可能需要的信息服务〔2〕。

比较上述二者的定义可以发现,个性化信息服务主要由对应的两个方面共同构成,一个是用户推动,即信息定制;另一个是机器推动,即计算机分析记录用户行为,发现潜在规律,建立独立的用户兴趣模型,进而运用相关的技术与算法,主动向用户提供尽可能满足用户喜好的信息与服务。

通过用户个人的主观描述以及机器客观的深层分析与挖掘,必将带来更加良好的用户体验。首先,每一位用户都是一个独立的个体,其知识结构、心理倾向、获取信息的类型与方式都是特有的,所以,信息服务应当为用户量身定做合适的服务内容与方式。其次,网络信息资源类型、内容的多样性,一方面为用户提供了多种选择,但同时也增加了用户挑选所需信息的难度,降低查询与浏览效率。若能提供个性化信息服务,用户便可以在固定模块或站点迅速找到具有很高权威性与可靠性的目标内容,并可实时获得更新信息。最后,用户的这种个性化信息需求,对某些站点服务器数据库中信息资源原有的组织方式也会带来新的挑战,比如,原先所使用的分类方式面对用户的查询需求与兴趣模型,可能会暴露其缺陷,并促进技术人员研究出更为高效的组织方式等〔3〕。所以,个性化信息服务的提出为传统的信息服务业带来了挑战,但也面临着很大的机遇。

1.2 搜索引擎的优势与劣势

1995年,雅虎用目录式搜索方式敲开了搜索引擎的大门,以一种把各类网站分类、排序的方法将纷乱如麻的网络信息理出些许头绪。1998年,Google举起了第二代搜索引擎的大旗,即关键词搜索,搜索框的出现给用户带来了惊喜,它实现了检索的机器化,其PageRank链接分析算法等新技术的出现更是提高了搜索质量与搜索效率。归纳起来,当前搜索引擎的优势主要体现在以下几个方面。

(1)超链分析。超链接的出现极大地方便了相关信息之间的跳转。超链通常分为三类:锚点链接、内部链接以及外部链接。对于网站建设者来说,超链接使得站内的页面之间互相有联系,结构清晰且有层次,通过链接可以引导用户。对于用户来说,则可以更加快速地跳转到自己感兴趣的页面。对于搜索引擎本身来说,则提供了一种对页面的等级/重要性进行计算并排序的更为科学的途径,譬如google的PageRank算法。

(2)反应速度快。搜索引擎极大地提高了人们手动查找信息的效率,它借助于计算机强大的计算能力以及自身内部的搜索算法,使得用户在输入关键词并开始搜索之后不到一秒就可以得到相关结果的标题与摘要。用户只需要浏览这些结果并点击链接便可以轻松得到详细的信息内容。

(3)操作简便。不论是关键词搜索还是目录搜索,对用户的技术要求都很低,用户只需在搜索框中输入自己的问题,而查找的过程与排序的算法都是透明的。任何人都不需要进行专业培训、掌握专业技能,就可以进行简单的搜索操作。

(4)网络资源丰富。网络资源类型多样并更新迅速,网络资源的开放性与获取方式的便捷性,对用户来说更是无法抗拒。而且,随着用户数量的增多以及用户需求的多样化,越来越多的传统纸质文献都会被数字化,更加方便大众的使用。

纵观前两代搜索引擎可以发现,导航目录式搜索引擎只能给用户提供简单的大致方向,而不能提供精准的结果;而关键词搜索则以其机器内的固有算法,为用户提供大量可能相关的网页列表,至于哪些是真正满足用户需求的,依然要由用户自己判断,用户体验依然不够好。网络世界正在呼唤更为强大的第三代搜索引擎。微软亚洲研究院高级研究员周明博士则定义第三代搜索引擎是“全信息基础上的个性化搜索,并在此基础上作推荐”的智能化搜索〔4〕。目前Web服务范式〔5〕发展非常迅速,一些Web服务商也在开发能够在分布式以及异构环境下为用户提供服务的技术。这种技术的应用将使用户能够在任何环境下得到所需要的任何信息〔6,7〕。譬如,Web服务不仅能够定位用户的具体地点,而且能够记录用户的路线,并能够根据这条路线为用户提供可行性的建议等〔8〕。

随着互联网的发展,搜索引擎面临着众多的功能与技术上的革新。同时,随着Facebook等社区网站的逐渐流行,社交网络平台和相关应用占据了互联网的主流,而社交网络所强调的是用户之间的联系和交互;Twitter、微博等提供微信息发布的个人媒体平台逐步兴起,又对搜索引擎的实时性提出了更高的要求;面对移动互联网的快速发展,针对移动设备的各种新特点,提供适合移动搜索的搜索引擎又成为新的挑战等〔9〕。这些发展潮流使目前的搜索引擎暴露出越来越多的弊端,越来越不合时宜,具体体现在以下几个方面。

(1)被动接受用户的提问,主动性明显不足。当前的搜索引擎只能根据用户输入的关键词,返回索引库中已经被网络蜘蛛抓取到的网页标题与摘要信息。不论搜索者是谁,只要输入的关键词是一致的,返回的结果也完全相同。虽然目前一些搜索引擎包含个人主页,并针对以往的搜索历史进行话题推荐,但这种推荐机制层次很低,只是简单匹配关键词,不能了解用户真正的需求爱好。而真正能够满足个性化需求的搜索引擎,不仅要返回机器算法认为相关的结果,而且应当尽可能地收集用户行为信息,了解用户的个性、知识结构、兴趣爱好、职业等信息,从而在机器搜索结果的基础上,过滤掉那些与用户需求明显不匹配的条目,减轻用户挑选的难度。还可以利用协同过滤技术,将用户兴趣模型比较相近的用户进行聚类,发现用户新的潜在的兴趣点,扩展更新兴趣模型,改善搜索结果。

(2)因传统搜索引擎固有的工作机制,使得搜索结果内容有一定的时滞。传统的网页搜索依赖网络蜘蛛抓取的网页建造索引库。由于互联网网页众多,同一个网页被蜘蛛再次抓取必然要间隔一定的时间周期,而这对实施搜索是非常不利的。在大多情况下,用户想要了解某些最新的信息,会求助于搜索引擎,所以搜索引擎必须要建立实时索引库来收录那些经常更新的站点,以及包含当下热点新闻的站点,并尽可能与社区网站建立联系,借助于社交网络巨大的用户群以及随时随地更新的信息库,为搜索用户提供最具时效性的相关信息。

(3)尽管现有搜索引擎已经开始设置个性化用户界面,但实现程度依然很初级,不能实现记录用户特征智能化,满足即时需求。智能型体现在两个方面。首先是对用户兴趣模型的主动更新。每一个体的知识结构都是阶段性的,其信息需求也将是阶段性的。搜索引擎应该随时随地关注用户的浏览行为以及浏览记录,并对记录进行分析,发现潜在的细微变化,并及时更新兴趣模型。兴趣模型的维护是一个动态的过程,而不应一劳永逸。过期的模型库所反映的搜索结果甚至会使用户感到反感,不利于用户体验。另一方面,体现在情境搜索,即针对“此时此地此人”来建立模型。建模的目的是为了更好地了解用户需求。一般用户的搜索都是与此情此景分不开的,需要搜索引擎可以定位用户的地理位置。所以智能化为搜索引擎提出了很大的挑战。

(4)对于专业性高或者复杂的问题找不出满意的答案。网络信息资源固然丰富多样,但就目前来说,对于专业性强的问题,依然无法找到全面且权威的答案。这要归因于搜索引擎与专业性网站的关系,大多数专业性的全文数据库都是付费的,而且其内部有自己的搜索引擎,对外部的搜索引擎是屏蔽的,用户当然得不到这类信息。而这部分信息才是最为全面准确的信息。

(5)网络广告干扰。搜索引擎本身就是一个商业化的产品,广告商看到搜索引擎如此快速的成长趋势以及大的用户规模,便会利用这种良好的宣传手段,搜索界面以及搜索结果中会渗入很多广告宣传性的条目,这些条目对大多数用户来说都是干扰性的。

1.3 搜索引擎个性化信息服务现状

艾瑞咨询2010年统计结果显示,中国搜索引擎的用户覆盖率(搜索引擎用户覆盖率是指搜索引擎用户数量占互联网用户数量的比例)从2002年的25.4%迅速增至2012年的82.9%,搜索引擎的受众规模与受众粘性都在逐年增加,并将保持稳中有升的局面,它已经成为用户进入网络的第一入口。所以,提高搜索引擎的个性化信息服务程度,在提高网络服务用户体验中占据着举足轻重的作用。

1.3.1 国内论文期刊网站中有关搜索引擎个性化论文数目与内容统计

本文选取《中国期刊全文数据库》(CNKI)为检索数据库。统计对象为与搜索引擎以及个性化相关的期刊论文,采用标准检索。具体检索策略为:在文献内容特征中选择主题字段,并将主题字段设置为搜索引擎和个性化,两者之间是“并”的关系,选择精确匹配。

对检出的1847篇论文按照相关度进行排序,选择前100篇作为统计分析的对象。采用excel软件对论文的主要信息予以登记,对论文主题词进行提取、归类以及规范化。对关键词的筛选与统计按照以下原则进行:舍弃出现次数少或者与主题相差较远的关键词,合并相近的关键词,共获得12个关键词,并对各个关键词在哪些论文中是作为关键词出现进行了统计,如表1所示。其中“算法”主要是指相关度计算方法、PageRank算法、搜索结果聚类、过滤算法、排序算法等。“技术”则代表了Agent技术、中文分词、人工智能以及建模技术等具体的功能实现方法。

表1 与搜索引擎、个性化相关的期刊论文关键词及出现次数统计

由表1可见,当前个性化搜索引擎的研究重点主要在模型的构建与实现上,大多数研究者在论述自己的模型之前都会先对目前市场上所使用的搜索引擎进行系统性的分析说明,指出现有搜索引擎的诸多不足,进而从现有搜索引擎出发,对相关模块进行改进,并指出其实现的可能性,以期更能满足用户个性化的信息需求。用户兴趣模型的构建以及用户信息的采集与更新,都是满足个性化需求的前提,其高词频的出现是意料之中的。而本体&语义以及Web挖掘的出现则表明,目前个性化搜索引擎的研究不仅仅停留在表面,已开始从更深层出发,运用本体论以及语义层次的相关技术,对用户的网络行为以及网络数据库中的网页内容进行深层挖掘和匹配,使搜索引擎更加了解用户,弄清其潜在的信息需求,精确化检索式并对检索结果进行个性化的排序。

除了统计以上关键词,在这100篇搜索结果中,还有11篇是探讨个性化搜索引擎在具体领域中的应用,例如,个性化基础教育搜索引擎用于个性化教学的研究、农业专业搜索引擎个性化服务研究与实现、知识产权搜索引擎分析与设计等。搜索引擎的发展必将向着专业化、个性化、智能化的趋势发展,而不仅仅向大众提供大量异构的非专业化的杂乱信息。个性化搜索引擎在具体行业的应用体现并推动这种趋势向前发展,大量个性化的垂直搜索引擎的出现恰恰体现了时代的需要。

1.3.2 现有搜索引擎个性化信息服务实例

iGoogle是Google提供的一项服务。该服务让使用者按照个人的喜好方便地定制和整合不同来源的信息,使之成为个性化的门户。该服务的实现主要借鉴了门户(Portal)与门户块(Portlet)的思想,即一个完整的门户页面由用户定制的门户块构成。用户通过访问一个聚合了不同信息来源的门户页面,避免了多次访问的麻烦。个性化的定制选择,为用户提供按需实现的“一站式”服务。这也是目前国内搜索引擎的一个发展趋势——门户化,使用户仅在搜索引擎时便可浏览访问各种信息。

自定义主页的功能使用户可以根据自己的喜好分别选择首页的名称、所需的小工具、页面主题以及页面布局等,并定制自己感兴趣的新闻资讯,如财经、体育、娱乐等,从而构建只属于自己的独特的首页,极大地满足了用户的个性化需求,用户可以方便及时地获取相关信息或登录到收藏的站点。

虽然Igoogle已经有了一些突破,但仍存在很多需要改进的地方。譬如,新闻资讯的定制显示完全依靠用户的主动添加,而且显示的资讯仅仅是标题和摘要,没有有关内容的全局性描述,用户还是需要自己判断哪些信息是自己的兴趣点所在。另外,对提供的信息是有关方面的最新信息,而没有一个侧重点,主题分类比较粗糙,不能够精准表示用户兴趣,并且缺乏对用户自身个性的深层挖掘,只是满足了个性化服务的第一个层次,即用户驱动。

2 搜索引擎个性化信息服务的基本架构

2.1 个性化信息服务工作模块

一般的个性化信息服务工作模块如图1所示。

图1 个性化信息服务工作图示

个性化信息服务的首要前提是构建用户兴趣模型。用户兴趣模型的构建不仅需要用户注册登录网站时所填的各项基本信息如性别、年龄、职业、爱好以及目前所在地等,还需要收集用户的搜索历史、经常浏览的网页、收藏的网页、各类新闻资讯以及在社区网站中所发布的信息等。从这些信息中获得用户的搜索策略、检索式构成结构、主要兴趣点、对某方面信息的喜好或厌恶强度以及对某类信息的需求程度等,进而更有针对性地从数据库中找出适合的特定信息〔10〕,更高效的做法是依靠用户的兴趣模型完善用户的检索词组合,获得扩展的查询,为用户提供超出其预期的、更加满足其需求的信息。提高用户体验将增强用户对该服务的依赖性。需要强调的是,用户兴趣模型的构建是一个动态的维护过程,用户的每次查询都是对模型的一次补充与更新。

2.2 搜索引擎个性化信息服务工作模块

搜索引擎个性化信息服务应当主要体现在:当不同用户在同一时间输入同一检索词时,搜索引擎所提供的检索结果相异。这种相异性所依赖的是,搜索引擎返回的结果不仅仅是从索引数据库中找出与检索词的内容相关度超过一定阈值的标题与摘要,而且还要将用户的兴趣模型考虑在内,不仅考虑内容因素,还要考虑该条目与用户本身的兴趣契合度,条目的排序则是综合这两方面因素的结果〔11〕。搜索引擎个性化信息服务框架如图2所示。

图2 搜索引擎个性化信息服务框架图示

当搜索引擎利用传统算法检索出条目之后,并不直接将结果呈现给用户,而是将初始的搜索结果与用户的兴趣模型进行匹配,不仅考虑到页面的重要性与相关性,还要试图猜测用户的真正意图,并将最有可能引起用户兴趣的结果排在前列,同时去除那些明显不是用户所需的信息。经过重新排序筛选的信息,按照用户之前定制的界面显示提交给用户。虽然搜索引擎的检索工作到此告一段落,但用户兴趣模型模块还要跟踪用户的浏览行为,将用户的注册登录、登录频率、登录地点以及最终点击的页面等信息,分别进行记录并加以分析,以便日后给用户提供更加准确的搜索结果。对于登录频率越高的用户,搜索引擎就越要重视其使用习惯,搜索引擎个性化信息服务中的个性化推荐功能就更加突出,并且对其反馈信息要给予最为优先、及时、详细的回答与响应。登录地点信息是在对用户进行个性化推荐以及对搜索结果进行排序时,需要考虑的情景信息,从而为用户提供更为可靠准确的信息。

3 搜索引擎个性化信息服务的层次

按照搜索引擎介入用户生活的深入程度,搜索引擎个性化信息服务可以分为三个层次:个性化定制、个性化推荐以及决策支持服务〔12〕。第一个层次是个性化定制,作为最初级的个性化服务方式,实现起来最为简单,搜索引擎只需要为用户提供一个可塑造的界面,界面的风格与内容由用户自己选择设置。第二个层次是个性化推荐,不仅为用户提供足够的自由度,而且能根据用户的特征进行有限的推测,并将推测结果显示推荐给用户。其优点是能根据用户的反馈进行推测机制的改进与更新,难度在于用户的特征模型是动态变化的,需要时时进行维护,并且推测机制的算法没有很明显的评价机制,评价体系的构建容易带有主观色彩,不易做到全面考核,这部分工作量很大。第三个层次是决策支持服务,不仅需要了解用户的需求特征,而且加入了环境因素、时间因素等其他客观因素,决策难度明显上升,对用户所处的现实环境也有了更为深入的了解。在这个层次上,搜索引擎已经成为每一个决策者离不开的帮手。

(1)个性化定制。这是个性化服务的最低层次。搜索引擎只需根据用户显示提供的有关个人喜好的基本信息,以及所定制的有关信息,简单地将最新的、最热的信息提供给用户,不论通过Web页面直接推送,还是定期或不定期地将有关更新信息发送到用户的邮箱或者手机终端上。机器无需记录用户的浏览行为,或者动态维护用户兴趣模型。

个性化定制包括三个方面:服务界面定制、信息资源定制以及检索定制。服务界面定制是由用户选择一种适合自己的界面主题以及布局,自己设置各类模块的显示方式以及位置。信息资源定制是信息服务提供商定期或不定期地将用户定制的信息频道以及信息栏目的更新信息发送给用户,构建用户独特的Web页面。由于每个用户的检索习惯不同,使用的检索策略、检索方法以及检索结果的显示、排序、选择也都不同,所以,个性化的检索定制为用户提供了可以记录自己检索习惯的模块,以后对其检索行为都进行相同的处理。虽然个性化定制在一定程度上满足了用户的个性化需求,但这种个性化却不具备足够的智能性,只是满足了个性化要求中的用户驱动。

(2)个性化推荐。个性化推荐应用最广的莫过于电子商务网站。例如,在卓越网上,不论用户是否登录,只要之前在网站上进行过搜索行为,那么在下次从同一个IP进入页面时,便会在主页上显示“更多供您考虑的商品”,这些商品大多与上次搜索的商品是紧密相关的。推荐对于企业,尤其是电子商务企业的巨大潜在效用。具体来说,个性化推荐就是根据用户的兴趣以及以往的购买记录,向用户推荐其可能感兴趣的商品和信息。

个性化推荐所运用的算法包括基于关联规则的推荐算法、基于内容过滤的推荐算法以及基于协同过滤的推荐算法。基于关联规则的推荐算法来源于数据挖掘中的关联分析,通过大量的数据记录,经过文本聚类进行关联分析,从貌似不相关的散乱的信息集中发现潜在关联。基于内容过滤的推荐算法,通过相关特征的属性来定义项目或对象,系统基于用户评价对象的特征了解用户的兴趣,依据用户资料与待预测项目的匹配程度进行推荐,努力向客户推荐与其以前偏爱的信息相似的内容。这种推荐算法简单易操作,但是对用户的兴趣变化缺乏预见性。协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,对该指定用户对此信息的喜好程度进行预测,并将不小于一定阈值的信息推荐给用户。这种推荐算法不仅能找到显示的满足用户兴趣的信息,而且还可以向用户推荐某些隐性的、满足用户需求的信息,帮助用户发现自己新的兴趣点。协同过滤正在成为比较受欢迎的一种推荐算法。

个性化推荐在用户搜索过程中也有很普遍的应用,比如搜索结果的智能匹配,当用户输入不完整的搜索请求或者出现语法错误时,搜索结果的开始便会显示“您是不是要找”;而在微博、社区等站内主页上,也会显示“您可能认识的人”,“您可能感兴趣的人”等等。总之,个性化的搜索引擎应能根据用户以往的操作记录或者个人信息,对搜索结果进行过滤并重新排序,尽可能提供精准的满足需求的结果。

(3)决策支持服务。决策支持系统是通过数据、模型以及知识来辅助决策者进行科学决策的人机交互系统,它是管理信息系统的更高层次。通过向决策者提供分析问题、建立模型、模拟决策过程和方案的环境,调用各种信息资源和分析工具,帮助决策者做出更高水平、更加科学的决策。未来的搜索引擎除了应满足用户对基本信息的需求,还应该能帮助用户针对特定问题做出科学合理的决策。这些问题通常都是结构化程度不高,难以用二维表格阐明逻辑关系,由于问题涉及的层面较多,用户又不可能掌握所有相关的信息,若是简单地将各个方面的信息罗列堆叠起来,容易使用户在巨大的信息海洋中迷失,不利于管理者快速高效地做出决策。这就需要搜索引擎将模型、分析技术与现有的传统数据检索技术结合起来,帮助用户对各种可能性组合进行可行性分析以及效果预测,比较并分析利弊。

这种能根据每个用户的实际需求与面临的现实问题以及所处的复杂环境进行面向单个用户分析处理过程的搜索引擎,便是最高层次的个性化信息服务。搜索引擎本身不再只是解决某一个微观问题的小工具,而是成为帮助决策者立足宏观,不可或缺的一大智库。搜索引擎要达到这种决策支持的水平,就需要充分运用数据仓库、联机分析处理、数据挖掘、模型库、数据库、知识库等资源与技术,使这种现在只能由管理层拥有与使用的技能可以走入日常生活,真正做到面向用户的个性化服务。

4 搜索引擎个性化信息服务的潜在问题

(1)硬件要求。个性化搜索引擎对传统搜索引擎的硬件要求主要体现在两个方面:第一,存储器的容量。一旦要对每个用户提供个性化信息服务,就不得不记录用户的个人基本信息以及个性化的动态信息,进而构建属于用户自己的兴趣模型,而这个模型需要随时随地根据实际情况进行更新。这样一来,用户数量迅速增加,而要维护这部分数据,服务器本身就需要准备足够的存储容量。同时存储空间应该可以灵活扩展,譬如,新数据的大量增加,历史数据的销毁,对腾出空间的再利用等。第二,存储器的存取效率。由于用户对搜索引擎的利用是随时随地的,所以对用户信息地查询也应该“随叫随到”。在这种情况下,最为简便的方式便是在用户的客户端提供高速的缓存空间,来存储那些更新活跃的个人信息,这样也可以减轻服务器的压力。

(2)技术要求。对存储器的要求,除了容量以外,还有存储算法以及存取方式的重新设计,以便在存储容量有限的情况下,实现对存储空间最为有效的合理利用。另一个技术上的要求是,用户的兴趣模型与初始搜索结果的匹配。首先是用户模型的维护。除了将用户的个人信息按照相关字段从复杂的行为中提取出来以外,还要能够看到行为背后隐藏的趋势信息,以便对用户进行个性化的推荐,这就要采用数据库的分析挖掘技术。用户的数量过亿,每个用户的类型又千差万别,浏览模式更是变化多端,机器所具备的分析挖掘能力不仅包括目前所具备的构建索引库、网页聚类、去重、排序等这些针对网页数据库的技能,还应该面向用户,对用户数据库进行分析、聚类、建模,从而可以在网页数据库中挑选更加符合用户个性与需求的信息。人与人之间的比较要比人与算法之间的匹配更加准确、精确,可信度、人性化程度也更高一些。

(3)用户隐私。信息服务提供商要想给用户提供更加精准的信息,就不得不了解用户自身,了解用户真正的信息需求。例如,在用户的搜索引擎日志记录中,记录着用户使用的检索词、对某个主题的检索次数、检索提问式的构成结构、用户在检索列表中选择的某个URL、用户的网页整体浏览情况等信息。对于注册用户来说,还包括用户的个人基本信息、用户的IP、ID等信息,这些是用户不愿意为他人所知的。一旦被机器提取并保存起来,就构成了对用户隐私的威胁。隐私泄露不仅包括内部工作人员的主动泄密,还包括网络黑客,即被第三方非法获取。所以个性化信息服务对用户信息的保密性提出了更高的要求。这不仅要求在技术上提供更加强硬的保护措施,网络工作者自身也要提高自己的职业道德,严格遵守行业的道德操守,同时,对某些至关重要的信息,要提供特殊的保密措施。

(4)效果评测。各个搜索引擎为实现其个性化的信息服务,必然要进行各种探索,从而选出其认为最为有效、最为精确的算法,包括构建用户兴趣模型的算法、挖掘算法,匹配算法、检索词扩展算法以及搜索结果个性化排序算法等,这些都因不同的机构而异。因此,在对各个搜索引擎进行评测时,很难进行规范化处理。即使选定了评测指标,各个指标的权重设定也是一个不可忽视的难题。此外,由于搜索引擎提供的是个性化的服务,每个用户对结果地反馈也不同,主观因素占据很大的比重。所以,对搜索引擎的效果评测,应尽快制定出合理有效全面的算法,可以使结果更加公正、客观、有效。

(5)用户信任。尽管目前有些搜索引擎提供了个性化的主页,但由于个性化程度不高并没有引起大多数用户的密切关注,甚至因登录时的复杂操作而放弃继续体验。实际上,用户对目前搜索引擎提供的个性化粘性不高的重要原因来源于搜索引擎自身。它并没有提供给用户所期望的那种面向自己的服务,只是提供给用户一些可供选择的小工具,这些小工具与搜索本身并没有很大的关系。搜索引擎要想提高用户的使用热情,赢得更多用户的信任,让其都能够加入到“使用-反馈-更新”的良性循环中,就必须提高自身的搜索功能,提供给用户良好的体验,这对搜索引擎以及用户来说都将是两全其美的。

1.马忠庚,王学军,邓建波.Internet上的个性化信息服务.聊城大学学报,2005,18(4):83-86

2.刘蕤.利用购物搜素引擎进行个性化信息服务.现代情报,2004,9:77-79

3.饶增阳.以用户需求为中心的个性化信息服务.南阳师范学院学报,2007,6(7):89-90

4.阅微网.人民网:静悄悄的搜索引擎革命.2012-5-13.http://www.yuewe.cn/portal.php?Mod=view&aid=158232

5.Alonso,G.,Casati,F.,Kuno,H.A.and Machiraju,V.Web Services-Concepts,Architectures and Applications Data-Centric Systems and Applications.Springer,2004,Berlin,Heidelberg.

6.Liu,J.and Zhao,F.Composing semantic services in opensensor-rich environments.IEEE Netw.,2008,22:44-49

7.Berger,S.,McFaddin,S.,Narayanaswami,C.and Raghunath,M.T.(2003)Web Services on Mobile Devices-Implementation and Experience.WMCSA 2003,Monterey,CA,October 9-10,pp.100-109.IEEE

8.Murat Ali Bayir1,Murat Demirbas1 and Ahmet Cosar.A Web-Based Personalized Mobility Service for Smartphone Applications.The Computer Journal,2011,54(5):800-814

9,10.张俊林.这就是搜索引擎:核心技术详解.北京:电子工业出版社,2012.1

11.李晓明,闫宏飞,王继民.搜索引擎——原理、技术与系统.北京:科学出版社,2005.4

12.马文峰.数字图书馆个性化信息服务的探索.图书馆杂志,2003,22(5):30-32

猜你喜欢
搜索引擎检索个性化
世界表情符号日
坚持个性化的写作
瑞典专利数据库的检索技巧
一种基于Python的音乐检索方法的研究
上汽大通:C2B个性化定制未来
专利检索中“语义”的表现
网络搜索引擎亟待规范
同桌宝贝
满足群众的个性化需求
基于Lucene搜索引擎的研究