基于情景感知的移动搜索的演变和实现

2015-02-13 10:08詹丽华李育嫦潘瑞冰肇庆学院图书馆广东肇庆526061
图书馆理论与实践 2015年11期
关键词:信息检索语义检索

●詹丽华,李育嫦,潘瑞冰(肇庆学院图书馆,广东肇庆526061)

基于情景感知的移动搜索的演变和实现

●詹丽华,李育嫦,潘瑞冰(肇庆学院图书馆,广东肇庆526061)

情景感知;情景感知计算;信息检索;移动搜索

从情景信息检索的演化发展入手,总结出基于情景感知的信息检索演变的三个阶段:基于语境、情景的信息检索,情景信息检索与查询的集成,基于情景感知的移动搜索。讨论了基于情景感知的移动搜索实现的技术与方法,认为基于情景感知的移动搜索已基本实现垂直搜索和本地搜索,满足用户的个性化需求和本地化需求是当前及以后的发展方向。

1 问题的提出

近几年,随着移动互联、无线网络等技术的发展,以PDA、智能手机、平板电脑等手持设备为代表的移动终端得到了广泛应用。2014年5月24日,全球领先的移动互联网第三方数据挖掘和整合营销机构艾媒咨询(iiMedia Research)发布了《2013-2014年中国移动搜索市场研究报告》,报告数据显示,2013年中国移动搜索市场规模达到50.6亿元,同比增长82.7%;移动搜索用户总量达到4.3亿,同比增长30.3%。[1]

移动搜索的快速发展,情景感知及情景感知计算功不可没,如利用情景的多层属性可以改进检索结构从而改善移动信息检索,将情景感知中间件应用于移动多媒体,有助于异步消息传递及情景信息的存储与管理等。基于情景感知的移动搜索成为信息检索领域和计算机领域新的研究热点,具有改进移动检索效果、促进移动通信发展等现实意义。

2 基于情景感知的移动搜索的演变

情景这一概念最先出现在认知科学领域和语言学领域,后来在人工智能领域成为广受讨论的对象。A.Dey对情景的定义广被接受:情景即任何可以被用来描述实体情况的信息,实体可以是人、位置或物体,以及它们与用户和应用之间的交互,并包括用户和应用本身。[2]情景感知源于普适计算的研究,最早由Schilit和Themer提出,认为情景感知能将情景告知应用,而应用能适应情景。[3]Dey认为,无论是桌面计算机还是移动设备,普适环境中使用情景的应用,都叫情景感知,情景感知获取的信息即情景,指任何可以描述实体情况的信息。[2]从信息检索的角度来追溯,基于情景感知的移动搜索经历了三个发展阶段。

2.1 基于语境、情景的信息检索

在传统信息检索领域(基于计算机的信息检索),情景指环境状态和设置的集合,该集合能确定应用程序的行为,或者将发生地应用程序事件反馈给用户。[4]上下文信息检索,基于语境、情景的信息检索,被视作基于情景感知的信息检索的开端,主要强调把情景信息整合到检索过程中,利用情景信息帮助分析语义(包括查询任务的语义和信息内容的语义),以获得更符合语义实际的检索效果,相关研究集中在查询扩展、命中文档的排序、推荐过滤等方面。[5]

2.2 情景信息检索与查询的集成

2005年,Ingwersen和Jarvelin在《转折——在情境中集成信息查寻与检索》一书中提供了一个与情境相关的整体主义认知观,提出了情景信息查询与检索的集成框架。与基于语境、情景、上下文的信息检索相比,该框架突破了情景帮助分析语义这一单向功能,更强调在任务、领域和信息系统情景下用户行为的分析以及检索的交互。该著作引发了新一轮情景信息检索的研究热潮。①情景信息的收集、融合、建模与管理。如Ejigu提出一种基于本体的通用内容管理模型(GCOM),它有助于情景推理及规范情景的语义结构;[6]Stefano构建了一个支持情景感知的Web应用程序概念框架,用于加强情景知识的管理。[7]②情景信息检索与新技术的结合。如Kwon,Kim提出利用泛在计算方法、[8]Mizzaro,Vassena提出社会化方法改进基于情景的信息检索。[9]③基于情景感知的信息检索。如构建多功能的普适服务平台、将信念修正理论应用于模型化自适应信息检索等。④情景信息检索的评估,如以实验室为基础从扩展评价、情境模拟、用户研究三个方面对情景信息检索的有效性进行评估。

2.3 基于情景感知的移动搜索

移动搜索是指以移动设备为终端对普遍互联网的搜索,以高速、准确地获取信息资源。PDA、智能手机等移动终端的广泛应用,促使基于情景感知的检索从传统信息检索领域向移动搜索领域迅速拓展。基于情景感知的移动搜索与基于情景的传统信息检索在检索发生的地点、检索目的、用户对检索结果的要求、检索结果的输出等方面存在很大不同。例如,移动检索发生在移动终端,传统信息检索发生在桌面计算机;移动检索以搜索背后的应用为主,传统信息检索以获取相关文档或网页为检索目的;移动检索既分析文本、图表、音频、多媒体等内容,又分析情景,以加强有用信息及其相互间的关系,而传统信息检索致力于处理内容;移动检索强调检准率和结果的简洁性,传统信息检索强调人机交互等。因此,不能简单地将后者的相关方法技术移植到前者中去,需要针对移动搜索的随时随地随身性、精确性、个性化等特点研发新的情景感知算法与感知技术。与基于情景的传统信息检索相比,基于情景感知的移动搜索需要集中解决以下问题:①移动搜索特别是手机搜索中,用户大多利用碎片时间,而桌面搜索大多是利用用户的整块时间,怎样才能把握用户、尽可能地占用用户的碎片时间;②如何根据移动用户的搜索记录、习惯等分析其个人偏好,推荐符合个人需求的搜索结果;③如何挖掘用户的查询、记录、点击等数据,并在挖掘数据中实现隐私保护。

3 基于情景感知的移动搜索的实现

3.1 理论构建

对于情景感知应用于移动环境,Anagnostopoulos等从理论层面进行了详细全面的论述。首先,一个情景感知系统(CAS)由情景建模、普遍性和系统行为三个逻辑轴构成,该模型既能描述非结构化的原始数据,也能描述与人的行为相关的关系模型、原生实物模型等逻辑模型;第二,将移动环境中的情景如资源与设备、邻近空间、用户交互的计算对象作为概念图、语义图进行建模;第三,通过获取、集成、匹配、发现、查询、自适应、推理、情景质量指标与情景集成等行为来实现情景感知;最后,通过上下文生成摘要、从原始数据中选择摘要数据两种方法构建情景感知的应用框架。[10]在上述研究基础上,作者进一步研究了支持情景感知移动设备的情景监测、适应、分布和推理的基础设施和架构。

3.2 支撑技术

便携式移动设备和无线通信是实现移动搜索的最基础的技术支撑。传感器技术是基于情景感知的移动搜索实现的关键技术。在室外最常用的是全球定位系统(GPS),此外,移动通信运行商的基站也常用来为移动通信设备定位。室内位置跟踪系统有基于红外信息(IR)、RFID、WIFI等,或基于室内GPS信号发生器。[4]

3.3 移动情景的感知计算

在总结前人研究结果的基础上,顾君忠认为情景感知计算是:①近似选择;②自动情景重构;③情景化信息与命令;④情景触发动作。[11]一般使用简单的IF-THEN规则说明情景感知系统应当如何适应情景。情景感知计算的实现离不开结构完整的情景感知系统。一个完整的情景感知系统能够收集环境或用户态势的信息,将这些信息翻译成适当格式;组合情景信息,生成更高级的情景信息,或是将其他情景信息归并后导出;基于检索到的信息自动采取动作;使信息能让用户随时存取和易于存取,帮助用户更好地完成任务。[12]

3.3.1 移动情景的获取、表示与使用

移动情景的获取,即如何感知情景并交付给应用程序。Chen和Kotz认为,为了在应用中使用情景,必须有一个机制来感知当前情景,并将之交付给应用程序,并将感知分为以下几类:[4]①位置感知,实现位置感知的前提是用户愿意将位置情景提供给系统;②感知位置之外的其他初级情景,如感知时间、邻近对象、网络宽带;③感知高级情景,如感知用户的当前活动;④感知情景变化,如使用信息监测器来获取新的副本信息。Coppola等[13]构建了一个在移动设备上使用的情景感知浏览器(Context Aware Browser,CAB)以基于现实世界的真实情景来搜索数字世界的信息。

移动情景的表示,即情景的建模、解释、存储、检索等。对于情景建模,Chen和Kotz认为情景信息类型多样,它们的不同属性导致使用不同的方式来表达和建模,并专门讨论了位置建模问题。[4]顾君忠总结了六种情景模型:关键值模型、模式标识模型、图形模型、面向对象模型、逻辑模型、本体模型。[11]情景的解释是指对处理过的情景进行语义解释,以获取隐藏在相关情景特征后面的语义。例如位置情景中,直接告知用户的经纬度即是解释过的情景,告知用户的所在街区即是未解释的情景。Jones和Brown[14]应用布尔过滤器来实现情景感知的文件匹配,信息检索与信息过滤中,采用查询文档匹配分数来提高移动搜索的效率,并设计了情景感知采集器来采集存储情景信息,帮助建立用户模型,提高移动搜索的个性化水平。

移动情景的使用,即以适当方式使用情景信息。情景的使用一般有四种类型。①情景作为输入。情景输入和用户输入同时输入给系统,系统对他们处理后给出输出。②情景修改输入。系统的输入还只是用户输入,情景是作为系统运行的一种调节因素起作用。针对用户输入,系统运行期间会按情景输入调整,给出相应的输出。③用户-系统反馈环中的情景。系统根据输出收集情景,交给用户,用户识别哪些情景可以或应该作为新的输入给系统,系统将对新输出再加工处理,形成新的输出。④情景作为触发器。情景信息作为输入,系统根据输入和触发信息的比对,满足预设匹配条件就给出相应输出。

3.3.2 移动情景的推荐算法

移动情景的推荐算法关系到移动搜索个性化的实现问题。考虑到移动环境中用户的个性化、动态性、情景信息的变化与丰富性,研究者提出了多种推荐算法,以在某些特定情况下向用户推荐项目。如Norma等提出了一种基于位置的情景感知推荐算法,它通过挖掘用户社交网络资料来自动推断用户喜好;[15]Xiang等考虑到其他的情景信息,如时间、地点、公司的其他人等,介绍了上下文预过滤、过滤后建模等算法。[16]Carsten等介绍了一种基于语义的地理信息检索的算法,将传感器获取的地理信息与WEB本体之间形成映射,用基于用户位置和喜好的个性化冲浪点作为案例来评估地理信息检索的语义规则的能力。[17]

3.3.3 移动搜索中的隐私保护

隐私保护是移动搜索服务的一个既重要又相对较难的目标。Teerakanok等认为,在基于位置的服务中,通过K-匿名,定时模糊逻辑和一个单向散列函数三个重要技术的组合为用户提供认证过程和查询过程以保护用户的隐私和防止被跟踪。[18]Riboni D等提出SpaceTwist和AnonTwist算法来保护用户访问移动服务的POI检索的隐私。[19]

3.4 实践应用

基于情景感知的移动搜索的实践应用十分广泛,主要体现在以下几方面。①与社交网络的结合。例如,腾讯于2011年推出的微信具备移动即时通信功能,它支持发送语音短信、视频、图片(包括表情)和文字、支持查看所在位置附近使用微信的人(LBS功能)、微行情:支持及时查询股票行情等,迅速成长为一种新型的互联网社交模式。②紧急情况救助。例如,在紧急情况中,移动终端感知用户位置并将之告之应用,以及时提供紧急救助。③个性化的生活服务。例如,根据用户消费习惯及所处位置提供用户周围的餐饮信息、购物信息;根据用户的兴趣爱好提供旅游信息。④电子商务。例如,根据用户的工作性质和工作要求提供会议助理;应用于移动商务内容服务。

4 结语

4.1 现有研究的主要特征

从基于情景感知的移动搜索的发展演化及实现可以发现:①研究内容上,涉及信息检索、计算机技术、人工智能等多领域,不仅充实了上述领域的相关理论研究,更解决了一系列实践应用问题;②研究方法上,研究者们采用的方法形式多样,既有理论分析,又有实验跟踪、模型检测等实践方法;③研究人员上,既有从事信息检索的情报人员,也有从事计算机及人工智能研究的技术人员。

4.2 研究中的不足

综观现有研究成果,基于情景感知的移动搜索还存在以下一些问题。①情景范围的界定。已有研究中的情景概念大多比较宽泛,有些研究甚至模糊该概念的要素和属性。情景的要素、类型和属性等需要更精确的界定与描述。②研究内容方面。现有研究大多从信息检索、多媒体、人机接口等角度入手,从信息组织的角度对移动情景进行数据挖掘和关系分析尚比较少见。③研究领域方面。基于情景感知的移动搜索的实现及应用,一方面要以信息检索的相关知识作为理论基础,另一方面也需要计算机及人工智能的先进技术将信息检索的理念付诸实践,只有二者相互融合,才能合力推进移动情景搜索的发展。但在实际中,不同研究领域的研究者们仍固守各自的领域,研究成果的交流与互动没有得到良性展开。

4.3 研究展望

现阶段,移动搜索向移动垂直搜索、本地搜索等方向发展,满足用户的个性化需求和本地化需求成为移动搜索当前及以后要解决的主要问题。基于情景感知的移动搜索研究可以在以下几方面进行突破:①解决基于位置的搜索中地理域与本地搜索的矛盾、Web内容与地图信息处理弱关联的矛盾等;②如何更好地提取移动情景中的有用语义,应用元数据来识别移动情景之间的关联性;③通过查询记录、点击、移动设备上的Web流量等进行用户分析、移动对等标记等数据挖掘,并加强对用户的隐私保护。

[1]2013-2014年中国移动搜索市场研究报告[EB/OL].[2014-05-24].http://www.iimedia.cn/37230.html.

[2]Abowd G D,et al.Towards a better understanding of context and context-awareness[C]//Handheld and ubiquitous computing.Springer Berlin Heidelberg,1999: 304-307.

[3]Schilit B N,Theimer M M.Disseminating active map informationtomobilehosts[J].IEEE,1994,8(5): 22-32.

[4]ChenG,KotzD.Asurveyofcontext-awaremobilecomputing research[R].Technical Report TR2000-381, Dept.of Computer Science,Dartmouth College,2000.

[5]Mizzaro S,Vassena L.A socialapproach to context-aware retrieval[J].World Wide Web,2011,14(4):377-405.

[6]Ejigu D,et al.An ontology-based approach to context modeling and reasoning in pervasive computing[C]//PervasiveComputingandCommunicationsWorkshops,2007.PerCom Workshops'07 Fifth Annual IEEE InternationalConferenceon.IEEE,2007:14-19.

[7]Mizzaro S,et al.Collaborative annotation for context-aware retrieval[C]//Proceedings of the WSDM'09 Workshop on Exploiting Semantic Annotations in InformationRetrieval.ACM,2009:42-45.

[8]Kwon J,Kim S.Ubiquitous information retrieval using multi-levelcharacteristics[J].LectureNotesinComputer Science,2005,3579:167-172.

[9]Mizzaro S,Vassena L.A social approach to contextaware retrieval[J].World Wide Web,2011(14):377-405.

[10]AnagnostopoulosCB,et al.Contextawarenessinmobile computing environments[J].Wireless Personal Communications,2007,42(3):445-464.

[11]顾君忠.情景感知计算[J].华东师范大学学报(自然科学版),2009(5):1-25.

[12]Barrett K,Power R.State of the art:Context management[J].M-ZonesResearchProgramme,2003: 69-87.

[13]CoppolaP,et al.Thecontext-awarebrowser[J].IntelligentSystems,IEEE,2010,25(1):38-47.

[14]Jones G J F,Brown P J.Context-aware retrieval for ubiquitous computing environments[M]//Mobile and ubiquitous information access.Springer Berlin Heidelberg,2004:227-243.

[15]SavageNS,et al.I’m feelingloco:Alocationbased context aware recommendation system[M].Springer BerlinHeidelberg,2012:37-54.

[16]Xiang B,et al.Context-aware ranking in web search[C]//Proceedings of the 33rd international ACM SIGIR conference onResearchanddevelopment in information retrieval.ACM,2010:451-458.

[17]KeβlerC,etal.Semanticrulesforcontext-awaregeographical information retrieval[M]//Smart Sensing and Context.Springer Berlin Heidelberg,2009:77-92.

[18]Teerakanok S,et al.Preserving user anonymity in context-aware location-based services:a proposed framework[J].ETRI Journal,2013,35(3):501-511.

[19]Riboni D,et al.Integrating identity,location,and absence privacy in context-aware retrieval of points of interest[C]//Mobile Data Management(MDM),2011 12th IEEE International Conference on IEEE,2011:135-140.

G254.9

B

1005-8214(2015)11-0102-04

詹丽华(1976-),女,硕士,馆员,研究方向:网络信息组织、信息服务;李育嫦(1968-),女,研究馆员,研究方向:情报检索语言;潘瑞冰(1974-),女,硕士,副研究馆员,研究方向:信息资源建设。

2015-02-12[责任编辑]刘丹

本文系2014年度广东省图书馆科研课题“基于情景感知的移动搜索中用户行为模式研究”(项目编号:GDTK1432)成果之一。

猜你喜欢
信息检索语义检索
高职院校图书馆开设信息检索课的必要性探讨
语言与语义
瑞典专利数据库的检索技巧
一种基于Python的音乐检索方法的研究
网络环境下数字图书馆信息检索发展
批评话语分析中态度意向的邻近化语义构建
“社会”一词的语义流动与新陈代谢
专利检索中“语义”的表现
“吃+NP”的语义生成机制研究
基于神经网络的个性化信息检索模型研究