◆王丽颖
(保利国防科技研究中心有限公司 北京 100088)
互联网搜索引擎的特型展现技术
◆王丽颖
(保利国防科技研究中心有限公司 北京 100088)
互联网搜索引擎一经问世便为人们的生活带来了极大的便利,有效提高了信息搜索的效率与质量,而特型展现技术的运用,使得搜索引擎再次得到发展,为用户带来了更加优质的信息搜索体验。本文将就特型展现技术在互联网搜索引擎中的运用方式展开全面论述,希望能够对信息搜索引擎的发展提供一定助益。
信息资源;互联网;搜索引擎;特型展现技术
现代人们对于网页信息搜索的要求正在逐步提升,要求信息搜索必须要达到一定的效率以及准确度,信息服务要更加人性化、智能化。而特型展现技术的推出,改变了以往单一的信息搜索解答方式,不觉会得到更加丰富的信息收索结果,能够满足不同使用者的需求,同时信息形式更加多样化,能够成功激发出用户的新需求,可以有效促进互联网的发展。
1.1 特型展现技术
特性展现起源于谷歌,指的是运用信息图谱形式来对用户的搜索需求进行满足,会根据用户提供的关键词,提供出完整性的信息内容{1}。这种技术在对信息内容进行展示时,还会在相应位置提供信息图谱,像同领域人物、百科以及图片等等,这样不仅能够满足客户的信息收索需求,同时还能为客户提供更多信息选择,服务更加人性化。这一技术的到来,使搜索引擎迎来了新的时代,各大网页都对推出了相应的特型展现模式,该项技术的发展前景值得期待。
1.2 搜索引擎
所谓“搜索引擎”就是指,运用互联网进行信息收集,并在整理之后提供给用户进行查询的信息系统[2]。目前我们已经进入到了大数据时代,网络信息内容规模极大,如果直观进行信息提取难度较大。为了方便用户进行使用,互联网网站会通过信息搜索的方式,来提升相关信息的提取效率。主要是因为搜索引擎实际就是一种网络服务设备,主要分为查询软件、搜索软件以及索引软件三部分内容,其索引数据库规模极大,通过三种软件的相互配合与使用,便能实现短时间内对信息内容的查询工作。
通过对特型展现技术的分析可以发现,该技术结构主要分为功能层、资源层以及中间资源层与控制层四部分内容[3]。而特型展现基础与主要技术主要有知识生成、知识库构建以及语义分析技术等内容,而按照互联网环境特征而言,知识挖掘是以及网络为基础的数据提取方式。
就互联网本质而言,其可以被视综合型功能信息库,会对信息实施过滤以及采集等处理之后,通过对文档分类技术的运用,来对网页页面类型进行区分。且会就用户视角,对用户信息进行后期追踪,从而判断出用户的信息查询喜好,从而建立起用户专属样本模型,进而向其提供更加合理的信息服务。同时特型展现技术会对数字信息进行转化,将其规划到特定分类体系之中,形成中间资源层,进而妥善解决知识共享与知识融合存在的弊端,保证独立本体之间能够构建起良好地关系表,实现共享与融合模式的切实落实,促进互联网搜索引擎的发展。
3.1 建设知识库
在进行知识和建设时,技术人员需要对五种知识库进行构建:(1)属性型。技术会按照实体、属性以及相关附加信息的模式,进行该类型知识库的建立,以便人们在进行信息搜索时,能够得到更加全面的内容,像胡歌-职业-演员等等,会对资源信息进行有效挖掘,库中资源以半结构化知识以及结构化知识为主;(2)专有名词型。库中资源以应用领域专名资源、分类以及热度等专名信息为主;(3)上下层型。在该知识库内,用信息储存都有着一定的概念联系,像植物-花卉-水仙等,是层次逐渐细化的概念组成方式,主要用于概念泛化以及推广等方面;(4)标签型。顾名思义该知识库就是对信息内容进行标签与分类,以便对其进行后续信息的搜索与推送,像电影捉妖记的标签为电影、搞笑、奇幻等,会对实体描述进行一定程度的补充;(5)相关型。该知识库是运用实体内在联系,像人物之间的关联,如邓超与孙俪是夫妻关系等等,来对信息进行组合。
3.2 知识挖掘技术
知识挖掘技术主要分为两种,一种是知识资源整合技术,而另一种是整合资源再挖掘技术。在进行知识资源整合时,该项技术会对用户日志、百科知识以及领域知识与网页资源进行信息价值开发与整理,并将结果整合成为实体信息数据库,这里的信息资源不仅储存量较为丰富,而且能够对信息关联属性进行精准描述,信息处理更加智能。
在信息完成整合之后,为了实现资源价值的最大化,还会运用资源挖掘技术对其内在价值进行开发。像“三元组”挖掘技术,可以自动对相应领域内部的垂直站点半结构以及结构信息进行开发。知识挖掘过程实际就是通过人工资能学以及统计学对资源实施整合与相应处理,主要会运用时间序列分析、数理统计以及多元统计等方式来完成相应的任务。而人工智能手段多以自动机为主,会对人类思维为模拟基础,对现实世界问题进行科学分析与处理,该项技术在知识挖掘运用过程中,多以成熟性技术与算法为主,像模糊逻辑、人工神经网络以及规则推理等等。同时“专家系统技术”以及“运筹学技术”等新型技术也应用到了该项工作之中,为工作发展方向带来了新的启发,信息资源挖掘水平势必会得到不断的提升。
3.3 语义分析技术
3.3.1 内涵
与传统只对关键词进行搜索的信息搜寻方式有所不同,语义分析技术的应用会使信息搜索变得更加智能化,会对关键词进行更加深入的分析,并会对关键词实体类型进行区别,同时会对实体属性进行研究,例如会按照植物、颜色以及生长季节等内容逐一进行分析,内容涉及更加全面,可以对关键词进行更加深层次的解读。
3.3.2 技术组成
该项技术组成主要分为四个部分:第一,分析词语相关性。
就是指对客户关键词进行分析,已明确客户真实需求,并对关键词相关内容进行确定;第二,关联性知识设计。在对知识点之间的关联性进行明确之后,该项技术会对知识相关内容进行推荐,例如在搜索张艺兴母亲时,该项技术不仅会提供张艺兴母亲的信息,同时还会对他其他家庭成员内容进行计算,并做出同时进行信息推出;第三,结果聚类。该项技术会对检索结果整理与统计,并会对其实施聚类,会对每一类的代表性语义进行标注,并会按照语义标签对搜索词潜在需求进行分析;第四,知识展现相关性。该项技术会对用户需求进行分析,并对检出信息进行适当取舍与展现,以确保能够对用户的信息搜索目标进行满足,在实施分析过程中,会对用户的实际性需求、潜在需求以及知识相关性需求等内容进行分析,从而在满足用户搜索目的的同时激发出用户的新搜索意愿,进而获得更大的经济效益[4]。
通过本文对互联网搜索引擎以及特型展现技术相关内容的介绍,使我们对互联网搜索中的特型展现技术有了更加深刻的了解。该项技术的到来,不仅有效提高了信息搜索的效率以及速度,而且推送信息内容更加丰富、多样,这样能够在满足用户查询需要的同时,为其提供更多相关信息选项,整体信息数据展现更加高效、准确,能够对信息搜寻本体所关联的内容进行更加全面的展现,已经成为了互联网搜索引擎发展的最佳动力。
[1]高云全,李小勇,方滨兴.物联网搜索技术综述[J].通信学报,2015.
[2]万飞,赵溪,梁循,潘登,倪志豪.基于移动互联网日志的搜索引擎用户行为研究[J].中文信息学报,2014.
[3]陈弄祺.国内互联网搜索引擎评价研究[J].统计与决策,2017.
[4]窦志成,文继荣.大数据时代的互联网分析引擎[J].大数据,2015.
网络安全技术与应用2017年4期