TRS全文检索系统在松辽委网站检索中的应用

2018-04-19 00:37任海霞张继军
东北水利水电 2018年4期
关键词:全文检索松辽网关

张 程,任海霞,张继军

(松辽水利委员会水文局(信息中心),吉林长春 130021)

1 系统简介

TRS信息发布检索系统是由北京拓尔斯信息技术有限公司开发的结构优、功能强、面向文本数据库的数据库检索系统,其特点是软件成熟,二次开发容易,人机交互界面简捷友好,维护工作量小,检索与发布功能强,满足网站全文检索功能要求。系统由TRS全文检索数据库((TRS Database Server)、TRS 全文检索网关(TRS GateWay)、TRS信息发布应用服务器系统(TRS WAS)三部分组成,另外TRS Admin作为维护模块,用于对TRS server数据库进行维护。

1.1 TRS全文检索数据库((TRS Database Server)

TRS全文数据库系统是采用TR的信息检索技术和中文自然语言处理成果开发完成,其核心功能是对结构化数据提供全文检索功能。主要特点包括:异构数据库海量数据统一管理,非结构化数据联合检索和智能检索,检索准确性高,检索速度快,动态索引实时更新,提供多语种查询引擎,可随需需求随时扩展。

1.2 TRS全文检索网关(TRS Gateway)

TRS全文检索网关是实现TRS数据与主流关系型数据库数据之间进行数据转换迁移同步的工具,实现了关系数据库与TRS全文数据库之间数据共享,使用户在享有关系数据库卓越的数据处理功能的同时,同时拥有TRS优秀的非结构化全文检索功能。

1.3 TRS信息发布应用服务器系统(TRS WAS)

TRS WAS由两部分组成:一是系统控制,称为TRS WAS管理控制台,用于设置和管理要发布的信息;二是应用,用于将数据库中的信息动态发布到Web服务器上。

管理控制台基于Web方式实现,管理灵活,可实现远程管理。检索网页采用JSP模板技术,通过概览和细览模板控制页面显示风格,通过设置频道对动态网页的输出进行控制。应用模块基于应用程序,根据管理控制台的设置,并根据前端的访问请求,自动访问后台数据库系统,动态地将信息组织成Web页面发送到前端。

TRS WAS提供1套TRS置标,使用此置标和网页开发语言可以快速开发JSP检索页面,既减少了开发的复杂程度,又保证了任务的顺利完成,同时使用户的各种需求能得到保证。

1.4 TRS管理员工具(TRS Adminn)

TRS管理员工具以实现远程对TRS Server中的数据库进行维护,包括直接对数据库进行查看、重命名、删除等项操作,直观地设置或修改数据库的结构和字段属性、数据增加、删除等项操作,进行用户管理,支持多种文件格式的加载。

2 松辽委网站全文检索系统拓扑结构(见图1)

图1 松辽委网站检索拓扑结构图

3 松辽委全文检索系统部署

松辽委网站以TRS WCM内容管理系统为核心设计构建,网站采用oracle数据库存储数据。网站检索系统基于TRS全文检索系统开发建设,系统包括:TRS全文检索数据库、TRS全文检索网关、TRS WAS和TRS管理员工具组成。根据松辽委网站部署拓扑结构,TRS全文检索数据库和TRS全文检索网关部署在位于局域网内的TRS内容管理服务器上,TRS WAS和TRS admin部署在位于防火墙DMZ区的松辽委网站外网插件服务器上,在防火墙上设置开放端口实现外网检索和检索结果展示数据的双向传输。

TRS全文检索网关采用C/S架构,由服务端和客户端组成,服务端包括:服务主体程序、服务关闭程序、服务监控工具、产品注册工具、配置升级工具、红樱枫外部调用工具;客户端包括客户端主体程序,实现了源数据库与TRS全文检索数据库之间数据迁移与共享。

根据松辽委网站的检索需求,首先进行oracle数据库到TRS数据库的数据迁移同步设置,启动TRS网关客户端登陆进入任务控制台创建任务,设置源数据库登录信息,指定源数据库表或视图,指定源数据库表或视图的主键,设置目标数据库登录信息,创建目标数据库表,设置目标数据库参数,设置更新方式,先创建oracle到TRS数据库数据同步完全更新任务,启动任务更新一次,再创建oracle到TRS数据库数据同步增量更新任务,每天0:00进行增量更新。

根据松辽委网、子网,以及专题检索页面展示要求,在TRS WAS控制台上分别创建定义检索频道,包括:设置频道名、频道说明、TRS服务器IP、TRS服务器端口、TRS用户帐号、TRS用户密码、频道条件、概览模板名、细览模板名、组合检索模板名、发送邮件模板名、打印模板名、TRS数据库表或视图,设置数据库字段的字段名、字段类型、字段显示名、字段属性、主键字段等。分别创建了松辽委网站、松辽流域水文信息网等子网,以及松辽委网站专题的检索频道,各检索频道的检索范围在频道条件中设置实现,在每个检索频道中,进行相应的JSP模板设计,通过TRS的置标语句设置,实现对TRS数据库的检索和显示要求;在松辽委网站以及子网和专题相应模板中嵌入调用检索频道号,并输入检索关键字等,实现网站内容的检索需求,同时,系统提供“高级检索搜索”功能,在高级检索界面可以根据标题、正文、开始时间、结束时间等属性进行检索,并且可以指定检索结果按照默认排序、日期倒序、日期正序、相关度进行排序显示。

4 结语

利用TRS检索系统构建松辽委网站全文检索系统,检索体系结构先进、功能强大、软件比较成熟,开发性工作相对较少,人机交互界面友好,维护便利,检索和发布功能完备,TRS检索技术将会在网站检索功能中得到更深入的应用。

猜你喜欢
全文检索松辽网关
松辽分水岭隆起带近30年景观格局变化及驱动力分析
一生追梦色粉笔画
内蒙古自治区2017年审定通过的水稻新品种
Oracle数据库全文检索性能研究
LTE Small Cell网关及虚拟网关技术研究
全文检索引擎技术在电子病历中的应用
应对气候变化需要打通“网关”
基于KySou的全文检索系统的分析与优化
一种实时高效的伺服控制网关设计
基于Zigbee与TCP的物联网网关设计