侯亮,李鑫玉,张文英,王变银,柳斌辉,蔡海燕*
(1.河北省农林科学院农业信息与经济研究所,河北 石家庄 050051;2.河北省农林科学院旱作农业研究所,河北 衡水 053000)
种质资源是人类赖以生存的物质基础,是作物育种及遗传学研究重要的材料来源[1]。20 世纪以来,随着新品种的大量推广、人口增长、环境变化、经济建设等进程的加快,作物种质资源多样性不断遭到破坏甚至丧失,高度一致的种质资源抵抗外来侵害的综合能力下降,当病虫等自然灾害暴发时,极易造成巨大损失。种质资源信息的收集、存储、管理是一项基础性工作[2],受到各国政府的高度重视,随着国家对种质资源研究投入力度的增大,对作物品种、抗性、品质、管理提出了更高要求,急需能够管理大量的种质资源信息,满足数据查询与共享的平台[3]。项目组开发了分布式的种质资源管理系统,实现作物种质资源的条件查询、存储、管理和共享,为农业科研人员提供了一个高效的信息平台。系统的应用可以促进种质资源的高效利用,充分发挥作物种质资源在农业可持续发展中的重要作用。
系统要求能够对种质资源数据进行高效管理,针对种质资源数据类型多样、结构复杂的特性,系统需满足以下需求。
系统采用B/S 架构,运行环境选用通用、稳定的软硬件,服务器端采用Windows Server 2008 及以上操作系统,浏览器端采用Windows7 及以上操作系统。服务器CPU 采用Intel 双核3.0GHz 或以上,硬盘容量400G 或以上,内存容量8G 或以上。浏览器采用Internet Explorer8.0 及以上版本,支持主流浏览器。
系统采用C 语言,Microsoft.NET Framework 4.0进行开发,数据库采用SQL Server 2017。
(1) 实现数据导入、查询、修改、删除、导出、数据可视化等功能。(2) 支持模板个性化定制,为用户提供灵活定义的数据导入导出模板。 (3) 查询界面采用模块化管理,各类查询条件按照数据类型分类,各模块统一显示,便于用户设置多重条件,方便直观。(4) 支持查询结果以表格、图表的形式展现,用户可以在查询结果表格中自由选择数据,生成柱状图、折线图等图表。(5) 系统数据库采用分布式方案,数据存储在在各个数据节点,由管理结点统一调度资源,通过路由规则访问数据结点中的数据。(6)系统具有完善的用户权限管理和系统管理功能,系统管理员为不同角色的用户分配相应权限,用户仅允许在相应权限下访问系统资源;系统管理员可以查看系统日志,进行数据备份、恢复等。(7) 系统具有较高的兼容性、可扩展性,便于日常维护和新功能的拓展。
2.1.1 友好的人机交互界面 系统的界面应符合大多数据用户的使用习惯,采用图形化的操作界面,色彩搭配柔和自然,各功能分区明确,模块调用便捷。
2.1.2 实用性 系统基于种质资源管理工作中面临的现实问题进行开发,有着较强的针对性,把满足各级用户的需求作为首要任务,系统功能尽可能全面。
2.1.3 可扩展性 种质资源信息是动态更新的,农业科研工作中即时产生大量的数据,新的种质资源信息意味着新的数据类型和数据规范,系统设计时应充分考虑可扩展性,能够添加新的功能模块、对接或移植不同类型的数据库、扩展数据库容量。
2.1.4 可靠性 系统具有较强的容错和应急响应能力,具有严密的用户访问权限管理功能,防止非授权登录;具有数据备份和数据恢复功能,力争最大限度减少信息损失。
2.1.5 规范性 系统设计符合软件开发的一般流程,采用通用、成熟的开发环境,开发过程规范;数据库组织、字段定义等环节遵循种质资源领域的分类编码标准,努力做到种质资源信息分类明确,数据类型标准、规范。
系统采用四层架构的设计,从底层至项层分别为基础环境层、数据层、应用层和用户层,基础环境层提供软硬件支持;数据层部署种质资源数据库,主要完成数据的管理、查询、修改、存储等功能,实现数据调用、共享;应用层提供各类业务功能,是系统开发的关键;用户层响应用户请求,提供数据的可视化展示。四层架构设计具有良好的开放性和可扩展性,使系统逻辑更加独立,各功能模块的任务更加清晰。系统架构如图1 所示。
图1 系统架构Fig.1 System architecture
2.2.1 系统登录模块 由于种质资源数据的访问涉及不同的研究团队,为保证数据安全,用户登录时需填写用户名、密码,防止非授权登录。管理员拥有最高权限;高级权限的用户可以对数据执行导入导出、查询、修改、删除等操作,一般权限的用户仅有数据查询和查看查询结果的权限。
2.2.2 数据管理模块 种质资源数据类型多样,用户往往希望有选择性地导入感兴趣信息,剔除冗余信息。针对这一需求,数据管理模块支持用户自定义模板,运用模板将标准化后的数据导入数据库,添加到相应数据表中,以规范的格式存储。
2.2.3 数据查询模块 此模块调用种质资源数据库中存储的数据,实现对数据的自定义查询,主要包括对种质资源基本信息、亲本组合、表型特征、品质特性、产量表现、抗性、栽培技术要点、适宜种植范围等几类信息的查询。以上信息对应独立的查询功能区,各功能区之间可以联合设置查询条件,实现跨区查询。
2.2.4 数据可视化及导出模块 用户执行查询操作后,以数据表格的形式展现查询结果,用户可以自主选择表格中的数据,生成各类图表,根据需求自定义模板,导出查询结果。
2.2.5 系统管理模块 系统管理员为各类用户赋予相应权限,同时负责系统维护、日志管理、数据备份等工作。
系统采用SQL Server 2017 作为数据库平台,数据库系统采用分布式方案,布置数个管理节点和数据节点,管理节点负责资源分配和调度,数据节点负责运算。分布式数据库系统具有以下优点: (1) 分布式数据库系统将数据分发到各数据节点,由多个节点并行处理运算任务,可以有效缩短任务执行时间,提高系统运行效率。(2) 可以较好地平衡各数据节点的负荷。管理节点根据任务量为各数据节点下达运算指令,降低单台物理机的运算压力;而任务量不饱和时,管理节点可以令不承担任务的节点离线,避免资源浪费。(3) 由于数据分散在多个数据节点中,当一个节点发生故障时,其余节点不受其影响,管理节点可以把故障节点的任务分配给正常运行的节点,使整个系统仍处于正常工作状态,保证了数据的安全。(4) 具有良好的可扩展性。通过增加数据节点的数量即可提高系统的运算能力,而无需通过复杂的接口配置将新的软硬件资源并入数据库系统,这种累加式的资源接入方式使数据库扩展方便、快捷。 (5) 在各节点负荷大致平衡的情况下,管理节点将任务优先分配至最近的节点,可以有效降低系统响应延时和传输延时。分布式数据库结构如图2 所示。
图2 分布式数据库结构Fig.2 Distributed database structure
本研究设计了种质资源数据库和系统管理数据库,采用分布式方案,部署于各个数据节点,由管理结点统一调用。种质资源数据库存储了种质的表型特征、品质特性、抗性等信息,其结构如图3 所示。
图3 种质资源数据库结构Fig.3 Database structure of germplasm resources
为便于数据的查询、存储和管理,根据实体类型将种质资源数据分为若干类,以小麦为例:
(1) 基本信息。主要包括品种名称、育种单位、审定年份、审定编号等信息。(2) 亲本组合。包括种质的父本、母本等信息。(3) 表型特征。主要包括分蘖数、亩穗数、穗粒数、穗型、穗长、千粒重、株高、茎秆形态、叶片颜色等信息。(4) 品质特征。主要包括容重、干基和湿基蛋白质含量、湿面筋含量、沉降值、吸水率、弱化度、出粉率、面粉白度、延伸性等信息。(5) 产量表现。主要包括平均单产、对比品种名称、增减产情况等信息。 (6) 抗性。主要包括抗旱指数、抗倒伏性、抗青干性、抗寒性、抗倒春寒、抗旱性、抗冻性、各类抗病性等信息。表型特征数据表和品质特征数据表的部分字段见表1和表2。
表1 部分表型特征数据Table 1 Parts of phenotypic characteristics data
表2 部分品质特征数据Table 2 Parts of quality characteristic data
用户数据表设立一般用户、种质研究团队成员和系统管理员三个用户类,赋予用户ID、用户密码、用户类型、学科方向等属性。用户ID 具有唯一性,根据用户类型分配相应的访问权限,以确保数据的安全。
系统界面分为登录界面、系统主界面和系统管理界面,采用Web 风格的图形界面形式,以功能区划分界面空间,信息的表达形象、直观;用户可以自定义界面布局,为重点显示区域划分更多的可视空间;对查询时间较长的操作,在界面显示进度条,便于用户实时了解任务的进展情况。
通过输入用户名和密码登录系统,后台服务器验证用户请求是否合法。若通过验证,则跳转到系统主界面,若验证不成功,则在登录界面返回错误信息。系统登录界面如图4 所示。
图4 系统登录界面Fig.4 System login interface
根据种质资源的数据类型,在界面左侧设置树状目录,目录树可以自由展开、合并,将目录对应的查询条件在右侧的查询界面中分组显示。对于查询条件较多的分组,设置滚动条,便于用户浏览。
(1) 数据查询方式。支持用户自定义查询。时间型、互斥性的查询选项采用下拉框的方式展现,限定用户的选择范围;数值型、描述性、数据区间性的查询选项采用数据框输入的方式,由用户自主定义查询内容。系统支持组合条件查询,便于用户筛选重点信息。
(2) 数据可视化及导出。查询结果以表格、图表的形式在新窗口展现。用户可以自由选择表格中的数据,自定义图表的类型,生成柱状图、折线图等,直观体现查询结果。数据查询界面如图5 所示。
系统采用独立的后台管理界面。管理界面左侧设置权限管理和系统维护两大类目录,界面右侧以列表形式展现用户权限分配信息和系统维护信息,管理员可以对用户进行添加、修改、删除、禁用、等操作,可以查看系统日志、进行数据备份等。系统管理界面如图6 所示。
图5 数据查询界面Fig.5 Data query interface
图6 系统管理界面Fig.6 System management interface
对种质资源的高效管理是提高现代农业综合生产能力的重要保证,开发种质资源管理系统是提高管理效率、发掘种质资源潜在信息有效手段。详细论述了分布式种质资源管理系统的开发流程,介绍了系统的架构、数据库结构和主要功能,系统提供了一个高效的种质资源数据管理、查询、存储、可视化的平台,有助于推动种质资源的创新、共享和可持续利用[4],为农业相关领域的品种引进、选育、推广提供了参考[5]。种质资源信息收集、存储、管理是一个长期性的工作[6],随着种质资源相关研究的深入,新品种、新特性将不断涌现,意味着更多的数据类型和数据量,系统需持续扩展或新建数据表,不断更新、添加最新数据。系统实现了部分主要粮食作物种质资源的管理、查询、存储和可视化等功能,在今后的种质资源信息化研究中,若继续引进蔬菜、水果等经济作物的种质资源,系统数据和功能将更加完善。