陆雪林,周洪钧,高杨,袁红艳,赵乐乐,梁永军
(1.上海市动物疫病预防控制中心,上海 201103; 2.同济大学电信学院,上海 201805;3.上海乐本信息科技有限公司,上海 201802; 4.上海红艳山鸡孵化专业合作社,上海 201408;5.吉林省四平市铁西区畜牧管理服务中心,吉林 四平 136000)
随着国内山鸡产业的发展,山鸡企业的种鸡群体规模越来越大。由于山鸡养殖有世代间隔短、性状指标多、数据量庞大等特点,加重了企业数据收集和管理的负担,使山鸡育种进展缓慢。因此,利用计算机技术,结合家禽育种学及数量遗传学理论,开发出一个简洁完善的育种管理系统,及时收集处理各种山鸡育种数据资料,准确计算育种值,指导企业选种、选配工作,是提高整个育种效率的有效手段。
应用计算机技术进行动物育种资料的管理和数据分析并不是一个新鲜话题[1]。国外已有比较成熟的通用软件ASREML[2],不仅适合于不同物种,而且还提供了大量的二次开发功能,但是,ASREML对于国内用户来说显得比较难以使用。国内也有家禽育种管理系统[1],但一般都是一个单机版系统,无法对家禽生产性状数据进行云端管理,更不可能利用云计算来实现大数据挖掘;而且,这些信息软件具有很强的专业性和针对性,并不是所有山鸡养殖场都能适用。因而,本课题组研究人员设计开发了一款专门针对山鸡育种的分析管理软件平台——红艳山
鸡育种分析管理软件。该软件基于C/S框架,利用云计算平台搭建,利用了最新的VC#.net 2012软件开发技术。数据存储的云端数据库采用基于C/S框架的分散DB设计方案,解决了局部用户(LOCAL)数据上传及管理需要,也实现了服务器云端统一管理需求。在育种值计算方面,采用了业内先进的最佳线性无偏预测法(Best Linear Unbiased Prediction,BLUP),不但可完成山鸡各类生产性状育种值的估计,还可以计算综合育种值,从而实现了考虑多种性状、不同经济系数综合影响下的山鸡留种工作。
山鸡育种工作周期性很强,一般来说1年1个世代,在山鸡不同生长阶段实施不同育种措施。山鸡育种数据管理与分析系统的程序总流程见图1。
图1 山鸡育种数据管理与分析系统的程序总流程图
本系统数据库的建立与设计是基于山鸡育种流程特点和MySQL数据库设计原理来进行的。每个山鸡个体从系谱孵化出生到繁殖下一代的生活周期中,在其不同生长阶段实施不同育种措施,所有育种数据都以个体出生时所佩戴的个体身份标识——翅号为基础,个体数据以及家系信息不断积累、计算和传递,从而在纯系选育过程中充分利用这些数据信息。本系统的数据流程见图2。
为了存储山鸡生活周期中各个时期的生产数据,系统在数据库中设计了12个基本数据表格:档案新登表、上测定笼表、生长测定表、外貌测定表、屠宰测定表、生长期选留表、上产蛋笼表、开产测定表、蛋品测定表、料蛋比测定表、产蛋量测定表、继代选留表。档案新登表主要记录雏鸡出生信息及其父母信息等,该类信息将在后面各阶段数据中共享;上测定笼表用于记录雏鸡鸡舍编号等信息;生长测定表用于记录始测、中测、结测3个时期山鸡的耗料及体重,从而计算测定期料肉比;外貌测定表用于记录胸宽、体长等山鸡体型外貌信息;屠宰测定表用于记录山鸡屠宰测定的全净膛重、腹脂率等数据;生长期选留表用于记录利用已测数据进行淘汰选留的情况;上产蛋笼表用于记录产蛋舍号、笼号等信息;开产测定表用于记录山鸡开产日龄、开产体重等信息;蛋品测定表用于记录山鸡蛋蛋品质性状测定的蛋重、蛋壳色泽、蛋壳强度、蛋壳厚度、哈氏单位等各类信息;料蛋比测定表用于记录山鸡蛋蛋重与饲料消耗等数据;产蛋量测定表用于记录不同时间段山鸡产蛋量;继代选留表是系统依据测定数据及计算的育种值进行选留后的结果。
主要由档案信息、肉用性状、蛋用性状、孵化管理、系谱选种选配以及系统维护等模块组成(图3)。
图2 山鸡育种数据管理与分析系统的数据流程
图3 山鸡育种数据管理与分析系统结构
本系统采用云存储(计算)结构,用户利用应用程序,负责数据的输入及简单计算,比如肉料比等计算,基本是在本地计算机上完成。数据输入界面等也在本地计算机展示,从而实现数据输入。大量山鸡性状测定数据被存储到云端服务器上,利用云端服务器的高性能计算能力进行BLUP计算,从而实现高性能云计算结构(图4)。
采用现场(山鸡场或孵化场)应用模式和办公室(育种技术室)局域网应用模式相结合的系统应用方式。现场应用模式包括肉用性状测定、蛋用性状测定、孵化管理、系谱选种选配等过程,完成现场数据采集和育种资料的收集工作后,将采集的数据转存于办公室局域网服务器中,在办公室应用模式中完成数据处理、统计分析、办公室选种、组建家系和遗传分析等工作。进行办公室应用时,只有具有访问权限的用户才能通过远程登录进行系统应用操作,而且只有系统管理员才可以进行所有育种数据的修改、编辑和数据转移等操作。
档案信息:对山鸡场布局、鸡场结构和数量、鸡舍数量和编号、品种情况、家系数量和组成登录存档。
图4 云存储(计算)系统
肉用性状数据:此模块的主要功能有肉用性状测定数据表生成、测定数据的现场输入、办公室数据处理和初选、各选择性状统计分析等。为解决群体中多个不同批次以及不同人员之间的测定误差,系统采用生物统计分析方法,先计算个体的标准化离差,再在此基础上进行家系成绩统计,从而消除某些系统因素的影响。本模块是整个育种程序中数据处理量最大、要求最高的一个程序,处理后的数据指导群体的早期选种和系谱选种。
蛋用性状数据:此模块是针对母山鸡需要进行个体蛋用性状测定而专门设计的。它包括“母山鸡上笼”、“母山鸡个体信息导出”、“蛋用性状测定记录导入”和“产蛋数据统计分析”等程序。其中,个体蛋用性状测定记录数据输入后,经由“产蛋数据统计分析”程序进行统计分析,计算出每只母山鸡各时期的累计总蛋数、累计合格蛋数、开产日龄、蛋重、蛋色、蛋品质等,同时也计算出家系和同胞上述各性状成绩,从而指导母山鸡蛋用性状选种。
孵化管理:家系输精生产的种蛋管理,孵化厅系谱孵化的数据记录和管理,出雏时穿戴翅号,建立山鸡雏个体翅号信息并记录山鸡雏出生重、出生日期、批次等出生信息。
系谱选种选配:利用测定的生产性状等数据进行统计分析,采用BLUP算法进行计算。同时,可以根据用户实际需求进行BLUP模型的定义及综合育种值各类经济系数的定义,因而分为单个育种值和综合育种值的计算。单个育种值是根据用户事先定义好的固定变量及随机变量等参数计算出的育种值;综合育种值是以上一步计算的结果乘以事先定义好的经济系数而得到的综合育种值,而经济系数是用户根据自己企业具体需求来定义的。该模块的模型定义及计算需要育种专家配合实施。
系统选种选配可以实现自动生成选配计划。自动选配可以根据亲缘关系系数来控制每个家系内具有全同胞或半同胞关系的母山鸡,以保证家系公山鸡与家系内的任何母山鸡没有全同胞或半同胞关系。另外,系统还可以选择实行或者避免同型交配,为避免同型交配过于集中,系统将母山鸡的主要选择性状在不同家系间均衡分布,既可以防止出现两极分化,也可以长时间保持品系的相对遗传多样性。该模块由程序通过计算亲缘关系系数组建家系,并避免全同胞或半同胞交配。
红艳山鸡育种分析管理软件的主界面见图5。山鸡的生产性状数据分上笼测定、生长测定、体型外貌测定、屠宰测定、上产蛋笼后的开产测定、蛋品测定及产蛋量测定等十余个测定环节,包罗了种山鸡生长测定及产蛋测定的所有性状。在继代选留环节,用户可以根据综合育种值来进行核心群的选择。
BLUP是目前动植物育种计算中的主流[3~5]。它是由C.R.Henderson提出的、统计学上用于线性混合模型对随机效应进行预测的一种方法,随机效应的最佳线性无偏预测等同于固定效应的最佳线性无偏估计。
本系统利用美国农业部农业研究服务中心(Agricultural Research Service,ARS)开发的第三方软件MTDFREML工具软件进行育种值的BLUP计算[6]。该工具软件利用Restricted maximum likelihood(REML)进行混合线性模型中的协方差矩阵参数G与R的估计,利用估计后的参数来预测用户所需性状的育种值。但考虑到企业经常会根据自身具体情况来综合多个性状的综合效应,本系统还可以利用自定义的经济系数(式1)来进行综合多个性状的育种值计算,从而得出个体的综合育种值。
Comp*
(1)
EVi:第i个性状的育种值;
wi:第i个性状的经济系数;
CompEV:综合育种值。
本系统就是利用综合育种值CompEV,以家系为单位进行下一代核心群的选取。
本系统中用户定义混合线性模型的界面见图6。通过该界面,用户可以定义要计算的目标性状、固定效应及随机效应等参数。
图5 山鸡育种数据管理与分析系统主界面
图6 BLUP模型登记界面
用户利用综合育种值进行种山鸡核心群继代选留的界面见图7。在该界面,用户可以利用个体综合育种值、家系平均综合育种值及同胞平均综合育种值进行排序,从而进行下一代核心群的选留。
图7 利用综合育种值进行核心群继代选留
红艳山鸡育种分析管理软件的研发与应用,全面规范了山鸡育种的数据采集、检索及育种值计算等业务流程,并充分满足了育种工作人员的实际应用要求。该系统从实际出发,收集、整理和规范所有相关育种信息资料,对规范种山鸡场的工作流程有着积极作用,同时也大大降低了工作人员的工作负担和工作误差。
该系统界面友好、使用方便、现场可操作性强,大大提高了数据的准确性、安全性和信息传递及时性,为种山鸡育种工作提供了强有力的技术支撑。同时由于该系统为C/S框架数据库结构,采用的是云平台,很好地解决了多个场区数据统一管理的客户需求。
基于云端的大数据处理技术,也使系统可以及时传递各类信息资料,有利于实时把握选育成效,及时应对市场需求变化,并有效降低育种成本,显著改善育种工作效率,改善种群遗传进展。
综上所述,该系统的开发与应用是传统数量遗传育种技术与现代计算机技术在山鸡育种工作中的紧密结合。在今后的发展中,配合现代化电子标签及光电技术进行山鸡无纸化测定,从而进一步降低工作强度,提高数据准确性、可信性及安全性,最大化利用所有可利用的现代化技术资源,将进一步提高山鸡整体育种工作效率和市场应变能力,且更加有效地推动山鸡育种工作开展。
[1]刘宗萌.家禽育种数据库软件的开发与应用[D].武汉:华中农业大学,2013.
[2]林元震,陈晓阳.R与ASReml-R统计分析教程[M].北京:中国林业出版社,2012.
[3]Robinson,G.K..That BLUP is a good thing:the estimation of random effects[J].Statistical Science,1991,6(1):15-32.
[4]Henderson,C.R..Best linear unbiased estimation and prediction under a selection model[J].Biometrics,1975,31:423-447.
[5]Xu-QingLiu,Jian-Ying Rong,Xiu-Ying Liu.Best linear unbiased prediction for linear combinations in general mixed linear models[J].Journal of Multivariate Analysis,2008,99(8):1503-1517.
[6]Boldmann,K.G.,L.A.Kriese,et al.A manual for use of MTDFREML[M].UnitedStates Department of Agriculture:Agricultural Research Service,1995.