蒲 强 陈苗苗 陶 涛 龚大刚 杜 鸿 鲜跃荣
(1成都大学信息科学与工程学院,四川成都 610106;2四川省阆中蚕种场,四川阆中 637400)
传统手工蚕桑生产效率低,在实际生产中蚕桑产业的历史数据未能得到充分利用并用来指导现有的工作和研究。如何利用信息化技术提高蚕桑产业的智能化、自动化生产及科研水平,是目前传统蚕桑产业面临的主要问题。虽有研究提出了利用信息化手段改良传统蚕桑产业的思路和举措[1-2],也有研究将互联网和物联网应用在蚕桑作业中[3-4],并利用信息化技术优化家蚕育种中的某些关键问题[5],但都没有形成一个在蚕桑生产中系统利用信息化技术的整体解决方案,对蚕桑信息化系统的智能性和数据分析重视不够。本文在传统蚕桑生产中引入信息技术,利用互联网、大数据智能处理与分析,设计了一种基于数据分析的蚕桑智能系统,可实现蚕桑数据的自动采集、科学分析,用数据引导推动蚕桑作业的精准、高效、科学生产。现将有关情况报告如下,供同仁参考。
蚕桑智能系统总体结构由下向上分为基础层、数据层、业务层和表示层等4层,系统总体结构如图1所示。蚕桑智能系统设计的原则如下:底层为上层提供网络运行支撑和蚕桑数据支撑;上层利用底层提供的网络和数据服务,进行蚕桑业务管理和数据分析,并向用户提供业务逻辑密切关联的人机交互界面和蚕桑业务所需的智能计算、分析结果和决策建议,如作业报表、谱系图和数据统计分析结果和建议等。
图1 蚕桑智能系统总体结构
基础层包括网络系统设计,分为互联网和物联网2大部分,是蚕桑智能系统运行的网络基础。服务器位于网络中心,是蚕桑智能系统的中枢,提供数据库、通讯、控制、数据分析等服务;另外,基础层还设计了数据自动采集系统,负责有关蚕桑作业数据的自动采集任务,与之相关的是各种客户工位计算机、电子秤和传感器。基础层负责数据采集、传输,为上层提供网络运行、通讯服务和数据自动采集服务。
数据层包括数据库管理系统和文件系统,存储蚕桑作业产生的数据和文档,形成数据仓库,是蚕桑业务工作和数据处理与分析的基础。
业务层为蚕桑智能系统的核心平台,设计包括家蚕选种、品种保存、杂交鉴定、原种繁育等4大业务系统。在此基础上,还设计了基于业务和底层数据上的各种智能系统,如智能指标系统、信息检索系统、报表生成系统、大数据分析系统、物联控制系统和滴灌系统。智能指标系统从多个统计角度分析各类蚕桑数据,有利于蚕桑工作人员合理选择蚕桑指标科学开展蚕桑业务,为蚕桑业务提供增值数据和智能决策;信息检索系统可辅助蚕桑工作人员从海量数据中搜索对生产有用的数据资料指导蚕桑业务;报表生成系统可灵活生成各类报表,将人从繁琐易错的报表整理工作中解放出来。整个业务层核心平台中,大数据分析系统是蚕桑智能系统的核心,物联控制系统和滴灌系统可实现蚕室和桑园的自动管理和环境控制。由于篇幅原因,以下仅以家蚕选种系统和大数据分析系统设计为例进行具体阐述。
2.3.1 家蚕选种系统 家蚕选种系统是蚕桑智能系统的核心业务,内容较多,其设计也成为业务层中的关键。家蚕选种系统包括选种管理子系统、智能选育子系统和选种谱系子系统(图2)。(1)选种管理子系统。包括年季作业计划和选种数据输入2大模块。年季作业计划是每个年季整个家蚕选种系统的起始工作,后续工作的开展和数据衍生都源于作业计划,因此本模块功能非常重要,设计时要充分考虑到作业计划数据的加锁功能,以防删除计划对后续管理工作造成严重不良影响。选种数据输入模块是选种原始数据输入的主要模块,包括出库催青、饲育管理、茧质调查、个体茧调查、母种交配型式、母种制种数据、原原种制种数据、卵质调查、生物学性状、区内一粒缫丝、区间多粒缫丝等数据的输入。设计时需要注意,业务数据根据其特点和需求彼此间在逻辑上关联性很强。为了保证数据的真实性、正确性,本模块需要设置大量的数据自动检查功能和关联检查功能,并且要做到一处数据的变动,多处数据都要随之发生联动。这种数据逻辑上的关联表示也保证了后续谱系的生成,智能选育工作、大数据分析和报表的数据能够准确引自本模块的输入数据。(2)智能选育子系统。包括选卵、蛾区选择、品质排队、交配蛾区选配、个体茧选择等模块,各个模块按照一定的规则和算法,由计算机自动进行智能选育工作,大大提高了家蚕选育工作的效率和准确率。比如,蛾区选择模块按照蛾区选择智能算法,自动选择母种当选蛾区和原原种当选蛾区,并给出淘汰意见。品质排队模块借助当季系统自动生成的当选母种主要性状成绩,对4龄结茧率、4龄健蛹率、普茧率、全茧量、茧层率、蔟中病死蚕率等指标,按照一定的算法规则进行打分排队。交配蛾区选配模块在母种小系内,以品质排队结果为依据,按照强强结合和异亲异蛾交配的原则,采用成绩优良者优先互交组合,智能选择合理的交配型式,充分确保选育蚕种的杂种优势。(3)选种谱系子系统。自动理清蚕种上下代亲缘关系,借助各季系统生成的当选母种及相交亲本,生成能够反映蚕种上下代亲缘关系的谱系图,并标明母本及父本的主要性状成绩,确保选育蚕种谱系清晰。
图2 家蚕选种系统
2.3.2 大数据分析系统 大数据分析系统可以根据需要进行数据分析,为蚕桑业务提供增值数据和智能决策,在蚕桑智能系统设计中占据绝对重要地位。大数据分析系统包含五大子系统,即回归建模子系统、数据统计子系统、方差分析子系统、相关分析子系统和品种性状自动评价子系统等(图3)。(1)回归建模子系统。可以对选定年季范围的某品种,设定任意一个性状指标作为因变量Y,然后根据选定的n个自变量性状指标[X=(x1,x2,…,xi…,xn),xi为第i个自变量性状指标]进行回归建模。对建立的回归模型,可以进行拟合分析,也可以用自变量性状指标预测未来年季的因变量指标值。(2)数据统计子系统。对某个品种按年季跨度或某些年季区间,对所选性状指标进行纵向或横向的统计比较,明确选种和工作目标。(3)方差分析子系统。可以对多个品种,按不同(单个)年季分析某个(多个)生物学性状指标的差异显著性;或对某个品种,分析多个生物学性状指标在不同年季下的差异显著性。另外,在研究工作中对蚕桑独立实验的数据,也可以灵活进行单因素、双因素和多因素方差分析,分析实验结果,提高选种效率。(4)相关分析子系统。分析选定年季范围内的某一品种的多个生物学性状指标间的相关性,揭示性状指标间的强弱关系。(5)品种性状自动评价子系统。能智能灵活评价某一品种与其它品种在设定年季范围内的性状指标,并自动给出性状趋势的比较结果和品种间最终的性状评价结论。
图3 大数据分析系统
表示层提供了蚕桑业务操作和数据分析的人机交互功能,提供了蚕桑数据来源的操作界面和数据分析结果的显示界面。包括业务操作界面、报表显示打印系统、统计图形系统、谱系系统和性状评价系统。报表显示打印系统显示和打印蚕桑作业上报报表和存档报表等。统计图形系统提供数据统计结果的图形显示,包括柱状图、折线图、回归模型拟合诊断图、回归模型预测图、性状指标散点图矩阵、相关矩阵图、相关系数表和性状比较图等。谱系系统和性状评价系统分别给出具体的谱系图和性状评价结论。
蚕桑智能系统已在四川省阆中蚕种场使用了6季,据我们调查,蚕桑作业中的数据关联检查和自动采集功能,减少了员工录入数据的工作量,提高了数据的准确性和生产效率,规范了操作程序,有效地保证了数据的及时性和真实性;使用物联网滴灌技术的桑园单位面积桑叶增产17%左右;蚕桑数据处理、大数据分析和报表生成,大大提高了生产效率,完成了传统纸质数据无法完成的工作。随着存档历史数据的不断丰富,大数据统计分析和谱系生成已显示了重要作用,为蚕桑作业和研究提供了数据指导、数据支撑和决策建议。由于篇幅原因,下面选择蚕桑智能系统中6个有代表性的模块,从数据自动采集/输入、个体茧智能选择、蛾区智能选择、选种谱系、数据统计和回归建模等模块的使用情况,简要说明系统的典型应用效果以及蚕桑智能系统的典型模块的工作情况。
图4为家蚕选种系统的选种管理子系统的数据输入模块的使用情况,具体为区内一粒缫丝数据自动采集/输入情况。从图4可以看出,输入工作可以根据需要,选择人工输入或者自动从电子秤采集数据(电子秤精度可根据需要设置)。对于一粒缫丝业务而言,还可以设置疵点系数并计算年季所有品种的净度。
图4 2019年春季“芳”的一粒缫丝数据自动采集/输入图
图5为家蚕选种系统的智能选育子系统的个体茧智能选择模块的使用情况。从图5可以看出,选茧时可分别设置雌雄个体茧选择指标,按照智能淘汰算法自动选择后,将给出品种饲育区淘汰的雌雄茧号,淘汰数量和淘汰比率,方便工作人员快速剔除对应淘汰茧号的蚕茧。
图5 2019年春季“7532A”的个体茧智能选择图
图6为家蚕选种系统的智能选育子系统的蛾区智能选择模块的使用情况。从图6可以看出,选择蛾区时可根据需要设置各小系蛾区的当选数量、指标比例和指标权重,然后按照蛾区智能选择算法从供选蛾区中自动选择规定数量的母种蛾区和原原种蛾区,并以不同颜色标注,同时给出蛾区淘汰意见。蛾区智能选择克服了手动选择慢,靠经验选择导致的不科学、不准确问题。
图6 2018年春季“7532A”的蛾区智能选择图
图7为家蚕选种系统的选种谱系子系统的使用情况。从图7可以看出,设置品种和起始年季后,系统能按照小系查找选择年季间所有的上下代亲缘关系,并用谱系图形的方式绘制出来。由于谱系图对家蚕繁育具有重要的意义,如果没有计算机自动绘制谱系图,仅靠人工画谱系图,在蚕种谱系年季跨度很大的情况下,则难以理清蚕种谱系正确的上下代亲缘关系。计算机自动绘制的树状谱系图,能够清晰、正确地反映蚕种的上下代亲缘关系。
图7 2016年早秋至2017年早秋“白”的C小系谱系图
图8为大数据分析系统的数据统计模块使用情况,是对品种“781B”的3个年季(即2017年早秋蚕期、2018年春蚕期、2018年早秋蚕期)的蔟中病死蚕率、半病态茧率和同宫茧率等3个统计指标平均成绩的统计调查比较结果。从图8可以看出,模块按照选择的统计年季,统计比较选择的指标并以选定的某种图形方式显示比较结果,据此分析品种某个性状指标的发展趋势,以便做出科学决策,加快蚕品种的选育进程。
图8 2017—2018年3个年季“781B”的蔟中病死蚕率、半病态茧率和同宫茧率平均成绩比较图
图9为大数据分析系统的回归建模模块使用情况。从图9可以看出,可以选择某个指标作为预测分析的因变量指标,再根据实际业务选择自变量指标,进行回归建模,发现因变量和自变量间的某种线性关系。模型可以进行拟合分析,检查回归建模的合理性。更重要的是系统可以根据建立的回归模型对因变量指标值进行预测。
图9 “734”的回归建模与预测图
本文在传统蚕桑作业中引入信息技术,利用互联网、物联网、大数据处理与分析等技术,设计了基于数据分析的蚕桑智能系统,该系统以蚕桑业务为主要内容,提供了业务逻辑上密切联系的数据表示方式,设计了蚕桑业务智能算法对蚕桑数据进行处理和分析,并产生图形和文字等分析结果。实际应用表明,蚕桑智能系统有效地实现和指导了蚕桑精准、高效、科学生产,有助于推动现代蚕桑产业的发展。