甘蔗品种优选及育种策略的信息化辅助决策

2023-11-05 07:44丘刚玮
广西糖业 2023年4期
关键词:甘蔗

丘刚玮

摘 要:信息化辅助决策是通过引入信息技术和数据分析方法,可加快育种进程,提高育种效率,且能更准确地选择和改良作物品种。文章从信息化辅助决策在甘蔗品种选育中的应用潜力、信息化辅助决策方法的实现及信息化辅助决策应用分析等方面介绍了甘蔗品种优选及育种策略信息化辅助决策的意义,并提出今后应进一步改进优化:(1)完善数据集的构建与整理工作,提高数据的准确性和可靠性;(2)探索更多先进的信息化辅助决策方法,结合多目标优化和约束优化方法实现个性化的决策支持;(3)研究甘蔗品种的遗传背景和基因组学特征,为甘蔗育种提供更深入的理论基础和技术支持;(4)加强与农业其他领域的交流合作,将信息化辅助决策方法应用于实际甘蔗育种场景,进一步提升甘蔗育种的效率。

关键词:甘蔗;品种优选;育种策略;信息化辅助决策

中图分类号:S126                                  文献标志码:A 文章编号:2095-820X(2023)04-0024-06

0 引言

甘蔗(Saccharum officinarum L.)是一种重要的经济作物,广泛种植于亚热带和热带地区,是世界上重要的糖料作物之一[1,2]。甘蔗具有产量高、糖含量高及适应性广的特点,对促进农民增收、推动农业发展及缓减全球能源压力具有重要意义[2]。然而,甘蔗品种的优选和育种策略面临着许多挑战,包括:(1)甘蔗遗传背景复杂,基因组巨大,导致传统的育种方法效率较低;(2)甘蔗的生长环境和生理特性对品种选择和育种策略提出了更高要求;(3)市场对甘蔗品质和产量的要求不断提高,需要更加优良的品种以满足市场需求。甘蔗品种优选和育种策略的目标是通过选择及挖掘优良的遗传资源,培育出产量高、抗病虫害、适应性强的优良品种[3],但传统的选育方法存在耗时费力且成本高等问题[4,5],因此亟待探索出一种高效、准确的信息化辅助决策方法以提高甘蔗育种效率及品种选育的准确性。信息化辅助决策在甘蔗育种中的應用可借助现代信息技术,如数据挖掘、机器学习和人工智能等,对大量的甘蔗遗传数据进行处理分析,辅助决策者制定更加科学、准确的品种选择和育种策略,提高甘蔗育种效率,缩短新品种(系)培育周期及降低育种成本。信息化辅助决策在农业领域已取得一系列重要的应用成果,如在作物品种选育、病虫害防控和土壤肥力管理等方面[6,7],但信息化辅助决策在甘蔗育种领域中的应用相对较薄弱。为此,本文通过引入信息技术和数据分析方法,结合甘蔗的遗传背景及生长环境特点,构建针对甘蔗品种选育的信息化辅助决策系统,探索甘蔗品种优选和育种策略的信息化辅助决策方法,为甘蔗育种领域的科学研究和实际生产提供指导,推动甘蔗品种改良及蔗糖产业的可持续发展。

1 信息化辅助决策在甘蔗品种选育中的应用潜力

传统的甘蔗品种优选和育种策略主要依赖于人工经验和实地观察。决策者通过选择具有优良性状的亲本进行杂交,然后通过对后代的观察和筛选以获得优良品种,但这种方法存在耗时、费力、成本高及主观性较强等弊端,且甘蔗的遗传背景复杂、基因组巨大,致使其育种效率较低。随着信息技术的快速发展,农业领域也开始广泛应用信息化技术以提高生产效率和决策准确性,如利用遥感技术获取农田的生长情况及土壤水分状况,利用物联网技术实时监测农作物的生长环境等[8]。

信息化辅助决策通过引入信息技术和数据分析方法,可加快育种进程,提高育种效率,且能更准确地选择和改良作物品种,目前已在作物育种领域取得良好的应用效果[6]。在水稻育种方面,利用基因组学与生物信息学方法结合大规模的遗传数据及表型数据,可快速筛选出具有抗病虫害、产量高和适应性强的优良品种。此外,在玉米、小麦等作物育种过程中也有类似的研究与应用,并逐渐覆盖到蔬菜、花卉和果树育种等领域,表明信息化辅助决策在作物育种中具有巨大的应用潜力[6,9]。由此可见,甘蔗品种优选及育种策略的信息化辅助决策将是今后甘蔗育种研究的热点,在借鉴其他作物育种领域的成功经验与方法,结合甘蔗的遗传背景和生长环境特点,开发出适用于甘蔗育种信息化辅助决策的方法,提高甘蔗育种效率和品种选育准确性,进而推动蔗糖产业的可持续发展。

2 信息化辅助决策方法的实现

2.1 数据采集与处理

信息化辅助决策的第一步是数据采集和处理(图1)。在甘蔗育种中,数据采集涉及到多个方面,包括遗传数据、表型数据和生长环境数据等,而这些数据可通过现代技术手段获取,如基因测序及高通量表型分析等[10]。

2.1.1 遗传数据采集

遗传数据是甘蔗育种中至关重要的部分,包括甘蔗基因组信息、基因型数据和遗传标记数据等。其中,基因组信息可通过基因测序技术获取,如甘蔗基因组序列、基因位置信息等;基因型数据可通过分子标记技术获取,如单核苷酸多态性(SNP)分子标记、简单重复序列(SSR)分子标记等;遗传标记数据可用于构建遗传图谱、遗传连锁图和关联分析等。

2.1.2 表型数据采集

表型数据是指甘蔗的性状表现,包括产量、糖含量及抗病性等。表型数据的采集主要通过田间观察、实验室测定和高通量表型分析等方法。其中,田间观察可直接记录甘蔗的生长情况、叶片形态、茎秆高度等;实验室测定可进行甘蔗生化分析,如糖含量测定、抗病性评估等;高通量表型分析是利用先进的仪器设备,自动化测量大量甘蔗样本的性状,如高通量酚酸测定、高通量图像分析等。

2.1.3 生长环境数据采集

生长环境数据是甘蔗生长过程中的环境因素数据,如温度、湿度、光照及土壤水分等[3],可通过气象站、土壤传感器、遥感技术等手段进行采集。其中,气象站可记录甘蔗生长地区的气温、降水量及日照时数等气象数据;土壤传感器可实时监测土壤水分、土壤温度和土壤养分等土壤条件;遥感技术是利用卫星图像获取广域范围的生长环境数据,包括植被指数和土地利用类型等。

2.1.4 数据处理

数据采集后,需要进行数据处理和整理,以便后续的分析及应用。数据处理包括数据清洗、数据标准化和数据存储等步骤。其中,数据清洗是为了排除异常值和错误数据,确保数据的准确性和可靠性;数据标准化可将不同来源或格式的数据转化为统一格式,方便后续比较分析;数据存储是利用数据库或云平台等方式,实现数据管理与共享。在数据采集和处理过程中,还需要注意数据的安全保护。尤其是甘蔗育种涉及到大量敏感数据,如基因组信息和遗传标记数据,必须采取相应措施以确保数据的安全性。

2.2 特征提取与选择

特征提取与选择是甘蔗品种优选及育种策略信息化辅助决策的重要环节,是通过统计分析、机器学习和图像处理等方法进行特征提取,再利用统计方法、机器学习和领域知识进行特征选择,可提取出最具有代表性和预测能力的特征[11],为甘蔗品种优选及育种策略的决策提供科学依据。

2.2.1 特征提取

特征提取是从原始数据中提取出具有代表性和区分性的特征,以描述甘蔗的性状和特性。在甘蔗育种中,需要利用统计分析、机器学习和图像处理等方法进行特征提取[12]。首先,统计分析方法可计算甘蔗的平均值、方差、相关系数等统计特征,有助于了解甘蔗的平均水平、变异程度及不同特征间的相关性。其次,机器学习方法可通过训练模型来学习和提取与目标变量相关的特征。如使用监督学习算法能将甘蔗的性状和特性作为输入变量,将目标变量(产量、抗病性等)作为输出变量,训练模型来模拟学习特征与目标变量间的关系。在训练过程中,模型还可以自动选择和提取与目标变量相关的特征。此外,图像处理方法可通过对甘蔗图像进行处理分析,提取出与生长状态和形态特征相关的信息,如测量甘蔗的叶片面积、叶片颜色、叶脉密度等特征,而掌握其生长状态和形态特征。

2.2.2 特征选择

特征选择是从提取得到的特征中筛选出最具预测能力和解释性的特征,以减少特征的维度和冗余,提高模型的效果和解释性,其方法包括统计方法、机器学习和领域知识等。其中,统计方法包括相关系数、方差分析等,可评估特征与目标变量间的相关性和显著性。机器学习是通过特征重要性评估或特征选择算法筛选出最具预测能力的特征,如使用决策树模型或随机森林模型评估特征的重要性,并根据重要性排序选择前几个重要的特征;也可使用特征選择算法,如LASSO(Least absolute shrinkage and selection operator)和递归特征消除等,通过迭代过程选择最具预测能力的特征。此外,领域知识也常用于特征选择。根据对甘蔗生长和性状的理解,可选择与目标变量相关的特征。

2.3 模型构建与优化

在甘蔗品种优选及育种策略的信息化辅助决策中,模型的构建与优化是关键。模型构建是根据已有的数据和特征,建立数学模型以描述甘蔗的性状和特性与遗传背景间的关系,常用模型有线性回归模型、决策树模型、支持向量机模型及神经网络模型等。由于不同模型类型对数据的拟合能力和解释性有所不同,因此需根据具体问题和数据特点选择适宜的模型类型。以预测甘蔗产量为目标时,可选择线性回归模型;若目标是分类甘蔗的抗病性,则选择决策树或支持向量机模型。在选择模型类型后,还需要根据已有的数据和特征进行模型训练。模型训练的目标是通过调整模型参数,使其能更好地拟合已有的数据,常用的训练方法包括最小二乘法和梯度下降法等。此外,在训练过程中可使用交叉验证方法评估模型的性能及其最佳参数组合。

模型优化可通过参数调整、特征选择和模型评估等方法来实现。参数调整是通过调整模型参数,使其能更好地拟合数据和预测目标变量,常用方法有网格搜索和交叉验证。其中,网格搜索是通过遍历参数空间中的所有可能组合,而选择最优参数组合;交叉验证是将数据集划分为训练集和验证集,在不同的参数组合下进行多次训练和验证,选择具有最佳性能的参数组合。特征选择是从已有的特征中筛选出最具预测能力的特征,以减少特征的维度和冗余,提高模型的效果和解释性,通常通过统计方法、机器学习和领域知识等来实现。模型评估是通过各种评价指标来评估模型的性能和稳定性,常用评价指标包括均方根误差(RMSE)、准确率和召回率等。通过评估模型的性能,可有效判断模型是否具有足够的预测能力和泛化能力,并进行必要的调整和改进。

2.4 决策支持系统的设计与实现

甘蔗品种优选及育种策略信息化辅助决策支持系统的设计是为决策者提供科学、准确的决策支持,并基于数据采集与处理、特征提取与选择、模型构建与优化等提供在线决策功能(图2),该系统的设计与实现需要考虑以下几个方面:①数据管理和处理。决策支持系统应有效管理和处理甘蔗品种相关数据,包括建立数据库用于存储和组织数据,确保数据的完整性和一致性。同时,决策支持系统应具备数据清洗、转换和集成的能力,以确保数据的质量和可用性。②特征提取与选择。决策支持系统需要从大量的甘蔗品种数据中提取有用的特征,并进行特征选择以减少冗余和噪音,基于统计方法、机器学习和领域知识来提取与决策目标相关的关键特征,提高决策的准确性。③模型构建与优化。决策支持系统应根据甘蔗品种优选及育种策略的需求,选择适宜的数学模型,如线性回归模型、决策树模型、支持向量机模型、神经网络模型等,通过参数调整、特征选择和模型评估等提高模型的预测能力和泛化能力。④决策支持功能。决策支持系统需要提供多元化的决策支持功能,以满足决策者的不同需求,包括甘蔗品种的推荐和排序功能等[13]。在基于模型预测分析的基础上,为决策者提供所需的信息和建议,并根据反馈意见进行动态调整及优化。⑤技术支持和用户界面。决策支持系统要提供直观友好的用户界面,确保用户能便捷地理解和使用系统功能,提供易于操作和导航的技术支持,同时要提供帮助文档、培训材料和技术支持渠道,以解决用户在使用过程中遇到的问题和困惑。

决策支持系统的实现需要借助现代信息技术,如云计算、大数据分析和人工智能等。其中,云计算可提供强大的计算和存储能力,支持系统的扩展和灵活性;大数据分析技术能处理大规模的甘蔗品种数据,提供高效的数据管理和分析能力[14];人工智能则主要用于模型构建与优化,以及决策支持功能的实现。通过合理的数据管理和处理、特征提取与选择、模型构建与优化,以及多元化的决策支持功能,可建立一个科学、准确的决策支持系统,为甘蔗品种优选及育种策略提供有力支持。同时,借助现代信息技术的应用可提高系统性能及用户体验感,促进决策的科学化和智能化。

3 信息化輔助决策应用分析

3.1 数据集的构建与整理

在甘蔗品种优选及育种策略的信息化辅助决策中,数据集的质量和完整性直接影响后续决策的准确性和可靠性。首先,需要系统收集与甘蔗品种相关的数据,包括甘蔗的生长环境数据、品种特征数据和生长过程监测数据等,而数据的来源可通过实地观测、实验室测量及传感器监测等途径。收集到的数据尽可能全面和准确,并覆盖不同品种和不生长环境的多样性。其次,对收集的数据进行整理和清洗,包括去除重复数据、处理缺失值及处理异常值等;同时需要对数据进行标准化或归一化处理,以确保不同特征间的可比性和一致性,为后续的决策分析打下基础。

3.2 信息化辅助决策方法的实施与评估

在数据集构建与整理完成后,可开始实施和评估信息化辅助决策方法,基于机器学习、数据挖掘和统计分析等技术提取模式、建立预测模型,然后通过特征提取和选择从数据集中提取与甘蔗品种优选及育种策略相关的特征,一般通过统计分析、特征工程和领域知识等方式来实现。提取到的特征应反映甘蔗品种的生长特性、抗病性及产量等重要信息,并建立预测模型对甘蔗品种进行评估和预测,常用的预测模型包括线性回归模型、决策树模型、支持向量机模型和神经网络模型等[15]。这些模型可根据特征和标签数据进行训练,并用于预测甘蔗新品种的性能表现。此外,基于决策树、规则推理等方法设计决策支持规则,辅助决策者进行最优品种选择及育种策略的制定。信息化辅助决策的评估可采用交叉验证、误差分析及指标评估等方法,评估模型的预测能力和决策支持的准确性,并与传统的决策方法进行比较,验证信息化辅助决策方法的优势和效果。

3.3 信息化辅助决策方法的验证

在实施和评估信息化辅助决策方法后,需要对评估结果进行验证,包括对预测模型性能分析及评估模型的准确性、稳定性和泛化能力,同时对决策支持规则有效性进行评估,判断其对决策结果的影响及贡献。结果分析还可探讨不同特征对甘蔗品种优选及育种策略的影响程度,尤其是通过特征重要性分析及相关分析可确定哪些特征对决策结果有重要影响,从而进一步优化决策支持系统的设计与实现。此外,需要对不同决策的策略效果进行比较。基于不同目标函数和约束条件,设计并实施不同决策方案,对其效果进行评估,有助于决策者了解不同策略的利弊,为甘蔗品种优选及育种提供更科学的决策支持。

4 展望

信息化辅助决策在甘蔗育种中具有广阔的应用前景。首先,信息化辅助决策可提供全面、准确的数据支持,帮助决策者更好地了解甘蔗品种的特性和生长环境,从而做出更科学、有效的决策。其次,信息化辅助决策方法是利用大数据分析和机器学习等技术挖掘隐藏在数据中的模式和规律,通过建立预测模型和决策支持规则可预测甘蔗品种性能及优化育种策略,提供个性化的决策建议。此外,信息化辅助决策可提高决策的效率和准确性,如通过自动化和智能化的决策支持系统能快速进行大规模的数据处理和决策分析,减少人工决策的主观误差。

甘蔗品种优选及育种策略信息化辅助决策还需从以下几个方面进一步改进优化:(1)完善数据集的构建与整理工作。收集更多、更全面的甘蔗品种相关数据,包括不同地区、不同生长条件下的数据,并加强数据质量控制,提高数据的准确性和可靠性。(2)探索更多先进的信息化辅助决策方法。引入深度学习和神经网络等技术以提高预测模型的性能及精准度,同时结合多目标优化和约束优化方法实现个性化的决策支持。(3)研究甘蔗品种的遗传背景和基因组学特征,结合基因测序和基因表达数据,探索基于基因组学的信息化辅助育种方法,为甘蔗育种提供更深入的理论基础和技术支持。(4)加强与农业其他领域的交流合作,将信息化辅助决策方法应用于实际甘蔗育种场景,与农业专家、育种者及决策者密切合作,将研究成果转化为实际生产力,进一步提升甘蔗育种的效率。

参考文献

[1] 胡水凤. 转基因技术在我国现代农业和甘蔗产业中的应用[J]. 广西糖业,2022,42(6):1-4.

[2] 李杨瑞. 广西甘蔗生产中的主要问题及几点建议[J]. 广西糖业,2020,40(4):3-7.

[3] 唐伟萍,黄欣,陈泳锨. 基于深度学习的甘蔗生长监测模型设计[J]. 广西糖业,2023,43(3):14-19.

[4] 杨荣仲,周会,唐仕云,等. 广西甘蔗育种思考[J]. 中国糖料,2021,43(3):18-27.

[5] 付瑜华,卢加举,李向勇. 甘蔗主要病害抗病遗传育种研究进展[J]. 生物技术通报,2014(2):1-6.

[6] 刘忠强. 作物育种辅助决策关键技术研究与应用[D].北京:中国农业大学,2016.

[7] 孙建龙. 信息技术在农机技术推广中的应用探究[J]. 山东农机化,2023(5):40-42.

[8] 黄欣,赵志刚,万荣泽. 面向精细农业的无线传感器网络关键技术研究[J]. 农机化研究,2017,39(11):208-211.

[9] 秦丹丹,董静,许甫超,等. 分子育种时代的作物种质资源创新与利用[J]. 大麦与谷类科学,2016,33(3):1-4.

[10] 董春水,才卓. 高通量数据采集技术在现代玉米育种中的应用[J]. 玉米科学,2014,22(1):1-6.

[11] 刘忠强,赵向宇,王开义,等. 基于序相关的作物育种评价性状特征选择方法[J]. 农业机械学报,2015,46(S1):283-289.

[12] 杨万能. 水稻产量相关性状参数自动提取的数字化技术研究[D]. 武汉:华中科技大学,2011.

[13] 黄震华,张佳雯,田春岐,等. 基于排序学习的推荐算法研究综述[J]. 软件学报,2016,27(3):691-713.

[14] 樊龙江,王卫娣,王斌,等. 作物育种相关数据及大数据技术育种利用[J]. 浙江大学学报(农业与生命科学版),2016,42(1):30-39.

[15] 池涛,曹广溥,李丙春,等. 基于高光谱数据和SVM方法的土壤盐渍度反演[J]. 山东农业大学学报(自然科学版),2018,49(4):585-590.

(责任编辑 兰宗宝)

猜你喜欢
甘蔗
花式卖甘蔗
清明甘蔗“毒过蛇”
甘蔗的问题
甜甜的甘蔗
吃甘蔗
爱咬甘蔗的百岁爷爷
吃甘蔗
甘蔗新品种粤糖03-373 组培快繁试验
甘蔗新品种云蔗05-51的选育
23个甘蔗品种对甘蔗黑穗病的抗性测定