测量不确定性下的种猪生长性能人工与电子测定工作数据正确性表现(上)

2023-05-30 10:48楼平儿杜秉华戴美玲毛元良唐国庆张和军
国外畜牧学·猪与禽 2023年2期
关键词:生长性能种猪

楼平儿 杜秉华 戴美玲 毛元良 唐国庆 张和军

摘  要:种猪生长性能的电子测定设备对加快育种做出了重大贡献,我国养猪界对电子测定技术在种猪育种领域的应用价值也有所熟知,但很多猪场并没有使所测定数据发挥应有的作用,原因是人们普遍质疑测定数据的正确性,是测定人员对电子测定的工作数据的正确性表现存在认识误区,从而不能采取有效的测定管理。本文探讨了被测量值与测量误差在人工测定和电子测定工况下的表现和特点,以帮助人们正确认识电子测定设备在种猪生长性能测定中的价值,加快我国种猪的遗传育种进展。

关键词:测定工作模式;工作数据正确性;测量不確定性;生长性能;种猪

种猪生长性能中的饲料报酬是衡量养猪经济效益的一个重要育种指标,也是育种历史和技术发展中倍受关注的一个测定项目。现代测定技术的一个重大进步是把人工测定发展到了电子测定。

电子测定技术是现代育种技术需要和现代科技进步下发展起来的新技术,电子测定实现了测定工作从人工操作向自动操作的转变。自动测定工作不仅极大地提高了测定的工作效率,还提供了整个测定期被测猪的采食和生长表型的全程动态信息。

世界育种大国对种猪的电子测定设备的应用已超过了30年的时间。电子测定种猪生长性能中的饲料报酬表型值在推动这些国家的种猪生长性能上发挥了重要的作用,并且这个表型值也成为了种猪业的一个重要的评定指标。我国引进和应用种猪电子测定设备至今已经超过20年,但是国内很多种猪育种场并没有使所测定数据发挥应有的作用,全国遗传评估中心至今也没有在数据平台上为饲料报酬表型值开辟一席之地。

我国猪场种猪生长性能电子测定数据的正确性被普遍质疑的原因有多种,其中之一是不少测定人员对电子测定的工作数据的正确性表现存在认识误区,从而不能采取有效的测定管理。

测量数据正确性的表现在于被测量值(通常意义上指真值)的准确程度以及测量结果与被测量值的偏离程度(通常意义上指测量误差),这两个因素构成了测量数据的正确性。

测量不确定性是现代测量的基础,对电子测定有很强的指导意义。

本文将探讨被测量值与测量误差在人工测定和电子测定下的表现和特点。

电子测定技术利用现代科技把测定工作从人工操作转变到不需要人工的自动操作,这个转变实际上是测定工作模式的转变,即从人工测定时被测动物的被动测定模式变成电子测定时被测动物的自助测定模式。测定模式的转变是测定技术的重大进步,但也导致测定工作数据表现和性质发生了变化,这个变化又进一步使这两种测定模式在测定工作数据的正确性上产生不同的解读。人工测定的工作数据还是有正确性属性的测定意义上的数据,而电子测定的工作数据则是没有正确性属性的纯记录性质的观测列数据。

人工测定的被动测定模式是一个在人工充分干预下把工作条件和管理相对管控得很“理想”的操作,该模式下产生的数据量极少,但其数据正确性能被管控在我们习惯认知的直观“合理”范围之内。

电子测定的自助测定模式,不会采取人工测定时必须的各种人为管控措施,从而得到了可能更接近育肥场真实饲养环境下的采食行为表型数据。这个数据既含有被测动物在整个测定过程中的大量的采食行为信息,又含有整个测定过程中其采食行为在开放状况下受到难以控制的各种外界因素的影响信息。信息所呈现的“大数据”特点和影响信息对工作数据“正确性”的影响远大于在人工测定时的影响,工作数据的“不正确”表现超出了我们习惯认知的“正确”范围。

种猪生长性能电子测定工作数据在正确性方面的不同表现,不但会影响其工作数据的正确性,也会影响电子测定工作的管理,这种影响在测定管理和数据要求不高时可能显得不大,但在不断发展的现代育种技术对表型数据的高质量要求和不断提高育种经济效益的社会需求下,所显示的作用会越来越大。

1  测定工作模式的区别

人工操作的种猪生长性能测定工作模式是被测动物的被动测定模式。该模式是在简单的机械和计量或电子计量工具的帮助下,一切测定工作和被测对象都在人为安排和管理下进行,包括测定条件的安排和管理、被测猪行为的管理以及测定数据的记录等。

电子测定是在现代工业科技支持和控制下的设备按编程进行“自动”运行,能够让被测动物“顺利地”进行自助测定的模式。在此模式下除了日常巡视和防病治病工作需人工操作外,被测猪在测定栏内可以不受限制地自由行动,在整个测定过程中,被测猪自主进入测定站采食,并自助接受设备的自动记录,测定工作是全天候和全测定周期自动进行的。

1.1 不同测定工作模式对测定工作数据正确性的影响

测定行为是一个测定和被测定之间的互动行为,在任何一个测定过程中,测定与被测定这两个因素的表现和作用都会影响测定工作数据的正确性。测定由测定者和测定设备组成,对测定者的要求是需要具备对参加测定工作的人能管控和对测定设备性能有基本了解;被测定是被测者对测定规则的反应和遵守能力。

人工测定条件下的测定者能最大程度地管控测定过程和测定条件,由于测定设备相对简单,故记录响应“迟缓”却相对“稳定”,数据特点表现为相对静止和孤立。被测猪的行为被强制约束在人为制定的测定规则下,一些所谓的“异常”数据在测定者习惯理念的监管下不允许出现。这表示在人工测定的工况下,来自测定者与被测者的因素对测定工作数据的正确性影响实际上是被“牢牢”地控制在习惯认知的范围之内。

电子测定对测定者和测定设备的要求相对较高。电子测定技术是多项现代科学技术支持下的产物,需要操作者具备现代管理和工业技术等基础知识才能较好地操作设备,然而实际情况是,畜牧业是社会各行业中综合技术基础很差的一个行业,操作者的能力普遍相对低下。对于测定设备来讲,目前普遍使用的电子测定设备还远远不是一个“人工智能”意义上的设备,因此又增加了一个除操作者能力以外的负分。笔者在80多家核心种猪场的种猪测定现场看到的实际情况也无意中证实了这点:在电子测定运行过程中出现的故障率和数据异常的状况都高于其他行业的,而且其影响测定结果的程度也常超出习惯认知的可接受范围。

在电子测定自助模式下,被测者的表现与人工测定模式下的不一样,我们期望被测猪在测定站内采食时不要冲撞料槽、扒料、流口水;被测猪站在体重秤上时不要晃动,在测定站内也不要发生争斗等,然而,在无人管控的情况下,什么事都会发生,而且常常发生在测定站内。被测猪对人为设定的测定规则没有遵守的意愿,现场操作人员对此不以为怪,因为知道被测猪有天生的智商和破坏性,以及不同个体之间有差异。但是,猪的行为、行为差异和应激反应等效应对现有测定技术的工作数据正确性的影响常常是不小的,而且也是不确定的,“忠实”的电子测定设备会把这一切都记录下来。

例如,有一頭被测时真实体重(称为“真值”)为50 kg的猪进入测定工作站采食,并接受了自助模式测定。自助模式测定的结果显示,该猪的体重可能是52 kg(或48 kg),甚至也有可能是75 kg等。我们希望的理想记录结果应该是(50±1)kg以内的示值,因为这是猪的真值(50 kg)加上正常称重误差(假如为“±1%”)后正常和应该的记录示值。52 kg或48 kg的测定结果表示在这次的体重记录过程可能受到一些影响,这可能是设备本身的计量性能发生了漂移,即设备本身的正常称重功能(误差±1%)变得有些不正常,但这次记录过程中的真值(50 kg)没有变化。75 kg的测定结果很可能是另一头猪的前半身也靠上了体重秤,也可能是被测猪的应激行为引起的,甚至可能出现了严重的粘连或卡顿等,这种情况表示这次测定过程中的真值(50 kg)在记录时出现了变化(当然也可能包括一些其他次要因素,本文不再叙述)。

上述实例中的电子测定工作数据状况在测定过程中是真实的,且很常见,从这个例子可以看到电子测定中测定者与被测者都对所得工作数据的正确性产生了不可忽视的影响,每次的记录结果常常是其“真值”不能被确定,且受到影响后产生偏离“真值”的程度也常常是不一样的。

电子测定工作模式的另外一个特点是必须长期不间断地工作,一个完整的测定周期需要6~12周,这是另一个让操作人员对一些所谓的“异常”情况和数据产生疲惫而麻痹到“视而不见”,这是工作数据中避免不了出现异常数据的又一原因。

电子测定工作数据表现的正确性与我们习惯的人工测定数表现的正确性相比显然要差,而且差很多,其表现既不容忽视,又为“常态化”和原因多种且效应互动。或者从另一方面讲,电子测定工作数据表现的“正确性”与我们习惯的人工测定数据表现的数据“正确性”的表述是不同的。

1.2 不同测定工作模式下工作数据的性质

在人工测定的被动测定模式下,由于能力的限制,人均管理的被测猪只能是极少量的,而且也只能对这些极少量的猪采集开始测定和结束测定时的数据(或根据需要再增加几个数据)而已,所以,人工测定下工作数据的表现特点是数据的总量少,且彼此为不呈数据链性质的孤立数据。

人工测定工作数据的另一个特点是数据有复测和复验的机会,在需要时可以使用这个机会来验证测定过程中每个数据的“可信性”。这个特点在测量学上有着认定工作数据性质的重要意义,它是认定工作数据是有正确性属性的测定数据还是没有正确性属性的纯记录性质数据的理论条件之一。为此,对电子测定来讲,电子测定所得的每一个工作数据都没有测量观点下验证它们“正确性”的基础,所以它不是“测量意义”上的数据,只是记录性质的数值。

电子测定在现代科技的帮助下实行了自动操作,工作效率远远超过人工测定的,通常一家种猪场会配置几十乃至几百台电子测定工作站,而且这些工作站能同时运行。按一个测定工作站内的被测猪平均在10头以上计算,进行电子测定工作时的人均管理的测定动物数量是人工测定的百倍以上。而且电子测定的被测动物自助测定模式是全天候和测定周期全程运行的,一个工作站一天中的事件数据量有100~200个,种猪场一个测定批次的测定事件数据量则可有几十万至上百万个,这是一个数据量庞大的数据集。

电子测定的每一个工作数据都不可复测和复验,测量科学的观点认为一个没有其数据正确性属性的工作数据只是一个记录性质的观测数据,所以,电子测定所得的工作数据集称之为数据观测列。该数据观测列是一个工作数据总量巨大的数据集,这种数据的特点显示要分析和处理它的方法只能把相应的数据观测列作为一个总数,然后用统计学的方法进行,而不可能用一个处理孤立数据的简单数理方法去进行。

1.3 不同测定工作模式下工作数据的信息量表现

前文1.2节介绍了在人工测定的被测动物被动测定模式下,由于各方面的能力和条件限制,人均测定的猪数只能是极少量,得到的测定数据也是极少量,所以人工测定工作数据的信息量是相对极小的,而且还是孤立的和静止的信息。

前文1.2节还介绍了电子测定下的工作数据是一个记录性质的观测列数据,通常拥有几十万条记录内容,并贯穿了从开始测定到结束测定的全测定期的观测数据集。这个观测数据集包含被测动物在整个生长期内发生的所有采食行为连续变化的动态信息,用数据链的形式记录了相应的各次采食行为发生时的被测猪身份、采食时长、采食记录和体重记录等即时信息。这是每头被测猪在生长全过程的采食行为表现以及它们的生长性能随之变化的动态信息,更是现代育种技术需要的很有价值的信息。人工测定的工作数据没有这样的信息内容。

电子测定数据观测列在测定过程中受到的各种影响通常表现为一些所谓的“异常”数据值和异常的数据链结构等。这些“异常”实际上就是受各种影响的过程和结果,这种“异常”也是测定猪信息。只要不是刻意地在APP上设置阈值来“过滤”或“平衡”某些“不好”的记录值,那么这些信息都会“忠诚”地显示在数据观测列中,这是电子测定管理中所需要的很有价值的信息。人工测定的工作数据没有这样的信息内容。

2  测量不确定性下的种猪生长性能测定工作数据的“正确性”和“可信性”

测量数据的正确性与“测量的参考量值”和“测量得到的量值”直接相关,这两个词是JJF1059-2012《测量不确定度评定与表示》[1]的术语。用通俗的实例来表示这两个量值的话,则分别是前文提到的“真值(真实体重值50 kg)”和实际的“记录值[测定结果为52 kg    (或48 kg),或75 kg]”。当然这种理解在测量科学的观点下不一定是合适的。

现代测量科学认为,测量的不确定性广泛存在于所有的测量工作中,测量不确定性导致任何测定的被测量值(“真值”)是一个理想化的概念,而且测量得到的量值(“测量结果”)也必定存在某些不确定的误差。由于现代测量项目的多样化,各项目有不同的测量条件和目的,两个量值(测量的参考量值和测量得到的量值)的测量不确定性效应在不同项目中的影响是不同的。本节讨论的内容是在测量不确定性观点下,这两个量值在种猪生长性能的人工测定与电子测定项目中的表现。

2.1 测量不确定性下的人工测定工作数据的“正确性”

在人工测定的实践中,人们习惯认知的测量工作数据正确性概念就是数据测量误差的概念。数据测量误差的经典公式:测量误差=测量值-真值。公式中的测量值是指在测定时记录下的测定记录值,真值是被测量值。这个数据正确性概念和数据误差公式是从测量行为开创以来就形成的认知。

在人工测定的实践中,几乎没有操作者会在每次操作时考虑“真值”的概念。如测量体重时,除非出现连续一样的称量示值或明显超出当前群体均值范围的体重值,才会或才去怀疑当前这头猪的真实体重(真值),然后再复验一下。也就是说,在经过正常称量前校准体重秤的程序中,在随后正常的或一般的人工测定过程中,操作者是默认当前的称量就是“真值”或者就是“约定真值”。

对于称量的结果,操作者也是基于同样的感觉,几乎没有操作者会在每次操作时怀疑这次“测量结果”,除非出现连续一样的称量示值或明显超出当前群体均值范围的体重值,才会怀疑当前这头猪的体重示值,然后再复验一下。也就是说在经过正常的称量前的校准体重秤的程序,在随后正常或一般的人工测定过程中,操作者承认当前的称量误差在体重秤的正常范围之内,并把这次测量结果作为“测量意义”上的测定值而记录了下来。

这是人工测定时发生的习惯操作和形成的对工作数据正确性的认知,而实际情况是绝大多数的数据用户根本没有想到那个经典误差公式的存在。人工操作的一切都是在操作者自信管控测定工作和自信控制工作数据不会出现超出认知的正确性范围,从人工测定工作开创至今一切都顺利成章。

持有测量不确定性观点的人认为,任何测定所得的真值实际上都是一个理想化的概念,真值是无法确切知道的。笔者曾经做过一项相关验证人工测定时体重“真值”的实验[2]。在实验期间,某测定站11头猪体重复测的情况:用笼秤连续两次人工称各头猪的即时体重,两次称重间隔时间不足10 min,每头猪两次称重值的差为差异值。结果是维持同样体重值的次数只有3次(占13.6%),其余19次(占86.4%)复测后都出现了差异,最大的差异甚至达到了2 kg。分析原因发现,出现这种差异主要是由动物的行为引起的。由此而见,人工测定时习惯使用的“默认真值”或“约定真值”,在严格的测量不确定观点下实际上并不完全靠得住。

然而,人工测定形成的工作数据正确性和数据误差的评估方法在一定条件下有一个实用的工作方法,现代测量科学指导下的国标对此也有测量误差的说法,JJF1059.1-2012《测量不确定度评定与表示》对“测定误差”的定义是:测量误差=测定的量值-参考量值。因为人工测定下的特定条件和对正确性的使用要求上达到了国标对公式右侧两个量值的定义要求。

JJF1059.1-2012《测量不确定度评定与表示》在第3.11节的定义要求如下:

① 当涉及存在单个参考量值:人工测定工作数据的孤立特点构成了参考量值是单个的存在。

② 如用测定值的测量不确定度可忽略的测量标准进行校准:人工测定时从不考虑测量不确定度因素,因为一切尽在掌握之中。

③ 用约定量值给定时:而且人工测定时习惯有“约定真值”的默认存在,还因为其工作数据是一个有复测和复验机会性质的数据。

④ 测量误差是已知的:人工测量时的设备系统误差和其他因素都在操作人员的控制范围之内。

⑤ 测量误差不应与出现的错误或过失相混淆:人工测定时不允许出错数据的出现,更不允许出现过失错误,这是人工测定必须要做的工作和需要做到的成绩。

人工测定时用“测量误差”的方法是在对育种数据要求不高和某些不确定因素可以忽略的情况下使用的方法,在规范的操作下这还是在现代测量科学的原则范围之内的一个实用的方法。然而,人工测定的工作数据的正确性是只是对静态和孤立的参考值而言,详情请见JJF1001-2011《通用計量术语级定义》第5.9节。并不适用于现代多样化要求和复杂状况下的其他测量项目,如种猪生产性能电子测定项目。

2.2 测量不确定性下的电子测定工作数据的“正确性”和“可信性”

从1.1节至1.3节可知,用电子设备测定动物生长性能获得的工作数据是一个由庞大数据量组成的数据集,该数据集以数据链的形式不仅记录着被测猪在测定期内的生长性能信息,还包括在相应时期内受到所有外界条件影响的信息,但这却是一个没有数据正确性意义的数据观测列。在测量不确定性下定义人工测定工作数据正确性的条件与电子测定的条件显然不同。

电子测定所得工作数据的正确性也是建立在“测量得到的量值和测量的参考量值”基础上,按照测量不确定性的观点,这两个量值的注解应该是:“由于存在测量不确定性,使被测量的真值难以确定,其测量结果是真值的一个近似值和一个用以表示近似程度的误差范围,具有不确定性。”吴石林[4]指出,从这个注解中可以看到,上述两个量值实际上都是在测量不确定性的效应下产生的工作数据。所以,相关的国家标准[1,3]指出,在测量不确定性观点下对工作数据的来源和特征应作以下表述:“根据所用的信息,表征赋予被测量值分散性的非负参数。”这样的表述将帮助我们理解电子测定工作数据会产生不同数据正确性概念的原因。

相关国标在这个定义中有四个表述要点:

① 根据所用到的信息:测量结果是由电子测定工作数据在诸多影响因素作用下产生的记录。这些信息的表现可见1.3节的介绍。

② 表征赋予被测量值:测定的目的是为了得到被测对象的量值,电子测定的被测量值就是被测动物生长性能中的饲料报酬,虽然这个性能在电子测定中是一个间接量值。在测定过程中诸多动物行为信息和各种影响信息都被体现在这个量值上。

③ 分散性:电子测定数据观测列中显示的动物采食行为表型真值,被表述为“一个近似值和一个用以表示近似程度的误差范围”。这个表型真值需要加上一个表示分散性的误差范围。

④ 非负的参数:该参数表示的是“误差范围”的分散性,不能用负值表示。

在测定不确定性观点下,电子测量工作数据正确性的概念和内容需要变动和扩展。

① 测定工作由测定获得工作数据和评定数据的正确性组成,即在测定过程中得到工作数据后,还要对其工作数据的正确性进行评定才是一个完整的测量行为。

② 在用测定不确定性观点评定电子工作数据正确性时,不再关注每次测定数据的“真值”,而是数据观测列中相关数据段“表现出”的符合动物行为和测定条件下的表型值。

③ 评定电子工作数据正确性的原因不能以传统的影响因素来分类,如各种类型的系统误差等,而是可以把测定过程中的各种影响结果所涉及到的数据、资料和经验等信息以统计方法进行处理。

④ 电子测定种猪生长性能工作数据的表现致使其正确性在测量不确定性的框架下进行评定,其工作数据的“正确性”用“可信性”来表述更合适。人工测定数据的正确性以孤立的真值为中心,表明测量结果与真值的差异程度是一个差值。电子测定数据以数据观测列的测量结果为中心,评估测量结果与被测量值相符合的程度是一个分散性区间范围,区间范围用一定置信范围的可信程度来表示。

3  小结

测量不确定性下的种猪生长性能人工测定与电子测定工作数据正确性表现是不同的。从表面上看是电子测定所得数据的正确性表现超出了人工测定习惯认知的数据正确性范围,实际上是不同测定模式、条件、目的、要求下两种工作数据表现出在测量意义上的不同数据属性。

人工测定数据的正确性在于它是通过现场工作数据得到的,因为人工测定数据的误差是与真值直接相联系。电子测定数据的正确性只能通过分析评定其观测列数据才能得到,因为它所有的观测数据都是没有真值可循的。两者的工作数据在测量意义上具有不同的性质,因此对它们的数据正确性表述也是不同的。

探讨电子测定下的数据正确性问题有助于制定有效的測定管理方法,该方法包括合理的测定操作规范、监测测定过程的管理机制和数据正确性的评估体系等可操作的实质性措施。

参考文献

[1] 全国法制计量管理计量技术委员会.测量不确定度评定与表示:JJF1059.1-2012[S].北京:国家质量监督检验检疫总局,2013:4-5.

[2] 韩雪峻,杜秉华,李步社,等.两种猪体重测定工具对测定值可信度影响的探讨[J].国外畜牧学(猪与禽),2022,42(2):85-90.

[3] 全国法制计量管理计量技术委员会.通用计量术语及定义:JJF 1001-2011[S].北京:国家质量监督检验检疫总局,2012:15.

[4] 吴石林.误差分析与数据处理[M].北京:清华大学出版社,2010:175.

猜你喜欢
生长性能种猪
2022年中国种猪信息网全年计划
部分地区种猪跌破2000元/头
天邦股份种猪事业部
广东广垦广前种猪有限公司
2020年种猪进口或创历史新高
艾叶水提液对肉兔生长性能及肉品质的影响
枯草芽孢杆菌对罗非鱼免疫功能和生长性能的影响
舍饲对生长期牦牛血液生化指标和生长性能的影响
一种复合微生态制剂在鲫鱼苗养殖中的应用
湖南省种猪业发展现状