湖北省稻谷质量调查、品质测报样品扦样量优化的研究

2017-03-08 07:52盛晓艳
粮食与饲料工业 2017年2期
关键词:测报样本量稻谷

李 琦,熊 宁,刘 勇,刘 利,朱 玫,盛晓艳

(1.湖北省粮油食品质量监督检测中心,湖北 武汉 430061; 2.华中师范大学数学与统计学学院,湖北 武汉 430061)

湖北省稻谷质量调查、品质测报样品扦样量优化的研究

李 琦1,熊 宁1,刘 勇1,刘 利1,朱 玫1,盛晓艳2

(1.湖北省粮油食品质量监督检测中心,湖北 武汉 430061; 2.华中师范大学数学与统计学学院,湖北 武汉 430061)

稻谷质量调查、品质测报是依据当年抽样稻谷样本数据来估计当年稻谷总体的质量水平。对2014年湖北省调查测报数据进行分析研究,结果表明:湖北省在市/县范围内进行扦样,品种选择按照“3+1”原则是合理的;由2014年样本数学模型计算出糙率、整精米率、直链淀粉含量、食味品质、垩白度的抽样误差分别为0.75、2.61、1.68、2.25、5.16;在95%的置信区间的条件下,以各市为扦样单位,2014年调查、测报的最小抽样个数分别以342、654个为宜;4、由2013年、2014年、2015年的数据分析知,3个年度5个指标的方差是随着年度变化而改变的,且显著不同。应先对当年样本方差进行估计,进而确定出当年的最小样本量,后按照规程合理分布各地样品量。

湖北省;稻谷;质量调查;品质测报;样本量

稻谷质量调查是指当年收获稻谷质量等级状况的评价,品质测报是指对推广种植的优良粮食品种内在品质状况的综合评估。调查测报工作是对稻谷质量的一种监测,是对种植品种的一种科学分析,可以为农民种植粮食提供建议[1-5]。开展调查测报工作对于指导稻谷生产、实施稻谷种植品种宏观调控和确保国家粮食安全有着重要意义[6-9]。

为了提高调查测报数据的代表性和准确性,需要从两个方面控制:一是要求所抽取样本能客观反应本区域当年粮食品质状况;二是要求所测数据能真实反应样品本身的品质状况。在抽样调查中,样本容量的确定,是经常要遇到的问题。样本容量太小,估计问题不那么精确;样本容量太大,又会造成人力物力的浪费[10-14]。

本研究以2014年湖北省稻谷调查测报数据为基础,分析、研究如何优化扦样方案。再利用2013年及2015年数据进行验证,研究以下几个方面问题:①扦样方案中“3+1”原则的合理性;②引入最小样品量概念;③确定计算最小样品量的指标;④合理的抽样误差的确定;⑤计算最小样品量及验证;⑥通过计算得到的最小样品量方案是否具有可持续性;⑦优化后的扦样方案的实施办法。

1 “3+1”原则的合理性

湖北省主要是中晚籼稻种植,一个县域种植的稻谷品种约20至30种,在质量调查扦样过程中不易全覆盖。国家粮食局发布的《全国粮食收获质量调查和品质测报工作实施方案》和《粮食收获质量调查和品质测报技术规范》[15]提出了“3+1”的扦样方案。“3+1”原则,以调查区域内主导稻谷品种为主,选择其中具有商业价值的3个品种,同时选择1种品质较好、有推广潜力的品种。

1.1 2014年我省代表面积或代表产量的确定

根据调查区域内稻谷的种植面积(或产量)权重,合理选择采样区域、分配采样数量。所选采样区域的种植面积(或产量)覆盖调查区域稻谷种植面积(或产量)的60%以上,所采集的样品应能反映调查区域当年收获稻谷的整体情况。2014年湖北省稻谷种植面积为203.62万hm2(3 054.3万亩),所采样区域的代表种植面积应达到122.2万hm2(1 833万亩)以上;或根据2014年的产量为1 616.91万t,所采样的代表产量应达到970万t以上。在实际工作中,我们一共抽取了1 774个样本,总代表面积为124.67万hm2(1 870万亩),总代表产量为1 020万t。调查区域的稻谷面积或产量均达到了湖北省稻谷种植面积60%以上,所以可以用此次调查的样本数据来估计2014年湖北省稻谷总体质量水平。

1.2 2014年的抽样方法

2014年稻谷质量和品质分布状况研究所采集的样品覆盖全省16个市(州)的71个粮食产区县(市)、1 100余个乡(镇)、3 500多个村。共调查扦取初级样品5 000余份,实验室检验二级样品1 774份(其中早籼稻谷156份,中晚籼稻谷1 618份),分析优质稻谷样品746份,参与采样和检测的人员达2 000余人次,获得检验数据3万余个。长期检测这样大的样本量不是抽样调查研究所需要的,对人力和物力消耗较大。

1.3 2014年抽样方案的具体实施

为调查湖北省稻谷生产情况,可以按行政区域划分层次,以省为总体,以市为抽样单位。结合当地地形特点、土壤条件、气候、种植面积及作物产量等具体情况,尽可能按等距离均匀原则分布。

1.4 “3+1”原则合理性的验证

1.4.1 验证2013年在各市/县的“3+1”方案合理性

对2013年仙桃市数据进行分析,仙桃市共有15种主要稻谷品种,根据“3+1”原则,选取4个品种,检验样本数据与总体各指标平均值的差,结果见表1。对2013年沙洋县数据进行分析,沙洋县共有17个主要稻谷品种,结果见表2。

出糙率、整精米、直链淀粉、食味品质、垩白度分别参照国标GB/T 5495—2008《粮油检验 稻谷出糙率检验》[16]、GB/T 21719—2008《稻谷整精米率检验法》[17]、GB/T 15683—2008《大米 直链淀粉含量的测定》[18]、GB/T 15682—2008《粮油检验 稻谷、大米蒸煮食用品质感官评价方法》[19]、GB/T 17891—1999《优质稻谷》[19]进行测定。

2013年在湖北省随机选取的全覆盖扦样2个县,根据“3+1”抽样的方案得到目前的扦样水平,能够满足95%置信区间下的范围,理论上按照“3+1”抽样方案所得到的数据能满足扦样要求。

表1 2013年仙桃市“3+1”抽样方案的检验

表2 2013年沙洋县“3+1”抽样方案的检验

1.4.2 验证2014年在各市/县的“3+1”方案

以钟祥市和沙洋县为例,钟祥市共有23个稻谷品种,检验数据见表3;沙洋县共有21个稻谷品种,检验数据见表4。

表3 2014年钟祥市“3+1”抽样方案的检验

表4 2014年沙洋县“3+1”抽样方案的检验

1.4.3 验证2015年在各市/县“3+1”方案

以钟祥市和监利县为例,监利县共有21个稻谷品种,检验数据见表5;钟祥市共有17个稻谷品种,检验数据见表6。

表5 2015年监利县“3+1”抽样方案的检验

表6 2015年钟祥市“3+1”抽样方案的检验

2013年、2014年、2015年,分别选取全扦样的2个县,计算确认得到,“3+1”抽样的方案达到目前的扦样水平,平均值能够满足95%置信区间下的范围,也就是“3+1”抽样的方案得到的数据反映出的当年品质状况趋势与原始数据所反映出的品质状况趋势是基本一致的。

2015年钟祥市稻谷垩白度达到74.8%和部分县市垩白度较高,可能由于近几年我省局部地区干旱少雨,导致垩白度值较高。符合优质稻标准,垩白度低于5%的样品较少。每年优质稻达标率不高的主要原因就是垩白度、垩白粒率较高。

最近几年湖北优质(优良)品种早籼稻谷、中晚籼稻谷全项目符合国家优质稻标准的比例分别为5.7%、11.2%左右,其中最主要的制约因素就是垩白度、垩白粒率不达标。

2 最小样本量

进行一项抽样调查时,抽取的样本单位数越多,所得的抽样调查数据的代表性就越高,抽样推断的效果就越好;反之,如果抽样单位越少,所得的抽样调查资料的代表性就越低。但抽样单位也不能过多,过多了就会增加人力、物力和费用,也影响抽样调查数据的及时提供。因此,在抽样调查时,认真研究和确定一个必要的抽样单位数,对于既能省时、省力又能保证较好的抽样调查效果,无疑是具有重要意义的。由数理统计学可知,最小样本量的数学模型为:

当N→∞时,可简写为:

式中,e为设定的抽样允许误差(经验值或推算值),S为分析样品数据标准差,t为样本95%置信度下的值(查t值表获得)。

3 稻谷最小样本量主要分析指标

稻谷质量分析包括质量调查、品质测报两个方面,其分析目的不一样,分析指标也不一样。质量分析选取的指标有出糙率、整精米率,主要分析收获稻谷整体质量水平。品质测报选取的指标有出糙率、整精米率、直链淀粉含量、食味品质和垩白度,主要分析不同品种稻谷品种品质上的差异。

4 抽样误差的确定

抽样误差是由于抽取样本的随机性造成的样本值与总体值之间的差异,只要采用抽样调查,抽样误差就不可避免。抽样误差是个一般性的概念,它可以用不同的量值来表示。由中心极限定理知,估计量方差S2及估计量标准差S都是抽样误差的表现形式。在抽样调查中,抽样误差虽无法消除,但是可以对其进行计量并加以控制。控制抽样误差的根本办法是改变样本量。在其他条件相同的情况下,抽样误差越小,样本量越大。抽样误差与样本量的平方根大致呈反比关系,如图1所示。

抽样误差在开始时随样本量的增大而显著减小,但经过一定阶段后便趋于稳定,也就是说,经过一定阶段后,用增大样本量的方式来减少抽样误差一般是不合算。这时只要合理降低精度,就可以大幅度减少样本量而节省抽样、检测的费用。

在置信水平为95%的条件下,利用2014年样本方差代替总体方差,计算出抽样误差与样本量之间的变化关系,分别找出在各个指标中相对稳定的抽样误差,并以此确定各指标的抽样误差。

由图2可知,当出糙率抽样允许误差曲线斜率变化率差值在0.000 1内时,认为曲线趋于平稳,此时抽样允许误差变化率基本不变。由图3~图6可知,出糙率的抽样样品量为17个,出糙率允许误差为0.75;整精米率的抽样样品量为36,允许误差为2.61;直链淀粉的抽样样品量为27,允许误差为1.68;食味品质的抽样样品量为32,允许误差为2.25;垩白度的抽样样品量为55,允许误差为5.16。

图1 抽样误差与样本量关系

图2 出糙率抽样允许误差与样本量的关系

图3 整精米率抽样允许误差与样本量的关系

图4 直链淀粉含量抽样允许误差与样本量的关系

图5 食味品质抽样允许误差与样本量的关系

图6 垩白度抽样允许误差与样本量的关系

5 最小样本量的计算及验证

5.1 最小样本量的计算

选取出糙率、整精米率、直链淀粉含量、食味品质和垩白度指标,分析调查和测报最小样本量的数学模型,分别计算出2014年省及各市在置信区间为95%的条件下最小样本量。以不同的扦样单位得到的最小样本量,是反映此扦样单位的质量水平,为更好反映出各地市水平,建议以地市为单位计算最小样本量。在95%的置信区间的条件下,以市为扦样单位,质量调查最小样本量共计为342个,品质测报最小样本量共计为654个。以湖北省为扦样单位,质量调查最小样本量共计为41个,品质测报最小样本量为81个,见表7~表9。

当原抽样调查量小于30个时,样本标准偏差较大,可能会出现最小样本量计算结果大于实际样本数的情况,见表10、表11。

表7 2014年湖北省稻谷质量各市最小样本量及实际样本数

表8 2014年湖北省稻谷品质各市最小样本量及实际样本数

表9 2014年湖北省稻谷质量及品质测报的最小样本量计算结果

表10 2014年湖北省稻谷质量指标

表11 2014年湖北省稻谷品质指标

5.2 2014年湖北省及部分市稻谷质量、品质指标整体水平

以湖北省、荆州市、黄冈市为例,分析稻谷质量、品质指标。

5.3 最小样本量验证

按2014年数据计算得到的最小样品量,从2014年样品数据里随机选取数据进行验证,结果见表12~表17。

表12 2014年湖北省稻谷质量数据最小样本量检验

表13 2014年湖北省稻谷品质数据最小样本量检验

表14 2014年荆州市稻谷质量数据最小样本量检验

表15 2014年荆州市稻谷品质数据最小样本量检验

表16 2014年黄冈市稻谷质量数据最小样本量检验

表17 2014年黄冈市稻谷品质数据最小样本量检验

通过对2014年湖北省及随机挑选的荆州市、黄冈市的最小样本量的验证,随机抽取的样品数据值与总体平均值的差值在95%置信区间下的误差范围。

稻谷品质整体最小样品量可以代表2014年湖北省稻谷品质整体水平,其平均值反映出的当年品质状况趋势与原始数据所反映出的当年品质状况趋势是基本一致的。

6 最小样品量方案是否具有可持续性

6.1 验证2014年最小样本量能否满足2015年扦样方案

2014年样本通过分析得到41个为最小样品量,用2015年的数据检验,比较2015年中随机挑选41个样品与2015年总体平均值的偏差。

如用2015年的数据检验,应假设2015年的方差和2014年的方差相等,否则2015年的方差和2014年的方差不等,最小样本量也不同。

表18 用2015年的数据检验2014年最小样本量

6.2 湖北省不同年度数据方差的比较

湖北省不同年度数据方差的比较见表19。

表19 湖北省稻谷不同年度方差的比较

由2014年方差的95%的区间估计发现,2013年及2015年的几个指标的方差均不在区间内,所以可以得到,在全省范围内最小样本量因为指标方差的变化,没有延续性。

6.3 各地市不同年度方差的比较

考虑在市/县范围内,最小样本量有无延续性,即市/县范围内不同年度,样本方差有无显著变化。

以荆州市、黄冈市为例,通过计算得到荆州市、黄冈市2015年样本出糙率、直链淀粉、食味品质、垩白度的方差均落在2014年样本方差95%区间估计范围外,见表20、表21。

由于每年稻谷种植区域、种植品种变化不大,造成最小样品量没有延续性最可能的原因是由于气候条件改变,使得样本方差变化较大。这也表明气候条件对我省稻谷丰收有较大影响。

表20 荆州市稻谷不同年度方差的比较

表21 黄冈市稻谷不同年度方差的比较

7 不同产地、年份最小扦样量方案制定与实施

最小样品量的数值虽然不具备延续性,但可以引用这个模式。在制定扦样调查方案时,先预先对当地样品进行小规模扦样,对当年稻谷指标的方差进行估计,再根据方差估算最小样本量,按照规程合理分布各地样品量,进行抽样。

8 总结

通过对2013年、2014年、2015年质量调查、品质测报数据分析可知:

(1)在市/县范围内进行迁样,品种选择按照3+1准则是合理的。

(2)根据数学模型计算出出糙率、整精米率、直链淀粉、食味品质、垩白度的抽样误差分别为0.75、2.61、1.68、2.25、5.16。

(3)在95%的置信区间的条件下,以各个市为扦样单位,2014年调查、测报的抽样个数分别以342、654个为宜。

(4)由2013、2014、2015年的数据分析知,3个年度5个指标的方差是随着年度变化而改变的,最小样本量没有延续性。制定不同地区、不同年度的最小样品量扦样方案,应先对当年样本方差进行估计,再算最小样本量,后按照规程合理分布各地样品量。

[1] 张 祎,毛志娟,贾继荣.对江苏省小麦质量调查品质测报的探讨[J].粮食与饲料工业,2015(2):17-19.

[2] 马文斌,周淑琴.稻谷品质测报抽样样本容量的优化分析[J].粮食与食品工业,2004,11(4):45-48.

[3] 何武顺,蔡 嵘,施肖峰,等.小麦品质测报代表性样本数的优化方法[EB/OL].北京:中国科技论文在线[2009-10-29].http://www.paper.edu.cn/releasepaper/content/200910-610.

[4] 何彤斌.对粮食收获质量调查及品质测报工作的认识[J].粮油食品科技,2010,18(3):66-68.

[5] 苗霖兴,苗 佳.粮食收获质量调查和品质测报工作的现状及建议[J].粮食科技与经济,2012(5):22-23.

[6] 杨奎伟,刘 冰,富成研.《粮食收获质量调查和品质测报技术规范》进一步完善的建议[J].粮食科技与经济,2013,38(6):30-31.

[7] 王兴磊,梁 瑞.粮食质量调查和品质测报工作探讨[J].粮食加工,2010,35(6):90-91.

[8] 王 琳.粮食质量调查和品质测报工作有关问题的探讨[J].粮食流通技术,2014(6):41-42.

[9] 安丽春,张 霞,杨军.关于做好收购粮食质量调查和品质测报工作的探讨[J].粮油仓储科技通讯,2011,27(3):52-53.

[10] 蔡 嵘,许 青.计算机及数据库技术在粮食品质测报工作中的应用[J].粮食与食品工业,2004,11(2):45-47.

[11] CRISP A,CURTIS P.Sample size estimation for non-inferiority trials of time-to-event data[J].Pharmaceutical statistics,2008(7):236-244.

[12] DUPONT W D,PLUMMER W D.Power and sample size calculations.a review and computer program[J].Controlled Clinical Trials,1990,11(2):116-128.

[13] 李洁明,祁新娥.统计学原理[M].上海:复旦大学出版社出版,2010.

[14] 金勇进,蒋 妍,李序颖.抽样技术[M].北京:中国人民大学出版社,2002.6.

[15] 国家技术监督局.粮食收获质量调查和品质测报技术规范:GB/T 26629—2011[S].北京:中国标准出版社,2011.

[16] 国家技术监督局.粮油检验 稻谷出糙率检验:GB/T 5495—2008[S].北京:中国标准出版社,2009.

[17] 国家技术监督局.稻谷整精米率检验法:GB/T 21719—2008[S].北京:中国标准出版社,2008.

[18] 国家技术监督局.大米 直链淀粉含量的测定:GB/T 15683—2008[S].北京:中国标准出版社,2009.

[19] 国家技术监督局.粮油检验 稻谷、大米蒸煮食用品质感官评价方法:GB/T 15682—2008[S].北京:中国标准出版社,2009.

[20] 国家技术监督局.优质稻谷:GB/T 17891—1999[S].北京:中国标准出版社,2000.

(责任编辑:俞兰苓)

Optimization of sampling scheme of survey and forecast of paddy harvest quality in Hubei province

LI Qi1,XIONG Ning1,LIU Yong1,LIU Li1,ZHU Mei1,SHENG Xiao-yan2

(1.Hubei Grain and Oil Food Quality Supervision and Inspection Center,Wuhan 430061,China; 2.College of Mathematics and Statistics, Central China Normal University,Wuhan 430061,China)

Paddy quality survey and forecast were based on the sampling data to estimate the overall level of quality in paddy. The survey data of Hubei Province in 2014 showed that: the province in the city/county sampler,variety selection in accordance with the "3 + 1" principle were reasonable; by the sample mathematics model of 2014, the sample error of husked rice yield, head rice yield, amylase content, edible quality and chalkiness were calculated as 0.75, 2.61, 1.68, 2.25 and 5.16;at the 95% confidence interval, with each city as a sampler unit, the sampling number of 2014 quality survey and forecast were respectively 342, 654;according to 2014, 2013 and 2015 data analysis, the variance of five indicators in three annual reports were changed year by year, and were significantly different. We should estimate the sample variance, and then determine the minimum sample size of the year, give a reasonable distribution throughout the sample according to the rules.

Hubei province; paddy;quality survey;quality forecast;sample size

2016-04-07;

2016-12-28

粮食公益性行业科研专项(201313006-2)。

李 琦(1986-),男,工程师,硕士,主要从事粮油食品品质分析、监测及标准研究。

10.7633/j.issn.1003-6202.2017.02.002

TS212.2

A

1003-6202(2017)02-0006-07

猜你喜欢
测报样本量稻谷
医学研究中样本量的选择
谦卑的稻谷
玉米价疯涨 稻谷也凑热闹
样本量估计及其在nQuery和SAS软件上的实现*——均数比较(十一)
夸夸咱们的测报员
浅谈林业有害生物测报与防治
田野稻谷香
梨小食心虫性信息素在测报和防治上的应用
江汉平原辞
性诱剂在梨小食心虫和苹果蠹蛾测报中的应用