陈玉华,邓建明
(1.百色水文中心,广西 百色 533000;2.贵港水文中心,广西 贵港 537100)
实验样品的管理是实验室管理的重要环节和关键控制点,是保证检测数据真实、准确、可靠的重要依据,样品管理的质量直接影响实验结果的准确性和可靠性,决定着检验检测报告的公正性、客观性[1]。因此,样品管理水平是检验检测机构能力认定和实验室能力认可的重要依据[2,3]。目前实验室的质量保证主要集中在实验分析方面,对样品采集过程关注较少,导致一旦出现误差而无法溯源其原因。在整个水质监测过程中,采样误差是分析误差的3 倍多,这样即使降低分析误差也起不到任何作用。因此,采样过程很大程度地影响了环境监测数据的质量[4]。
随着实验室评审和日常监管的要求越来越规范、严谨。样品管理的科学化、标准化成为评审和评价的重要内容,决定着实验室能否进入检验检测领域和检验检测数据是否公正、准确。样品随机化编码可以规范样品采集和分析过程,实现样品来源信息的不可预测性,减少分析过程的主观偏倚和均衡未知因素,保证结果可溯源和客观性,样品随机化编码与电子采集系统相结合可以极大地提高样品管理效率和质量。
样品随机化编码的应用非常广泛。例如,在水质评估时,研究人员可能会在多个断面采集样品,通过随机化选择采样断面,可以减少选择性偏差,确保检测结果能够全面反映整个水体的水质;又如,在实验检测过程中,研究人员经常使用随机化分组来分配实验组和对照组,通过将样品随机化分配到不同的组,可以实现样品检测基线的一致性,从而降低系统误差。本文主要介绍利用完全随机化设计进行样品编码的4种方式。
SAS(Statistics Analysis System)是用于数据分析与决策支持的大型规模化的集成应用软件系统,被誉为国际上的标准分析软件系统[5],在数据处理与统计分析领域具有重要的地位。SAS具有灵活的功能扩展接口和强大的功能模块,可以满足各种不同的需求。尤其在医药卫生、金融、生产、教育领域应用广泛,被用于试验设计、风险分析、质量控制、抽样调查和模拟试验等。本节主要介绍应用SAS的Proc Plan 程序对模拟的12 个水质断面样品生成随机化编码。样品名称和断面名称相同为A-L。
SAS程序设计如下:
(1)输入样品名称:
(2)生成随机数字:
表1 SAS生成的编码表
在程序基础上只需要更改样品名称,设定种子数就可以重现样品编码表或生成新的样品编码表,操作简单方便,生成的编码表可以溯源,能较好满足评审要求。
VBA(Visual Basic for Applications)是微软开发的一种执行自动化任务的宏编程语言。主要用来扩展Microsoft Office 软件应用程序的功能。利用VBA 编程可简化复杂工作,减少重复性工作,提高工作效率,实现办公自动化[6]。
VBA程序设计如下:
表2 VBA生成的编码表
该程序以随机抽样的原理对样品进行编码。从样品集合中随机抽取样品,同时将抽到的样品从集合中删除,以保证不会重复抽样,将抽到的样品按抽中顺序从小到大排序,顺序号加样品标识符作为该样品的编码。应用该程序时只需要将样品名称从A2单元格向下依次输入,不需要更改代码,程序运行结束后即可生成样品编码表。
Excel 函数法生成随机化编码表需要用到3 个函数,分别为Rand、Rank和If函数。Rand函数返回大于等于0 并且小于1 的均匀分布的随机实数,Rank函数返回数字在排位区域中的次序,IF为条件判断函数。函数详细用法请参考函数帮助信息。
Excel函数实现样品编码的操作过程如下:
(1)输入表头信息:在[A1-D1]单元格依次输入表头信息:样品名称,随机数,排位,样品编码。
(2)输入样品名称:在[A2-A13]单元格中输入样品名称A-L。
(3)生成随机数字:[B2]中输入=rand(),并下拉至[B13]。
(4)生成随机数字的排位:[C2]中输入=RANK(B2,$B$1:$B$13),并下拉至[C13]。
(5)生成样品编码表:[D2]中输入=IF(C2<10,"S0"&C2,"S"&C2),并下拉至[D13]。
通过Rand函数生成随机数,并对随机数进行排位,排位顺序为从大到小,排位数加上样品标识符作为样品的编码。Rand 函数生成的随机数位数可具体到15 位,因此每次生成的随机数不相同,随机数的排位不同,保证了样品编码的唯一性。
表3 Excel函数生成的编码表
随机数字表也称为乱序表,是由随机生成的从0 到9 十个数字组成的表格,表中每个位置上出现某个数字的概率大致相等,它们在表上出现的顺序是随机的。
随机数字表生成样品编码的操作过程如下:
(1)确定要读取数据的位数。本实验共需12个编码,因此,读取两位作为一个随机数字。
(2)确定读取的起点和顺序。可以从随机表[7]的任一行任一列任意顺序读取,如第6行第7列,从左向右读取。依次读取2位数字作为一个随机数录于样品名称下方。
(3)将全部随机数从小到大编序号(数据相同的按先后顺序编号),将每个随机数对应的排序号记在第三行。
(4)序号加上样品标识符作为样品的编码。
表4 随机数字表生成的编码表
随机数字表法生成样品编码的原理与函数法相同,均以生成的随机数的排序号作为样品的编码依据,不同之处是随机数字表法可以通过随机数字表重现样品编码,而函数法只能生成新的样品编码。
样品的规范化管理既体现了实验室的检验检测能力也体现了实验室的管理水平,同时也是实验室质量体系顺畅运行的重要保障。在检测机构资质认定和外部监管越发趋严的形势下,样品的数字化、精细化管理对提升实验室运行效率,满足审评要求起着重要的作用。通过规范样品采集和分析过程,在样品采集前生成样品编码表,按照样品编码表到对应断面采集样品,样品分析时按照样品编码顺序依次进样检测,可以较好地保证样品采集和分析过程的规范性、溯源性,同时样品采集和分析过程对检测人员设肓,可以降低检测风险,保证分析结果的客观性、准确性和可靠性。
四种编码方式各有优缺点。SAS 专业性强,功能强大,结果可溯源,不足之处是SAS 需要购买许可证才能使用相应的模块。Excel VBA 易于理解和操作,可以和其他Excel 功能相结合实现灵活的操作,不足之处是Excel VBA的算法不够丰富和精细。函数法是最为简单的一种编码方式,但只能生成新的编码表而不能再现已经生成的编码表。随机数字表应用时间早,应用范围广泛,例如应用于临床试验、调查研究等。不足之处是生成的随机数字受表格大小的限制,不适合于生成大量的随机数字,同时随机数字表的质量取决于生成的随机数字的质量,样品编码需要手动操作,制表效率较低。文中设计的四种方式,均可以实现对水质样品的编码管理,检测机构可以根据样品量、工作需求、财务能力选取一种适宜的编码方式高效、规范地实现对样品的加密设盲管理。