汤学军 朱岩 夏天 张诚 许锦 张倩 杨振宇 赵文华
现代大范围的儿童营养与健康基础资源调查,涉及面广、调查人数多,而且涉及儿童营养、膳食、认知、心理行为、健康等多方面业务内容,实现调查数据采集内容、格式、代码,包括信息系统的统一标准化,是确保调查工作顺利实施。从调查起始就注重数据标准化,形成我国儿童营养与健康的横断面调查数据资源。横向上,调查数据可以用于与其他课题、其他项目的共享,也可以用于与被调查儿童的电子健康档案共享。纵向上,调查数据可以与后续的标准化调查数据进行前后比较研究。标准化使儿童营养与健康调查数据成为无论横向还是纵向都可以进行比较、追踪、研究、服务、健康管理所利用的信息资源。根据我国儿童营养信息化发展需求,在充分调研国内外儿童营养与健康调查评价业务开展情况、信息化技术体系与标准化体系现状及发展趋势基础上,构建我国儿童营养与健康信息标准化框架,研究制订儿童营养与健康调查基本数据集标准。通过数据标准化,使调查数据横向可以用于与其他课题、其他项目的共享,为开展儿童的健康管理服务奠定基础,纵向可以与后续的标准化调查数据进行前后比较研究,使调查数据成为可利用的有效信息资源[1]。
经过充分论证,国家卫健建委统计信息中心上报了《儿童营养与健康调查基本数据集标准》制定项目申请,获得立项批准,标准项目编号20210105(0~35个月)、20210106(36~71个月)、20210107(6~17岁)。
通过查阅文献、现况调查和多次专题调研,对儿童营养与健康调查工作进行了深入细致的业务需求分析。通过对业务目标、数据内容、工作表单等开展专题调研,收集、梳理了包括0~23月龄儿童营养与健康状况问卷、0~23月龄儿童医学体检表、0~5岁儿童膳食称重记录表、2~5岁儿童营养与健康状况问卷、2~5岁儿童医学体检表、6~18岁儿童医学体检表、6~18岁身体活动问卷、6~18岁膳食调查问卷等相关业务表单,整理、归纳和确定了儿童营养与健康调查数据集的核心内容。
根据确定的业务核心内容,遵循《GB/T 1.1-2020 标准化工作导则 第1部分:标准化文件的结构和起草规则》[2]《WS 370-2012 卫生信息基本数据集编制规范》[3]等标准规范,规范编制数据集标准;为了保持标准一致性,按照国家标准—行业标准—地方标准的序列,引用已有的数据元标准和值域代码[4-5],依次采纳和编制了儿童营养与健康调查数据集,数据集标准分为3部分,包括《儿童营养与健康调查基本数据集标准 第1部分:0-23月》(数据元123个、值域代码9个)、《儿童营养与健康调查基本数据集标准 第2部分:2-5岁》(数据元139个、值域代码25个)、《儿童营养与健康调查基本数据集标准 第3部分:6-18岁》(数据元155个、值域代码36个),实现从标准层面规约数据采集、规范代码体系,确保了标准的成熟性、拓展性、实用性和安全性[3]。
为使标准更切合我国儿童营养与健康调查信息化建设的实际情况及发展要求,符合国家既定规范要求,具备普遍适用性、操作实用性,在全国范围广泛开展征求意见,征求相关标准使用各级各类应用单位、IT企业及相关专家等各方面意见,并组织部分标准应用单位、IT 企业应用本标准,总体反馈良好,标准具备普遍适用性。对反馈意见进行归纳整理、分析研究,修订完善标准。
本标准规定了儿童营养与健康调查基本数据集标准的数据集元数据属性和数据元属性。适用于儿童营养与健康调查相关医疗机构及卫生行政部门进行相关业务数据采集、传输、储存等工作。
引用了《GB/T 3304 民族代码》[6]《GB/T 4658 学历代码》[7]《GB/T 4761 家庭关系代码》[8]《GB/T 6565 职业分类与代码》[9]《WS 364.4 卫生信息数据元值域代码 第4部分:健康史》[10《]WS 370 卫生信息基本数据集编制规范》[3]等标准规范。
儿童营养与健康调查基本数据集元数据采用表1的格式进行描述。
表1 儿童营养与健康调查基本数据集属性描述
2.4.1 数据元属性设置 数据元属性设置分为两类:数据元公用属性和数据元专用属性。数据元公用属性7项,数据元专用属性7项。
2.4.2 数据元公用属性 在同一个数据集中,版本、注册机构、相关环境等7个数据元属性的值若完全相同(可称为数据元公用属性),则采用集中描述,在数据元摘要式目录中可不再分述。
2.4.3 数据元专用属性 在同一个数据集中,数据元属性的值不相同(可称为数据元专用属性),采用表2的描述格式进行描述[11-12]。
表2 数据元专用属性描述格式(举例)
2.4.3.1 内部标识符 内部标识符格式为:数据集标识符+“.”+在数据集中的序号。例如,“孩子姓名”在为HDSB01.06.001,表明当前数据集标识符为HDSB01.06,“孩子姓名”在数据集内部序号为001。
2.4.3.2 数据元标识符 如数据元是引用国家标准、行业标准、地方标准的,数据元标识符直接引用相关标准中的数据元标识符;自研的数据元,数据元标识符则空着。
2.4.3.3 数据元名称 数据元“中文名称”是唯一的,以字母、汉字、数字式的字符串形式表示。例如:
有代码表的,数据元名称:××代码,例如:性别代码。
选项是与否的,数据元名称:××标志,例如:户籍标志。
表示日期(年月日),数据元名称: ××日期,例如:出生日期。
表示日期和时间,数据元名称: ××日期时间,例如:死亡日期时间。
2.4.3.4 定义 本文件中数据元定义以字母、汉字、数字式的字符串形式表示。
2.4.3.5 数据元值的数据类型 数据元值的数据类型有字符型(S)、布尔型(L)、数值型(N)、日期型(D)、日期时间型(DT)和时间型(T)。
字符型(S)通过字符形式表达的值的类型,可包含字母字符、数字字符等,字符型(S)分为S1、S2、S3三种形式,S1表示描述类的内容;S2表示选项3个或以下的,可在“数据元允许值”中直接描述;S3表示选项3个以上的,在后面列出代码表。
布尔型(L)又称逻辑型,采用False或True形式表示。
数值型(N)是数字形式表示的值的类型。
日期型(D)、日期时间型(DT)、时间型(T)釆用GB/T 7408中规定的格式表示的值的类型。
2.4.3.6 表示格式 数据元值的表示格式中字符含义描述规则如下。
AN18:表示固定长度为18个字符(字母或/和数字)长度的字符。
A..100:表示可变长度,最大为100个字符(字母)长度的字符。
N2:表示固定长度为2位数字。
N2..4:表示最小长度为2位,最大长度为4位数字。
N5..7,1:表示最小长度为5位,最大长度为7位的十进制小数格式(包括小数点)。
D8:表示年、月、日。
T6:表示小时、分钟、秒。
DT15:表示年、月、日、小时、分钟、秒。
2.4.3.7 数据元允许值 数据元有选项的均已代码表形式列举。其中:选项3个或以下的,直接在“数据元允许值”中列举;选项3个以上,在“数据元允许值”中写出代码表名称,在后面列出代码表。代码中有其他选项,均以9或者99表示。代码表采用表3的格式进行描述。
表3 代码表描述格式
《 儿童营养与健康调查基本数据集标准》规定了我国儿童营养与健康调查必须收集记录的儿童营养与健康状况、医学体检记录等信息的采集范围,通过标准应用,实现儿童营养与健康调查信息规范采集、交换、统计和共享,使辖区内医疗机构、卫生行政部门和广大市民能有效共享、利用相关信息。本标准在制定过程中,充分考虑当前工作的实际水平和业务发展趋势,兼顾先进性和可行性,有利于标准的应用和推广,从而切实发挥标准的作用[13]。在标准实施过程中因涉及面广,技术性强,各地现况有参差等问题,各方面建设和完善工作须进一步加强。现提出如下贯彻实施建议。
《儿童营养与健康调查基本数据集标准》是儿童营养与健康调查信息化建设工作的基础,对于各地规划、设计和建设儿童营养与健康调查信息管理系统具有重要的、直接的指导作用,对儿童营养与健康调查工作的发展起到积极的促进作用。
各地规划、建设主管部门要牢固树立标准意识,使该标准真正成为儿童营养与健康调查信息化建设的指南。儿童营养与健康调查信息化新建、改建、扩建项目,应以按标准设定的数据元构成和值域范围为基准,确定儿童营养与健康调查卫生服务的核心数据要求,满足儿童营养与健康调查信息化建设需求。
统一的数据标准是信息化应用的基础和前提,在此基础上,规范基于计算机逻辑架构的技术标准和共享文档将更有利于异构系统间的数据共享、互联互通,对于各地应用本标准进行规划和建设具有更直接的促进作用。因此,各地在实践过程中,要及时总结、反馈应用成果,为标准的不断完善提供实践经验,促进相关的技术标准和共享文档的出台,进一步加强儿童营养与健康调查信息化建设。