徐晓巍,郭 臻,王 举,侯 丽,李 姣
(中国医学科学院医学信息研究所,北京 100020)
面向健康管理的食物营养成分数据表达方法研究
徐晓巍,郭 臻,王 举,侯 丽,李 姣
(中国医学科学院医学信息研究所,北京 100020)
目的:设计一种食物营养成分数据表达结构,为开发面向健康管理的膳食营养计算方法奠定基础。方法:参考国家卫生计生委发布的《食物成分数据表达规范》,以及当前常见的食物营养成分计算流程,基于关系型数据库对营养计算中涉及到的数据进行组织,详细定义了食物营养成分的数据对象和数据对象之间的关系。结果:对5类数据对象进行了计算机可读的描述,具体包括成品菜、基本食材、食材分类、烹饪方式、营养元素,并且建立了数据之间的关系。结论:该数据表达结构具有较好的计算机可读性、计算机算法可操作性以及可扩展型,有助于数据的共享、传播与利用,支持食物营养成分计算相关应用。
食物营养成分;健康管理;膳食管理;数据表达;营养计算
个人健康管理是提高生活质量的重要部分,其中营养管理是健康管理的重要方面[1,2]。对具有特定健康状况人群进行日常饮食和营养追踪对提高健康管理水平和生活质量具有重要意义[3,4]。将现有的食物营养成分数据转换为计算机所能理解的数据格式进行存储,为上层各种应用的实现提供数据支撑是完成计算的前提与必要条件。对食物营养成分数据进行有效的表达及存储能够提高运算效率,有助于增强营养数据的可移植性。然而,在食物成分数据库建设过程中面临着命名标准不统一、规则不一致以及数据自动化水平薄弱等问题[5,6]。本文借鉴国内外在食物营养成分计算方面的研究进展,并结合中国膳食习惯,设计中国食物营养成分的数据表达方法。
长期以来,许多国家投入大量精力建设食物成分数据库(Food Composition Databases,FCD),为食物成分数据领域内的应用研究奠定了重要基础。美国农业部自1992年发布《营养标准数据库》,至今已经发展到拥有8 789条食物数据和150种营养成分[7];英国公共卫生部(Public Health England)于2015年发布的食品数据库中包含将近1 200种食物条目及在英国饮食中最关注的食品数据[8];日本计划发布的第七版《日本食品标准成分表》,与2000年发布的第六版相比,食品品种由1 878种扩增到2 191种,并充实了收载营养成分[9]。
以食物营养数据库为支撑数据,对特定人群营养摄入的研究已经成为当前研究热点之一。以色列科学家David Zeevi等基于以色列卫生部的食品数据库数据建立了一个含有6 401种食物的营养成分数据库,并以此为基准数据对800名志愿者进行为期1周的饮食记录跟踪来研究饮食和血糖变化之间的关系[10]。密歇根州立大学的Debra R.Keast 等人[11]以食物成分数据库为支撑数据,采用24h膳食回顾法确定美国儿童摄入能量及28种营养素的来源。
公众对食物中营养成分的日益关注也创造了市场机会,许多企业开始探索面向健康饮食消费的数据服务。食谱搜索网站Yummly[12]使用美国农业部发布的《营养标准数据库》[7](NDSR)为基准数据库,对其从网络上搜集的菜谱进行营养成分的计算,只要用户按照菜谱中的食材及相应重量进行菜肴的烹制,那么就可得知用户从这道菜中获取的各项营养成分含量;体重管理软件MyFitnessPal[13]将来自各种渠道的食物成分数据进行整合,目前该公司有超过由500万种食物组成的食物营养成分数据库。
中国疾病预防控制中心发布的《中国食物营养成分表》从食物所含有一般营养成分、食物氨基酸、脂肪酸、胆固醇含量等方面对食物营养成分进行了描述[14,15]。国家卫生和计划生育委员会于2015年4月28日发布了《食物成分数据表达规范》[16],为我国食物成分数据标准化、统一化和电子化奠定了基础,有助于食物成分的数据得到共享和利用最大化[17]。何宇纳等对中国膳食平衡指数进行修订,该修订将膳食指南和平衡膳食宝塔的内容进行了量化,有助于人们根据膳食指南对日常饮食进行评价[18]。
综合如上国内外的研究现状,可以发现我国膳食营养成分的数据表达存在如下问题:其一,中国食物营养成分数据未建立可供查询、方便利用的电子版或网络版数据库;其二,饮食营养数据服务提供方便使用的成分库缺乏统一数据规范标准,数据的计算机可读性和计算机可操作性低。
2.1 膳食营养成分计算方法及流程
膳食营养成分计算主要有两种方法:化学分析法和称重法[19]。相较于化学分析法,称重法的优点是方便快捷,若已知食材的名称、重量,结合食物成分表就能估算出个体摄入的营养成分,能够在日常膳食营养计算中广泛应用。借鉴称重法的计算思路,本文设计膳食营养成分计算流程(图1)。根据菜肴名称确定原材料和相应重量;考虑原材料烹饪过程中重量变化和营养素变化,根据食物营养成分表计算出菜肴的营养含量。
图1 膳食营养成分计算流程
2.2 膳食营养成分数据表达方法设计
参考卫计委制定的 《食物成分数据表达规范》,以及当前常见的食物营养成分计算流程,设计了膳食营养成分计算的数据表达方法。采用关系型数据库对营养成分计算中涉及到的各类数据进行组织,从数据表结构、字段定义、字段类型及表之间的关系等方面进行设计。下面分别对成品菜、基本食材、食材分类、烹饪方式、营养元素等5类数据对象和数据对象之间的关系进行了说明。
2.2.1 成品菜数据表 该表用于存储中国菜肴数据,分别定义菜肴名称(cookfood_name)、菜肴做法(cookfood_desc)等与菜肴基础描述信息相关的数据内容(表1)。
2.2.2 基本食材表 该表用于存储中国居民经常食用的基本食材数据,数据主要来源为《中国食物成分表》[14,15]中的基本食物,分别定义食材名称(food_name)、对食材的基本描述信息(food_desc)、食材可食用部分(food_edible)等与食材相关的数据内容(表2)。
表1 成品菜数据表(COOK_FOOD)字段描述
表2 基本食材表(FOOD)字段描述
2.2.3 食物分类表 该表用于存储食物分类数据,数据主要来源于《中国食物成分表》[14,15]基本食材划分的21种食物类,分别定义每种食材类别的唯一编码(food_group_id),每种类别的名称(food_group_name),以及每类食物的详尽描述信息(group_desc)(表3)。
2.2.4 烹饪方式定义表 该表用于存储中国的烹饪方式[20]数据,分别定义每种烹饪方式的名称(cooktype_name)及其具体描述信息(cooktype_desc)(表4)。
2.2.5 营养元素定义表 该表用于存储食物中所含有的营养素信息,数据来源为《中国食物成分表》[14,15]中定义的食物一般营养元素。分别定义每种营养元素的名称(nutrition_name)、该营养元素相关的信息(nutrition_desc)及该种营养元素常用的计量单位(nutrition_unit)(表5)。
2.2.6 食材—营养—烹饪方法关联表 该表用于存储每种食材所包含的营养元素信息在不同的烹饪方式下所对应的营养留存因子[21]信息,将来自基本食材表(FOOD表)中的food_id、来自营养元素定义表(NUTRITION_DATA)中的nutrition_id和烹饪方式定义表(COOK_TYPE_DEF)中的cooktype_id进行关联,定义了一种食材所含有的营养成分在某种烹饪方式下所对应的营养留存因子信息(nutrition_retention_factor)(表6)。
表3 食物分类表(FOOD_GROUP)字段描述
表4 烹饪方式定义表(COOK_TYPE_DEF)字段描述
表5 营养元素定义表(NUTRITION_DATA)字段描述
表6 食材—营养—烹饪方法关联表(NUTRITION_
2.2.7 重量转换表 该表用于存储常用计量单位与标准克重的转换数据,分别定义每种食材常用计量方式(weight_measure)、计量方式描述(measure_desc)、及转换为克重对应的数据信息(weight_gram)(表7)。
2.2.8 生—熟品关联表 该表用于存储成品菜所使用基本食材及相应重量的信息,定义成品菜所使用每种食材的计量信息(weight_num)(表8)。
2.2.9 食材—营养关联表 该表用于存储每种食材含有的营养元素信息,数据来源为《中国食物成分表》[14,15]中定义的每种食物所含有的营养元素信息。定义某food_id 100g可食部对应的nutrition_id的营养元素的含量(nutrition_weight)(表9)。
2.2.10 食材—烹饪方法关联表 该表用于存储基本食材经过烹饪后的重量变化信息,当前数据来源为美国农业部发布的USDA Table of Cooking Yields for Meat and Poultry[22 ],该数据表定义了food_id对应的基本食材在cooktype_id对应的烹饪方法下的重量变化(cooking_yield_factor)(表10)。
表7 重量转换表(WEIGHT_CONVERT)字段描述
表8 生—熟品关联表(COOK_FOOD_ASSOCIATION)字段描述
表9 食材—营养关联表(FOOD_NUTRITION)字段描述
表10 食材—烹饪方法关联表(YIELD_FACTOR)字段描述
2.3 膳食营养成分数据关联关系设计
为了方便各类数据在膳食营养计算过程中的灵活调用,及新增数据的扩展性,本文设计了不同数据表之间的关联关系的构建模式(图2)。
图2 膳食营养成分数据库关系
2.3.1 成品菜数据表与生—熟品关联表的关联关系实现 由于成品菜所含有的营养成分主要来自于食材,而食材的营养成分又与用量有很大关系,所以本文设计了成品菜数据表和生—熟品关联表,2个表通过cookfood_id字段连接,从而确定每道菜中用到的食材及相应常用计量重量。
2.3.2 烹饪方式定义表与食材—营养—烹饪方法关联表的关联关系实现 由于食材中所含有的营养元素含量与具体的烹饪关系有关,所以本文设计了食材—营养—烹饪方法关联表与烹饪方式定义表,两表通过cooktype_id字段连接,从而确定某种食材在某种烹饪方式作用下其中的营养元素含量变化。
2.3.3 基本食材数据表与食材—烹饪方法关联表的关联关系实现 由于食材的重量在具体的烹饪过程中会发生变化,而该变化也会直接影响到成品菜的营养素含量,所以本文设计基本食材数据表与食材-烹饪方法关联表通过food_id字段连接,从而确定某种食材在不同烹饪方式作用下其重量变化。
2.3.4 重量转换表与生—熟品关联表的关联关系实现 由于中国烹饪过程中所使用的计量单位通常不是按照克重计量,而在营养成分计算过程中都要转换成以克重计量,所以本文设计了重量转换表和生—熟品关联表通过weight_measure关联,以将食材的常用计量单位转化为按克重计数。
为了能够实现计算机对膳食营养成分进行智能计算,本文设计了可支持通用计算流程的食物营养成分数据表达模型,然而,本研究提出的数据表达方法需在实际应用中进一步完善,后期可通过食物制造商、用户上传等众包方式对食材数据表进行扩充完善。另外,权威数据库 《中国食物成分表》[14,15]中的数据并未对原材料和烹饪过的菜肴进行区分,所以在计算每一道菜谱的营养成分之前都应该在《中国食物成分表》[14,15]中对其进行查询,若表中已有该数据,则不需要再进行计算。而对于表中不存在的菜肴,将其原材料分解到什么程度也是后续对知识库的完善过程需要考虑的问题。此外,中国菜谱中往往出现大量的“少许”、“适量”等作为食材用量的度量表达,因此本研究设计了重量转换表WEIGHT_CONVERT来处理度量器具的不统一的问题。而针对具体的应用场景,需要专门设定重量转换表中的具体数值。针对食物的加工过程产生的营养流失问题构建了“食材—营养—烹饪方法关联表”(NUTRITION_FACTOR)。鉴于中国食材加工方法的多样性和“营养留存因子”计算的复杂性,目前还没有较为完善的数据支撑,也是本研究后续需要进一步研究和探索的方向。◇
[1]赵霖,鲍善芬.膳食营养在健康管理中的作用和地位[J]. 中华健康管理学杂志,2008,2(1):12-14.
[2]Nutrition therapy recommendations for the management of adults with diabetes[J].Diabetes Care,2014,37 Suppl 1:S120-43.doi:10:2337/dc14-S120.
[3]Xu X,et al.Assessing Dietary Quality of Older Chinese People,Using the Chinese Diet Balance Index (DBI).PLoS ONE,2015.10(3):e0121618.doi:10:1371/journal.pone. 0121618
[4]Xu X,et al.Dietary Pattern Is Associated with Obesity in Older People in China:Data from China Health and Nutrition Survey (CHNS)[J]. Nutrients,2015,7:8170-8188.
[5]杨月欣.食物成分分析数据的表达——问题和挑战[J]. 营养学报,2003,25(2):130-134.
[6]赵洪静,等.澳大利亚营养健康声称和管理对我国相关工作的启示[J]. 中国食品卫生杂志,2015,27(4):423-426.
[7]US Department of Agriculture,Agricultural Research Service,Nutrient Data Laboratory.USDA National Nutrient Database for Standard Reference,Release 28.Version Current:September 2015.Internet:http://www.ars.usda.gov/ba/bhnrc/ndl.
[8]Finglas P.M,Roe M.A.,Pinchen H.M,et al.McCance and Widdowson’s The Composition of Foods,7th summary edition.The Royal Society of Chemistry,Cambridge.2015.
[9]http://trb.mofcom.gov.cn/article/zuixindt/201510/2015100113
1348.shtml
[10]David,et al.Personalized Nutrition by Prediction of Glycemic Responses[J]. Cell,2015,163:1079-1094.
[11]Keast DR,et al. Food sources of energy and nutrients among children in the United States:National Health and Nutrition Examination Survey 2003-2006.Nutrients,2013,5:283-301.
[12]http://www.yummly.com/
[13]https://www.myfitnesspal.com/
[14]杨月欣,等.中国食物成分表(第二版)[M]. 北京:北京大学医学出版社,2009.
[15]杨月欣.中国食物成分表(2004)[M]. 北京:北京大学医学出版社,2005.
[16]WS/T464—2015,食物成分数据表达规范[S].
[17]http://www.moh.gov.cn/fzs/s3582h/201505/3cc87bebca6a4ab8a6b2bb6cc2a9cc8d.shtml
[18]何宇纳,翟凤英,杨晓光,葛可佑.修订中国膳食平衡指数[J]. 营养学报,2009,31(6):532-536.
[19]焦广宇.临床营养学[M]. 北京:人民卫生出版社,2001.
[20]韩枫.烹调技术(第二版)[M]. 北京:中国劳动社会保障出版社,2007.
[21]Matthews R,Garrison Y.Agriculture handbook No.102:Food yields summarized by different stages of preparation.Washington,DC:USDA Agricultural Research Service,1975.
[22]U.S.Department of Agriculture,Agricultural Research Service. 2014.USDA Table of Cooking Yields for Meat and Poultry,Release 2.Nutrient Data Laboratory Home Page:http://www.ars.usda.gov/nutrientdata
(责任编辑 李婷婷)
Data Representation for Food Nutritional Composition in Health Management
XU Xiao-wei,GUO Zhen,WANG Ju,HOU Li,LI Jiao
(Institute of Medical Information & Library,Chinese Academy of Medical Sciences,Beijing 100020,China)
【Objective】To design a data representation structure for food nutritional composition,through which the dietary nutrition calculation can be applied in health management.【Method】 According to theRegulationofFoodCompositionDataExpressionpublished by the National Health and Family Planning Commission and the current calculation flow,based on relational database,a data representation structure for food nutritional composition was designed in terms of data objects and relationships between data objects.【Result】The data representation was capable to formulize five objects including completed dishes,food ingredient,food classification,cook step,and nutrition composition.In addition,we built up the relationships between the above five data objects.【Conclusion】The data representation proposed was computer readable and operatable,and was extendable for computation model application,which enriched nutrient related data sharing and dissemination.
food nutritional composition;health management;dietary management;data representation;nutrition calculation
国家社科基金“面向知识服务的公众健康知识组织体系构建研究”;北京协和青年基金“多元自我量化在健康促进中的应用研究”。
徐晓巍(1990— ),女,硕士,研究实习员,研究方向:医学信息学、营养信息学、移动医疗。
李姣(1981— ),女,博士,副研究员,研究方向:医学信息学、数据挖掘、数据整合。