黄泽颖
(农业农村部食物与营养发展研究所,北京 100081)
营养素参考值(Nutrient Reference Values,NRV)作为食品标签营养标示规范化的措施,于1985年被国际食品法典委员会(Codex Alimentarius Commission,CAC)提出专门用作食品营养标签标示营养素日需要量的参考值[1]。营养素参考值表示的是在一份食物中含有的营养成分,可以给人体(特殊人群除外)1 d提供的营养百分比,例如,100 mL的牛奶中蛋白质的营养素参考值为6%,则意味着可以提供给人体1 d所需要蛋白质的6%[2]。不同国家的营养素参考值根据各国居民的营养素需要量而定,在中国,营养素参考值主要依据中国居民膳食营养素推荐摄入量(RNI)和适宜摄入量(AI)制定。作为中国首个预包装食品营养标签国家标准——《预包装食品营养标签通则》(GB 28050—2011)规定营养成分表由营养成分及其含量、营养素参考值百分比构成,于2013年1月1日起在预包装食品上强制性实施,主要用于标示食品的能量和4种核心营养素(蛋白质、脂肪、碳水化合物、钠)。这意味着,营养素参考值以量化的方式在食品外包装袋上标示,能帮助中国居民购买和食用时方便快捷地判断自己摄入的营养素是否足够或超标,以及为选择低热量、低脂肪、低钠的健康食品提供参考依据,对缓和当前中国居民肥胖发生率与营养性疾病增长的凸显矛盾[3]有重要意义。
营养素参考值已强制实施8年,学术界关注主要集中在营养素参考值标示现状[4-6]、存在的问题[7-8]、居民的KAP(知识、态度、行为)调查[9-11]等方面。然而,中国居民如何使用与评论,有多大的关注程度,未来关注趋势等问题有待研究。
第45次《中国互联网络发展状况统计报告》[12]指出,截至2020年3月,中国网民规模达9.04 亿,即时通信与搜索引擎的用户分别占99.2%和83.0%,从中获取居民的舆情监测和网络关注度等数据全面且客观,具有数据获取渠道的创新性。新浪微博作为中国最大的及时信息分享和传播平台之一,用户的评论数据丰富,而百度是全球最大的中文搜索引擎,其推出的百度指数能客观地反映网民的主动搜索需求和网民对网络信息的关注程度。因此,在大数据时代,文章拟利用互联网大数据开展中国居民对营养素参考值的舆情监测(使用情况与评论)、网络关注度及其趋势分析,对真正发挥营养素参考值的效用,引导食品工业良性发展,保障居民均衡膳食具有重要意义。
文章使用的数据:① 舆情监测数据来自新浪微博上用户对营养素参考值的评论数据。文章以营养素参考值为关键词,网络爬虫收集2013年1月1日—2019年11月27日的评论数据1 531条。② 网络关注度数据来自百度指数平台(http://index.baidu.com),以“PC端+移动端”指数(基于中国居民越来越多使用电脑和智能手机搜索信息的趋势)作为搜索指数来源,地区范围设为全国,为提高查全率,以“营养素参考值”为关键词采集2013年1月1日—2020年1月31日每日数据,共2 587个。
文章运用R统计软件,结合营养素参考值数据开展词云分析、文本情感分析与ARIMA-SVM模型预测。
1.2.1 词云分析 词云是一种特殊的文本可视化,频率更高的词通过占据突出的位置有效地表示出来[13]。文章抽取营养素参考值评论文本的关键词进行词频统计,然后利用R软件的Wordcloud包绘制词频云图,且根据Wordcloud函数自行调节关键词、词频、字号、颜色、角度、词频量和关键词个数,字体越大代表频率越高,颜色相同代表频率相同。
1.2.2 文本情感分析 文本情感分析又称情感挖掘、倾向性分析,是对带有情感色彩(如赞成、反对、表扬、批评、喜、怒、哀、乐等)的评论文本内容进行处理、归纳和推理的过程,从而发现评论者对研究对象的态度和意见[14]。文章通过对营养素参考值的评论文本进行拆句,从中抽取情感词,匹配情感词典,分类合并每条评论ID,对每条文本进行情感倾向性分析,最终根据划分规则,将情感值>0表示为正面情感,情感值=0表示为中性情感,情感值<0表示为负面情感,从而计算正面情感词、中性情感词、负面情感词的个数,获取整体情感倾向。
营养素参考值词云图(图1)中,要求被标识的“4+1”营养成分中,出现频率从高到低依次是能量、蛋白质、脂肪、维生素、碳水化合物,可见,中国居民在选购预包装食品时,主要关注食品的能量占每天推荐摄入量的比重;食品方面,月饼、酱油、元宵、牛奶的营养素参考值被提及的次数较多,而且,营养素参考值被多数人用于选购儿童食品。
图1 营养素参考值词云图[17]Figure 1 Word cloud of nutrient reference values
中国居民对营养素参考值分别持有中性、负面和正面情感(见表1),在1 531个评论中,正面情感和中性情感的比重约35%,正面情感略微高,但持负面情感的评论数比重不低(接近28%),居民较多认为营养素参考值难懂,不易理解含义,没有起到判断食品健康与否的效果,可以判断,居民对营养素参考值的态度是复杂的,既有一定程度的好评,但也存在不好的评价。
表1 营养素参考值文本情感分析结果[17]
中国对营养素参考值的网络关注度见图2。8年来中国每日百度指数基本在200上下浮动,日均为232,最低为12,最高达到993(2017年8月30日),可见,2013年1月1日起中国实施《预包装食品营养标签通则》以来,居民持续在关注营养素参考值,但关注度不高,也没有随着国民经济水平、教育水平、健康意识的提高而同步增长,可见,中国实施的营养参考值没有引起居民较大的关注。
图2 2013年1月1日—2020年1月31日中国的营养素参考值百度指数变化趋势Figure 2 The trend change of the baidu index of nutrient reference values in China from January 1, 2013 to January 31, 2020
中国居民对营养素参考值网络关注度有性别差异,男性占43.68%,而女性占56.32%。同样,也存在年龄分布差异(见图3),20~29岁的比重最高,接近44%,其次是19岁及以下和30~39岁(均占比25.29%),但40~49岁的居民比重不到5%,特别是50岁及以上(1.15%)。
图3 营养素参考值网络关注度的年龄分布图Figure 3 The residents’age distribution of network attention of nutrition reference values
省份方面,中国居民对营养素参考值的日均网络关注度存在差异性(见图4),广东省最高,超过100,其次是北京(95)、江苏(95)、浙江(85)、山东(79)、上海(78),总体上是来自发达省市的居民比较关注营养素参考值。
图4 2013年1月1日—2020年1月31日日均各省营养素参考值百度指数Figure 4 Dailybaidu index of nutrient reference values in each province from January 1, 2013 to January 31, 2020
由ARIMA模型、SVM模型和ARIMA-SVM模型对2019年1月—2020年1月每月首日的预测值与实际值的比较(见表3)发现,ARIMA-SVM模型的预测接近程度不如其他两个模型的时间,仅是2019年4月、11月的首日,而其他时间的预测效果不差。在一定程度上,ARIMA-SVM模型的预测效果较佳。
表2 ARIMA-SVM模型预测结果[18]
通过3个指标的比较(见表4),ARIMA-SVM模型比单个ARIMA模型与SVM模型的预测精度要高,故采用ARIMA-SVM模型对营养素参考值网络关注度进行预测。
表4 3种模型预测效果的比较[18]
基于ARIMA-SVM模型对2020年2月—2022年12月每月首日营养素参考值百度指数的预测发现(见图5),未来3年,中国居民对营养素参考值的网络关注度仍比较低迷,百度指数在144~179范围波动,平均值为162,比过去8年的均值(232)低。
图5 2020年2月—2022年12月每月首日的营养素参考值百度指数的预测值Figure 5 The predicted value of baidu index of nutrient reference value on the first day of each month from February 2020 to December 2022
为了解食品标签营养素参考值实施8年来中国居民的使用情况、评论、网络关注度,以及预测未来3年网络关注度的变化情况,文章采用2013年以来的新浪微博评论数据和百度指数,基于词云分析、文本情感分析以及ARIMA-SVM预测模型,得出的研究结论是,营养素参考值在中国实施没有获得广泛的好评和关注,居民提及最多的是能量、月饼、酱油、儿童食品的营养素参考值,然而表示出复杂的情感,虽然有较高的好评,但也持有不满意的态度;8年以来,中国居民对营养素参考值的网络关注度平平,百度指数不随时间显著增长;营养素参考值网络关注度存在性别、年龄与省份差异,以女性、20~29岁、来自发达省市的群体为主;基于预测精准度高的ARIMA-SVM模型,2020—2022年营养素参考值的网络关注度预计仍较低迷。营养素参考值作为国际上常见的食品标签,在中国推行的情况不够乐观。在健康中国建设时期,要使营养素参考值发挥显著的作用,需要一些促进营养素参考值发挥应有作用的配套措施,拟提出如下几点政策建议。
要使营养素参考值产生最大的影响,科普宣传是关键[19]。在中国,健康饮食看营养标签的科普宣传开展不少,主要围绕如何看懂营养素参考值主题,大概介绍了营养素参考值的概念、用途及使用方法。这样的科普固然必要,但断章取义式的科普方式缺少介绍营养素参考值的科学依据、推行的原因以及如何与日常饮食有效结合,使多数人只知其一不知其二,无法真正理解营养素参考值,更别说科学指导日常饮食。
因此,改进营养素参考值的科普宣传极为重要,建议在科普类文章或者常识解说中,以讲故事或举身边老百姓的例子,少用学术用语,改用通俗说法,少用长篇大论,改用诙谐有趣的卡通动漫,少用文字,改用声频与视频,达到简洁明了阐述营养素参考值来龙去脉的目的。此外,建议借鉴美国1990年发布的营养标签和教育法(Nutrition Labeling and Education Act,NLEA),确立中国的营养标签教育法,为营养素参考值的科普宣传提供法律依据。
能量+4种核心营养素是包装食品强制性标示的营养成分,比较常见,但其他营养成分如膳食纤维、优质蛋白、维生素、矿物质等由于非强制要求,仅在个别食品显示。为满足消费者对更多营养成分的关注需求,提高营养素参考值的利用率,支撑更多食品的健康选购以及适应更广泛的人群,建议修改《预包装食品营养标签通则》,添加糖(单糖与双糖)、膳食纤维、饱和脂肪、反式脂肪等营养成分,显示其营养素参考值,为消费者选择合适、健康的食品提供更多的判断依据。
片面显示单个或数个营养成分的营养素参考值难以适应大健康时代需求,食品包装正面(Front of Package,FOP)标签通过营养素度量法(Nutrient Profile,NP)向消费者直观易懂地评价食品整体营养价值,克服了营养素参考值认知度低且位置不醒目等问题。一些发达国家在FOP标签中融入营养素参考值,例如英国的交通灯信号标签显示营养素参考值,当某一种营养物质的营养素参考值超过30%(食品)及超过15%(饮料)时,则会显示红色,警告消费者慎重选购[20]。在中国,《健康中国行动(2019—2030年)》已将推动FOP标签列入国家行动计划,在改进标签设计与落地实施之前,建议总结英国等国的经验做法与存在的不足,尝试将FOP标签与营养素参考值相结合,根据国民营养健康状况与发展目标,对重要的营养素含量根据营养素参考值划分健康等级,并采用颜色编码、图形、文字、数字其中的一种方法标示。