基于近红外光谱和K线图的烟丝总糖实时监测方法

2023-10-30 10:45杜国荣马莉马雁军刘德水史素娟矫海楠黄越
中国烟草学报 2023年5期
关键词:牌号烟丝均线

杜国荣,马莉,马雁军,刘德水,3,史素娟,矫海楠,黄越*

基于近红外光谱和K线图的烟丝总糖实时监测方法

杜国荣1,2,马莉2,马雁军2,刘德水2,3,史素娟2,矫海楠2,黄越1,2*

1 中国农业大学食品科学与营养工程学院,北京海淀区清华东路17号 100083;2 上海烟草集团有限公司技术中心北京工作站,北京通州区万盛南街99号 101121;3 北京生命科技研究院有限公司,北京 102211

【背景和目的】针对传统生产过程监控中对特定化学成分的变化趋势往往无法实时获取和判断的问题,提出一种基于金融领域中K线图计算和趋势判断的质量监控方法。【方法】通过颜色趋势和长短均线策略实现对批次内、批次间结果的比对分析并预测未来批次走势,并与常用的误差棒图和箱线图进行对比分析。【结果】牌号A和B的烟丝总糖趋势判断准确率最高分别为 75.00%和84.62%,采用K线图能判断批次前期、后期的物料化学成分变化。【结论】该方法具有较好的直观性和时效性,对同类产品的其他生产指标监控具有良好的拓展应用价值。

烟丝;K线图;过程监控;总糖含量;近红外光谱

烟丝的质量控制对于卷烟生产非常重要,如何监控烟丝化学成分的变化是实现质量控制和管理的重要环节。近红外光谱具有样品前处理简单、不需要破坏样品,检测速度快,易于实现原位实时分析等优点而备受关注[1-3]。近红外光谱已广泛应用于烟草行业的各个领域[4-7]。实时分析后的结果可用于快速获取物料的实时品质,对产品质量的稳定控制有重要的指示作用。实时分析结果的展示方法大多采用点线图,批次统计结果大多使用柱状图、误差棒图等方式[7-8]。批次内数据的点线图可以反应出当前批次化学成分的变化情况,但是因为没有历史批次信息,无法看出当前批次和历史批次的对比情况。多批次的点线趋势图[9]、箱线图[10]或误差棒图[11]可以反应出历史批次成分的变化趋势,但无法及时查看当前批次的波动情况。

K线图是金融领用常用的一种技术指标[12-15],最早出现在日本,用于预测大米价格的走势。K线图也称为蜡烛图,指基于市场特定交易品种的最高价、最低价、开盘价、收盘价4项数据构成的类似于蜡烛形状的图形。如果收盘价高于开盘价,则蜡烛图中空,被称为阳线[15-16],国内大多用红色实体表示;反之,则蜡烛图为实心,被称为阴线,国内常用绿色实体表示。基于趋势、反转理论,结合K线图和常用的技术指标如移动平均线、平滑异同移动均线、KDJ随机指标、相关性等,可以快速判断市场行情的走势[16]。

烟丝常规化学成分,如总糖、总植物碱、氯、钾等,是烟丝质量重要的品质指标[17],使用近红外技术在离线和在线的场景对其实现快速测定。为提高方法准确度,在数据处理时常使用光谱预处理[18-19]、异常样品识别[20-21]、变量筛选[22-24]等技术以获取更加稳健的模型。鉴于现有监测结果实时显示方法较单一,且无法同时对批次内、批次间结果进行快速比对分析,难以快速预测未来批次走势,本研究以生产过程烟丝总糖含量为研究对象,提出一种基于K线图的烟丝化学成分监测方法。通过对两种牌号连续多批次的结果分析,快速判断批次内、批次间的变化情况及未来批次走势,具有较好的潜在应用价值。

1 材料与方法

1.1 仪器与试剂

傅里叶变换近红外光谱仪(布鲁克Matrix-E,德国),连续流动分析仪(Seal AA3,德国)。高纯度蒸馏水(≥18 MΩ),冰醋酸(≥99.5%),盐酸(36%),氢氧化钠(98%),对羟基苯甲酸酰肼(98%),聚乙氧基月桂醚(Brij 35)溶液,硫氰酸汞溶液,硝酸铁溶液,氯化钠溶液等根据实际条件配制。

1.2 建模样品

选取制丝生产过程中间环节的特定时段的烟丝作为分析对象。使用在线傅里叶变换近红外光谱仪采集370个烟丝样品的原位近红外光谱。仪器采用漫反射模式,波数范围为12000~4000 cm-1,波数间隔约为4 cm-1,共获得2074个波长点,扫描次数64次,分辨率8 cm-1。按照行业标准[25]YC/T 159—2002测定样品总糖含量。按照4:1将样品分为建模集和验证集,分别含有样品269个和68个。

1.3 样品批次信息

牌号A烟丝采集2017年3月4日至2022年7月19日期间的烟丝总糖数据,其中包含该牌号烟丝的生产日期有108 d,其中平均每个批次持续约50 min,最终采集牌号A烟丝合计186个批次的近红外光谱19802条。牌号B烟丝采集2017年2月21日至2022年7月14日期间的烟丝总糖数据,其中包含该牌号烟丝的生产日期有135 d,平均每个批次持续约50 min,最终采集牌号B烟丝合计339个批次的近红外光谱36224条。

1.4 计算部分

建模计算使用近红外光谱仪配套软件OPUS 6.5(布鲁克,德国),计算及作图采用Python v3.8.8软件。

K线构造方法采用IQR法去除异常点,IQR为第三四分位数Q3减去第一四分位数Q1的差,大于Q3+1.5*IQR或小于Q1-1.5*IQR的值被认为是异常值。批次前1/2时间的预测指标的中位值作为开盘价,批次后1/2时间的预测指标的中位值作为收盘价,批次数据的90%分位数作为最高价,10%分位数作为最低价。

使用K线图方法进行判断时,若前1/2批次的数值大于后1/2的数值,则K线为实心绿柱,反之K线实心红柱。通过K线是否阴线或者K线颜色可以快速判断批次前期和后期化学成分变化情况,通过观察K线的上下影线可以快速观察出当前批次数据的上10%分位数和下10%分位数。通过构建长短均线,可以用于判断未来批次数据走势。当短期均线从下至上穿过长期均线时,未来批次数据有上升的可能,本研究用下穿进行表示;反之,当短期均线从上至下穿过长期均线时,未来数据有下降的可能,用上穿进行表示。本文长期和短期均线计算参数分别选取20和5,该参数可以通过历史数据进行设置。

2 结果与讨论

2.1 烟丝总糖模型

预处理方法为一阶导数和多元散射校正组合方法,选择的波段为7502.1~6098.1 cm-1和5450.1~4246.7 cm-1,如图1A所示,灰色区域为经过预处理后的光谱选定波段区域。在此波段范围内建立偏最小二乘回归(PLS)模型(图1B),模型参数和结果见表1,可知建立模型回归系数2为99.47%,预测均方根误差RMSEP为0.385,残差预测偏差RPD值远大于3,具有较好的预测能力。

图1 建模变量分布和模型验证结果统计图

表1 烟丝中总糖PLS模型参数统计表

2.2 牌号A的K线图趋势

图2为牌号A的混合烟丝中总糖成分的K线图,共186个批次。其中,蓝色线为5批均线,黄线为20批均线。可以看出该牌号所有批次中烟丝总糖值最小为22.5(质量分数%),最大为28.3。经统计得到,5批均线从上向下穿过20批均共有8次,统计穿越点前5批的5批均值和后5批的5批均值结果见表2。可以看出,8次中有6次突破后的均值小于突破前,准确率为75.00%。短期均线从下向上穿过长期均线一共8次,其中5次判断正确,随后均值上升,正确率为62.50%。

图2 牌号A烟丝总糖含量变化K线图

通过图2可以快速判断出批次生产工程中总糖的变化。批次前期物料总糖低于批次后期时K线主体为蓝色,反之为黄色。批次前期和后期总糖变化越大,K线主体柱越长。通过K线图的上下影线可以快速判断批次中的极端数值。如图2中第二个批次,测定值最小值为22.84,最大值为28.17,极差为5.33,明显不同于其它批次。将该批次数据做折线图(图3),该批次持续时间较长,有928个数据点,合计检测时间接近618 min。经核查该批次数据的批次信息有误,实际为6个不同的批次,且生产的物料也有所不同,因此批次上下影线差异很大。此外,K线图也能了解到生产调整或配方调整的实际工况,如在140批次后,总糖数据有明显的升高,从24%一直增加到27%,可以回溯数据了解到这个阶段其实是原料配方的调整阶段,从图中可以明显看到配方调整前后的目标成分的变化情况。

图3 牌号A烟丝第二批次总糖含量变化图

2.3 牌号B的K线图趋势

图4为牌号B的混合烟丝总糖的K线图,一共339个批次。从K线颜色看出,大部分批次的后期比前期的总糖值要高。同样地,短期均线和长期均线交叉时数据变化情况见表3。可知,短期均线从上向下穿过长期均线13次,其中11次发生了批次数据数值下降情况,准确率为84.62%。短期均线从下向上穿过长期均线12次,其中10次发生了批次数据数值上升的情况,准确率为83.33%。

图4 牌号B烟丝总糖含量变化K线图

表3 牌号B短期均线上下穿长期均线前后总糖变化统计表

Tab.3 Statistics of changes in total sugar before and after the short-term average crossing the long-term average of brand B

2.4 其他趋势图的分析结果

采用生产物料质量监控中常用的趋势变化分析误差棒图、箱线图与K线图方法进行对比。图5分别为牌号A和B历史批次中烟丝总糖含量变化的误差棒图。为便于和K线图比较,图中误差棒的上下限分别为批次下十分位和上十分位值。通过误差棒图的上下限可以快速判断批次内总糖的波动情况,通过误差棒的走势也可以分析批次的走势。但是通过误差棒图无法快速判断批次前期、后期总糖的变化情况。如采用K线图结合长短均线可以更准确的预测未来批次的走势,通过颜色判断批次前后总糖的大小变化和数值大小,其相比于误差棒图更具有优势。

图5 牌号A和B的烟丝总糖含量变化误差棒图

图6分别为牌号A和B的箱线分析图。从箱线图的主体可以看出批次数据的上下四分位位置,从上下箱线可以看出批次数据的上下限。和误差棒图类似,箱线图也可用于直观表达批次总糖的走势和批次内数据的波动大小,但是无法判断批次前期、后期的物料化学成分变化。对于最新批次的实时变化情况,这两种方法的图形表现都稍逊于K线图方法。

图6 牌号A和B的烟丝总糖含量变化箱线图

3 结论

本研究以生产过程烟丝总糖含量为研究对象,提出一种基于金融领域K线图的烟丝化学成分监测方法。正如金融研究中监测实时股票数据,本方法可以实现快速判断烟丝生产中特定批次的目标成分含量数值的变化情况。同时,通过颜色趋势可以快速判断特定批次前期和后期的变化,方便直观地进行当前批次和历史批次对比。最后,结合金融领域的长短均线策略,本方法可用于对批次数据走势的快速判断,其中,对于A牌号批次趋势判断的最高准确率为75.00%;对于B牌号批次趋势判断的最高准确率为84.62%。本研究也将现行常用的生产批次监控方法与本方法进行了比对,结果表明本方法在直观性和实用性上仍具有较大的应用潜力。该方法可用于烟丝其他指标的实时分析如总烟碱、氯、钾等,具有良好的扩展性。

[1] Shao X G, Bian X H, Liu J J, et al. Multivariate calibration methods in near infrared spectroscopic analysis[J]. Anal. Methods, 2010, 2(11): 1662-1666

[2] Pasquini C. Near infrared spectroscopy: A mature analytical technique with new perspectives e A review[J]. Anal. Chim. Acta, 2018, 1026: 8-36.

[3] 褚小立,陈瀑,李敬岩,等. 近红外光谱分析技术的最新进展与展望[J]. 分析测试学报,2020, 39(10): 1181-1188.

CHU Xiaoli, CHEN Pu, LI Jingyan, et al. Progresses and perspectives of near infrared spectroscopy analytical technology[J]. J. Instrum. Anal, 2020, 39(10): 1181-1188.

[4] 张翼,杨征宇,葛炯,等. 近红外分析技术在烟草中的应用[J].计算机与应用化学,2016, 33(02): 251-254.

ZHANG Yi, YANG Zhengyu, GE jiong, et al. The application of near-infrared spectroscopy in tobacco[J]. Comput. Appl. Chem, 2016, 33(02): 251-254.

[5] 邱军,张怀宝,宋岩,等. 近红外光谱分析技术在烟草行业的应用[J]. 中国烟草科学,2008, 01: 55-59.

QIU Jun, ZHANG Huaibao, Song Yan, et al. Application of near infrared spectroscopic analytical techniques in tobacco industry[J]. Chin. Tobacco Sci, 2008, 1: 55-59.

[6] 刘华友,周顺峰,朱传才,等. 基于在线近红外光谱分析的原烟精选均质化调控方法[J]. 安徽农业科学,2021, 49(03): 193- 195.

LIU Huayou, ZHOU Shunfeng, ZHU Chuancai, et al. Raw tobacco selective homogenization regulation method based on online NIRS[J]. J. Anhui Agric. Sci, 2021, 49(3): 193-195.

[7] 王毅,马翔,温亚东,等. 近红外光谱与多元统计方法用于生产过程实时分析[J]. 光谱学与光谱分析,2013, 33(5): 1226-1229.

WANG Yi, MA Xiang, WEN Yadong, et al. Near infrared spectroscopy and multivariate statistical process analysis for real-time monitoring of production process[J]. Spectrosc. Spec. Anal, 2013, 33(5): 1226-1229.

[8] 李伟,冯洪涛,周桂圆,等. Hotelling T2结合多组分NIR校正模型在卷烟生产过程质量监测中的应用[J]. 烟草科技,2014,324: 5-9.

LI Wei, FENG Hongtao, ZHOU Guiyuan, et al. Quality Monitoring in Cigarette Manufacturing Process by Combining Hotelling T2 Statistics and Multicomponent NIR Calibration Model[J]. Tobacco Sci. Tech, 2014, 324: 5-9.

[9] Wang Y, Han F, Zhu L, et al. Line graph or scatter plot? Automatic selection of methods for visualizing trends in time series[J]. IEEE Transactions on Visualization and Computer Graphics, 2018, 24(2):1141-1154.

[10] Larson H J. Moving beyond the bar plot and the line graph to create informative and attractive graphics[J]. Modern Lang. J, 2017, 101(1): 244-270.

[11] Kim J, Lee J S, Jang S J. Drawing guideline for 'hip and pelvis': plot with error bar [J]. Hip Pelvis, 2020, 32(4): 161-169.

[12] Lee K H, Jo G S. Expert system for predicting stock market timing using a candlestick chart [J]. Expert Syst. Appl, 1999, 16(4): 357-364.

[13] Hung C C, Chen Y J. DPP: Deep predictor for price movement from candlestick charts[J]. PLoS ONE 16(6): e0252404.

[14] Lan Q, Zhang D, Xiong L L. Reversal pattern discovery in financial time series based on fuzzy candlestick lines[J]. Syst. Eng. Proc, 2011, 2: 182-190.

[15] Ho T T, Huang Y. Stock price movement prediction using sentiment analysis and candlestick chart representation[J]. Sensors, 2021, 21(23): 7957.

[16] 吕涛,郝泳涛. 基于K线序列相似性搜索的股票价格预测[J]. 计算机应用,2017, 37(S2): 229-235.

LV Tao, HAO Yongtao. Stock price prediction based on K-line series similarity search[J]. J. Comput. Appl. 2017, 37(S2): 229- 235.

[17] 李跑,马雁军,马莉,等. 基于近红外漫反射光谱和化学计量学方法的晒红烟常规化学指标的快速测定[J]. 湖南农业大学学报(自然科学版),2018,44(03):251-255.

LI Pao, MA Yanjun, MA Li, et al. Rapid determination of routine chemical index in dark sun-cured tobacco by near-infrared diffuse reflectance spectroscopy and chemometrics methods[J]. J. Hunan Agric. Univ, 2018, 44(03): 251-255.

[18] Shao X G, Leung A K, Chau F T. Wavelet: a new trend in chemistry[J]. Accounts Chem. Res, 2003, 36(4): 276-283.

[19] Bian X H, Wang K Y, Tan E X. A selective ensemble preprocessing strategy for near-infrared spectral quantitative analysis of complex samples[J]. Chemometr. Intel. Lab. Syst, 2020, 197(15): 103916.

[20] Liu Z C, Cai W S, Shao X G. Outlier detection in near-infrared spectroscopic analysis by using Monte Carlo cross-validation[J]. Sci. China, Series B-Chem, 2008, 51(8): 751-759.

[21] 王家俊,李正风,王萝萍,等. 蒙特卡洛交叉验证用于偏最小二乘建模数据质量的评价. 计算机与应用化学,2015, 32(12): 1530-1536.

WANG Jiajun, LI Zhengfeng, WANG Luoping, et al. Evaluation of calibration data for partial least squares modeling by using Monte Carlo cross validation. Comput. Appl. Chem, 2015, 32(12): 1530-1536.

[22] Shao X G, Du G R, Jing M, et al. Application of latent projective graph in variable selection for near infrared spectral analysis[J]. Chemometr. Intel. Lab. Syst, 2012, 114: 44-49.

[23] Li P, Du G R, Ma Y J. A novel multivariate calibration method based on variable adaptive boosting partial least squares algorithm[J]. Chemometr. Intel. Lab. Syst, 2018, 176:157-161.

[24] Li P, Du G R, Cai W S. Rapid and nondestructive analysis of pharmaceutical products using near-infrared diffuse reflectance spectroscopy[J]. J. Pharm. Biomed. Anal, 2012, 70: 288-294.

[25] YC/T 159—2002,烟草及烟草制品水溶性糖的测定连续流动法[S].

YC/T 159-2002,Tobaccoa ndt obaccop roducts-Detelrminationo fw ater solubles ugars- Continuousf low method[S].

K-line tracking method of total sugar changes in cut tobacco

DU Guorong1,2, MA Li2, MA Yanjun2, LIU Deshui2,3, SHI Sujuan2, JIAO Hainan2, HUANG Yue1,2*

1 College of Food Science and Nutritional Engineering, China Agricultural University, Beijing 100083, China;2 Technology Center, Shanghai Tobacco Group Beijing Cigarette Factory Co., Ltd., Beijing 101121, China;3 Beijing Life Science Academy(BLSA), Beijing 102211, China

The change of total sugar content in cut tobacco in the cigarettes production is one of the main indicators affecting the stability of the product. Aiming at the problem that the change trend of specific chemical components cannot be obtained and judged in real time in traditional production process monitoring, this study proposed a quality monitoring method based on K-line chart calculation and trend judgment from the financial field. First, based on the data of cut tobacco obtained by online near-infrared spectroscopy, the total sugar content of 525 batches from two brands was analyzed before and after the short-term moving average or the long-term moving average. Comparative analysis of intra-batch and inter-batch results and prediction of future batch trends were successfully realized. Results showed that the highest accuracy rates of judging the trend of total sugar in cut tobacco of brands A and B were 75.00 % and 84.62 %, respectively. Subsequently, the commonly used error bar chart and boxplot were compared with the K-line analysis and the results revealed that the K-line combined with the long and short moving averages can accurately predict the trend of future batches better. This approach has good intuition and timeliness, and has a good expansion and application value for the monitoring of other indicators of similar products.

cut tobacco; K-line; process monitoring; total sugar; near infrared spectroscopy

Corresponding author. Email:huangyue@cau.edu.cn

北京市自然科学基金项目(No. 8222070);兴化健康食品产业研究基金(No. 201905);上海烟草集团有限责任公司科技项目(No. K2015-2-017p);上海烟草集团北京卷烟厂有限公司科技项目(No. TP2019-C1)

杜国荣(1984—),博士,高级工程师,主要研究方向为分析化学,Tel:010-59028225,Email:nkchem09@126.com

黄越(1985—),博士,副教授,主要研究方向为食品质量监控和智能化检测,Tel:15810052357,Email:huangyue@cau.edu.cn

2022-09-27;

2023-06-06

杜国荣,马莉,马雁军,等. 基于近红外光谱和K线图的烟丝总糖实时监测方法[J]. 中国烟草学报,2023,29(5). DU Guorong, MA Li, MA Yanjun, et al. K-line tracking method of total sugar changes in cut tobacco[J]. Acta Tabacaria Sinica, 2023,29(5). doi:10.16472/j.chinatobacco.2022.T0274

猜你喜欢
牌号烟丝均线
含水率和温度对烟丝破碎规律的影响
交流绕线电机电刷牌号及数量选择
有趣的楼牌号
结存烟丝返掺方式的选择
高牌号灰铁前端箱体质量提升
球齿钎头用中颗粒硬质合金GM06牌号的研制
基于PLC的烟丝配比控制系统的研制
基于图像处理技术的烟丝检测系统
股票懂得适时卖出方为赢家