基于大数据分析的茶叶质量评估

2016-03-30 08:20谢艳云重庆水利电力职业技术学院重庆402160
福建茶叶 2016年5期
关键词:质量评估数据分析茶叶

谢艳云(重庆水利电力职业技术学院,重庆402160)



基于大数据分析的茶叶质量评估

谢艳云
(重庆水利电力职业技术学院,重庆402160)

摘要:随着网络技术的不断成熟,数据信息变得更加庞大,大数据的应用范围越来越广阔。茶叶的数据信息包含茶叶种植面积、气候、湿度、质量等多方面信息,通过大数据分析技术,可以更加精准地了解茶叶的各项信息。本文主要探讨大数据分析在茶叶质量评估方面的应用技术。

关键词:茶叶;质量评估;大数据;数据分析

1 引言

中国的茶叶已有几千年的发展历史,由茶叶开发出来的产品种类丰富多样。我国是世界上最大的茶叶生产国和消费国,茶叶种植区域广阔,从南到北,从东到西已有20个省市区有种植。我国产有红茶、乌龙茶、黑茶、白茶、绿茶、黄茶等六大茶类,受地理环境、气候等的影响,不同茶类、不同茶叶产品的质量千差万别。影响茶叶质量的因素很多,包括种植区的气候环境、土壤、采摘及后期加工等。为了保障茶叶质量安全,传统的方法有现场采样和现场检测,该检验方法消耗大量的人力物力,但反馈的信息量少;随着技术的不断发展,先后衍生出化学检验法、指纹图谱检验法等新的检验鉴别方法,但这些检验方法无一不是针对成片特定的茶叶进行的检验,信息量也非常有限;以大数据平台来分析茶叶质量已经逐渐进入人们的视线,通过互联网技术,将茶叶从种植、生长气候环境、病虫害、土壤成分、采摘及加工等全方位信息进行数据信息化并进行分析,可以很好地把控并保障茶叶质量。

2 大数据国内外相关研究

随着信息技术的快速发展,针对大数据的研究越来越多,对于大数据的定义也不尽相同,麦肯锡全球研究所指出大数据是一种规模大到在获取、存储、管理、分析方面都大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。百度百科认为大数据是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策更积极目的的资讯。美国政府认为一个国家拥有数据的规模和运用数据的能力是构成综合国力的重要组成部分。随着政府和企业对大数据发展和应用的关注度越来越高,国内外学者对大数据也进行了大量研究,格雷布林克认为大数据具有多样性、大量性、高速性三大特点,布莱恩·霍普金斯认为除了该三个特点外,还具有易变性等特点;国内学者刘念真认为大数据除了以上特点外,还具有真实性的特点,即大数据有五大特点。现实社会中对大数据的应用也越来越多,美国最大的西奈山医疗中心使用Ayasdi大数据公司的技术来分析大肠杆菌的全部基因序列及其菌株对抗生素的抗药性。与国外相比,国内大数据的研究和应用还处在起步阶段,2012年6月中国计算机科技论坛举办了“大数据时代,智谋未来”学术报告会,对大数据平台开发、数据挖掘、体系理论框架以及数据安全等进行了讨论。国内企业对大数据也越来越重视,阿里巴巴集团提供的云计算服务,百度提供的百度云等,通过对大数据平台对数据进行预分析和预处理,让大数据处理更便捷、更快速、更贴近用户,而且更容易实现和操作。

大数据具有信息规模大、数据种类繁多、流动速度快及价值密度低等特征。信息规模大表现在数据规模已经不能用G 或T来衡量,数据的计量单位从PB到EB再到ZB,高度发达的互联网技术,以及存储数据的电脑、手机、U盘等工具的不断普及,都在不断适应数据信息快速增长的步伐,国际数据公司的研究指出,2008年全球产生的数据量为0.49ZB,到了2011年已经达到了1.8ZB。数据种类的多样性,表现在数据不仅包括以文本资料为主的结构化数据,还包括音频、视频、图片等半结构或非半结构化的数据信息,随着人们对数据信息的要求层次越来越高,而且数据信息处理技术也不再是难题,数据信息也就更加具有多样性。流动速度快表现在信息处理能力方面,人们对数据信息具有实时性的要求,但是数据信息量规模庞大,需要在短时间内从海量信息中提取到有价值的信息,这对数据处理技术要求很高。价值密度低指数据的价值具有稀缺性、不确定性和多样性,大数据中包含了人们生产、消费以及心理活动等各方面有价值的信息,但是数据规模的量非常巨大,而且数据信息不断更新变动,这些有价值的信息就可能转瞬即逝,一般而言,数据的价值密度高低与数据规模大小成反比,数据规模越大,则数据价值密度越低,反之则越高。

3 影响茶叶质量的因素分析

茶叶是我国重要的经济作物,产量丰富而且品质扬名海内外市场,茶叶不同于其他农作物,需要经过种植生长过程和加工过程,茶叶采摘以后,只有经过加工以后才能成为商品,加工过程同样也是茶叶增值的一个过程。茶叶的生长过程和加工过程都关系到茶叶品质的高低、质量的好坏,下面分别就这两个过程进行论述。

3.1 茶叶种植生长过程中影响茶叶质量的因素

茶叶在生长环节内影响茶叶质量的因素有三方面:产地环境、农资使用和采摘标准。产地环境的好坏又细分为温度、湿度、土壤盐碱度等多方面,茶园周边空气质量,土壤中重金属含量、PH值高低都将直接影响到茶叶中铅的含量,茶叶中重金属超标将直接影响茶叶的质量。农资使用标准是指农药、化肥等在茶叶中的残留,农药喷洒过量、化肥使用过量、激素不正当使用等都将影响到茶叶的原料质量。采摘是在茶叶生长过程中进行的,采摘的标准不同也同样影响茶叶中重金属含量,采摘的原料过老,甚至夹入老叶或修剪枝叶,会导致茶叶中氟含量过高,名优茶采摘夹带鳞片、成熟叶,同样会导致茶叶中铅、汞等重金属超标。

3.2 茶叶加工过程中影响茶叶质量的因素

加工过程中影响茶叶质量的因素分三个方面:首先,我国茶叶市场上的茶叶加工企业一般为中小企业或是家庭作坊,茶叶加工工序不统一,管理水平和硬件条件良莠不齐,生产、加工、包装、储藏及运输过程中存在被污染的风险,而且难以形成有效的监管。其次,茶叶加工过程中存在二次污染,由于茶叶加工链条比较长,加工过程中如果没有规范的流程标准和质量监督,就会容易受到灰尘以及机器的污染,而灰尘中含有铅等重金属,机器则包含铜、铝、镍等重金属,此外,还有加工人员的卫生状况、燃煤使用过程等都会引起硫、磷等污染。最后,茶叶包装过程中的包装材料的不达标也会影响茶叶的质量,包装材料包含油墨、粘合剂、工业塑料等,如果这些包装没有按照国家要求的标准进行生产,那么包装本身就是有害的,不仅对茶叶造成了三次污染,还影响了茶叶的色香味等品相。

在国内市场上,茶叶质量安全事件时有发生,茶叶质量安全隐患一直都存在!要保障茶叶市场中的茶叶质量,国家需要在规范茶叶市场的同时,加强对茶叶质量的监督,不断运用最新技术来加强对茶叶质量的检测,只有保障了茶叶卫生质量才能保障茶叶市场的健康发展。

4 大数据分析技术对茶叶质量的把控

随着互联网、云计算和物联网的快速发展,数据信息规模不断的膨胀,要处理的数据信息种类也越来越多,这对数据信息处理的实时性和有效性提出了新的挑战,需要更加快速,更加便捷,更加多样性的技术来处理不同的数据,来满足不同的业务需求。大数据技术是一系列收集、存储、管理、分析、共享和可视化技术的集合,包含了遗传算法、神经网络、数据挖掘、回归分析、分类分析、聚类分析、网络分析、情感分析、应用实践序列分析、关联规则学习、分布式数据库、可视化技术以及其他的一些数据处理技术等。大数据分析茶叶质量包含茶叶质量数据的积累与整理和茶叶质量数据的分析、开发与应用两个过程,大数据相关技术也将在这两个基本过程之中得以运用。

4.1 茶叶质量数据的积累与整理

数据的积累与整理过程是对原始数据进行搜集,并将原始数据中的重要信息提取出来并进行简单的分析,数据的提取过程就应用到了数据挖掘技术,初步分析则可以包含大量统计分析方法。要挖掘茶叶质量的原始数据,首先就要建立茶叶质量监控体系,从茶叶的种植生长过程到茶叶加工过程各个环节都建立检测指标,例如茶叶生长过程中对土壤酸碱度、重金属含量的每天测量,温度、湿度、日照时间等的每天记录,病害虫的监控等多方面立体式信息监测。其次是茶叶加工环节的监测数据,企业加工过程中对茶叶质量的检测,包含茶叶色泽、形状、气味、重金属含量、口感等。最后,将所有数据汇总整理,提取出有效的数据,为分析做准备。茶叶质量的把控不是针对一种茶叶或一个地区的茶叶进行检测,而是要针对整个茶叶市场和茶叶种植区的所有信息进行收集,只有大量的数据信息才能形成有效的检测结果。

4.2 茶叶质量数据的分析、开发和应用

数据分析具有时效性,即对数据必须是最新的,而且分析的结果是有效的,对下一阶段工作安排有预测作用。茶叶质量数据的分析需要对茶叶生长过程和加工过程等信息及时做出反应,将茶叶质量控制在标准允许的范围之内。由于数据具有流动性,并随着时间的推移而不断壮大,其价值被利用之后还会源源不断产生新的价值,因此数据开发至关重要。茶叶质量数据同样可以开发,应用于其他方面如茶叶衍生产品之中。传统数据的应用是以解释现状和预测未来为目的的,但是大数据时代,数据的可视化可将大型数据以图像形式实时表示出来。茶叶质量数据的可视化不但能够方便监测人员把控茶叶质量,而且可以将数据呈现给消费者,让消费者直接了解到茶叶的质量,从而对茶叶质量有更深入的了解。

5 小结

大数据时代已经来临,云计算、物联网等技术的不断应用引发了数据信息规模的快速增长,让数据渗透到了各行各业,成为重要的生产因素。茶叶作为历史悠久的传统行业,茶叶质量一直都是备受关注的重心,如何把控好茶叶品质也一直都是行业努力的方向,通过大数据分析技术可以逐渐改善茶叶质量监测的现状,通过大量数据的有效分析,可以更加科学合理地保障茶叶的质量,从而为茶叶市场的健康发展奠定良好基础。

参考文献

[1]陈宗懋.我国茶产业质量安全和环境安全问题研究[J].农产品质量与安全,2011(3):5-7.

[2]张文锦,王峰,翁伯琦.中国茶叶质量安全的现状、问题及保障体系构建[J].福建农林大学学报:哲学社会科学版,2011,14(4):27-31.

[3]严霄凤,张德馨.大数据研究[J].计算机技术与发展,2013(4):168-172.

[4]林烈青.企业数据中心的研究与设计[J].制造业自动化,2011(15):22-25.

作者简介:谢艳云(1980-),女,湖南娄底人,硕士,讲师,研究方向:非线性理论研究与数学建模。

猜你喜欢
质量评估数据分析茶叶
《茶叶通讯》简介
藏族对茶叶情有独钟
香喷喷的茶叶
基于组合分类算法的源代码注释质量评估方法
新常态下集团公司内部审计工作研究
浅析大数据时代对企业营销模式的影响
中国上市公司会计信息质量研究
澳大利亚研究生课程的外部质量评估
“学生学习结果评价”:美国高校教学质量评估的有效范式
便携式茶叶