摘要:橡胶是一种重要的战略物资,其种植受到土地资源、地理环境、橡胶机械化的影响,产量波动很大。本文对农垦橡胶产业种植、生产加工引入数据挖掘技术的必要性进行了初步探究,指出通过提取土壤图像的特征,用支持向量机的算法可以发现橡胶种植、生产加工的规律,进而制定精准的橡胶产业相关策略,以提高橡胶产量、节约成本、提高利润。
关键词:橡胶种植;数据挖掘;特征提取;支持向量机
橡胶是一种重要的战略物资,与石油、钢铁、煤炭并称为四大工业原料。我国是全球最大的天然橡胶消费国和进口国,国内天然橡胶长期处于缺口状态,需求的2/3依赖进口来满足天然橡胶产业属于资源约束型、劳动密集型产业,相对其他农作物来说,具有周期长、收益长等特点。农垦橡胶业的产生、发展与壮大实际上是中国橡胶业发展的一个缩影,一直是学术界研究的热点。根据农垦橡胶产业种植、生产加工的历史数据进行数据挖掘,发现其种植、生产加工的规律,进而制定精准的橡胶产业相关策略,以提高橡胶产量、节约成本、提高利润的数字化研究,目前国内还比较少。
1 引入数据挖掘技术的必要性
天然橡胶以其独具的高弹性、高强度、高伸长率、耐磨、耐撕裂、耐冲击、耐酸碱、耐油、耐腐蚀、耐高低温和绝缘性好、粘合性、密封性强等特点,始终处于不可替代的地位。我国天然橡胶需求量大,近几年一直处于供不应求的状态。造成这种局面的原因主要有以下两点:一、国内轮胎工业迅猛发展;二、天然橡胶的种植条件苛刻。其种植条件苛刻主要体现在对种植地要求高,如对土地的含碳、含氮、湿度等要求都很严格;容易受到寒害、虫害、台风的袭击。橡胶的供应不足阻碍了我国经济(特别是轮胎行业)的发展。基于此背景下,本文通过数据挖掘技术对橡胶树生长地的土壤进行评价研究,为寻找出最适合橡胶树生长的土壤和寻找橡胶树种植地提供依据,一方面可以降低种植橡胶的成本,另一方面可以让新的橡胶农更容易掌握种植橡胶技巧,让更多的人加入种植橡胶的队伍中。
2 数字化流程图
2.1 样本采集
研究的橡胶林可以分为4种不同林龄胶林:幼林早期(0~2龄)、幼林晚期(2~7龄)、开割数(7~16龄)、老龄即将更新数(>16龄)。取土壤样本的时间要在晴天上午,如果遇雨天,则等2个晴天后再进行取样。每个林龄段中随机设置n个样地:每个样地的面积a(m)×b(m),分0~15cm、15~30cm、30~45cm、45~60cm4个层次拍摄土壤样品,每个层次拍摄m张。每张土壤样品图片的命名规则为“胶林_层次.jpg”。
2.2 特征提取
通过拍摄得到的土壤图像,由于图像的维度过大,不容易分析,需要从中提取土样图像的特征,提取反应图像本质的一些关键指标,以达到自动进行图像识别的目的。
图像的特征主要包括颜色特征、纹理特征、形状特征等。本文主要运用图片的颜色特征和纹理特征建立图片自动识别模型。
2.2.1 颜色特征
图片的颜色特征用颜色矩表示。基于颜色矩提取图像特征的数学基础在于图像中任何的颜色分布均可以用它的矩来表示。颜色的矩包含各个颜色通道的一阶矩、二阶矩和三阶矩,对于一幅RGB颜色空间的图像,具有R、G和B三个颜色通道,共有9个分量。
2.2.2 纹理特征
。因为纹理是由灰度分布在空间位置上反复交替变化而形成的,因而在图像空间中相隔某距离的两个像素间一定存在一定的灰度关系,称为是图像中灰度的空间相关特性。
其中L表示图像的灰度级,i,j分别表示像素的灰度。d表示两个像素间的空间位置关系。不同的d决定了两个像素间的距离和方向。元素Pd(1,0)代表了图像上位置关系为d的两个像素灰度分别为1和0的情况出现的次数。
在建模中一般不直接用图片的灰度共生矩阵建模,往往要从灰度共生矩阵中提取它的特征参数用户建模。灰度共生矩阵的特征参数有二阶距、对比度、相关、熵。
3 模型构建
特征提取完之后,用支持向量机算法对图像进行图片识别。根据识别出的结果就可以有针对性的对土壤做些有利于橡胶树生长的干预工作,如:如果识别出土壤缺少氮元素,可以给土壤适当的施些氮肥;如果识别出土壤的水分较少,就要给土壤浇水,给农垦橡胶产业提供数学指导意义。
4 结论
本文分析了橡胶种植中引入数据挖掘技术的必要性,对橡胶种植数字化研究做了初步阐述。可以给橡胶业提供一定的参考意义。
参考文献:
[1]黄冠,吴红宇.广东农垦天然橡胶种植现状及“走出去”战略实践.中国热带农业,2015,3(4),1821.
[2]李炜.广东农垦“走出去”做强做大橡胶产业.今日热作,2013,19(1),5253.
[3] Rapepun Wititsuwannakul, Piyaporn Pasitkul, et.al. Hevea latex lectin binding protein in Cserum as an antilatex coagulating factor and its role in a proposed new model for latex coagulation, Phytochemistry 2008,69(1),656–662.
[4]勒碧.數据挖掘算法及其生产优化应用中的研究.浙江大学硕士学位论文,2006.
项目:广东农工商职业技术学院校级课题“基于数据挖掘技术的橡胶产业的数字化研究”(xykt1601)
作者简介:官金兰(1982),女,博士,副教授,研究方向:偏微分方程及其应用,大数据与数学建模。