吴丽文,蔡少霖
(汕尾职业技术学院 广东,汕尾 516600)
粤东是广东省东部地区汕头、汕尾、潮州、揭阳四个地级市的简称。受自然地理环境、区域定位及产业发展等因素影响,粤东地区大多数乡镇的产业基础是农业。其农产品品种丰富、绿色优质而广销珠三角及粤港澳等地区,深受消费者喜爱。为更好发挥农业资源优势,做好产销对接,关键在于找准市场,拓宽销售渠道。国家各部委联合印发的《关于实施 “互联网+” 农产品出村进城工程的指导意见》指出,要进一步发挥 “互联网+” 与农业农村深度融合的优势,充分发挥网络、数据、技术和知识等要素作用,建立完善的适应农产品网络销售的供应链体系、运营服务体系和支撑保障体系,促进农产品产销顺畅衔接、优质优价,带动农业转型升级、提质增效[1]。《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》提出,要深入推进农产品的出村进城,深入推动农产品上行,全面推进乡村振兴[2]。
在大数据时代,基于大数据的爬虫技术与数据挖掘技术能够获取互联网上大量的客户行为数据并对客户进行精准分析,从而构建精准用户的特征,实现对客户和行为的精准判断,推送符合消费者个性化的产品,实现农产品的精准营销,加强农产品的产销精准对接,提升营销效率,有效实现农民的增效增收,全面推进乡村振兴。
随着国内经济稳定增长和人民消费水平的持续提升,我国农产品市场也在大踏步地成长,并在我国农产品流通体系发挥着重要作用。农产品生产者以此为重要交易平台,向消费者提供各式各类农产品。农产品市场对促进农业生产发展、提高农民收入有着重要的基础性作用,并为农民提供了各种灵活就业岗位,保障着城市农产品的稳定供应。
数据显示(如图1所示),2020年我国农产品行业营业收入达4.79万亿元,同比增长2.2%;行业利润总额突破2000亿元,同比增长5.9%。2021年1~3月我国农产品行业营业收入达9618亿元,同比增长26%[3]。
图1 2017~2021年3月中国农产品营业收入统计
我国农产品市场按产品种类大致分为种植产品、林产品、畜产品。据国家统计局2020年数据显示,2020年全国居民人均食品烟酒消费支出6397元,占总消费比重的30%左右。从整体账单中可以看出,农产品消费(以粮食、果蔬、肉蛋奶油为主)的占比远低于其他消费品。
纵观我国居民的恩格尔系数(如图2所示),近年来整体处于下降趋势,2020年因疫情原因略有抬头,但幅度较小。在当前的大环境下,城市居民的消费能力基本已经达到较高水准,但对以农产品为主的食品消费总量却在逐年减少。
图2 中国居民恩格尔系数变化图
3.1.1 特色农产品种类繁多,地理标志产品比比皆是粤东地区以台地地形为主,其农产品以蔬菜、优稀水果、水稻、水产品为特色,品种丰富,质量上乘,一大批名特优产品畅销海内外。荣获国家地理标志产品称号的有汕尾市的虎噉金针菜、陆河木瓜等;汕头的 “南澳牡蛎” “潮阳姜薯” “金玉三捻橄榄” “达濠鱼丸” “西胪乌酥杨梅” 等;获得国家名特优新产品的有汕头的澄海狮头鹅、饶平的饶平沃柑、饶平青梅;汕尾海丰的莲藕、海丰菜心、陆丰大安的大蒜、海丰油占米等。
3.1.2 受疫情影响,生鲜农产品需求量加大 中国稳定增长的经济大环境以及中国消费者日益增长的农产品需求为粤东地区农产品的销售提供了机遇。 “养生经济” 的兴起,使得消费者对食物的需求不再局限于充饥饱腹,而是越来越注重食物的绿色、健康和有机,消费者对于高品质的农产品的需求与日俱增。同时,餐桌消费提档升级、社区团购等新业态快速发展、加工技术和设备高新化等,将促进未来10年蔬菜消费稳步增长。特别是疫情防控期间,消费者大多通过各类电商平台购买生鲜农产品,生鲜农产品网络零售量爆发式增长。根据央广网的新闻数据,2020年全国农产品网络零售额5750亿元,同比增长37.90%;2021年全国农产品网络零售额4221万亿元,全国农村网络零售额达20500亿元。
3.1.3 农产品消费观念升级 随着人们物质消费水平的提高,消费者在农产品方面的消费观念不断进步。消费者不再满足于普通初级农产品,对绿色健康、安全、高品质农产品的需求持续高涨,他们对农产品的安全、质量要求越来越严格。同时,农产品的消费群体已经趋向年轻化,年轻消费者较为热衷于精致、小巧且带有特色产地色彩的各类差异化农产品。
3.2.1 国内外农产品品牌强势崛起,特色农产品知名度不高 粤东属于经济欠发达地区,农产品的经营主要依托分散的农户,他们缺乏创建品牌意识。同时,农产品加工企业数量多,规模小,农业龙头企业少。据中国农产品市场协会公布的107个 “中国农业品牌目录2020年农产品品牌” ,广东只有6个品牌入选,其中1个粮食类品牌是韶关的 “金友” 大米;信宜的 “银妃” 三华李入选果品类品牌;深圳 “自然之心” 菜心、新丰县的 “少丰” 菜心、韶关的 “亚北兴” 菜心和徐闻的 “正茂园” 辣椒等4个品牌入选蔬菜类品牌。粤东地区没有品牌入选目录。除此以外,传统的农产品品牌也早已深入消费者的心,比如五常大米、西湖龙井茶、烟台苹果、江西脐橙等。
根据广东省农业农村厅最新公布的广东省重点农业龙头企业名单及广东省 “菜篮子” 基地名单,全省共有820家重点农业龙头企业通过评审与复核,而粤东地区则农业龙头经营主体及 “菜篮子” 基地均相比较少[4]。
3.2.2 同质化程度严重,市场竞争力低 粤东地区由于同属台地地形,地理环境相似,种植的农产品同质化程度严重。比如茶叶方面,同时潮州市就有凤凰单丛茶、岭头单丛茶;水果方面,汕尾陆河素有青梅之乡,潮州饶平也盛产青梅;家禽方面:汕头澄海有狮头鹅,潮州饶平也有狮头鹅。农产品同质化严重,是直接导致市场竞争力不足的主要原因。
3.2.3 营销策略缺乏新意 粤东地区农产品企业在销售农产品的过程中一直停留在比较传统的农批、商超等线下模式,同时由于农产品的易腐性质导致普通的流通较有阻碍。受疫情影响,消费者网购行为增加,但粤东很大农产品企业或农户没能及时更新人才和技术,创新营销模式。
随着乡村振兴战略的提出, “三农” 工作迎来了又一个春天,农产品供给不断增加,竞争也愈发激烈。良好的市场运营环境需要法律法规的约束,因此中国农产品行业相关的法律条款也在不断完善,这或成为粤东地区农产品企业面临的新挑战。2006年4月通过的《中华人民共和国农产品质量安全法》就是为保障农产品质量安全,维护公众健康,促进农业和农村经济发展,而制定的法律。进入新发展阶段,人民日益增长的美好生活需要,对农产品质量和食品安全提出了新的更高要求[3]。2021年9月1日,李克强主持召开国务院常务会议,通过《中华人民共和国农产品质量安全法(修订草案)》,也从质量安全标准、场地、生产、包装和标识等方面提出了监管意见,旨在促进优质食品企业健康发展、严控食品质量安全,打击行业生产乱象[5]。食品安全是农产品生产与发展的重要基础,它不仅紧密联系着消费者的健康,对农业市场的稳定发展也有重要保障作用。
经济的高速发展,家庭收入水平的不断提升,消费者对农产品的需求已经逐渐跨过温饱需求,逐步走向小康的生活层次需求。消费者对农产品的需求开始呈现出特产化、精致化。他们追求食品的高品质、原产地、自然生态等,同时对农产品美观的外形、精美的包装也有了更高的要求。因此,推出具有地域特色的高品质、原生态的农产品就成为农产品企业必然的选择。
中国人喜欢纯自然、原生态的产品。特别是在回归国潮的趋势下,有机、绿色、野生等已成为消费者最关注的关键词,也更容易引起年轻人的好感,这给粤东农产品的发展营造了良好的文化力量氛围。
近年来,生鲜农产品冷链储运技术飞速发展并日渐成熟,且逐步朝着自动化、智能化方向持续迈进,这极大满足了人们通过互联网购买各种优质生鲜农产品的需求,也同步促进了生鲜农产品网络销售量的快速攀升。
随着互联网的高速发展,我们也迎来了大数据时代。大数据在企业决策中扮演着越来越重要的角色。特别是在企业的市场营销决策中,大数据挖掘技术成为企业获得客户显性与隐性信息的重要工具。
不管是传统零售还是线上零售,客户都会留下相关属性数据或是行为数据,其中有客户的基本自然属性信息、购物频次、购物种类与数量,浏览商品次数与时长等。企业利用大数据挖掘技术采集并分析这些数据,根据客户的基本自然属性信息、购物频次、购物种类与数量,浏览商品次数与时长等原始数据,进行挖掘分析,进而深入了解客户的消费偏好、行为特征,并得到市场需求等衍生数据,这些数据能够为企业的市场营销提供依据,使得企业更快地发现客户需求,做好个性化推荐,实现大数据下的精精准营销,以提高顾客满意度与顾客忠诚度。
随着市场营销环境的不断变化,传统营销手段已经无法匹配消费者的个性化需求。特别是在疫情环境下,大数据背景下的精准营销必将成为助力粤东农产品销售的必然选择。
在互联网时代,农产品的营销不再是 “广撒网” 而是有的放矢。大数据挖掘技术成为市场营销中获得客户信息的重要工具。大数据下的精准营销主要是利用网络爬虫等数据抓取技术采集用户相关的大量数据,通过大数据挖掘技术构建用户画像,分析出客户特征、用户兴趣、偏好等;同时对客户实施侦测搜索、精确定位、持续跟踪,利用个性推荐算法对客户的行为趋势进行预判,做好个性化推荐,实现精准营销,为客户提供更好的体验,并更快地满足客户需求。
数据挖掘的一般流程是 “确定目标—获取数据—数据探索—数据预处理—挖掘分析建模—模型效果评价” 。
5.3.1 确定目标 数据挖掘的基础是数据,但互联网上的数据是海量的,其中参杂了太多的无效数据,如何获取到与农产品的精准营销有帮助的数据反而成为关键。所以,必须确定一个所需要获取数据的核心目标,比如常用蔬菜的消费人群,各类水果的消费人群,初级加工农产品的消费人群等,这些人群都具备各自的特点,所以在确定好农产品的品类后,需要根据这些人群的大致分布范围去收集此类人群自然属性特征、社会属性特征和线上线下消费行为特征等各类数据,再通过数据挖掘技术确定精准营销的目标人群。
5.3.2 收集数据 一是利用爬虫技术在某些电商网站收集消费人群的购买数据、评价信息等,现在由于消费者保护原因,一般情况下很难得到消费者的各类隐私数据,在一些公开网络平台上面,可以抓取到的有效数据是比较少的,更多只能够去抓取例如某类农产品的销量数据,用户一个周期内的购买量数据以及使用评价等文本信息;二是可以通过自建电商平台,在用户注册的过程中获得用户的相关属性特征数据,不过此类收集方式要注意把握尺度,太过详细容易引起用户反感,导致用户放弃注册或是填报一些虚假数据,不利于后续的挖掘分析;三是可以通过一些产品促销或是某些商业活动,在用户填报申请表的同时收集数据;四是可以通过购买无风险商用数据,但在使用过程中注意脱敏处理,防止不必要的问题发生。
5.3.3 数据探索 数据探索其实就是数据探索性分析(EDA),这项工作的目的在于通过对所获得数据进行一系列先行分析,对样本数据有充分的了解,便于后续的数据清洗和特征工程处理提供思路。简单的探索性分析可以通过对数据的定性、定量分析,来确定数据的分布情况;也可以通过统计量分析来分析数据的集中、离散趋势以及数据的分布形状。在这个分析过程中,可以借助可视化工具中的直方图、散点图、箱线图、核密度图等进行数据的预览分析。进行两特征或是多特征分析时,可以采用相关系数分析,确定后续分析时可以剔除的某些无效字段,以避免分析结果受到干扰。
5.3.4 数据预处理 无论是网络上抓取到或是直接下载的数据,亦或是用户自行填报的数据,都不可避免地存在一些缺失的、重复的或是不合理的数据(比如过大、过小、不符合规则等),因此是必须对这些数据进行预处理(数据清洗),才能保证后续的数据挖掘分析不会受到这些异常值的影响。不过数据预处理并没有规定的流程,只是根据数据挖掘需求和数据样本本身的特性选择不同的处理方面。比如有些是用户的ID值属性,可以直接删除这些对分析结果没有什么影响与帮助的数据;再者就是各种属性中存在的缺失值,可以采用删除缺失值或是利用各种缺失值补全方法进行补全处理;对于非数值型数据,比如性别中的 “男” “女” 这种文本数据,可以采用Get_dummies哑变量处理或是Label Encoding编号处理;对于数值型数据,则需要对数据进行Z-Score或是Max-Min的标准化处理,使此类数据缩放到相同的区间与范围,避免构建的模型受到数据规模、特征以及分布差异的影响。
5.3.5 挖掘分析建模 数据挖掘分析建模方法种类繁多,不同的领域有不同的适用方法,精准营销方面比较经典的应用就有:客户分群及用户画像的聚类分析、客户流失预测的判别分析、零售商品组合的购物篮分析、市场占有率预测的马尔可夫链分析等。本文聚焦于构建粤东地区农产品精准营销路径,找到目标客户是关键,推荐给客户是重点。所以在这个精准营销路径的数据挖掘分析建模方面,首要选的是聚类分析,通过收集客户在农产品消费方面的各种数据,对客户进行聚类建模,找到目标客户群体。当然,也可以收集采用最有尺度分析方法来评估客户的消费倾向,再结合协同过滤算法,构建个性化推荐的精准营销产品销售模式。
5.3.6 模型效果评价 不同的模型有不同的模型评估指标,比如回归分析模型通常会有SSE和方差、均方误差、均方根误差、R Squared等进行评估,分类模型大多采用错误率、召回率、精确率、F1分值的指标进行模型评估,同时还借助ROC(受试者工作特征曲线)曲线图和AUC值(曲线下面积图)直观评估模型的执行效果,如图3、图4所示。
图3 ROC曲线图
图4 AUC值(曲线下面积图)
这些评估均将模型在测试数据下得到的结果与现实生活中实际发生的数据进行比对,越接近真实数据则说明模型效果越好,偏离越大则需要对建模方法、建模参数等进行调整。评估模型效果要充分考虑模型的合理、有效预测能力、稳定、简单等因素,从而得到一个较为中肯的结果。
农产品行业属于完全竞争行业,农产品之间具有高度同质化,加上农民因不了解市场需求造成销售难的矛盾一直存在。而当今的互联网时代,借助大数据对农产品进行精准营销,可以有效解决产销不对称的难题,帮助农产品生产者更好地了解消费者,掌握消费需求,进而从根本上解决农产品的销售难题。