周 洁,夏 换,刘建义
(1.贵州财经大学信息学院,贵州 贵阳 550025;2.贵州财经大学电子商务大数据营销工程研究中心,贵州 贵阳 550025)
随着国家实施西部大开发战略、调整农业产业结构和实施退耕还林政策,贵州省政府把发展茶叶产业作为全省的重点产业来抓,以统一规划、统一标准及建成精品为原则,在产业基础好且群众积极性高的乡镇大力发展茶叶种植,稳步推进茶叶产业的发展。贵州省古茶树资源保存量丰富、茶叶种植历史悠久,因而有“茶资源历史博物馆”的美称。2021年,贵州省茶叶产量46.99万吨,产值570.95亿元,产量、产值同比分别增长7.74%、13.32%;茶叶出口达3亿美元,同比增34.9%,茶叶成为贵州第一大出口农产品;贵州遵义湄潭县已连续2年位列中国茶业百强县榜首。
公开数据显示,2021年贵州省茶园总面积稳定在700万亩,投产面积643万亩,全年共引进茶产业项目180个,茶叶加工企业及合作社已达5813家,新增国家级龙头企业2家,国家级龙头企业总数达12家,居全国第二位,所以选择贵州茶叶销售数据作为研究样本是具有代表性的。
数据获取来源为京东平台贵州茶叶销售数据,具体包括销售价格、茶叶品种、店铺名称、茶叶销量。具体的数据获取过程如下。
数据的获取采用Python爬虫技术获取[1],利用Python爬虫第三方库selenium即浏览器自动化操作框架,这里主要用到webdriver这一个工具,接着利用element_by_xpath或css_selector进行数据抓取,具体处理过程如下:
1)新建.py文件导入第三方库selenium、pandas、time、csv、requests、json、lxml、urllib;
2)获取URL;URL=’https://www.jd.com/’;
3)设置代码自动点击登录按钮,然后选择扫码登录,程序休眠5 s方便扫码;
4)登录后利用by_xpath选择内容搜索,keyword=贵州茶叶[2];
5)建立空白词典,词典内容包括留言时间、留言内容、留言标题;
6)抓取数据,F12进入开发者选项利用by_xpath抓取所需数据的源代码,同时设置代码将滚动条拖到最后方便获取全部数据。
本研究共获取了5760条京东平台贵州茶叶销售数据,在进行下一步的研究之前需要将获取到的数据进行预处理,包括残缺值的处理、相似值的处理等,将处理好的数据表格保存整理成csv文件。
在对茶叶品种的数据分析,本文采用了“Wordcloud词云”算法[3],将受消费者欢迎的贵州茶叶品种进行筛选处理。所谓“Wordcloud词云”算法就是对网络文本中出现次数较高的关键词予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使得浏览者可以方便快速地获取数据分析的主旨结果,节约信息成本。
本文在使用词云图对贵州茶叶产品进行视觉上突出的基础上,根据获取文本的特殊性设置新的停用词表,把对研究结果有影响的文本影响因子进行筛除,例如“茶叶”“口粮茶”“官方”“京东”等文本影响因子,最后将处理好的文本利用jieba分词第三方库进行分词处理,形成可视化图谱,如图1所示。
图1 贵州茶叶品种词云图
“Wordcloud词云图”显示,雀舌、高山云雾、湄潭翠芽、都匀毛尖为京东平台比较受欢迎的贵州茶叶品种,而且根据该词云图可以看出贵州绿茶的受欢迎程度是比红茶要高的;再者就是消费者更倾向于明前新茶,因为这个时间段的茶叶口感和味道都是最好的。
贵州茶叶价格区间图如图2所示。根据图2可以很清楚地看到,在500+销量以上的贵州茶叶销售数据中,0~100元的茶叶占据了接近一半的市场份额,0~200元茶叶占据了76%的市场份额。高端礼盒装茶叶所占市场份额较小,这表明该市场还有继续开发的可能,特别是随着我国经济的稳定向好发展,人民收入的逐年增高,高端茶叶市场发展前景向好。在200元以下的贵州茶叶市场中多数都标榜口粮茶和小份茶,目标客户为本店铺产品的回头客和未开发潜在的贵州茶叶爱好者群体[4]。
图2 贵州茶叶价格区间图
在上述研究中,对京东平台的贵州茶叶销售数据进行了数据可视化分析,并得出了相应结论,根据上述结论有针对性地提出贵州茶产业的发展策略。
创建特色茶文化的重要前提就是要先了解贵州当地的特色茶文化。贵州茶文化历史悠久,在唐代茶圣陆羽的《茶经》中有说到:“黔中生思州、播州、费州、夷州……往往得之,其味极佳。”唐代黔中道辖内的思州位于沿河土家族自治县城东,播州即现在的遵义市,费州位于思南县及德江县一带,夷州则位于遵义东部。2014年贵州的“都匀毛尖茶制作技艺”被列入第四批国家级非物质文化遗产代表性项目名录。中央茶厂的建立、浙大的西迁,一起相聚于贵州的湄潭,造就了贵州名茶湄潭翠芽[5]。
正是因为将茶产业与茶文化结合起来,使得茶产业有了文化底蕴,人们在品茶闲谈之余还能回味那段属于杯中香茗的历史,使得茶叶不再单单是一种饮品,而是一种民族兴衰的载体。
贵州的都匀毛尖、湄潭翠芽、遵义红茶都有自己的历史渊源和文化承载,因此成为人们熟悉的茶叶品种,这是天然的广告宣传。依托历史文化可以厚重茶叶的含义,形成茶产业文化自豪感和骄傲感,有利于茶产业的可持续发展。
“茶产业+”概念脱胎于“互联网+”概念,即茶产业要拓宽产业链,丰富产品种类,不再单单生产茶叶这一单一品种,而是与其他行业形成一个成熟完善的产业生态群体。
“茶产业+”可以与旅游业进行结合,贵州省是旅游大省,十四五规划开局之年贵州省政府大力发展旅游业,提出“四梁八柱”的旅游业产业化发展策略,特别是在2021年年底,贵州省旅游业产值已经达到了1000亿元,旅游业产业发展成熟,旅游景点繁多、知名度高可以带来大批的客流量,为茶产业带来大量的潜在客户群体。茶产业和旅游业结合的具体表现为带领游客去茶园亲手采摘、烘焙炒制茶叶,亲身体验手工茶的趣味,还可以通过这些游客进行二次宣传从而提高贵州茶叶的知名度,具体措施可以与旅行社以及各大景点进行合作将其作为景点的增值服务,同时还可以将茶叶作为游客的旅行纪念品以此来提高知名度和受众群体。
除此之外,“茶产业+”还可以与新兴流量平台进行合作,依托抖音、快手等流量平台来进行贵州茶叶的宣传。这些流量平台的流量美食博主的影响力是巨大的,贵州茶产业从业者可以与其签订合作协议来提高贵州茶叶的知名度,同时也应当注重茶产业专业博主的培养,这有利于回答消费者提出的专业性问题。
2021年贵州省茶园总面积稳定在700万亩,投产面积643万亩,茶叶加工企业及合作社已达5813家,新增国家级龙头企业2家,国家级龙头企业总数达12家,居全国第二位。贵州省茶产业发展应当依托龙头企业的优势资源,学习其盈利模式,根据市场导向进行合理的规划布局,发挥产业集聚的优势。集中优势资源对都匀毛尖、湄潭翠芽、雀舌等热门茶叶种类进行宣传和销售,提高贵州茶叶的知名度。
依托龙头企业以及业内其他知名茶叶加工厂可以使得贵州茶产业更加规范化和集中化[6-7],减少不必要的生产成本,要按照“区域布局、基地化生产、专业分工”的发展策略,依托龙头企业、示范性茶厂,因地制宜,发展适合贵州茶产业发展的茶叶专业合作社,建立“龙头企业或示范茶厂+合作社”组织形式,合作社负责生产鲜叶,龙头企业或示范茶厂负责加工、营销,做到利益共享,风险分担,做强品牌,做大产业。
完善贵州茶叶标准体系建设,以机械化、自动化为方向,以企业为主体,全面开展“都匀毛尖”“湄潭翠芽”“绿宝石”“遵义红”等重点品牌,通过QS、ISO、HACCP等质量管理体系认证,严格按照标准种植、施肥、用药、采摘、加工、储运等,全面提升黔茶质量安全水平。
开展病虫害绿色防控,茶区全面禁止销售、施用高毒高残留农药、水溶性农药,全面施用低毒低残留农药、脂溶性农药。严格农药销售登记备案制度,加强生产记录管理,落实责任追究制度,严格执行安全间隔期规定。
建立茶叶质量安全监测体系,推进全省有资质并已具备相应检测能力的检测机构—贵州省农产品质检中心、贵州省分析测试研究院、贵州大学精细化工研究院等与企业合作,建立高效、便捷通过欧盟认证和出口国认可的茶叶质量安全第三方检测机构[8],满足省内企业开拓国内外市场的检测需要[9]。
加强人才队伍建设,鼓励支持贵州省内大专院校、职业院校设立茶叶专业,加强师资队伍建设,优化学科设置,扩大茶叶专业招生规模。每年培养茶叶种植、加工、质量审评、市场营销(电子商务)、茶艺茶文化等专业复合型人才4000人。深化产教融合、校企合作,鼓励创办各类民间茶叶学校、培训机构、茶艺馆。在茶叶主产县、省级园区、省级以上重点龙头企业、交易市场及茶馆,建立教学实践基地。
本文利用Python爬虫技术爬取京东平台的贵州茶叶销售数据,并且根据这些数据进行了数据分析,利用数据可视化技术得出受消费者欢迎的贵州茶叶品种,并将结果进行了展示。分析结果得出,雀舌、高山云雾、湄潭翠芽、都匀毛尖为受欢迎的品种,同时对茶叶的价格区间进行了宏观分析,得出200元以下的口粮茶最受消费者欢迎,市场占比最高。
同时,依据这数据些分析结果,结合贵州省茶产业的行业特点,对其销售策略和行业发展提出了相应的发展策略,从茶文化、行业布局、行业可持续发展等方面进行了相应的阐述[10],提出“茶产业+”发展概念,结合贵州省优势行业—旅游业,构建多元化的茶产业集聚,拓宽上下游产业链,丰富茶产业产品种类,从而提高贵州省茶产业的抗风险能力和可持续高质量发展能力。
贵州省是世界知名的茶叶原生地和优生区,“低纬度、高海拔、寡日照、多云雾、无污染”的生态优势赋予了贵茶“香高馥郁、味醇鲜美、色纯鲜亮”的独特品质。利用大数据分析技术科学发展茶产业,有助于推动乡村振兴[11],提高贵州茶叶种植者的收入,助力贵州乡村富起来、强起来,提高民众的幸福感和获得感。