李俊
关键词:人工智能 大数据 职业教育
人工智能与大数据在各行各业的主要应用有:语音识别、图像识别、无人驾驶、智能助手、专家系统、网络爬虫、数据挖掘、关联分析等。这些高科技应用的背后,是各种复杂的数学原理与算法实现。人工智能与大数据专业是否只需要学术型人才,职业院校的学生是否具有市场竞争力,行业各界对此有着不同的看法。
其实,职业院校的师生可以不必深入探究算法的原理,而是应该把主要精力放在如何应用它们上。
对此,本文将从以下几点进行阐述。
一、人工智能与大数据的发展现状
可以说,随着近几年的广泛应用,人工智能与大数据技术的门槛已经不再高不可攀。支持人工智能与大数据算法的软件相当多,它们各有所长,如Matlab、IBM SPSS、SAS等;如果想通过编程实现人工智能与大数据功能,互联网上也有相当多现成的开源代码,不需从零开始。
例如,谷歌就把曾经在围棋领域里战无不胜的“阿尔法狗”核心算法——深度学习框架TensorFlow,开源并发布出来。在众多代码托管平台,如国内的开源中国、CSDN和国外的GitHub,都有丰富的共享资源提供给大家“拿来”使用,进行二次开发。
实现人工智能与大数据算法的工具和开源代碼已经非常齐全,可以获得的途径也很多,关键是职业院校培养出来的学生,能否像操作一台电脑、一台机器那样,把这些“工具配件”利用起来,组装起来,运行起来。
二、人工智能与大数据常用算法和编程语言
人工智能与大数据采用的算法主要有:监督学习的神经网络、贝叶斯、决策树、线性回归;无监督学习的神经网络、关联分析、聚类分析等。各种算法背后深奥的数学理论知识,不是职业院校师生关注的重点,我们只需要大概知道它们工作的原理擅长应用的场所即可。
人工智能与大数据编程的语言主要有:C++、JAVA和Python等,其中这几年最火最热的就是Python语言。笔者认为,面向对象的编程语言都是相通的,而Python语言具有语法更简单、代码更人性化、功能库更强大、资源分享更丰富等优点,可以成为职业院校人工智能与大数据专业学生重点掌握的编程语言。
三、职业院校学生如何“接地气”地应用人工智能与大数据并进行二次开发
(一)熟练掌握一种软件工具和编程语言
前面提到过,有很多专业软件支持人工智能与大数据的算法,职业院校师生应该掌握一、两种这方面的工具,这对编程开发具有很大的帮助。
在常用的人工智能与大数据编程语言中,Python语言是最简单、最容易入门的一种语言,非常适合职业院校相关专业的学生学习。Python开发平台主要有VSCode和PyCharm,笔者用得比较多的是PyCharm,它和WEB应用结合良好,可供下载的功能库很多,内置的智能辅助工具可以显著提高编程效率和代码质量。
(二)跨专业挖掘应用需求
人工智能与大数据技术人才,要走出自己的圈子,多与其他专业的人士交流,了解他们的需求,分析问题,探索合作方向,在促进对方技术进步的同时,锻炼自己的专业技能,学以致用,避免纸上谈兵。
(三)充分利用校企合作平台资源
职业院校的校企合作平台,是企业联系学校的关键桥梁,人才、技术和市场的需求,都可以通过这个桥梁传达到学校,这也是职业教育的特色所在。
同时,职业院校为了响应国家职业教育相关政策的要求,通过校企合作部门,每年都会安排老师和学生深入到企业生产一线进行实习培训,和工厂工人同吃同住,这是难得的学习和交流机会。
(四)善于利用网络共享平台
互联网时代,网络资源应有尽有,人工智能与大数据方面的技术文档、功能代码,甚至是大数据采集任务,都可以在网络上找到下载资源。这里的网络资源不单局限于一些大型的门户网站,还包括以下:微信公众号、微博等自媒体;代码托管网站,如国内的开源中国、CSDN和国外的GitHub等;行业动态交流平台,如人工智能网和AI中国网等;行业技术交易服务平台,如猪八戒网等。
四、人工智能与大数据应用案例
(一)利用Excel对调查问卷进行数据挖掘
一体化教学重视师生的互动,现阶段职业院校通常使用问卷调查方式获得学生对教学效果的反馈意见。这种问卷调查获得的信息量较大,很难从中看出一些规律。通过数据挖掘的方式,可从大量杂乱的反馈意见中提炼有效信息,区分出重要和不重要因素,从而做到有的放矢地跟进,更有效地改善一体化教学效果。
笔者曾经设计了一个关于学生课程满意度的调查表,有13个影响因素和1个满意度评分。笔者选取了一个专业班的同学,对该班所有课程进行匿名问卷调查,将调查结果记录到Excel中。
笔者采用线性回归算法进行数据挖掘,Excel中提供了相应的功能函数,首先将影响因素进行数据化操作,接着使用数据分析中的回归,选择好X值和Y值后执行,即可获得详细的分析结果。其中,系数为正的表示重要因素,系数为负的表示不重要因素。
最终,通过数据挖掘得知,一体化教学老师可以从巡回指导到位、适当增加课外知识、语言表达更幽默、教学过程中多结合案例和应用等方面提高学生对一体化课程的满意度。
(二)利用Excel和Python语言打造新生大数据
各职业院校在开学季,都会适时推出有趣的新生大数据,例如:男女学生人数比例,年龄和星座分布情况,同名同姓或者生日相同的学生、籍贯统计等。
笔者带领了几位计算机专业的学生,从招生部门收集了当年新生数据,以简单实用为指导思想,先是利用Excel进行新生数据的整理,筛选出必要的字段,接着导入Python的pandas库,调用value_counts等函数,对新生数据进行分析和汇总,然后输出结果到Excel表格,利用Excel强大的图表和地图功能,打造了新生大数据报告,提供给相关部门参考并发布。
整个过程中,学生对大数据技术有了深刻的认识并且学会了综合利用各种工具解决问题。
(三)利用关联分析获取消费者爱好需求
关联分析在销售领域的经典案例就是“沃尔玛的啤酒和尿布”,当这两个看起来没有任何关联的东西放在一起销售时,两者的销售量都大大增加,这是因为丈夫买尿布时有“顺手”买啤酒的消费习惯。关联分析擅长在大量数据里面发掘出不同事物之间隐含的联系。
关联分析采用Apriori算法,而在Python开发环境中,mlxtend库提供了强大又好用的关联分析工具。
(四)决策树在葡萄酒酿造中的应用
本地有大规模投产的葡萄酒庄园,笔者所在职业院校的食品化工专业师生,曾经在校企合作部门的带领下,前去参观学习。该专业老师在交流过程中,对葡萄酒酿造工艺非常感兴趣,甚至将这套流程的简化版引入到教学实践中。他带着学生,买了一批紫秋葡萄,利用实验室环境,酿造起了葡萄酒。在这个项目教学过程中,学生理解了葡萄酒酿造的完整过程和原理,学会了酵母菌的分离纯化和检测方法。
笔者对葡萄酒酿造工艺不甚了解,但知道决策树在食品加工工序上有比较广泛的应用。而该老师给出了实验过程中,学生记录的各組数据,包括加入分离纯化的酵母菌对发酵时间的影响,酵母菌在不同培养基中的观察数据、加糖发酵等关键步骤分析、葡萄酒最终检测指标等。笔者利用Python中的sklearn库,导入了决策树tree模型,将葡萄酒酿造中涉及的关键因素作为属性,这些属性将是这棵树分支的节点,然后将检测指标作为结果集。所有的记录数据最终分成了训练集和测试集,通过建立模型、探索属性重要性、修改参数和剪枝,最终得到了简化版的葡萄酒酿造专家模型。
(五)利用深度学习开发人脸识别程序
谷歌开源了深度学习框架TensorFlow,在这基础上电脑专家们开发了很多深度学习的库,而采用纯Python语言编写,基于TensorFlow框架的库就是keras。网络上已经有相当多利用keras库开发的深度学习案例,其中最常见的就是在图像识别领域中的应用。笔者曾经参观了一家香菇生产企业,它使用的香菇分拣流水线就是基于图像的深度学习开发的。
在教学中,笔者重现了一个开源的人脸识别代码,其中除了调用keras库外,还调用了opencv库及sklearn库。这个项目是一个综合的应用,需要学生有扎实的理论知识和熟练应用Python开发语言的能力。
五、小结
职业院校是培养应用型人才的摇篮。我们充分利用教学资源,结合专业所长,在校企合作平台上,“接地气”地利用人工智能与大数据进行二次开发,解决企业在生产经营一线遇到的问题,重新定位新时期技能人才的基本素养,展现职业教育特色。
参考文献:
[1]Wes Mckinney.利用Python进行数据分析[M].北京:机械工业出版社,2018.
[2]郑泽宇,梁博文,顾思宇.实战Google深度学习框架[M].北京:电子工业出版社,2018.
[3]上田和明.用Excel学数据挖掘[M].北京:科学出版社,2012.
(作者单位:广东省南方技师学院)