张云涛 翟楠 山东省桓台第一中学
①能够敏锐感觉到信息的变化,分析数据中承载的信息。(信息意识)
②能够采用计算机可以处理的方式界定问题、抽象特征、建立结构模型。(计算思维)
③通过评估并选用常见的数字化资源与工具,有效地管理学习过程与学习资源,创造性地解决问题。(数字化学习与创新)
④对信息技术创新产生的新观念和新事物,具有积极学习的态度。(信息社会责任)
本节课出自教育科学出版社出版的《必修1 数据与计算》第五章第二节,是必修1的收尾篇章,主要介绍人工智能技术的相关概念、应用领域、发展新趋势以及在信息社会中的重要作用。为了更好地呈现人工智能的发展与应用趋势,也为了给选修课程“人工智能基础”做铺垫,依据课程标准和教材相关内容,笔者设计了情感分析这一项目教学:以如何使机器读懂人的情感态度作为线索,整合机器学习流程和Python编程生成技术;以完成情感分析项目为目标,形成相应知识结构,提高学生分析应用能力及核心素养。
从知识技能看,学生已掌握Python基础语法,会用Python解决一些实际问题。从思维能力看,学生具有一定的逻辑推理与分析能力和较强的学习能力。从生活经验看,学生在生活和影视作品中经常接触到人工智能,渴望了解人工智能背后的工作原理。
了解机器学习流程,根据需求对项目进行改进;利用第三方库SnowNLP进行模型训练解决问题;能够根据情感分析过程,使用Python完善部分核心代码;树立利用人工智能解决问题的观念。
重点:根据机器学习流程,利用第三方库SnowNLP进行模型训练解决问题;体验人工智能解决问题的一般流程。
难点:能够使用Python完善部分核心代码的编写与调试;理解机器学习的基本原理;初步理解贝叶斯算法的基本原理。
师:我们在网购时通常会将商品评价作为判断商品质量优劣的一个非常重要的参考。但有时商品评价过多,要把所有的评价内容都看完,是一件相当困难的事情,要是能让计算机帮忙分析商品评价,我们的购物体验就会变得更加轻松。那么,计算机可以区分某条评价是好评还是差评吗?计算机能够理解商品评价中的人类情感或态度吗?
设计意图:用学生较熟悉的网络购物作为问题导入,提高学生的学习兴趣,为整节课的学习做好铺垫。
师:让我们借助百度AI开放平台的情感分析功能模块,来体验利用人工智能让计算机对文本进行情感倾向性判断。
学生打开百度AI开放平台,找到情感分析模块,任意输入语句,观察机器判定结果。根据结果,体验计算机的情感判定得分是否准确,并进一步思考讨论如何让计算机理解人的情感或态度。
设计意图:以人工智能应用作为导入,关注信息技术发展新动向,确立实用又有趣的项目目标,激发学生学习的内驱力。
师:刚刚的体验,同学们产生了很多疑问,现在思考并分组讨论以下几个问题—如何让计算机像人一样理解语言中的情感倾向?人类天生就拥有理解情感的能力吗?可否借鉴人的学习过程使计算机具备情感分析能力?
学生通过头脑风暴,分析出人的学习过程:对知识经验进行归纳,得到规律,应用规律解决新问题;通过分析人的学习过程,理解机器学习流程。
设计意图:通过创设问题链,寻找项目解决思路—类比人的学习过程,理解机器学习流程。
师:厘清了利用机器学习进行情感分析的一般流程,下面我们借助Python第三方库SnowNLP来制作一款个性化的情感分析工具。
SnowNLP情感分析是一种基于中文文本的自然语言处理技术,它的原理是抽取文本中的词语,判断出其情感特征,并结合句子的构建,判断出整段文本的情感倾向性。它是一种基于统计学习的情感分析,需要用到机器学习的算法,将文本中的数据集先做情感标注,以此作为样本数据去训练模型,再用训练好的模型去判断新的句子的情感是“正向”情感还是“负向”情感。
任务一:SnowNLP的简单使用。阅读图1所示的代码,学习SnowNLP的核心应用代码。
图1
调试运行上述代码,观察情感分规律:情感分是位于区间(0,1)的一个小数,越接近1说明越偏向正向情感,越接近0说明越偏向负向情感。
通过任务一的测试,有的学生觉得程序做出的情感得分比较准确,有的学生则觉得这个情感得分准确性不尽如人意。原因是由于SnowNLP语料库没有经过专门的训练,对一些特定领域的文本分析不准确,所以需要事先对其进行有针对性的训练,向其投喂经过标注的训练数据,之后再用训练好的模型进行测试,就能有效提高准确性。
设计意图:学会使用SnowNLP进行简单文本的情感分析,初步体验情感分析过程,并掌握情感分析计算的关键步骤,在测试过程中发现新问题,思考原因并寻求解决方案,为提高准确率做铺垫。
师:虽然我们学会了使用SnowNLP对文本进行情感倾向的判断,但是有的同学发现一个问题—由于模型未经专门训练,对测试文本的情感得分不够准确。下面我们一起来看看,如何对初代人工智能工具进行训练,以提高其情感倾向判断的准确率。
任务二:SnowNLP的模型训练。首先要告诉计算机哪些文本的情感倾向是正向的,哪些是负向的,这个过程叫做样本标注。请对样本数据进行人工区分,从而形成正向和负向训练样本,分好类的评论分别存放在pos-lock.txt(正向样本)和neg-lock.txt(负向样本)中,并通过如下页图2所示的代码,将其投喂给人工智能工具,以对其进行针对性的训练,形成新的情感分析模型。之后用新模型进行文本测试,观察情感判断的准确率是否有所提升。
图2
通过教学资源,总结得出机器学习的一般流程:导入样本数据—训练分类模型—对目标文本进行情感分析。通过测试,掌握提高准确性的方法,即使用更加丰富的训练样本进行模型训练。
设计意图:让学生明白人工智能的学习过程与人类学习过程的相似性,初步理解使用人工智能进行信息处理的基本原理和一般过程,同时理解SnowNLP模型训练的代码,为进一步优化升级做准备。
师:在实际应用中,我们面对的可能是通过爬虫程序自动获取的大型文本集合,AI1.0需要一句一句输入测试文本,它在处理这种大型数据时的分析效率明显偏低,难以满足我们的需求。那么,如何提高效率,实现程序自动化遍历文本数据集合,并自动统计情感倾向,从而直接给出最终结论呢?
任务三:SnowNLP的综合应用。假设你现在想购买一款智能门锁,货比三家,最终你锁定了某品牌的一款智能门锁,为了更准确地了解该商品,用爬虫程序搜集了大量关于该商品的评价,存放在Excel电子表格文件中。接下来,能否利用情感分析工具自动完成该商品评价的分析处理工作,并最终给出购买建议呢?
通过分析新的问题,确立改进方案:①增加读取Excel文件的功能,从而可以遍历所有评论内容;②使用SnowNLP对每条评论做出情感倾向的打分,并自动统计好评率(正向情感的评论数量在总的评论数中的占比),具体代码如图3所示。以此,作为购买建议的重要依据。
图3
另外,为了保证准确率,在正式运行之前,还要选取一部分数据进行测试。
设计意图:本环节以SnowNLP的使用方法为内核,以实际需求为外延,通过活动串,让学生在人工智能情感分析系统的完善与应用的过程中,进一步理解人工智能情感分析的原理,掌握利用人工智能工具处理信息的一般流程。
教师指导学生填写项目评价表,组织学生对项目改进方案、情感分析应用领域进行交流,揭秘情感分析背后的技术原理:数据获取处理、自然语言处理技术、条件概率、贝叶斯分类。
设计意图:诊断目标达成度,对学科核心素养达成情况进行评价;了解现实生活中的应用如何从技术中来再到场景中去。
本节课以人工智能应用作为导入,根据现实生活创设项目目标,通过问题链理顺机器学习流程,通过任务链开发并完善情感分析系统,实现了从学技术到用技术的转变,让学生感受到了运用人工智能解决问题的喜悦感,增强了利用智能技术服务人类发展的责任感。
苍山点题
关于人工智能在中小学信息科技教育中的发展,目前至少在三个层次被广泛实践:一是,基于人工智能产品应用层面的体验式活动;二是,基于机器人开源设计层面的设计活动;三是,基于人工智能模型训练层面的原理探究活动。当然,这三个层次的活动又派生出涉及计算思维、编码、编程、传感、物联以及机器情感、人工智能伦理等多种逻辑线索的学习设计,展现出了信息科技课程建设的广阔天地。本期解码的两篇文章,就是从不同的层面对信息科技原理进行实践,值得深入研讨。
第一篇文章,基于能听会说的“机器人”来探究人工智能如何“听”、如何“说”。首先,结合生活实例,从人工智能语音识别技术的工作流程角度,揭秘机器人如何才能“听”懂自然语言,即揭秘语音识别的科技原理。该活动没有局限于传统的活动体验,而是在体验中着重探究原理,把人工智能的自然语音识别纳入学习的重点,以语音识别的概念与流程解释人工智能的“能听”,突出了人工智能之“科”的价值。接下来探究机器人如何“说”。仍然在通过实例体验之后,探究语音合成技术的工作原理,以语音合成的概念与流程解释人工智能的能“说”,继续突出人工智能之“科”的价值。这些“科”的价值也不是生涩地解释理论,而是融入“技”的应用与体验,在体验中思考与探究。这相对于第一层次的人工智能体验式教育来说大幅度地提高了一个段位,且融合了第三层次的探究活动,即人工智能模型的应用。所以,这节课以让人容易借鉴的方式让信息科技课程得到高层次发展。
第二篇文章,基于对人工智能的原理深入探究,突出计算思维的培养,并结合了机器对人的情感分析这一自然语言处理应用。首先,通过开放的人工智能情感分析应用体验,直观体验人工智能用人的语义分析情感,事例生动,活动有趣,容易激发学生的好奇心;其次,借助模型训练的方式,用人工智能构造情感分析模型与应用,提高到计算思维的层次来探究人工智能的模型,甚至涉及部分神经网络的体验;最后,又通过人工智能模型推理商品评价来解决决策问题,让人工智能原理不仅可用而且可见。这节课涉及编程、模型训练、模型应用等,属于第三层次的人工智能模型探究方面的学习,难能可贵的是切入点涉及语义理解、情感分析与智能决策,这无疑是以更加生活化的视角丰富了课程内容。
来源于实践的教学探究往往更具活力,来源于生活的认知案例往往更具亲和力,让我们共同以构建更具生活化、更具深度思维的人工智能教育课程内容的方式,将信息科技课程推向深入吧!