陈澜
摘要:“数据”是义务教育阶段信息科技课程中的逻辑主线之一,本文以“大数据”为一节课的核心概念,尝试在真实的问题情境中以“大数据”的视角了解、探讨、体会“数据”的来源、呈现以及对现代社会的重要意义,帮助学生深入了解“数据”“大数据”的价值,落实对学生信息意识的培养。
关键词:大数据分析;教学案例;反思
中图分类号:G434 文献标识码:A 论文编号:1674-2117(2023)14-0074-03
案例背景
1.教学内容
《大数据及其分析》一课属于理论课,主要是对大数据基础性知识的了解与认识。对于初中生来说,大数据的概念过于抽象,难以理解,并且此部分学习内容涉及一些专业术语,较难借助实践或者操作辅助理解。
2.学生情况
本课的授课对象是初一年级的学生,他们虽然在日常生活中经常接触大数据的应用,但对“什么是大数据”“大数据分析的主要步骤”“大数据分析的意义”并不理解。
教学片段及反思
片段一
师:现在正是樱花开放的时节,你们知道南京市哪个景点现在最火爆吗?(生:鸡鸣寺)对,这段时间去鸡鸣寺赏花的游客太多,景区为了缓解游客排队的情况,设置了“反悔门”。现在我们通过一段视频来了解一下最近的鸡鸣寺风景区到底有多火。(教师播放新闻视频)第一个问题,你们觉得是男性游客多还是女性游客多?
生:女性游客多,因为感觉女游客更喜欢去看樱花。
师:这位同学所说的“感觉”,其实就是指一种生活经验。第二个问题,你们觉得哪个年龄段的游客最多?在“19岁以下”“20~29岁”“30~39岁”和“40岁以上”中选择。第三个问题,大家知道“20~29岁”的游客在全体游客中的比例大概是多少吗?
生:不知道。
师:你们不知道,我也不知道。但有个“朋友”知道,它就是大数据。大数据在我们日常生活中的应用已经非常广泛,它“懂”你想买什么样的衣服,它推送给你想看的视频或新闻。对鸡鸣寺的游客信息它又“知道”多少呢?下面我们借助百度指数这一大数据平台一起体验大数据的力量。
教师演示百度指数的使用方法,布置学习任务一:①使用百度指数搜索鸡鸣寺。②观察“趋势研究”的搜索指数趋势线,你发现了什么规律?
③观察“人群画像”,你认为去鸡鸣寺的游客中男性比例高还是女性比例高?哪一个年龄段的比例最高?
师:通过观察“趋势研究”,大家发现了什么规律?(学生回答)就如刚才同学们所说,“人群画像”中所看到的年龄分布以及性别分布基本符合我们的日常体验。那么,为什么百度指数可以通过用户的搜索数据进行这样的推测呢?这就需要我们学习大数据及分析的相关知识。
在教学片段一中,笔者选择“为什么通过搜索指数可以推断去鸡鸣寺的游客性别分布以及年龄分布?”这一问题作为真实问题情境的原因是:学生都很熟悉百度搜索,并且搜索指数背后所使用的大数据技术与本节课的教学内容紧密相关。每年三月中下旬都会有无数游客前往鸡鸣寺赏花,新闻热度很高,并且南京的学生们绝大部分有过去鸡鸣寺赏花的经历。用此问题作为真实的问题情境有利于学生将自己的生活经验与本节课的学习内容产生勾连,便于学生体会大数据技术在生活中的运用,感受数据对现代社会的重要意义。
片段二
教师布置学习任务二:①阅读教材第56页或浏览视频《2分钟带你了解什么是大数据》,了解大数据的概念以及大数据的特征。②阅读教材第57页,或使用网络搜索了解大数据分析的四个主要步骤,结合百度指数的应用体验对照理解。
……
师:通过刚才的自主学习和小组讨论,我们了解了大数据分析的四个主要步骤。现在请大家结合百度指数的应用体验说说对每个步骤的理解。第一个步骤,百度指数如何进行大数据的收集?第二个步骤,导入与预处理该如何理解?第三个步骤,统计与分析怎么理解?第四个步骤,大数据挖掘怎么理解?
学生讨论、回答。
在教学片段二开始前,学生按照任务要求,主要通过阅读教材、与同学讨论、使用互联网搜索,尽可能地了解大数据分析的主要步骤,并填写在学习任务单中。大部分学生通过学习后会对此部分内容产生一定程度的认识。
在教学片段二中,教师将学生需要学习的内容与所创设的真实情境紧密结合。大数据分析的第一步—大数据采集,具体到真实情境中就是在用户使用百度搜索鸡鸣寺时,相关的数据就已经被系统自动收集;大数据分析的第二步—导入与预处理,具体到真实情境中就是百度指数所呈现的与鸡鸣寺相关数据并不是最新的全部数据,并以搜索生物机械进行补充说明;大数据分析的第三步—统计与分析,具体到真实情境中就是百度指数对与鸡鸣寺相关的海量数据进行分类和汇总,以了解十年以来用户百度搜索鸡鸣寺的相关情况;大数据分析的第四步—数据挖掘,具体到真实情境中就是通过数据挖掘技术确定使用百度搜索鸡鸣寺用户中的性别分布和年龄分布。
通过从抽象的过程到具体步骤一一进行对比学习,帮助学生了解、认识一些相对抽象和陌生的术语或概念。
片段三
师:接下来请观看“抖音南京大数据报告”,请从以下不同人物角色设定出发,回答相关问题。(教师播放“抖音南京大数据报告”视频,学生观看)
第一个问题,如果你是计划到南京游玩的游客,看了本段视频后你会选择哪些景点作为旅游的目的地?为什么这样选择?”
生1:我选择去钟山风景区爬山,去夫子庙夜游秦淮河。因为去的人多,这里一定是值得去的旅游景点。
生2:我会去清凉山和牛首山。因为它的排名靠后,去的人相对来说较少。我不喜欢人多的地方,所以我选择去这两个地方。
师:第二个问题,如果你在南京经营一家土特产店,看了本段视频后,你将会对店里的商品搭配比例做怎样的调整?为什么?
生:我会以视频中南京土特产受欢迎的排名情况为依据调整商品搭配的比例。因为排名靠前的大概率会卖得更好,排名靠后的大概率卖得会差一些。
师:我很赞同你的观点!不管是第一个选择景点的问题还是第二个调整土特产店商品搭配比例的问题,同学们实际上都是根据既往大数据呈现的结果做了一个分析,对未来会发生的事情做了一个什么?
生:推测!
师:大数据分析的核心目的就是预测。我们接着看下一个问题,观察百度指数搜索关键词“鸡鸣寺”,通过观察与分析,给出一些你认为合理的推测。(教师打开百度指数首页,输入搜索关键词“鸡鸣寺”。教师将光标从趋势线上缓慢移动,提示学生趋势线升降与周末之间的关系)
生:根据我的观察,每到周末搜索“鸡鸣寺”的量显著增加,平常的搜索量相对减少,结合最近的新闻报道每到周末鸡鸣寺人满为患。并且最近一个月对鸡鸣寺的搜索量呈上升趋势,所以我预测这个周末鸡鸣寺依然会人声鼎沸。建议怕拥挤的人就不要周末去鸡鸣寺了。
师:非常好!这位同学根据大数据显示的趋势线,结合新闻报道对本周末鸡鸣寺游览人员数量做出了推测,推测得到底对不对,同学们可以实地考察验证一下。我个人的观点是,推测的内容是准确的。
推测是大数据分析的核心目的。怎样使学生理解并认同这一观点?最重要的是学生可以从身边发生的事中得到验证,进而体验大数据的力量。
在教学片段三中,笔者将体验大数据的力量分成了两个层级。
第一层级是学生观看“抖音南京大数据报告”视频得到与南京旅游相关的数据统计结果后,从两种角色的角度出发对获取的数据进行利用,开展基于數据的推测。此处设计蕴含了数据来源的可靠性、数据的组织与呈现的多样性以及数据对现代社会的意义。学生在回答问题的过程中受到视频中数据的影响,不由自主地进行推测。
第二层级是学生通过阅读百度指数搜索“鸡鸣寺”后的图表,观察搜索量随日期变化而出现的趋势性变化。在这一问题中,数据的呈现方式发生了改变,需要的信息没有直接出现,学生要通过具体的分析才能给出推测。此部分锻炼学生读懂并发掘图表中相应信息的能力,同时帮助学生感受数据对现代社会的意义。