钟琪 朱顺安
[摘 要]面对日益庞大的互联网数据,企业已经不满足于仅仅对数据库进行存储管理,更希望海量数据以一种更加直观、易懂的图表形式呈现,生成商业智能解决方案,帮助决策者分析和推断。而今高等院校数据库课程的教学方式已无法满足市场最新发展需求。将数据可视化技术和工具融入数据库课程教学,能够使学生掌握更丰富、更多维度的数据展示、交互方式,提升实践能力,为商业智能发展助力。
[关键词]数据库;数据可视化;商业智能;课程教学
[中图分类号] G642.3 [文献标识码] A [文章编号] 2095-3437(2023)04-0028-03
商业智能是指用现代的存储、处理、挖掘、展现技术进行数据分析,以实现商业价值。随着大数据时代的到来,对数据进行分析和处理成为迫切需要,数据分析师成为统计学、应用数学、计算机等专业毕业生就业的热门职业之一,其岗位供不应求。数据分析师的岗位职责是对海量数据进行分析挖掘,从而得到有利的信息以推动生产,利用分析的结果预测出将来会发生某种事件的可能性,帮助决策者找到产业未来发展的方向。
一、高等院校数据库课程教学现状
数据库技术是数据管理的技术,是计算机信息系统与应用系统的核心技术和重要基础[1]。运用好数据库技术能够确保计算机信息处理过程中的大量数据得到有效组织和共享。高等院校计算机相关专业和对数据依赖度高的专业普遍会开设此课程,其覆盖面广。现有的数据库课程主要涵盖数据模型、数据库系统结构、关系数据库、SQL语言、数据库安全性、数据库完整性、关系数据库设计理论、数据库设计等内容,学生掌握了数据库技术的基本原理和应用技术后,结合当今网站建设技术、软件工程知识可设计出功能完善的数据库应用系统。其教学内容一般是以关系数据库即二维表的存储方式为主线。实验操作的数据库管理系统软件以MySQL、Oracle、SQL Server居多,需用SQL语言包括DDL(数据定义语言)、DML(数据操纵语言)、DCL(数据控制语言)三种类型的语言,完成基本的操作命令,并辅以存储过程、触发器等过程化SQL语言的实践操作。在关系数据库中,数据的呈现是以关系二维表的形式,常借助客户端软件(如SQL Developer、Navicat等)展示基本表或视图中的数据。但此方式下的数据仅表示为数值或字符的形式,一行数据为一条记录,看不出数据局部与全局的比例关系,无法进行大小值的比较,更无法得知数据的趋势变化,不便于对数据进行深入分析和观察。
近几年,数据的形式更为多变(有图像、音频、视频等),数据量也呈指数式增长。传统的关系数据库在处理海量非结构化数据时暴露出许多管理、并发、扩展等方面的问题,于是非关系数据库(Not Only SQL、 NoSQL)迅速发展,它在非结构化数据及半结构化数据方面有明显的优势。因此,部分高等院校的数据库系列课程增设了非关系数据库的内容[2-3]。此时,学生对海量数据进行直观、易懂、易于查找分析的可视化展现技能的需求更加迫切,而目前数据库课程教学大纲未涵盖此方面的内容。
二、数据可视化技术和工具
数据可视化技术是利用计算机图形学和图像处理技术,将数据转换成图形或图像在屏幕上显示出来并进行交互处理的理论、方法和技术[4]。它涉及计算机图形学、图像处理、计算机视觉、计算机辅助设计等多个领域,成为研究数据表示、数据处理、决策分析等一系列问题的综合技术。数据可视化过程可分为以下7个步骤 [5]:(1)获取。收集包括数据库的表、文字记录、网络上的源文件、录像记录等数据。数据的获取有时会采取网页抓取的方式, 需用一定的网络爬虫技术。(2)分析。根据数据的语义构造一个结构分类图,并按不同的分类排序。(3)过滤。删除冗余数据,对数据进行整合、清洗,保留感兴趣、有价值的数据。(4)挖掘。运用统计学或数据挖掘中的方法,挖掘数据背后潜在的规律。(5)表述。选择一种视觉模型如条形图、饼状图、列表或树状结构图等进行展示。(6)修饰。优化基本的表述方法,使它变得更加清晰、视觉化、直观化。(7)交互。增加方法来操作数据或控制其可见的特性,实现交互选择性。
随着信息技术的发展,数据可视化的详细流程逐渐“黑箱化”,先进的可视化工具可帮助实现从数据获取到图形输出的“一条龙”服务。企业原始数据作为数据库管理系统处理的主要对象, 最终是以报表的形式提供给用户及决策者的。企业通常使用可视化的报表设计器来简化报表设计,目的是提高软件开发的效率和可重用性。因此,数据可视化过程中的第2步到第7步都可以在报表设计器中完成。笔者在教学改革中选用了FineReport报表生成器作为可视化软件。FineReport是一款集数据展示(报表)和数据录入(表单)功能于一身、用来辅助软件开发的工具软件,具有界面操作方便、支持主流的B/S架构与传统的C/S架构、部署方式灵活等特点,是国内企业主流的报表生成器软件之一。配置FineReport软件对设备性能要求不高,普通的PC机即可。考虑到FineReport独立部署的应用场景,在机器上还需配置tomcat应用服务器,此配置对于高等院校普通机房的条件来说都是可行的。
三、數据库课程与可视化技术融合的教学改革
(一)教学大纲修订
数据库课程教学需注重培养学生的实验动手能力,因此,厦门理工学院相关专业开设了数据库原理与应用课程和数据库应用编程实践课程,前者为理论与实验相结合的专业必修课,后者为数据库课程的课程设计。学生根据数据库设计流程和软件开发知识对实际应用系统进行数据库设计与平台开发。笔者在数据库原理与应用课程教学改革中,将原来的数据库编程章节的理论教学调整为线上自学,空出来的课时在原实验的数据库应用场景下增设了关于FineReport核心功能的3个实验,分别对应动态交互式表格、饼状图和柱状图3种重要的报表数据可视化方式;而在数据库应用编程实践课程教学改革中则设计应用系统界面部分的任务要求,在原有二维表增删改查的基础上加入了FineReport的报表数据分析展示。
(二)教学内容改革实施方案
1.在数据库原理与应用课程中增设教学重点
数据库原理与应用课程的实验成绩占总成绩的30%,本次教学改革在原实验的基础上加入了FineReport的报表制作,使学生能在FineReport中熟练应用数据库技术设计报表,完成数据的多种图形化交互展示。FineReport通过整合多源数据,并支持跨数据库跨数据表取数,还能用于复杂报表的展示。在FineReport中连接数据源后,可使用SQL语句查询生成数据源,再通过类似Excel表格的设计器拖拽字段至单元格,即可将字段与单元格进行绑定,完成二维表展示,然后通过样式设计、参数设置和图表显示设定制作成一张实时的图形化报表。FineReport制作报表的流程如图1所示。
设计实验教学方案时,为提高学生的学习兴趣,笔者将实验内容设定为图书城这一应用背景,要求对图书城数据库的数据进行可视化统计分析,以解决相关实际问题。图书城关系数据库包含Books、Customers、Purchases和Pricing4个表,分别记录图书城的图书信息、客户信息、购买信息与书价信息。表2列出了每张表包含的属性及完整性约束。实验项目1的任务为熟悉FineReport软件菜单,了解cpt与frm这2种报表文件的不同之处。学生需将FineReport与Oracle或MySQL数据库建立连接,用SQL语句建立数据源,用动态交互式表格展示图书城所有图书的详细信息(包含价格信息,此处需用SQL语句完成Books和Pricing这2张表的连接查询)。实验项目2的任务是学习建立frm格式报表,用表格显示图书分类情况。在此之前,先用SQL语句统计各类图书的数量,再完成数据与表格的绑定,并在frm格式报表上用饼状图展示各类图书的占比。实验项目3要求用表格展示图书城每年的销售额情况,并动态计算增长率数据,再用柱状图展示以上销售额的变化后分析销售趋势。通过上述3个实验的设置,学生可运用FineReport报表生成器实现对数据的动态交互式表格、饼状图和柱状图这3种可视化分析方法的掌握。
此外,由于报表设计器实验初次被纳入课堂教学,没有实验指导书可参考,因此,学生往往这样开展学习:通过FineReport软件的教学视频自学软件操作,边看边做,巩固知识点;做实验时常参考软件的用户说明书以找到所需资源;遇到问题时,除了请教老师,还会在FineReport论坛中找相似问题的解决方法,或在论坛中求助。通过上述方式,学生的自主学习能力、解决问题的能力都得到了锻炼。
2.在数据库应用编程实践课程设计中添加数据分析模块的考核
用FineReport制成的报表为js、jsp和html代码的集合,可独立用来做数据分析,也可嵌入到其他应用系统的前端代码中作为界面的一部分,这样可缩短前端开发时长和降低代码复杂度。因此,FineReport设计出的报表通過独立部署的方式可与应用系统融为一体,以超链接的形式嵌入到前端界面中,作为网站数据展示的一部分。基于此,可将报表分析融入数据库的课程设计中。
原来的数据库应用编程实践课程设计每周有30学时,要求学生以小组为单位完成某市房地产交易数据管理的数据库设计与平台开发,包括需求分析、概念模型设计、逻辑模型设计、完整性设计、规范化设计、权限管理设计、数据库SQL语言实施、界面设计8个部分,系统需实现用户登录及多个二维表的增删改查功能。在完成以上任务的基础上,本次教学改革删减了部分表的数据操作界面,因考查的知识点重复,进而增设了数据分析模块,要求对房地产交易数据进行交易面积、地区、经纪公司、价格等多个维度的分析,利用FineReport报表生成器与数据库建立连接,生成各维度的动态图形,在网站中用左侧菜单树的方式链接显示报表的可视化分析结果。
该课程设计的数据是从网站抓取而来,仅包含每次房地产交易的记录,并不包含统计分析信息。学生将抓取到的数据进行清洗后,按指定的属性域导入到设计好的数据库基本表中,接着用SQL语句完成数据的各项统计后生成多个视图,将视图数据作为FineReport的数据源设计出报表。在最终成绩的评定中,界面部分占30%,可视化分析占20%,二者属于界面展示的重点考核内容。
此课程设计可作为数据库技术与可视化技术整合的巩固和提升,完成该项任务后,学生能够基本掌握数据获取、存储、分析及图形展示方法,模拟演练整个数据可视化过程。
四、本次教学改革的初步成效
从学生的实验完成情况来看,95%的学生较好地完成了数据库原理与应用课程的3个数据可视化实验项目,可以熟练掌握FineReport软件的基本操作,他们对数据库SQL语句运用的能力有了很好的提升。学生评价该门课程教学质量的分数也达到了97.76(总分100)。值得一提的是,笔者的授课班级有11名学生(共47名)通过了计算机三级(数据库)的考试,这也是历年之最,说明学生对数据库的学习有兴趣并熟练掌握了课程知识。在以小组为单位的数据库课程设计中有13个小组实现了对FineReport的独立部署,将数据的可视化分析融入Javaweb的项目中,其中大概有1/3的小组设计出的数据报表界面友好美观,达到了优秀等级。有了一定的FineReport基本技能后,班级中有3名学生应聘到数据分析公司实习,参与公司数据库及报表设计工作,最终有2名学生被公司正式录用;毕业后有另外3名学生也应聘到数据分析师的岗位。从以上结果可看出,学生将FineReport的技能很好地运用到了实际应用中,也可看出本次教学改革对于培养学生理论联系实际的能力有较好的成效。
五、结语
本次教学改革与厦门理工学院建设应用型本科高校、为产业服务的办学理念相契合,通过完善学生的知识体系,提升其技能,使其更好地与企业需求接轨。但由于本专业目前开设的课程未涉及大数据的基础知识和技术,数据可视化分析的教学仅限于关系数据库,数据量少,因此尚未推广到海量数据背景下非关系数据库与可视化技术的融合,有一定的局限性,可作为今后改进的方向。本文提出的数据库课程与可视化技术融合的改革方向也可为其他高等院校同类课程的教学提供参考。
[ 参 考 文 献 ]
[1] 王珊,萨师煊. 数据库系统概论[M].5版.北京:高等教育出版社,2014.
[2] 薛伟.软件工程专业数据库课程教学改革探究[J]. 安徽工业大学学报(社会科学版),2021,38(2):67-68.
[3] 冯霞.高职院校大数据方向数据库课程体系及教学模式的改革与探索[J]. 电脑知识与技术,2021,17(9):101-102.
[4] 唐荣锡,汪嘉业,彭群生,等. 计算机图形学教程[M]. 修订版.北京: 科学出版社, 2000.
[5] 谭坤,杨亚楠. 数据可视化技术的研究现状探究:基于社会网络分析视角[J]. 价值工程, 2018,37(36): 215-216.
[责任编辑:庞丹丹]