尹帮治
关键词:大数据技术;专业核心课程;解释结构模型;层次关系构建
0 引言
大数据技术的使用在各个领域迅速扩展,寻求有效的方法来设计专业核心课程体系结构,显得非常重要。高等职业院校大数据技术专业的课程体系结构可以通过各种方法来确定,如行业咨询、课程基准、基于研究的方法和教师专业知识[1]。咨询行业专家可以使课程体系结构符合行业要求,学生为就业做了更好的准备。但这种方法可能会导致狭隘地关注当前的行业需求,随着时间的推移,这可能会变得过时。课程基准是将各高校的教学计划进行比较,在必要时进行调整。这种方法可能导致大学之间缺乏差异,并且可能没有考虑到特定机构的独特优势和重点。基于研究的方法是高校根据与大数据技术相关的现有研究和出版物来设计课程体系结构。这种方法的优势在于它将课程建立在最新的学术研究之上,但是缺点是这种方法可能没有考虑到大数据技术在行业中的实际应用。依靠教师的专业知识和经验来定制课程体系结构,可以成为高校吸引学生的竞争优势,但这可能无法反映大数据技术领域更广泛的要求。
本文将上述方法有效地结合起来,充分利用每一种方法的优点,采用解释结构建模(ISM) ,科学设计高等职业院校大数据技术专业核心课程的层次结构图,强调多学科课程的重要性,反映最新的学术研究、行业趋势和实际应用,同时保持灵活性并适应该领域不断变化的需求。
1 大数据技术专业核心课程识别
识别大数据技术专业包含的核心课程对于学生选择专业以及在专业中学习和发展都具有重要意义。首先,了解核心课程有助于学生建立起全面深入的大数据技术知识体系,把握大数据技术的主要应用领域和发展趋势。其次,核心课程还涵盖了大数据技术的各种基础和重要的应用技术,如大数据处理、数据挖掘、机器学习等,这些技术在实际工作中都有广泛的应用和需求。最后,了解大数据技术专业包含的核心课程还有助于学生在今后的职业生涯中为自己制定学习和发展计划,更好地适应职业发展的需要。
从国内的研究文献来看,主要分为本科层次和专科层次的大数据教育。在本科层次中,贺文武博士设计的数据科学与大数据技术专业课程体系中,主干课程包含了机器学习、数据可视化、并行与分布式计算等课程[2]。中南大学数据科学与大数据专业主要课程包含了数据挖掘与分析、大型数据库技术及应用,数据安全等课程。福建工程学院数据科学与大数据专业主要课程包含了机器学习与模式识别、时间序列分析、数据挖掘等课程。在专科层次中,从潘梅勇教授设计的课程体系中可以看出,高职大数据技术与应用专业核心课程包含了数据库应用技术、Hadoop实用技术、数据可视化技术等课程[3]。李建平老师指出,大数据技术与应用专业课程应涉及数学、统计学、计算机科学等领域[4],大数据技术与应用专业核心课程建设除了要重视理论知识外,还要重视实践技术。
国外的研究文献主要包括大学教育、行业资讯和专著出版物。在大学教育中,Wadhwa和Krishnamur?thy 提出了一套指导原则和经验教训,用于设计大数据课程,为学生在该领域的未来职业生涯做准备。指导原则来自对现有课程的审查、对行业专家的调查以及来自教师和学生的反馈[5]。Gehringer提出了数据科学专业的课程设计框架[6]。该框架包括一套数据科学毕业生应具备的核心能力,以及一套可供学生根据兴趣和职业目标选择的选修课程。该框架旨在灵活适应不同机构的需求,同时仍然提供一致和全面的数据科学教育。
综上所述,数据建模可以使学生掌握大数据的基础理论知识和数据架构设计方法,从而能够将大数据理论应用到实际的数据分析和处理中。数据库系统课程使学生掌握数据库系统的基本原理和技术,掌握数据库设计和管理技术。数据可视化能够培养学生对数据加工和可视化的能力,使其能够从数据中挖掘出信息和知识。统计分析培养学生对探索性数据分析、统计分析和数据建模的能力,为数据分析和决策提供科学支持。机器学习课程是培养学生应用机器学习方法解决大数据分析问题、构建机器学习实践项目的必修课程。分布式数据处理课程是培养学生理解分布式计算的理念和机制,掌握分布式计算平台的原理和使用方法,提高学生大规模数据命令的能力。数据安全是大数据时代面临的重要议题,数据安全课程是培养学生对大数据可信和安全行为的认识和掌握,增強学生的大数据安全意识。数据挖掘培养学生填补大数据领域各种知识间断的人才,掌握大数据分析整体思路及熟悉算法,能够应对大数据领域的多元场景要求。因此,选择上述8门课程作为数据技术专业的核心课程是科学的,这些课程的设置可以让学生全面、深入、系统地了解大数据技术专业相关知识和技术,为学生的学习和未来的职业发展提供了必要的保障。
2 解释结构建模(ISM)
解释结构模型(Interpretative Structural Modeling,ISM) 是由Gregory H. Watson于1982年首次提出的一种处理复杂战略规划问题的方法,用于识别系统或问题的不同组件之间的复杂关系。 它包括将一个复杂的系统或问题分解成更小的子系统或组件,并创建一个层次结构来表示这些组件之间的关系。然后,使用该结构来理解系统或问题的组件如何相互作用,并识别影响系统的整体行为和动态的关键驱动因素和依赖因素。
解释结构模型(ISM) 方法可以作为一种有效的工具,用于确定专业领域中核心专业课程的顺序。通过使用ISM,有可能确定不同课程之间的关系,并确定在给定顺序中影响其重要性的关键驱动因素。 特别是,ISM可以帮助确定构成专业领域基础的核心课程,以及它们相对于其他课程的相对重要性。它可以揭示不同课程之间的依赖关系,以及它们如何有助于学生知识和技能的发展。然后,这些信息可用于设计结构良好的课程,并与该计划的学习目标保持最佳一致。 此外,ISM可以帮助识别不同课程之间的潜在冲突或权衡,并提供如何解决它们的见解。它还可以帮助根据课程对专业实践的影响或它们对实现学习目标的贡献程度来确定课程的优先顺序。
3 专业核心课程层次关系ISM 模型构建
ISM模型一般遵循四个步骤:研究问题的目标抽象确定模型中的要素及其关系,并生成邻接矩阵;对邻接矩阵进行相乘操作,得到可达矩阵,必要时进行多次自乘,直至矩阵不再发生变化;基于可达矩阵进行模型层级分解,形成模型层次结构,通常最上层为系统目标,下面的各层则为上一层因素;划分完层次后,使用有向连接图更直观地表示模型的层次结构。
3.1 确定课程关系邻接矩阵
为了方便讨论,将8门核心专业课程标记如下:C1为数据建模、C2为数据库系统、C3为数据可视化、C4为统计分析、C5为机器学习、C6为分布式数据处理、C7为数据安全、C8为数据挖掘。通过与企业专家、高校专业教师和已毕业的相关学生进行访谈,明确各课程之间的逻辑关系(学生学习课程的优先顺序关系),生成邻接矩阵 A,如式(1) 所示。矩阵A 中,当Ci对Cj有直接优先顺序关系,则元素aij=1,否则aij=0。
3.2 求解可达矩阵
若M=(A+I)n = (A+I)n-1则M=(A+I)n
利用上述方法,根据邻接矩阵A,利用Python编程语言,可求得可达矩阵M=(A+I)4,如式(2) 。
3.3 可达集合与先行集合的抽取过程
可达集合定义为式(3) ,先行集合定义为式(4) 。
若P (c ) i ∩ Q(c ) j = P (c ) i 则Ci 为当前最高级要素。可达集合与先行集合的初始状态如表1所示。从表1可以得出:L1={C5}。
根据表1,对可达集合与先行集合进行第1次抽取后,得到的结果如表2所示。从表2可以得出:L2 ={C8}。
根据表2,对可达集合与先行集合进行第2次抽取后,得到的结果如表3所示。从表3可以得出:L3={C1 ,C4 ,C7}。
根据表3,对可达集合与先行集合进行第3次抽取后,得到的结果如表4所示。从表4可以得出:L4={C3 ,C6 }。
根据表4,对可达集合与先行集合进行第4次抽取后,得到的结果如表5所示。从表5可以得出:L5={C2 }。
最后得到核心课程层级表,如表6所示。
4 课程层次关系分析
大数据技术专业核心课程层次关系如图1所示。
第一层的课程是数据库系统,可安排在第一学期。数据库是用于存储、管理和处理大量数据的软件系统,是大数据技术不可或缺的基础。Hadoop、Spark等大数据技术都依赖于数据库系统,而这些大数据技术也被广泛应用于数据挖掘、机器学习等领域。数据库系统提供了大量的数据处理和管理功能,如查询、索引、事务管理、并发控制、安全控制等,这些功能对于处理和管理大量的数据必不可少。因此,数据库系统作为大数据技术的基础,是大数据技术专业最基础的课程之一,需要最先开始学习。掌握数据库系统的知识和技能,有助于学生更好地应对大规模数据的处理和管理。
第二层的课程包含分布式数据处理、数据可视化,这两门课程可以安排在第二学期。其中分布式数据处理的前导课程是数据库系统。分布式数据处理建立在数据库知识之上。学生需要掌握数据库的基本原理和知识,能够快速编写SQL查询语言,以及实际上手操作数据库,这些都是分布式数据处理所需要的技能和知识。另外,数据库系统还提供了诸如索引、事务、完整性控制和并发控制等重要的功能,这些功能也是分布式数据处理所依赖的。通过学习数据库系统,学生可以掌握这些重要的功能和技能,有助于学习分布式系统的设计和开发。
第三层的课程包含数据建模、统计分析、数据安全,这三门课可以同时安排在第三学期。其中,统计分析的前导课程是分布式数据处理、数据可视化,数据安全的前导课程是数据库系统。对于统计分析而言,分布式数据处理和数据可视化是必不可少的工具和技术。分布式数据处理可以协助学生处理大量数据,通过并行计算实现数据的快速处理和分析;而数据可视化则可以帮助学生更好地理解数据,从而提高分析的准确性和可靠性。对于数据安全,其中一个核心部分是数据库系统。数据库系统是数据安全的基础,因为大多数应用程序需要与数据库打交道。学生需要了解关系型数据库,掌握SQL查询语言以及防范SQL注入等攻击。
第四层的课程是数据挖掘,需要先修讀数据建模、统计分析、数据安全、数据可视化,可安排在第四学期。数据挖掘是一个涉及多个学科领域的综合性任务,需要很多专业知识来支持。数据建模能帮助人们了解数据是如何构成的,以及如何进行数据清洗和预处理;统计分析能够帮助人们处理大量的数据并从中提取有价值的信息;数据安全能够帮助人们保护数据的安全性,防止未经授权的访问或滥用;数据可视化能够帮助人们以图形化的方式展现数据,更直观地理解数据的内涵。所以,修读这些课程将有助于人们建立一种全面的数据挖掘理解和方法,从而更好地进行数据挖掘工作。
第五层的课程是机器学习,需要先修读数据挖掘、统计分析、数据建模,可安排在第五学期。现代大数据技术趋向于自动化和智能化,机器学习技术可以在海量数据中发现规律和模式,为大数据技术的应用提供支持。机器学习可以促进大数据处理中的数据预处理、特征提取和分类任务等,提高大数据生成的价值,减少对人工处理的依赖。大数据技术的发展离不开数据挖掘、数据分析等相关领域的知识,机器学习作为数据挖掘和数据分析的重要工具,可以帮助学生更好地理解和运用这些领域的知识。同时,学习机器学习课程需要具备一定的数学、统计学和计算机科学基础。如果没有良好的数据挖掘、统计分析和数据建模的基础,学习机器学习课程会相对困难,可能会对机器学习的深入理解和应用产生影响。
5 结束语
从引入ISM模型到递阶结构的建立,专业核心课程体系结构的设计是高等职业院校大数据技术专业建设的重要内容。而ISM模型为专业课程建设提供了方法指导,并通过分析课程间的关系,优化教学计划、排布教学进度等方面提供了有效方法。这一过程中,理论的支持与现实系统的运作吻合,为课程体系优化提供了更加可靠的基础。