Python 课程在数据科学与大数据技术专业中的地位和作用

2020-12-08 09:30米伟娟
魅力中国 2020年21期
关键词:编程语言编程框架

米伟娟

(河北传媒学院信息技术与文化管理学院,河北 石家庄 051430)

一、Python 语言的发展历史

Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言,是由Guido van Rossum 在80 年代末至90 年代初,在Netherlands National Institute of Mathematics and Computer Science 设计出来的。这门语言自己也吸收了很多不同编程语言的精华,包括ABC、Modula-3、C、C++、Algol-68、SmallTalk、Unix shell和其他的脚本语言等等,发展到现在,Python以其优美、清晰、简单的特性在全世界内广泛流行,成为最主流的编程语言之一。截止2019 年6 月,Python 在TIOBE 流行编程语言排行榜中的排名已经上升到第三名,创下了新纪录,使用率达到8.530%,超过C++的7.384%。TIOBE 表示,Python 之所以排名快速上升,是因为软件工程正在蓬勃发展,而Python 作为一门简洁而有效的编程语言吸引了很多新手进入开发领域。它在过去5 年中采用率增长最多,达到了17.6%,并且还在呈增长趋势。

二、Python 语言的特点与应用

(一)Python 语言的特点

第一,Python 语言的关键词比较简洁,因此框架基础,规则十分清晰,使用时十分方便。第二,Python 语言程序行注释很明了,因此能够轻松阅读。第三,Python 语言的广泛传播的主要原因是后台数据是易于使用且修改的。第四,Python语言支持引入部分C/C++语言,使用户可以随心而用。第五,Python 语言的具备多种内库,并且支持连接外库,在UNIX、Windows和Macintosh都有其适配的版本。第六,易于调试,支持放入设定好的条件并给出程序结果,同时支持多次性能试验和运行部分程序。第七,因为Python 语言有开放的github 等平台,可以在其他相似的项目中直接引用。第八,在Python 程序中可以直接调用C 或C++完成编程,从而可以保证关键算法的私密性。第九,Python 可以直接接入许多主流商业DB,使用其数据。第十,Python 可以GUI 编程,能够在许多版本直接写入和引调。

(二)Python 语言的应用

经过十几年的发展,Python 语言的被广泛的应用在许多学科,如Web 应用开发、自动化运维、深度学习、网站爬虫、科学计算和游戏开发等方面。其最主要的应用是在三方面:Web 应用开发、人工智能、自动化运维。

在Web 应用开发方面,随着Python 语言的Web 开发框架逐渐成熟(例如Django、Flask、TurboGears、web2py 等等),常见的开发库Django 和Flask 主要用来搭建网页框架,程序员可以更简洁地开发和管理复杂的Web 程序。例如谷歌的搜索引擎是用Python 语言构建框架,国内的豆瓣也是用Python 语言搭建的框架,此外例如Youtube、百度、新浪、搜狐、腾讯、阿里、网易、淘宝、知乎、豆瓣、汽车之家、美团等等许多大中型互联网企业都在使用Python 语言完成各种各样的架构模式。

在深度学习方面,深度学习发展的基础是大数据分析和机器的神经网络算法,而Python 语言在这个区域的利用最为丰富。网络爬虫属于数据挖掘类别的方向,爬虫方向有urllib、Selenium、BeautifulSoup等多种工具库,及其scrapy整体架构;数据分析方向(含科学计算)包括NumPy、SciPy、Matplotlib、pandas 等功能强大的库,因此可以很轻松的完成大数据所需要的计算分析,数据分析因此成为Python语言的主要应用方向;机器学习方向,世界上许多最优秀的人工智能学习框架是由Python 语言编程实现的,例如 Google 的TensorFlow(神经网络框架)、FaceBook的PyTorch(神经网络框架)以及开源社区的Karas 神经网络库和scikit-learn 等。除此之外。还有多模态生物识别、自动应答与推荐、物网结合等方面的引入。深度学习领域的热门使Python 语言的地位占据先列。

在自动化运维方面,需要的是能够执行简单任务自动化的小程序,而非功能复杂的大型程序。其体现的是编制脚本的功效,因此Python 语言因其相对简单的语法和易于编写的特性被因运维工程师所青睐。

三、Python 在数据科学与大数据技术专业内的应用

数据科学与大数据技术专业,简称数据科学或大数据,旨在培养具有大数据思维、运用大数据思维及分析应用技术的高层次大数据人才。掌握计算机理论和大数据处理技术,从大数据应用的三个主要层面(即数据管理、系统开发、海量数据分析与挖掘)系统地培养学生掌握大数据应用中的各种典型问题的解决办法,有效提升学生处理实际题目的速度,具有将领域知识与设计算法的能力和大数据技术融合、创新的素质,能够从事大数据研究和开发应用的高层次复合型人才。目前,数据科学与大数据技术专业属于交叉学科,以统计学、数学、计算机为三大支撑性学科;生物、医学、环境科学、社会学等为应用拓展性学科。此外还需学习数据采集、分析、处理软件,学习数学建模软件及计算机编程语言等,知识结构是二专多能复合的跨界人才。

Python 课程应设置为数据科学与大数据技术专业一门主要课程,因为Python在处理大量数据时具有高效率、自动化、可运用算法建立数据模型等特点。在计算量有限时,表格和Python 的计算维度相似,在当计算量较大或者引入较多复杂公式时,表格就会变得很慢,Python 对于复杂计算的运行时间或迭代次数会明显低于表格。Python 具备程序编写所需要的所有条件,因此对于大数据也十分适用,数据分析编程包含的引入数据库、构建图表、建立算法模型等,在Python 中都有相应的部分与之对应,可以直接调用。

四、提高Python 语言教育质量的好处

就学生而言,可以学习到Python 编程培训对其理解从基础语法到完整分布式编程有着剧组亲中的作用,对于目标的思路和编程的起承转合流程的方法会有自己独特的思考。Python 语言的教育好比是为了构建出每个人编程知识树的主干,每遇到新的问题都可以用已有的编程语言知识消化吸收。若有困惑,可通过网络或老师等途径答疑解惑,使认知能力更上一层楼,从而使书本上的知识真正转化为自己的能力,日积月累,语句的编写越来越迅捷,规范性强并逻辑清晰,框架完整,学生逐渐可以做到熟能生巧,将不同的语言潜移默化的理解到位。之后可以将所学的内容在实际项目里实践使用,查缺补漏,逐渐成为一名优秀的程序设计师。

随着科技产业发展持续简洁化、高科技化,其依赖的底层设计必然越来越完整化、细化,同时基础程序的高性能、高兼容、低崩溃就成了对每一个合格程序员的新要求。因此程序员的选拔与考核标准都会更为严苛,淘汰率也会更高。所以,中国的计算机专业的大学生应在学生时代就基本具备一个合格的程序员的能力,对编程培养兴趣与热爱,从而自发地不断提高编程水平,并以之为终生目标,每个新生带力量的强大即为国家、社会未来的强大。一随之而来的是软实力的质变,因为基数和兴趣都得到提升,一定会同时酝酿新技术的革新,从而激发创造力的喷发。综上所述,在高校完成合格的Python 编程培训能够从个人到国家都受到益处,切实落实科教兴国的方针政策。在当今社会,人工智能和深度学习盛行,为了不落后于行业平均水平,将数据化变革引入企业已经成为新的热门趋势,这给很多软件创新带来新的机遇,学生必须具备与之相匹配的能力,如可以建立行业专用数据库和运算库等专属编程框架,将至引入github 平台,使其他行业从业者也可方便调用,从而以一点带动整个行业进步与发展。这支持了许多行业的改革换代与加速发展,这些行业的发展会加速社会市场经济的发展,从而对数据分析行业带来正反馈,加速整体社会结构的高科技化转型。

五、结语

去年上半年,一篇教育部下发的《2018 年度普通高等学校本科专业备案和审批结果的通知》显示,人工智能专业至此正式进入本科专业范围,全国共有35 所高校获首批建设资格。人工智能专业内的Python 课程,工程方向注重的是封装细节提升开发效率,而底层方向注重的是暴露细节提升运行效率。显然,程序设计这种注重编程思想以及可维护性的课,引入Python 更合适。深度学习、物网结合、数据分析等编程热门领域的核心与地基都编程语言,因此对于各类计算机语言的低龄化培养显得更为必要。Python 课程在数据科学与大数据技术专业中的引入具有重要意义。

猜你喜欢
编程语言编程框架
基于对计算机软件Java编程及应用的分析
基于JavaScript编程语言之 闭包技术在焦点轮播上的应用
有机框架材料的后合成交换
框架
编程,是一种态度
元征X-431实测:奔驰发动机编程
编程小能手
纺织机上诞生的编程
基于计算机应用软件开发的Java编程语言研究
计算机应用软件开发中编程语言的选取