Python在概率论与数理统计教学中的应用案例研究

2022-11-22 02:20王永娟姜喜春谢兵兵
黑河学院学报 2022年9期
关键词:概率密度函数置信区间数理统计

王永娟 姜喜春 谢兵兵

(黑河学院 理学院,黑龙江 黑河 164300)

随着科学技术的发展和社会现代化的推进,社会对大数据科学的研究与应用型人才的需求与日俱增。概率论与数理统计是统计学和数据挖掘的理论基础,在大数据专业中显得尤为重要。大数据的价值体现在其蕴含的规律,对数据处理、分析离不开统计学和数据挖掘,而其原理和方法基于概率论与数理统计。Python软件作为大数据分析的主流软件,具有简洁、可读性强、易于操作等特点,是每个大数据专业学生必须掌握的软件之一。那如何将Python软件引入到概率论与数理统计的教学过程中,使学生既理解了概率论与数理统计的理论,又掌握了Python软件的应用呢?本文从三个方面探讨Python在概率论与数理统计教学中的应用案例,旨在激发学生的学习积极性,提高课堂教学质量,为培养大数据人才提供一定的参考。

一、Python在f分布图像上的应用

定义[1]:设且X与Y相互独立,称随机变量

的分布为具有(m,n)的F分布,记F~F(m,n)

自由度为(m,n)的F分布的概率密度函数为

在教学过程中发现,F分布的概率密度函数比较抽象,学生理解起来比较困难,所以利用python软件画出不同自由度下F分布的图像[2],如图1所示,帮助学生掌握F分布中两个自由度对函数图像的影响。

从图1可以看出,F分布图像是非对称分布,自由度m和n是有顺序的,不同的自由度图像的偏度不同。同时,将代码展示给学生,加深对Python中scipy库内F分布概率密度函数f.pdf()的以及matplotlib库内绘图函数的使用,图像上显示中文、负数等方法的理解。

图1 F分布图像

二、Python在点估计中的应用

在概率论与数理统计中点估计有两种常见的方法:矩估计法和极大似然估计法,在理解两种方法原理的情况下,应用原理进行推导计算,得到公式带入数据进行计算计算,过程相对复杂[3]。对于大数据专业的学生,因为已经有一定的python基础,可以应用python软件进行计算。

程序中蕴含矩估计表达式,结合相应函数,程序本身也能加深对矩估计法的理解,同时学生在遇到类似的问题,只需要把原始数据替换,即可求得相应的矩估计值,简化计算。

三、Python在区间估计中的应用

以正态总体均值的区间估计为例,在总体方差已知和未知两种情况下分别进行讨论,相比较带公式计算,用python代码运行更加简便。

1.总体标准差已知情况下

例2:20世纪末,某高校对50名大学生的午餐费进行调查,得到样本均值为3.10元,假设总体的标准差为1.75元,是求总体均值(即该校大学生的平均午餐费)的0.95的置信区间。

代入公式即可求得置信区间,调用python运行如下[4]:

2.总体标准差未知情况下(小样本)

例3:2005年某市某行业职工的月收入服从N(μσ2),现随机抽取30名职工进行调查,求得他们的月收入的平均值2084元,标准差元,试求的置信水平为0.95的置信区间。

代入公式即可求得置信区间,调用python运行如下:

3.置信区间图像

在给定均值和方差的条件下,利用np.random.normal()函数生成服从正态分布数据,利用st.t.interval()计算出置信区间[6],并画出图形如图2所示。

图2 正态均值置信区间

从图像中可以清晰看出,正态数据与置信区间的包含关系,帮助学生理解置信区间的含义。

四、结语

概率论与数理统计中的一些定理与大数据专业中的软件相结合[7],不但可以提高运算速度,更重要的是可以生动形象地演示复杂定理的变化过程,揭示其内在规律,从而激发学生的学习兴趣。Python语言是数据科学与大数据技术领域主要应用语言之一,因为Python在处理大量数据时具有高效率、自动化、可运用算法建立数据模型等特点,是大数据专业的学生必备语言,在概率论与数理统计教学过程中运用python软件可以起到事半功倍的效果。

猜你喜欢
概率密度函数置信区间数理统计
幂分布的有效估计*
线上线下混合教学模式在概率论与数理统计课程中的应用
基于预警自适应技术的监控系统设计
效应量置信区间的原理及其实现
已知f(x)如何求F(x)
基于变构模型的概率密度函数的教学探索
关于概率论与数理统计课程改革的思考
概率统计教学中培养学生创新思维和实践能力的探索与实践
非高斯随机分布系统自适应控制算法的研究