关于随机变量的几个基本问题

2016-05-30 03:20崔召磊
科教导刊 2016年10期

崔召磊

摘 要 本文讨论了连续型随机变量和离散型随机变量的分布函数的部分性质,并探讨了二维连续型随机变量在任意曲线上的概率是否为零以及其与一维连续型随机变量的关系。这几个问题是描述几个常用概念之间联系的基本问题,然而也是在教学中容易忽略的问题,本文为此进行归纳整理,以期对随机变量有更清楚的认识。

关键词 阶梯函数 连续型随机变量 边缘分布

中图分类号:O211.6 文献标识码:A DOI:10.16400/j.cnki.kjdks.2016.04.026

Abstract This paper discussed some properties of the distribution function of continuous random variables and discrete random variables, and to explore the probability of the two-dimensional continuous random variable in arbitrary curve is zero and the and one dimensional continuous random variable relationship. These problems are a few concepts between contact the basic problem description, but also in teaching easy to overlook problems. For this reason, to collate, to have a more clear understanding of random variables.

Key words step function; continuous random variable; marginal distribution

概率论是研究随机现象的科学,通俗地讲,就是研究某种现象或某个事件发生的可能性大小,比如投掷硬币,出现正、反面的可能性有多大;在路上,偶遇一个孕妇,那么此孕妇生男孩和生女孩的可能性又各有多大?这个可能性就是概率论学科要研究的最主要目标——概率,那么要如何研究事件的概率问题,这就需要把随机现象引入到一个合理有效、逻辑严谨的理论体系中,在这个过程中,随机变量就像一座桥梁或基石,在理论研究中起着无可替代的作用。随机变量从本质上看就是一个函数,或者更加清楚准确地描述为:从由随机试验的结果构成的样本空间到实数上的一对一或多对一的映射。正是由于随机变量的存在,随机现象的研究中才将高等数学引入到了整个理论体系中,使得概率论学科获得了巨大的进步。随机变量在我们的教学过程中,一般只讨论两种典型情形:离散型随机变量和连续型随机变量。在概率论的讲解过程中,可以发现离散型随机变量的定义浅显而直观,易于理解和接受, 而连续型随机变量的定义则有些抽象了。对连续型随机变量的深层次理解,严重依赖于对高等数学相关内容的理解,尤其是对积分和各种函数知识的掌握。另外,无论是离散型随机变量还是连续型随机变量,我们的主要目标都要研究其概率的取值情况,也就是随机变量的概率分布情况,因此在本文中我们主要讨论的内容就是随机变量的分布函数的一些特点。通过对概率分布函数的详细分析,进一步加强对随机变量,尤其是连续型随机变量的认识,本文将几个关于概率分布的基本问题进行整理和归纳,其中第一个问题分别讨论了离散型随机变量和连续型变量的分布函数的基本特点;第二个问题讨论了一维、二维连续型随机变量在什么情况下,概率的取值为零;第三个问题讨论了二维连续型随机变量与边缘分布之间的关系。在下文中,我们将以上三个问题逐一加以讨论。

第一个问题:离散型随机变量的分布函数是阶梯函数,连续型随机变量的分布函数是连续函数。这个结论正确吗?其逆命题成立吗?

这里,我们首先要明确阶梯函数的定义。定义在区间[]上的函数,如果存在有限个分点 = …,在每个开区间(), 上取常数,则称之为阶梯函数。将此定义推广到无限区间上时,只要求满足在任意有限区间上如上定义(参见王梓坤(1996))即可。总之,无论有限情形还是无限情形,从图像上看,阶梯函数都会出现阶梯形状。 故而,当离散型随机变量取有限个值时,容易知道其分布函数一定是阶梯函数;然而当其取值为可列多个值时,则不一定是阶梯函数了。

例: 定义一个取值于(0,1)中的有理数 (互质)的离散型随机变量如下:

= ,

其中 = , 为(0,1)上的有理数集。

显然,此随机变量确定的分布函数在区间(0,1)上的有理数点处都发生跳跃,其图象无法形成阶梯形状,也就不是阶梯函数。另外,更多的例子可以在朱作宾(1984)中找到。

这个问题的反向结论则显然是成立的,即如果一个分布函数是一个单调上升且右连续的阶梯函数时,则与其对应的随机变量一定是离散型的,并且随机变量的取值点就是跳跃间断点。

那么连续型随机变量的情形又是怎样呢? 连续型随机变量的分布函数是一个变上限积分函数,一定是连续的,但其反向,则不然。如果一个分布函数连续且在每一点都可导,那么其导数就是对应的密度函数,也就是这个分布函数一定是连续型随机变量的分布函数。然而,将此结论中的可导条件稍微弱化一点,改成几乎处处可导,则结论不成立。一个例子可以参見桂春燕(2015)。这个例子是基于康托尔集构造的,其过程比较繁琐,本文只介绍一下该例子的构造思想。其具体思路为:在非康托尔集上按特定规则定义为常数(该常数与点所在的区间有密切联系),而在康托尔集上定义为由非康托尔集上的常数序列确定的上确界(极限值)以保证连续, 通过这种方法构造的函数在非康托尔集上可导且导数为零,在康托尔集上不可导,而康托尔集为零测集,也就是说,我们得到了一个几乎处处可导且导数几乎处处为零的分布函数,故这个分布函数不是连续型随机变量的分布函数。

第二个问题:一维连续型随机变量在任意一点的概率为零,这是一个显然的事实。那么这个结论推广到多维情形又如何呢?是否可以推广为二维连续型随机变量在任意曲线上的概率为零?

这个问题的本质是考虑一个二元可积函数在曲线上的二重积分问题,而在二维空间内曲线的测度一般为零,比如常见的幂函数、指数函数等初等函数确定的曲线,此时上述推广的结论是成立的。然而,数学常常会有让人惊讶的奇妙之处。事实上,曲线的测度不一定是零, 一个有趣的例子就是皮亚诺曲线(可参见那汤松(1965))。关于此曲线的一种经典的构造方法是通过把一个正方形分割成4个小正方形,然后将小正方形的中心点相连,此过程不断重复递归,取极限后,可构造出一条曲线,该曲线可以覆盖整个正方形。这种语言描述显得有点不够严谨,赵明方(1965)给出了一类皮亚诺曲线的解析表达式,其具体定义如下:

在闭区间[0,2]上,令

且 = ,是整数,是[0, 36]上任意的一个实数。 再令

= , =

从而可由, 构造出一条曲线:,赵明方(1965)证明了此曲线就是正方形[0,1]譡0,1]上的皮亚诺曲线,可以表示正方形中的任何一个点。因此,如果在某个正方形上定义一个服从二维均匀分布的随机变量,则其在对应的皮亚诺曲线上的概率为1。不过,这种曲线是极其特殊的,值得更进一步的研究和讨论。为避开这种特殊情形,我们可以限制曲线为可由一元参数方程确定的光滑曲线,此时光滑曲线的面积(测度)一定为零,那么我们的结论在光滑曲线上就一定是成立的,也就是说二维连续型随机变量在光滑曲线上的概率一定为零。

第三个问题:二维连续型随机变量的边缘分布是否一定对应连续型随机变量?反之, 如果边缘分布都对应连续型随机变量,其二维随機变量是否一定是连续型的?

这一个问题的前半部分的答案是肯定的。事实上,假设二维随机变量的密度函数为,则的边缘分布为

= ,

故存在一个非负函数 = 满足连续型随机变量的定义。然而,其反向结论则不成立,可见下面的例子。

例:假设随机变量服从参数为1的指数分布,,则二维随机变量的分布函数为:

此时, = 0, 从而不存在一个满足二维连续型随机变量的定义的非负二元函数,即不是二维连续型随机变量。

以上几个问题,是概率论教学过程中需要留意的几个小问题,这些问题因为都是在非常规情形下出现,往往容易忽视,故而在学习研究概率论的过程中,要始终保持谨慎认真的态度,既要对知识有直观的认识,又要严格对待理论体系的严密逻辑。

参考文献

[1] 王梓坤.随机过程通论.北京师范大学出版社,1996:73.

[2] 朱作宾.关于离散型分布函数的一个问题.安徽师大学报(自然科学版),1984:19-21.

[3] 桂春燕.连续的分布函数与连续型随机变量的关系. 安庆师范学院学报(自然科学版),2015.21(1):101-102.

[4] . .那汤松,张德英,曹治平.皮亚诺曲线.数学通报,1964:43-46.

[5] 赵明方.再论皮亚诺曲线.数学通报,1965:35-36.