在上学时代和工作期间,经常会遇到概率论中相关概念,这里再重新来认识一下随机变量相关概念。包括随机变量(离散随机变量、连续随机变量)、分布列、概率密度函数、分布函数等。下面都是来自茆诗孙版本《概率论与数理统计》
在本书中,“用来表示随机现象结果的变量”称为随机变量。随机现象中有很多样本点本身就是用数量来表示的,由于样本点出现的随机性,其数量是随机的,也称为随机变量。也有样本点不是数,这时也可以根据研究设计出随机变量,可以用数量来表示。先看第一种情况,在实际生活中的例子。
定义 定义在样本空间\(\Omega\)上的实值函数\(X=X(\omega)\)称为随机变量,常用大写字母X,Y,Z等表示随机变量,其取值用小写字母x,y,z等表示。假如一个随机变量仅取有限个或可列个值,则称其为离散随机变量。假如一个随机变量的可能取值充满数轴上的一个区间(a,b),则称其为连续随机变量,其中a可以是\(-\infty\), b可以是\(+\infty\)。这个定义表明:随机变量X是样本点\(\omega\)的一个函数,这个函数可以是不同样本点对应不同的实数,也可以是多个样本点对应同一个实数。这个函数的自变量(样本点)可以是数,也可以不是数,但是因变量(随机变量取值)一定是实数。正如前面所述,“用来表示随机现象结果的变量”,随机现象就是各种样本,这些样本的某种结果可以用一个变量来表示,这个变量就是随机变量。对于随机变量,研究它不仅要知道它可以取那些值,还要知道这些值的概率是多少。
随机变量X是样本点\(\omega\)的一个实值函数。若B是某些实数组成的集合,即\(B\in R\),R表示实数集,则\(X\subset B\)表示如下随机事件\({\{\omega:X(\omega) \in B}\}\subset \Omega\)这个就是我们可以用随机变量取某些值表示随机事件的依据。譬如
为了掌握X的统计规律,我们只要掌握X取各种值得概率,这是由于\({ \{ a<X\leq b \}=\{X \leq b\}-\{x \leq a\} }\).因此只要对任意实数x,知道了事件\(X \geq x\)的概率就够了,这个概率具有累积特性,常有F表示。另外这个概率与x有关,不同的x,此累积概率值也不同,为此记为\(F(x)=p(X \leq x)\)于是F(x)对于任意\(x\in (-\infty, +\infty)\)都有定义,而F(x)是定义在\((-\infty, +\infty)\)上、取值于[0,1] 的一个函数。
定义 设X是一个随机变量,对于任意的实数x,称\(F(x)=p(X \leq x)\)为随机变量X的分布函数。且称X服从F(x), 记为\(X \backsim p(X \leq x)\)。定理 任意分布函数F(x)都具有下面三条基本性质:(1)单调性 F(x)是定义在整个实数轴上的单调非减函数,即对于任意的\(x_1<x_2\),有\(F(x_1) \leq F(x_2)\)(2)有界性 对于任意的x,有\(0 \leq F(x) \leq 1, F(-\infty)=\lim_{x \to - \infty}F(x)=0, F(+\infty)=\lim_{x \to + \infty}F(x)=1\)(3)右连续性 F(x)是x的右连续函数,即对于任意的\(x_0\), 有$ \lim_{x \to x_0+}F(x)=F(x_0)$
离散随机变量的概率分布可以用概率分布列来表示,连续随机变量的概率分布可以用概率密度来表示。由于离散随机变量,可以认为形式上可以列举的,我们将离散随机变量取各个值得概率,用数列的方式列举出来。而连续随机变量却不行,只能用函数的形式来表示。
连续随机变量的一切可能取值是充满某个区间(a,b), 在这个区间内有无穷多个不可列实数,因此描述连续随机变量的概率分布不能再用分布列的形式表示,而是该用概率密度函数表示。下面用一个实例来引出概率密度函数。
定义 设随机变量X的分布函数为F(x),如果存在一个实数轴上一个非负可积函数p(x),使得对任意实数x有\(F(x)=\int_{-\infty}^{x} p(t)dt\)可以看出,在F(x)导数存在的点上有\(F^{'}(x)=p(x)\)F(x)是累积概率函数,其导数p(x)是概率密度函数。
密度函数的基本性质(1)非负性: \(p(x) \geq 0\)(2)正则性: \(\int_{-\infty}^{+\infty}p(x)dx=1\)