概率分布
表述随机变量取值的概率规律
概率分布,是指用于表述随机变量取值的概率规律。事件的概率表示了一次试验中某一个结果发生的可能性大小。若要全面了解试验,则必须知道试验的全部可能结果及各种可能结果发生的概率,即随机试验的概率分布。如果试验结果用变量X的取值来表示,则随机试验的概率分布就是随机变量的概率分布,即随机变量的可能取值及取得对应值的概率。根据随机变量所属类型的不同,概率分布取不同的表现形式。
简介
概率分布律[law of probability 广义函数]简称概率律或概率分布。上描述随机变量取值规律的概率测度。假定 是概率空间 上的随机变量则由
所定义的 上的集函数 F 是一个概率测度,称为随机交量 的概率分布律。对于任何 随机变量 落入B中的概率可通过计算B 的测度 得出这就是说概率分布F 完全刻画了 取值的概率规律。
正态分布
正态分布是一种很重要的连续型随机变量的概率分布。生物现象中有许多变量是服从或近似服从正态分布的,如家畜的体长、体重、产奶量、产毛量、血红蛋白含量、血糖含量等。许多统计分析方法都是以正态分布为基础的。此外,还有不少随机变量的概率分布在一定条件下以正态分布为其极限分布。因此在统计学中,正态分布无论在理论研究上还是实际应用中,均占有重要的地位。关于正态分布的概率计算,我们先从标准正态分布着手。这是因为,一方面标准正态分布在正态分布中形式最简单,而且任意正态分布都可化为标准正态分布来计算;另一方面,人们已经根据标准正态分布的分布函数编制成正态分布表以供直接查用。
分布函数的性质
对于特定的随机变量X,其分布函数FX是单调不减及右连续,而且FX(-∞)=0,FX(∞)=1。这些性质反过来也描述了所有可能成为分布函数的函数:设F:[-∞,∞]→[0,1],F(-∞)=0,F(∞)=1且单调不减、右连续,则存在概率空间(Ω,F,P)及其上的随机变量X,使得F是X的分布函数,即FX=F。
随机变量的分布
设P为概率测度,X为随机变量,则函数F(x)=P(X≤x),(x∈R)称为X的概率分布函数。如果将X看成是数轴上的随机点的坐标,那么,分布函数F(x)在x处的函数值就表示X落在区间(-∞,x]上的概率。例如,设随机变量X为掷两次子所得的点数差,而整个样本空间由36个元素组成。其分布函数是:F(x)={0,x\u003c0; 6/36,x\u003c1; 16/36,x\u003c2; 24/36,x\u003c3; 30/36,x\u003c4; 34/36,x\u003c5; 1,x≤5}。
离散概率分布族
离散概率分布指的是随机变量取值为离散集合时的概率分布,例如只取整数值的随机变量。离散概率分布的一个重要特征是其分布函数的值域是离散的。如果随机变量X的取值只有有限或可数无限多个,比如x1\u003cx2\u003c...\u003cxn,则其分布函数可以表示为FX(xi)=∑j=1iP(xj),且∑k=1nP(xk)=1。离散概率分布的常见类型包括二项式分布、超几何分布和泊松分布等。
二项式分布
二项分布是离散概率分布中最重要的一种,由瑞士数学家雅各布·伯努利发展。它适用于每次试验只有两种可能结果的情况,且每次试验是独立的。二项分布的概率质量函数为f(n,k,p)={n \choose k}p^k(1-p)^(n-k),其中p是单次试验中成功的概率。二项分布的期望值为E(X)=np,方差为var(X)=np(1-p)。
超几何分布
超几何分布适用于不放回抽样的情况。在一个容器中有N个球,其中M个黑球,(N-M)个红球,超几何分布的概率质量函数为f(k,n;M;N)={M \choose k}{N-M \choose n-k}/{N \choose n},用以计算抽出n个球中有k个黑球的概率。
泊松分布
泊松分布是二项分布的一种极限形式,适用于事件发生概率很小而试验次数很大的情况。泊松分布的概率质量函数为f(n,k,p)=(n*p)^k/(e^(n*p)*k!),其中e是自然对数的底数。泊松分布常用于计算稀有事件的概率,如某时间段内发生某事件的次数。
连续概率分布族
连续概率分布涉及随机变量取值为连续集合时的概率分布。如果连续随机变量X具有分布函数F,且F的一阶导数处处存在,则其导函数f(x)=dF(x)/dx称为X的概率密度函数。概率密度函数的性质包括∫(−∞,∞)f(x)dx=1和∫(a,b)f(x)dx=P(a≤X≤b)=F(b)−F(a)。连续概率分布的常见类型包括正态分布、指数分布、t分布、F分布和χ²分布等。
正态分布
正态分布是连续概率分布中最著名的一种,其概率密度函数为f(x)=(1/(σ√(2π)))e^(-1/2((x−μ)/σ)^2),其中μ是平均值,σ是标准差。正态分布的曲线呈对称钟形,因此又被称为钟形曲线。正态分布在统计学中有广泛的应用,许多自然和社会现象的分布都近似于正态分布。正态分布的累积分布函数为F(x)=(1/(σ√(2π)))∫(−∞,x)e^(-1/2((t−μ)/σ)^2)dt。标准正态分布是μ=0和σ=1的特殊情况,其累积分布函数为Φ(z)=(1/√(2π))∫(−∞,z)e^(-1/2t^2)dt。通过z变换z=(x−μ)/σ,可以将任意正态分布转换为标准正态分布进行计算。
正态分布与二项分布的关系
当二项分布的试验次数n很大,且单次试验的成功概率p不是很小时,正态分布可以用来近似二项分布。近似的规则是n*p*(1-p)≥9。从二项分布中获得μ和σ的方法是μ=n*p,σ=√(n*p*(1-p))。如果σ\u003e3,则需要使用连续性修正,即P(x1≤X≤x2)≈Φ((x2+0.5−μ)/σ)−Φ((x1−0.5−μ)/σ)。这种修正有助于在σ值较大时获得更精确的近似值。
参考资料
目录
概述
简介
正态分布
分布函数的性质
随机变量的分布
离散概率分布族
连续概率分布族
参考资料