在概率论和统计学中,概率质量函数(probability
质量 函数,简写作pmf)是离散
随机变量在各特定取值上的概率。有时它也被称为离散密度函数。概率质量函数通常是定义离散
概率分布的主要方法,并且此类函数存在于其定义域是离散的
标量变量或多元随机变量。具有最大概率质量的随机变量的值称为众数。
概率质量函数和概率密度函数不同之处在于:概率质量函数是对离散随机变量定义的,本身代表该值的概率;概率密度函数是对连续随机变量定义的,本身不是概率,只有对连续随机变量的概率密度函数在某区间内进行积分后才是概率。
注意这在所有
实数上,包括那些X不可能等于的实数值上,都定义了 。在那些X不可能等于的实数值上,取值为,取为0)。
离散
随机变量概率质量函数的不连续性决定了其累积分布函数也不连续。
一个伯努利分布的例子是抛硬币。假设X是抛硬币的结果,反面取值为0,正面取值为1。则在
状态空间{0, 1}(这是一个
雅各布·伯努利(Bernoulli)
随机变量)中,X = x的概率是0.5,所以概率质量函数是
尽管可能的结果有无限多,但总概率质量为 1/2 + 1/4 + 1/8 +⋯ = 1,满足
概率分布的单位总概率要求。
两个或多个离散
随机变量具有联合概率质量函数,它给出了随机变量的每个可能的实现组合的概率。