二项分布是描述独立重复伯努利试验中成功次数的概率分布。在每次试验中,事件发生的概率p和不发生的概率(1-p)保持不变,且各次试验独立。当n很大,p很小,二项分布可以近似为泊松分布;若n趋于无穷,p保持有限,根据中心极限定理,二项分布趋向正态分布。这种分布广泛应用于统计学和数据分析中。 摘要生成于 ,由 DeepSeek-R1 满血版支持,

二项分布(binomial distribution)就是在重复n次独立的伯努利试验(Bernoulli experiment)中,所期望结果出现次数的概率分布。

伯努利试验的特点:

  1. 每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立
  2. 每次试验中事件发生的概率是相同的
  3. 各次试验的事件相互之间独立

重复n次独立的伯努利试验形成二项分布(高尔顿板)

高尔顿板丨图片来源:维基百科

从最上方的节点往下,是几排交错排列的钉子。从入口扔下的小球撞上一个钉子,就像触网的乒乓球一样,弹向左边和右边的概率相等。最上方只有一种可能。下降之后,左右两边比例变成1:1,继续这个步骤,第n行的比例系数其实就是n次二项式的展开系数,或者表现为杨辉三角的第n行数值。

一般地,如果随机变量 X 服从参数为 np 的二项分布,记为 X\sim B(n,p)X\sim b(n,p)n 次试验中正好得到 k 次成功的概率由概率质量函数给出

式中, k=0,1,\cdots,nC_n^k 是二项式系数。不同参数下的二项分布概率分布:

如果 X\sim B(n,p) ,那么随机变量 X 的期望为

随机变量 X 的方差为

二项分布的近似

p=0.5 时,二项分布的概率质量函数是对称的。当 p\neq 0.5 时,二项分布的概率质量函数呈现偏态,且 p>0.5p<0.5 的偏斜方向相反。如果 n 很大,即使 p\neq 0.5 ,偏态逐渐降低,最终成正态分布。

二项分布逼近正态分布的过程丨图片来源:维基百科

1. 近似为泊松分布

如果 np 存在有限极限 \lambda ,则该二项分布就趋于参数为 \lambda 的泊松分布

实际运用中,如果 n 很大,但 np 比较小(比起 n 来说很小),通常 np\leq 5 就满足要求。一般来说,n的值越大,p的值越小,近似就越准确。因为在这种情况下,(1-p)将接近1,因此 \mbox{Var}(X) =np(1-p) 将接近分布的均值,即 \mbox{E}(X)=np 。这满足了泊松分布模型中均值和方差接近的条件。那么用泊松分布近似二项分布更简单些,毕竟泊松分布跟二项分布一样都是离散型分布。

2. 近似为高斯分布

如果 np 趋于无限大(如 p 是一个定值),则根据德莫佛-拉普拉斯(De'Moivre-Laplace)中心极限定理,这列二项分布将趋近于高斯分布(正态分布)

式中, \mu = np\sigma = \sqrt{np(1-p)}

实际运用中,要求 np\geq 5n(1-p)\geq 5 时,一般都用高斯分布来近似计算二项分布。

概率分布 二项分布 、泊松分布、正态分布 1. 概率分布 概率分布 是指事件的不同结果对应的发生概率所构成的分布,可以利用二维坐标进行形象地解释。如下图所示,两幅图的横轴代表的都是事件所有的可能结果,纵轴则是不同结果所对应的发生概率或概率密度。 2.离散型 概率分布 —— 二项分布 在现实生活中,许多事件或结果只有两个,或者结果只有一个是我们想要,其他不是我们想要的。例如,买了福利彩票,有中奖和不中奖两种结...
1. 二项分布 的基本描述: 二项分布 就是重复n次独立的伯努利实验。伯努利实验就是在同样的条件下重复发生、且每次实验相互独立的一种随机试验。 二项分布 有两个参数n和p,n是重复实验的次数,p是每次独立实验发生的概率。特殊的n=1时,我们把 二项分布 称为伯努利分布。   N次独立重复试验中发生K次的概率是:   P(ξ=K)= C(n,k) * p^k * (1-p)^(n-k),其中C(n, k...
排列与组合公式: 排列A(n,m)=n×(n-1)…(n-m+1)=n!/(n-m)!(n为下标,m为上标,以下同) 组合C(n,m)=P(n,m)/P(m,m) =n!/m!(n-m)!; 例如A(4,2)=4!/2!=43=12 C(4,2)=4!/(2!2!)=43/(21)=6 P(x=2)= c(5,2)X0.5X0.5X0.5X0.5X0... var pmf = require ( 'distributions-binomial-pmf' ) ; pmf(x [,选项]) 计算的(PMF)。 x可以是 , array ,typed array或matrix 。 var matrix = require ( 'dstructs-matrix' ) , mat , out , out = pmf ( 1 ) ; // returns 0.5 out = pmf ( - 1 ) ; // returns 0 out = returns ( 1.5 ) : // return
假设一个随机变量XXX服从参数为n∈Nn\in\mathbb{N}n∈N和p∈[0,1]p\in [0,1]p∈[0,1]的 二项分布 , 即X∼B(N,p)X\sim B(N, p)X∼B(N,p), 则XXX的取值为kkk的概率为 : Pr⁡(X=k)=Cnk(1−p)n−kpk\Pr(X=k)=C_n^k(1-p)^{n-k}p^kPr(X=k)=Cnk​(1−p)n−kpk 其中k=0,⋯ ,n...