Gamma 分布与Possion 分布

Gamma 分布首先与Possion 分布(离散型)、Possion 过程发生密切的联系。我们容易发现Gamma分布的概率密度和Possion分布在数学形式具有高度的一致性。参数为 的Possion分布,其概率(probability mass function,pmf)为:

P o s s i o n ( X = k | λ ) = λ k e λ k !

而Gamma分布的密度( α = k + 1 , β = 1 G a m m a ( x | α = k + 1 ) = x α e x Γ ( k + 1 ) = x k e x k !
所以这两个分布在数学形式上是一致的,只是Possion分布是离散的,Gamma分布是连续的, 可以直观地认为Gamma分布是Possion分布在正实数集上的连续化版本

我们在概率论与数理统计的课程中都学过, P o i s s o n ( λ ) 分布可以看成是二项分布 B ( n , p ) n p = λ , n 条件下的极限分布

B ( k ; n , p ) = ( n k ) p k ( 1 p ) n k n p = λ , n P o i s s o n ( X = k | n p ) = λ k e λ k !
如果你对二项分布的关注足够多,可能会知道二项分布的随机变量 X B ( n , p ) 满足下面一个奇妙的 恒等式 def poisson_pdf (x, k) : return x**k*np.exp(-x)/factorial(k) print(integrate.quad(possion_pdf, lmbda, np.inf, args=(k))[ 0 ]) # 0.995466194474 # 0.9954661944737513 # 两者达到完美的相等

书归正传,我们再来看上面的公式,

P o i s s o n ( X k | λ ) = λ P o i s s o n ( Y = k | x ) d x = λ x k e x k ! d x

该等式即为著名的 Poisson-Gamma duality ,接下来我们来点好玩的,对上面的等式两边在 λ 0 取极限,左侧Poisson分布表示的是至少发生 事件的概率, λ 0 的时候就不可能有事件再发生了,故 P ( X k ) = 0 1 = lim λ 0 λ x k e x k ! d x = 0 x k e x k ! d x 该积分式子说明 f ( x ) = x k e x k ! 在实数集上是一个概率分布函数(probability density function,pdf) ,而这个函数恰好就是 Gamma分布 G a m m a ( x | α ) = x α 1 e x Γ ( α ) , α = k + 1 也即我们通过二项分布,再根据泊松定理,推导出了最后的Gamma分布 )。我们继续把上式右边中的 移到左边,于是得到: 1. Gamma函数的形式2. Gamma分布与Beta分布的关系3. 如何从二项分布到Gamma分布4. 如何从Gamma分布得到Possion分布5. 更重要一个问题阶乘在正实数轴上的推广,也即是阶乘的插值 var pdf = require ( 'distributions- gamma - pdf ' ) ; pdf (x [,选项]) 评估 分布 的( PDF )。 x可以是 , array ,typed array或matrix 。 var matrix = require ( 'dstructs-matrix' ) , mat , out , out = pdf ( 1 ) ; // returns ~0.3678 out = pdf ( - 1 ) ; // returns 0 x = [ 0 , 0.5 , 1 , 1.5 , 返回的是n次试验中事件A发生的次数; Size表示做size次的n伯努利试验; 需要注意的是,size可以取(10, 3)等,相当于做10*3次实验,这样就会返回10行3列的矩阵,这个 函数 其实返回的是一个ndarray数组 array是一个数组,而ndarray是一个类对象; np.array([1,2,3,4]) im po rt numpy as np np.random.seed(20201124)

Gamma 分布 :假设B(n,p),为投掷n枚硬币,每次投币朝上的概率为p。 Gamma 函数 表示最后朝上的硬币数目为α\alpha的时候,成功的概率和期望的关系。我们观察其 分布 不难看出,如果结果朝上的次数是确定的,其实期望和最后的结果越接近越好。prog: im po rt numpy as np np.mean(np.random. gamma (8,1,13060000)) np.mean(np.ran
· 指数 分布 (Ex po nential distribution)解决的问题是:要等到一个随机事件发生,需要经历多久时间。 · 伽马 分布 ( Gamma distribution)解决的问题是:要等到n个随机事件都发生,需要经历多久时间。 · 泊松 分布 ( Po isson distribution)解决的问题是:在特定时间内发生n个事件的概率。 所以,伽马 分布 可以看作是n个指数 分布 的独立随机变量的加总。 即n个Ex po nential(λ)~ Gamma (n,λ) 1、泊松 分布
最近参与翻译的一本书,以下是我翻译的其中一章,其余可以阅读 https://github.com/apachecn/prob140-textbook-zh 英文原文:https://nbviewer.jupyter.org/github/prob140/textbook/tree/gh-pages/notebooks/ 18. 正态和伽马 分布 族 # HIDDEN from data...