概率论常见分布

概率论常见分布,第1张

概率分布有两种型别:离散(discrete)概率分布和连续(continuous)概率分布。离散概率分布也称为概率质量函式。离散概率分布的例子有伯努利分布、二项分布、泊松分布和几何分布等。

扩展资料

连续概率分布也称为概率密度函式(probability density function),它们是具有连续取值(例如一条实线上的值)的函式。正态分布(normal distribution)、指数分布(exponential distribution)和β分布(beta distribution)等都属于连续概率分布。

PDF:概率密度函数(probability density function), 在数学中,连续型随机变量的`概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。本身不是概率,取值积分后才是概率。

PMF: 概率质量函数(probability mass function), 在概率论中,概率质量函数是离散随机变量在各特定取值上的概率。

CDF: 累积分布函数 (cumulative distribution function),又叫分布函数,是概率密度函数的积分,能完整描述一个实随机变量X的概率分布。是PDF在特定区间上的积分。  CDF就是PDF的积分,PDF就是CDF的导数

描述发生某事件概率。任何一个CDF,是一个不减函数,最终等于1。

参考:
>

事件的概率表示了一次试验某一个结果发生的可能性大小。若要全面了解试验,则必须知道试验的全部可能结果及各种可能结果发生的概率,即必须知道随机试验的概率分布(probability distribution)。为了深入研究随机试验,我们先引入随机变量(random variable)的概念。 作一次试验,其结果有多种可能。每一种可能结果都可用一个数来表示,把这些数作为变量x的取值范围,则试验结果可用变量x来表示。
例43对100头病畜用某种药物进行治疗,其可能结果是“0头治愈”、 “1头治愈”、“2头治愈”、“…”、“100头治愈”。若用x表示治愈头数,则x的取值为0、1、2、…、100。
例44孵化一枚种蛋可能结果只有两种,即“孵出小鸡”与“未孵出小鸡”。若用变量x表示试验的两种结果,则可令x=0表示“未孵出小鸡”,x=1表示“孵出小鸡”。
例45测定某品种猪初生重,表示测定结果的变量x所取的值为一个特定范围(a,b),如05―15kg,x值可以是这个范围内的任何实数。
如果表示试验结果的变量x,其可能取值至多为可列个,且以各种确定的概率取这些不同的值,则称x为离散型随机变量(discrete random variable);如果表示试验结果的变量x,其可能取值为某范围内的任何数值,且x在其取值范围内的任一区间中取值时,其概率是确定的,则称x为连续型随机变量(continuous random variable)。引入随机变量的概念后,对随机试验的概率分布的研究就转为对随机变量概率分布的研究了。 离散型随机变量概率分布
要了解离散型随机变量x的统计规律,就必须知道它的一切可能值xi及取每种可能值的概率pi。
如果我们将离散型随机变量x的一切可能取值xi(i=1,2,…),及其对应的概率pi,记作
P(x=xi)=pii=1,2,… (4—3)
则称(4—3)式为离散型随机变量x的概率分布或分布。常用分布列(distribution series)来表示离散型随机变量:
x1 x2… xn …。
p1 p2… pn …
显然离散型随机变量的概率分布具有pi≥0和Σpi=1这两个基本性质。 连续型随机变量概率分布
连续型随机变量(如体长、体重、蛋重)的概率分布不能用分布列来表示,因为其可能取的值是不可数的。我们改用随机变量x在某个区间内取值的概率P(a≤x<b)来表示。下面通过频率分布密度曲线予以说明。
由表2—7作126头基础母羊体重资料的频率分布直方图,见图4—1,图中纵坐标取频率与组距的比值。可以设想,如果样本取得越来越大(n→+∞),组分得越来越细(i→0),某一范围内的频率将趋近于一个稳定值──概率。这时,频率分布直方图各个直方上端中点的联线──频率分布折线将逐渐趋向于一条曲线,换句话说,当n→+∞、i→0时,频率分布折线的极限是一条稳定的函数曲线。对于样本是取自连续型随机变量的情况,这条函数曲线将是光滑的。这条曲线排除了抽样和测量的误差,完全反映了基础母羊体重的变动规律。这条曲线叫概率分布密度曲线,相应的函数叫概率分布密度函数。若记体重概率分布密度函数为f(x),则x取值于区间[a,b)的概率为图中阴影部分的面积,即 图4-1表2-7资料的分布曲线 (4—4)式为连续型随机变量x在区间[a,b)上取值概率的表达式。可见,连续型随机变量的概率由概率分布密度函数确定。此外,连续型随机变量概率分布还具有以下性质:
1.分布密度函数总是大于或等于0,即f(x)≥0
2.当随机变量x取某一特定值时,其概率等于0
3.在一次试验中随机变量x之取值必在-∞<x<+∞范围内,为一必然事件。

如图所示:

因为,(X,Y)是二维离散型随机变量。

所以,xy也是离散型随机变量。

先求出xy的概率分布列。

再求xy的期望:比如 P(x=0)=1/2,P(x=1)=1/2 P(y=0)=1/2,P(y=1)=1/2 则,P(xy=0)=3/4 P(xy=1)=1/4 所以,E(XY)=0×(3/4)+1×(1/4)=1/4。

当随机变量的可取值全体为一离散集时称其为离散型随机变量,否则称其为非离散型随机变量,这是很大的一个类,其中有一类是极其常见的,随机变量的取值为一(n)维连续空间。

计算方法:

随机变量即在一定区间内变量取值为有限个或可数个。例如某地区某年人口的出生数、死亡数,某药治疗某病病人的有效数、无效数等。离散型随机变量通常依据概率质量函数分类,主要分为:伯努利随机变量、二项随机变量、几何随机变量和泊松随机变量。


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/yw/12923435.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2025-08-28
下一篇2025-08-28

发表评论

登录后才能评论

评论列表(0条)

    保存