卡方分布大于45怎么查表计算

卡方分布大于45怎么查表计算,第1张

首先要先认真翻看课本,了解什么是卡方分布。弄清楚什么是自由度、分位数以及卡方分布的密度函数和分布函数。在具体问题中确定需要查询的自由度和分位数分别是什么,然后查表;表的左侧是n值,即自由度,上方一行是p值,即分位数。这里以自由度为7,分位数为0025为例。先找到左侧一列,找到数字7,对应那一行。然后找到上方一行,找到数字0025,对应那一竖。两者相交的那一个数字就是我们所要查找的自由度为7、分位数为0025的卡方分布对应的值。
卡方分布(chi-square distribution)是概率论与统计学中常用的一种概率分布。k个独立的标准正态分布变量的平方和服从自由度为k的卡方分布。卡方分布是一种特殊的伽玛分布,是统计推断中应用最为广泛的概率分布之一,例如假设检验和置信区间的计算。

以t0,025(6)=24469为例,0025表示概率,6当然是表示t分布的参数了,整个式子表示当x=24469的时候,参数为6的t分布的累积概率密度为0025,即P(x≤24469)=0025
这里的z表示的是正态分布,也就是高斯分布。至于查表,你知道了这些参数的意义,想查表就不难了,有点类似于以前的三角函数查表或者是对数查表

X服从N(u,σ^2)分布是正态分布; 则Z=(X-u)/σ服从N(0,1)的正态分布称为标准正态分布分布(即μ=0,σ=1),这是数学的定义,标准正态分布应用最广,教材上的附录正态分布表也是查的这个,推导过程公式比较多难打出来,教材中肯定有的,你看看教材。

μ就是正态分布曲线的数学期望或总体均值,

o就是正态分布曲线的标准差

分布不象正态分布那样将所有正态分布的查表都转化为标准正态分布去查,在分布中得对每个分布编制相应的概率值,这通过分布表中列出不同的自由度来表示,在分布表中还需要如标准正态分布表中给出不同 P 值一样,列出概率值,只不过这里的概率值是值以上分布曲线以下的概率。由于分布概率表中要列出很多分布的概率值,所以分布中所给出的 P 值就不象标准正态分布中那样给出了400个不同的 P 值,而只给出了有代表性的13个值,因此分布概率表的精度就更差,不过给出了常用的几个值,足够在实际中使用了。
查分布概率表时,按自由度及相应的概率去找到对应的值。如上图所示的单侧概率 005(7)=141的查表方法就是,在第一列找到自由度7这一行,在第一行中找到概率005这一列,行列的交叉处即是141。
表中所给值直接只能查单侧概率值,可以变化一下来查双侧概率值。例如,要在自由度为7的卡方分布中,得到双侧概率为005所对应的上下端点可以这样来考虑:双侧概率指的是在上端和下端各划出概率相等的一部分,两概率之和为给定的概率值,这里是005,因此实际上上端点以上的概率为005/2=0025,用概率0025查表得上端点的值为16,记为 005/2(7)=16。下端点以下的概率也为0025,因此可以用0975查得下端点为169,记为 1-005/2(7)=169。
当然也可以按自由度及值去查对应的概率值,不过这往往只能得到一个大概的结果,因为分布概率表的精度有限,只给了 13 个不同的概率值进行查表。例如,要在自由度为 18 的分布查找 =30 对应的概率,则先在第一列找到自由度 18,然后看这一行可以发现与 30 接近的有289与315,它们所在的列是005与0025,所以要查的概率值应于介于005与0025之间,当然这是单侧概率值,它们的双侧概率值界于01与005之间。如果要更精确一些可以采用插值的方法得到,这在正态分布的查表中有介绍。
为什么从正态总体中抽取出的样本的方差服从分布
在抽样分布理论一节里讲到,从正态总体进行一次抽样就相当于独立同分布的 n 个正态随机变量ξ1,ξ2,…,ξn的一次取值,将 n 个随机变量针对总体均值与方差进行标准化得(i=1,…,n),显然每个都是服从标准正态分布的,因此按照分布的定义,应该服从参数为 n 的分布。
如果将总体中的方差σ2 用样本方差 s2代替,它是否也服从分布呢?理论上可以证明,它是服从分布的,但是参数不是 n 而是 n-1 了,究其原因在于它是 n-1 个独立同分布于标准正态分布的随机变量的平方和
我们常常把一个式子中独立变量的个数称为这个式子的“自由度”,确定一个式子自由度的方法是:若式子包含有 n 个变量,其中k 个被限制的样本统计量,则这个表达式的自由度为 n-k。比如中包含ξ1,ξ2,…,ξn这 n 个变量,其中ξ1-ξn-1相互独立,ξn为其余变量的平均值,因此自由度为 n-1。

分布通过检验统计量来比较期望结果和实际结果之间的差别,然后得出观察结果发生的概率。其中O代表观察值,E代表期望值。这个检验统计量提供了一种期望值与观察值之间差异的度量办法。最后反映在数值的大小上。
那么,当大到什么程度,差异才算显著呢?这要根据自由度,设定的显著性水平查找分布表来判定。对于卡方分布的具体使用,我认为其有三要素:一个公式,一张分布表,一张概率密度图。下左图中n代表自由度,纵轴为概率值,横轴为卡方值。自由度越大,卡方分布的外形越接近正态分布。下右表即为卡方分布表,第一列为自由度,第一行为显著水平,据此可以查找到临界值,如果检验统计量大于临界值,则检验统计量就位于拒绝域以内,说明观察结果与期望结果之间的差异显著。
分布有两个主要用途:
(1)用于检验拟合优度,也就是可以检验一组数据与指定曲线的拟合程度,或检验某组观察值是否符合某种分布。
(2)检验两个变量的独立性,通过这个方法检查两个变量之间是否存在某种关联
对于拟合优度检验,主要是找到期望值与观察值,带入公式计算卡方值,然后查表即可得出结论。举例说明:
本人开发了一台体重秤,我想通过与标准体重秤对比,看看我开发的体重秤在精度上是否能够和标准设备相媲美,是否与标准设备存在显著差异,于是我找来5个人,我知道他们总体重值为300kg,所以我只需要知道4个人的体重,就可以知道第五个人的体重,因此,确定了自由度为4,然后设定了显著性水平=005。对于每一个人,各用我开发的体重秤和标准体重秤称量一次,我就获得了每个人的期望值(标准称量结果)与我的观察值(我开发的体重秤称量结果),然后带入卡方公式求得卡方值,与查表所得临界值进行比较,如果大于临界值,说明差异显著。


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/yw/10287819.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-07
下一篇2023-05-07

发表评论

登录后才能评论

评论列表(0条)