
cov(x,y)=EXY-EXEY
协方差的定义,EX为随机变量X的数学期望,同理,EXY是XY的数学期望,挺麻烦的,建议你看一下概率论cov(x,y)=EXY-EXEY
协方差的定义,EX为随机变量X的数学期望,同理,EXY是XY的数学期望,挺麻烦的,建议你看一下概率论
举例:
Xi 11 19 3
Yi 50 104 146
E(X) = (11+19+3)/3=2
E(Y) = (50+104+146)/3=10
E(XY)=(11×50+19×104+3×146)/3=2302
Cov(X,Y)=E(XY)-E(X)E(Y)=2302-2×10=302
此外:还可以计算:D(X)=E(X^2)-E^2(X)=(11^2+19^2+3^2)/3 - 4=460-4=06 σx=077
D(Y)=E(Y^2)-E^2(Y)=(5^2+104^2+146^2)/3-100=1544 σy=393
X,Y的相关系数:
r(X,Y)=Cov(X,Y)/(σxσy)=302/(077×393) = 09979
表明这组数据X,Y之间相关性很好!
1在概率论计算中的应用 例1.若将一枚硬币抛n次,X表示n次试验中出现正面的次数,Y表示n次试验中出现反面的次数。计算ρXY。
解:由于X+Y=n,则Y=-X+n,根据相关系数的性质推论,得ρXY = − 1。
例2.已知随机变量X、Y分别服从正态分布N(1,9),N(0,16)且X,Y的相关系数
设,求证X,Z相互独立。
证明:由已知得E(X)=1,D(X)=9,E(Y)= 0,D(Y) = 16
由于正态分布的随机变量的线性组合仍然服从正态分布,知Z是正态变量。
根据数学期望的性质有
根据方差的性质有得
由于 E(XY) = Cov(X,Y) + E(X)E(Y) = − 6,
E(X) = D(X) + [E(X)] = 10
ρXZ = 0,X,Z不相关。
由于正态随机变量的相互独立与互不相关等价,故X,Z相互独立。
因此,一般情况下两个随机变量不相关不一定相互独立。不相关仅指随机变量之间没有线性关系,而相互独立则表明随机变量之间互不影响,没有关系。 2在企业物流上的应用 例一种新产品上市。在上市之前,公司的物流部需把新产品合理分配到全国的10个仓库,新品上市一个月后,要评估实际分配方案与之前考虑的其他分配方案中,是实际分配方案好还是其中尚未使用的分配方案更好,通过这样的评估,可以在下一次的新产品上市使用更准确的产品分配方案,以避免由于分配而产生的积压和断货。表1是根据实际数据所列的数表。
通过计算,很容易得出这3个分配方案中,B的相关系数是最大的,这样就评估到B的分配方案比实际分配方案A更好,在下一次的新产品上市分配计划中,就可以考虑用B这种分配方法来计算实际分配方案。 3在聚类分析中的应用 例如果有若干个样品,每个样品有n个特征,则相关系数可以表示两个样品间的相似程度。借此,可以对样品的亲疏远近进行距离聚类。例如9个小麦品种(分别用A1,A2,,A9表示)的6个性状资料见表2,作相关系数计算并检验。
由相关系数计算公式可计算出6个性状间的相关系数,分析及检验结果见表3。由表3可以看出,冬季分蘖与每穗粒数之间呈现负相关(ρ = − 08982),即麦冬季分蘖越多,那么每穗的小麦粒数越少,其他性状之间的关系不显著。
两个变量之间相关关系的方法,要想知道两个变量之间的有关或无关的精确的可信程度,只有利用独立性检验的有关计算,才能做出判断。
拓展:
数理统计是数学的一个分支,分为描述统计和推断统计。它以概率论为基础,研究大量随机现象的统计规律性。描述统计的任务是搜集资料,进行整理、分组,编制次数分配表,绘制次数分配曲线,计算各种特征指标,以描述资料分布的集中趋势、离中趋势和次数分布的偏斜度等。推断统计是在描述统计的基础上,根据样本资料归纳出的规律性,对总体进行推断和预测。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)