如何用计量经济学方法分析影响因素大小

如何用计量经济学方法分析影响因素大小,第1张

一、理论模型的设计对所要研究的经济现象进行深入的分析,根据研究的目的,选择模型中将包含的因素,根据数据的可得性选择适当的变量来表征这些因素,并根据经济行为理论和样本数据显示出的变量间的关系,设定描述这些变量之间关系的数学表达式,即理论模型。例如上节中的生产函数就是一个理论模型。理论模型的设计主要包含三部分工作,即选择变量、确定变量之间的数学关系、拟定模型中待估计参数的数值范围。1确定模型所包含的变量在单方程模型中,变量分为两类。作为研究对象的变量,也就是因果关系中的“果”,例如生产函数中的产出量,是模型中的被解释变量;而作为“原因”的变量,例如生产函数中的资本、劳动、技术,是模型中的解释变量。确定模型所包含的变量,主要是指确定解释变量。可以作为解释变量的有下列几类变量:外生经济变量、外生条件变量、外生政策变量和滞后被解释变量。其中有些变量,如政策变量、条件变量经常以虚变量的形式出现。严格他说,上述生产函数中的产出量、资本、劳动、技术等,只能称为“因素”,这些因素间存在着因果关系。为了建立起计量经济学模型,必须选择适当的变量来表征这些因素,这些变量必须具有数据可得性。于是,我们可以用总产值来表征产出量,用固走资产原值来表征资本,用职工人数来表征劳动,用时间作为一个变量来表征技术。这样,最后建立的模型是关于总产值、固定资产原值、职工人数和时间变量之间关系的数学表达式。下面,为了叙述方便,我们将“因素”与“变量”间的区别暂时略去,都以“变量”来表示。关键在于,在确定了被解释变量之后,怎样才能正确地选择解释变量。首先,需要正确理解和把握所研究的经济现象中暗含的经济学理论和经济行为规律。这是正确选择解释变量的基础。例如,在上述生产问题中,已经明确指出属于供给不足的情况,那么,影响产出量的因素就应该在投入要素方面,而在当前,一般的投入要素主要是技术、资本与劳动。如果属于需求不足的情况,那么影响产出量的因素就应该在需求方面,而不在投入要素方面。这时,如果研究的对象是消费品生产,应该选择居民收入等变量作为解释变量;如果研究的对象是生产资料生产,应该选择固定资产投资总额等变量作为解释变量。由此可见,同样是建立生产模型,所处的经济环境不同、研究的行业不同,变量选择是不同的。其次,选择变量要考虑数据的可得性。这就要求对经济统计学有透彻的了解。计量经济学模型是要在样本数据,即变量的样本观测值的支持下,采用一定的数学方法估计参数,以揭示变量之间的定量关系。所以所选择的变量必须是统计指标体系中存在的、有可靠的数据来源的。如果必须引入个别对被解释变量有重要影响的政策变量、条件变量,则采用虚变量的样本观测值的选取方法。第三,选择变量时要考虑所有入选变量之间的关系,使得每一个解释变量都是独立的。这是计量经济学模型技术所要求的。当然,在开始时要做到这一点是困难的,如果在所有入选变量中出现相关的变量,可以在建模过程中检验并予以剔除。从这里可以看出,建立模型的第一步就已经体现了计量经济学是经济理论、经济统计学和数学三者结合的思想。在选择变量时,错误是容易发生的。下面的例子都是从已有的计量经济学应用研究成果中发现的,代表了几类容易发生的错误。例如农副产品出口额=-10766+013×社会商品零售总额十022×农副产品收购额这里选择了无关的变量,因为社会商品零售总额与农副产品出口额无直接关系,更不是影响农副产品出口额的原因。再如生产资料进口额=073×轻工业投资+021×出口额+018×生产消费+6760×进出口政策这里选择了不重要的变量,因为轻工业投资对生产资料进口额虽有影响,但不是重要的,或者说是不完全的,重要的是全社会固定资产投资额,应该选择这个变量。再如农业总产值=078+024×粮食产量+005×农机动力—021×受灾面积这里选择了不独立的变量,因为粮食产量是受农机动力和受灾面积影响的,它们之间存在相关性。值得注意的是上述几个模型都能很好地拟合样本数据,所以绝对不能把对样本数据的拟合程度作为判断模型变量选择是否正确的主要标准。变量的选择不是一次完成的,往往要经过多次反复。2确定模型的数学形式选择了适当的变量,接下来就要选择适当的数学形式描述这些变量之间的关系,即建立理论模型。选择模型数学形式的主要依据是经济行为理论。在数理经济学中,已经对常用的生产函数、需求函数、消费函数、投资函数等模型的数学形式进行了广泛的研究,可以借鉴这些研究成果。需要指出的是,现代经济学尤其注重实证研究,任何建立在一定经济学理论假设基础上的理论模型,如果不能很好地解释过去,尤其是历史统计数据,那么它是不能为人们所接受的。这就要求理论模型的建立要在参数估计、模型检验的全过程中反复修改,以得到一种既能有较好的经济学解释又能较好地反映历史上已经发生的诸变量之间关系的数学模型。忽视任何一方面都是不对的。也可以根据变量的样本数据作出解释变量与被解释变量之间关系的散点图,由散点图显示的变量之间的函数关系作为理论模型的数学形式。这也是人们在建模时经常采用的方法。在某些情况下,如果无法事先确定模型的数学形式,那么就采用各种可能的形式进行试模拟,然后选择模拟结果较好的一种。3拟定理论模型中待估参数的理论期望值理论模型中的待估参数一般都具有特定的经济含义,它们的数值,要待模型估计、检验后,即经济数学模型完成后才能确定,但对于它们的数值范围,即理论期望值,可以根据它们的经济含义在开始时拟定。这一理论期望值可以用来检验模型的估计结果。拟定理论模型中待估参数的理论期望值,关键在于理解待估参数的经济含义。例如上述生产函数理论模型中有4个待估参数和α、β、γ和A。其中,α是资本的产出d性,β是劳动的产出d性,γ近似为技术进步速度,A是效率系数。根据这些经济含义,它们的数值范围应该是于集中的问题。经济变量在时间序列上的变化往往是缓慢的,例如,居民收入每年的变化幅度只有5%左右。如果在一个消费函数模型中,以居民消费作为被解释变量,以居民收入作为解释变量,以它的时间序列数据作为解释变量的样本数据,由于样本数据过于集中,所建立的模型很难反映两个变量之间的长期关系。这也是时间序列不适宜于对模型中反映长期变化关系的结构参数的估计的一个主要原因。四是模型随机误差项的序列相关问题。用时间序列数据作样本,容易引起模型随机误差项产生序列相关。这个问题后面还要专门讨论。截面数据是一批发生在同一时间截面上的调查数据。例如,工业普查数据、人口普查数据、家计调查数据等,主要由统计部门提供。用截面数据作为计量经济学模型的样本数据,应注意以下几个问题。一是样本与母体的一致性问题。计量经济学模型的参数估计,从数学上讲,是用从母体中随机抽取的个体样本估计母体的参数,那么要求母体与个体必须是一致的。例如,估计煤炭企业的生产函数模型,只能用煤炭企业的数据作为样本,不能用煤炭行业的数据。那么,截面数据就很难用于一些总量模型的估计,例如,建立煤炭行业的生产函数模型,就无法得到合适的截面数据。二是模型随机误差项的异方差问题。用截面数据作样本,容易引起模型随机误差项产生异方差。这个问题后面还要专门讨论。虚变量数据也称为二进制数据,一般取0或1。虚变量经常被用在计量经济学模型中,以表征政策、条件等因素。例如,建立我国的粮食生产计量经济学模型,以粮食产量作为被解释变量,解释变量中除了播种面积、化肥使用量、农机总动力、成灾面积等变量外,显然,政策因素是不可忽略的。1980年前后,由于实行了不同的政策,即使上述变量都没有变化,粮食产量也会发生大的变化。于是必须在解释变量中引人政策变量,用一个虚变量表示,对于1980年以后的年份,该虚变量的样本观测值为1,对于1980年以前的年份,该虚变量的样本观测值为0。也可以取0、l以外的数值,表示该因素的变化程度。例如,在工业生产模型中用虚变量表示气候对工业生产的影响,可以将不同年份气候的影响程度,分别用0、1、-1,甚至05、-05等表示。不过,这种方法应慎用,以免违背客观性。2样本数据的质量样本数据的质量问题大体上可以概括为完整性、准确性、可比性和一致性四个方面。完整性,即模型中包含的所有变量都必须得到相同容量的样本观测值。这既是模型参数估计的需要,也是经济现象本身应该具有的特征。但是,在实际中,“遗失数据”的现象是经常发生的,尤其在中国,经济体制和核算体系都处于转轨之中。在出现“遗失数据”时,如果样本容量足够大,样本点之间的联系并不紧密的情况下,可以将“遗失数据”所在的样本点整个地去掉;如果样本容量有限,或者样本点之间的联系紧密,去掉某个样本点会影响模型的估计质量,则要采取特定的技术将“遗失数据”补上。准确性,有两方面含义,一是所得到的数据必须准确反映它所描述的经济因素的状态,即统计数据或调查数据本身是准确的;二是它必须是模型研究中所准确需要的,即满足模型对变量口径的要求。前一个方面是显而易见的,而后一个方面则容易被忽视。例如,在生产函数模型中,作为解释变量的资本、劳动等必须是投入到生产过程中的、对产出量起作用的那部分生产要素,以劳动为例,应该是投入到生产过程中的、对产出量起作用的那部分劳动者。于是,在收集样本数据时,就应该收集生产性职工人数,而不能以全体职工人数作为样本数据,尽管全体职工人数在统计上是很准确的,但其中有相当一部分与生产过程无关,不是模型所需要的。可比性,也就是通常所说的数据口径问题,在计量经济学模型研究中可以说无处不在。而人们容易得到的经济统计数据,一般可比性较差,其原因在于统计范围口径的变化和价格口径的变化,必须进行处理后才能用于模型参数的估计。计量经济学方法,是从样本数据中寻找经济活动本身客观存在的规律性,如果数据是不可比的,得到的规律性就难以反映实际。不同的研究者研究同一个经济现象,采用同样的变量和数学形式,选择的样本点也相同,但可能得到相差甚远的模型参数估计结果。为什么?原因在于样本数据的可比性。例如,采用时间序列数据作为生产函数模型的样本数据,产出量用不变价格计算的总产值,在不同年份间是可比的;资本用当年价格计算的固定资产原值,在不同年份间是不可比的。对于统计资料中直接提供的这个用当年价格计算的固定资产原值,有人直接用于模型估计,有人进行处理后再用于模型的估计,结果当然不会相同。一致性,即母体与样本的一致性。上面在讨论用截面数据作为计量经济学模型的样本数据时已经作了介绍。违反一致性的情况经常会发生,例如,用企业的数据作为行业生产函数模型的样本数据,用人均收入与消费的数据作为总量消费函数模型的样本数据,用31个省份的数据作为全国总量模型的样本数据,等等。三、模型参数的估计模型参数的估计方法,是计量经济学的核心内容。在建立了理论模型并收集整理了符合模型要求的样本数据之后,就可以选择适当的方法估计模型,得到模型参数的估计量。模型参数的估计是一个纯技术的过程,包括对模型进行识别(对联立方程模型而言)、估计方法的选择、软件的应用等内容。在后面的章节中将用大量的篇幅讨论估计问题,在此不重复叙述。四、模型的检验在模型的参数估计量已经得到后,可以说一个计量经济学模型已经初步建立起来了。但是,它能否客观揭示所研究的经济现象中诸因素之间的关系,能否付诸应用,还要通过检验才能决定。一般讲,计量经济学模型必须通过四级检验,即经济意义检验、统计学检验、计量经济学检验和预测检验。1经济意义检验经济意义检验主要检验模型参数估计量在经济意义上的合理性。主要方法是将模型参数的估计量与预先拟定的理论期望值进行比较,包括参数估计量的符号、大小、相互之间的关系,以判断其合理性。首先检验参数估计量的符号。例如,有下列煤炭行业生产模型:煤炭产量=-1085427+000067×固定资产原值+001527×职工人数-000681×电力消耗量+000256×木材消耗量在该模型中,电力消耗量前的参数估计量为负,意味着电力消耗越多,煤炭产量越低,从经济行为上无法解释。模型不能通过检验,应该找出原因重新建立模型。不管其他方面的质量多么高,模型也是没有实际价值的。2统计检验统计检验是由统计理论决定的,目的在于检验模型的统计学性质。通常最广泛应用的统计检验准则有拟合优度检验、变量和方程的显著性检验等。3计量经济学检验计量经济学检验是由计量经济学理论决定的,目的在于检验模型的计量经济学性质。通常最主要的检验准则有随机误差项的序列相关检验和异方差性检验,解释变量的多重共线性检验等。4模型预测检验预测检验主要检验模型参数估计量的稳定性以及相对样本容量变化时的灵敏度,确定所建立的模型是否可以用于样本观测值以外的范围,即模型的所谓超样本特性。具体检验方法为:(1)利用扩大了的样本重新估计模型参数,将新的估计值与原来的估计值进行比较,并检验二者之间差距的显著性;(2)将所建立的模型用于样本以外某一时期的实际预测,并将该预测值与实际观测值进行比较,并检验二者之间差距的显著性。经历并通过了上述步骤的检验后,可以说已经建立了所需要的计量经济学模型,可以将它应用于预定的目的。五、计量经济学模型成功三要素从上述建立计量经济学模型的步骤中,不难看出,任何一项计量经济学研究、任何一个计量经济学模型赖以成功的要素应该有三个:理论、方法和数据。理论,即经济理论,所研究的经济现象的行为理论,是计量经济学研究的基础。方法,主要包括模型方法和计算方法,是计量经济学研究的工具与手段,是计量经济学不同于其他经济学分支学科的主要特征。数据,反映研究对象的活动水平、相互间联系以及外部环境的数据,或更广义讲是信息,是计量经济学研究的原料。这三方面缺一不可。一般情况下,在计量经济学研究中,方法的研究是人们关注的重点,方法的水平往往成为衡量一项研究成果水平的主要依据。这是正常的。计量经济学理论方法的研究是计量经济学研究工作者义不容辞的义务。但是,不能因此而忽视对经济学理论的探讨,一个不懂得经济学理论、不了解经济行为的人,是无法从事计量经济学研究工作的,是不可能建立起一个哪怕是极其简单的计量经济学模型的。所以,计量经济学家首先应该是一个经济学家。相比之下,人们对数据,尤其是数据质量问题的重视更显不足,在申请一项研究项目或评审一项研究成果时,对数据的可得性、可用性、可靠性缺乏认真的推敲;在研究过程中出现问题时,较少从数据质量方面去找原因。而目前的实际情况是,数据已经成为制约计量经济学发展的重要问题。六、相关分析、回归分析和因果分析从上述建立计量经济学模型的步骤中进一步看出,经典计量经济学方法的核心是采用回归分析的方法揭示变量之间的因果关系。但是,变量之间具有相关性并不等于具有因果性。这是建立计量经济学模型中一个十分重要的概念,那么首先需要对相关关系与因果关系作一简要的说明。所谓相关关系,是指两个以上的变量的样本观测值序列之间表现出来的随机数学关系,用相关系数来衡量。如果两个变量样本观测值序列之间相关系数的绝对值为1,则二者之间具有完全相关性(完全正相关或完全负相关);如果相关系数的绝对值比较大,或接近于1,则二者之间具有较强相关性;如果相关系数的绝对值为0,或接近于0,则二者之间不具有相关性。如果一个变量与其他两个或两个以上变量的线性组合之间具有相关性,那么它与每一个变量之间的相关系数称为偏相关系数。相关关系是变量之间所表现出来的一种纯数学关系,判断变量之间是否具有相关关系的依据只有数据。所谓因果关系,是指两个或两个以上变量在行为机制上的依赖性,作为结果的变量是由作为原因的变量所决定的,原因变量的变化引起结果变量的变化。因果关系有单向因果关系和互为因果关系之分。例如,劳动力与国内生产总值之间具有单向因果关系,在经济行为上是劳动力影响国内生产总值,而不是相反;但是,在国内生产总值与消费总额之间则存在经济行为上的互为因果关系,国内生产总值既决定消费总额,反过来又受消费的拉动。具有因果关系的变量之间一定具有数学上的相关关系。而具有相关关系的变量之间并不一定具有因果关系。例如中国的国内生产总值与印度的人口之间具有较强的相关性,因为二者都以较快的速度增长,但显然二者之间不具有因果关系。相关分析是判断变量之间是否具有相关关系的数学分析方法,通过计算变量之间的相关系数来实现。回归分析也是判断变量之间是否具有相关关系的一种数学分析方法,它着重判断一个随机变量与一个或几个可控变量之间是否具有相关关系。由于它的特定的功能,所以也被用来进行变量之间的因果分析。但是,仅仅依靠回归分析尚不能对变量之间的因果关系作出最后判断,必须与经济行为的定性分析相结合。这就是上面强调的建立计量经济学模型的三要素。

现实情况中 我们可能会遇到这样的一些例子,需要得到一所高校有车学生的分布情况(假定符合参数为p的伯努利分布),某地区成年男性的身高分布情况(假定符合参数为u1,σ1的正态分布),南极洲成年帝企鹅的体重分布(假定符合参数为u2,σ2的正态分布)等等。
由于时间和经费的限制,不可能进行全面统计,我们只能通过一定的观察,得到一系列的观察值,在上述假定概率分布模型上,现在需要求出是哪个具体的概率分布生成了这些观察值。要解决这个问题,就需要用到参数估计方法,即估计出上述的参数p,(u,σ),而最大似然估计就是这样一种方法。

最大似然估计 是一个在已知观察结果(即样本)和给定概率分布模型的基础上,估计概率分布模型的参数,并使得在该参数下,生成这个已知样本的可能性最大的方法。

举第一个例子,设我们已经获得了一个样本集{X1,X2,…,Xn},其中Xi=0表示选取的学生没有车,Xi= 1表示选取的学生有车。 Xi服从概率为未知参数p的伯努利分布,那么根据伯努利分布的定义,每个Xi的概率质量函数为:

f(xi;p)=pxi(1−p)1−xi

其中Xi=0或1。 首先,要通过极大似然估计方法求出参数p,需要定义似然函数。前面提到,最大似然估计就是去找参数估计值,使得已经观察到的样本值发生概率最大。既然这些样本已经实现了,其发生概率最大才符合逻辑。这就是求所有观测值样本的联合概率最大化。因此,似然函数在形式上,其实就是样本的联合概率。对连续型随机变量和离散型随机变量,样本的似然函数分别是概率密度和概率质量函数的连乘形式。

对于本例,似然函数为:

L(p)=∏i=1nf(xi;p)=px1(1−p)1−x1×px2(1−p)1−x2××pxn(1−p)1−xn

将上式化简,我们得到:

L(p)=p∑xi(1−p)n−∑xi

在实际应用中,为了求解方便,一般使用似然函数的对数。

ln(L(p))=ln(p∑xi(1−p)n−∑xi)=(∑xi)ln(p)+(n−∑xi)ln(1−p)

我们知道,对数函数是单调递增的。这意味着使得ln(L(p))获得极大值的p也是使得L(p)获得极大值的p。下图为对数函数的图像。

利用一元函数求极大值的方法,对上式两边求p的导数,并令其等于0:

∂ln(L(p))∂p=∑xip−(n−∑xi)1−p≡0

两边乘以p(1-p),得到:

(∑xi)(1−p)−(n−∑xi)p=0

化简后:

∑xi−np=0

需要说明的是,这里的p实际上是我们估计的p,因此使用如下的符号:

p̂=∑xin=∑ni=1xin

假设我们随机观察了30个学生的样本,样本集为:

{0,0,0,0,0,1,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,1,0}

通过上述的极大似然估计方法,可以求出预估的参数为:

p̂=∑ni=1xin=530=0167

再来看另一个例子:

假定该高校男生的体重呈均值为μ,标准差为σ的正态分布。我们获得了随机采样10个男学生的体重如下(单位:斤):

序号体重

1115

2122

3130

4127

5149

6160

7152

8138

9149

10180

正态分布的概率密度函数为:

f(xi;μ,σ2)=1σ2π‾‾‾√exp[−(xi−μ)22σ2]

根据上面的定义,似然函数是概率质量函数(离散随机变量)或概率密度函数(连续随机变量)的乘积,因此:

L(μ,σ)=1σn(2π‾‾‾√)nexp[−12σ2∑i=1n(xi−μ)2]

我们把上式的似然函数可以看作是参数θ1和θ2的函数,其中:

θ1=μ,θ2=σ2

因此,似然函数可以改写为:

L(θ1,θ2)=∏i=1nf(xi;θ1,θ2)=θ−n/22(2π)−n/2exp[−12θ2∑i=1n(xi−θ1)2]

而相应的对数似然函数则为:

logL(θ1,θ2)=−n2logθ2−n2log(2π)−∑ni=1(xi−θ1)22θ2

这是一个关于θ1和θ2的二元函数,根据二元函数求极值的方法,先求θ1的偏导数(partial derivative),然后设偏导数为0。我们得到:

∂logL(θ1,θ2)∂θ1=−2∑ni=1(xi−θ1)2θ2=0

∑i=1n(xi−θ1)=0

∑i=1nxi−nθ1=0

由此我们得到参数θ1的极大似然估计是:

θ1^=μ̂=∑ni=1xin=x¯

现在对θ2求偏导数(partial derivative),然后设偏导数为0。我们得到:

∂logL(θ1,θ2)∂θ2=−n2θ2+∑ni=1(xi−θ1)22θ22=0

两边同时乘以2θ22:

−nθ2+∑i=1n(xi−θ1)2=0

由此得到参数θ2的极大似然估计是:

θ2^=σ̂2=∑(xi−θ1)2n=∑(xi−x¯)2n

概括起来,我们已经求出了均值μ和方差σ2的最大似然估计:

μ̂=∑xin=x¯,σ̂2=∑(xi−x¯)2n

你发现没有,这实质上就是教科书中均值和方差的计算公式!

最后我们根据样本数据,计算μ和方差σ:

μ̂=∑xin=1422,σ̂2=∑(xi−x¯)2n=18654

于是,我们得到求极大似然估计的一般步骤:

- 根据设定概率模型,写出联合概率形式的似然函数

- 对似然函数取对数,并整理

- 求导数或偏导数,并赋值为0

- 求解方程

最后,谈谈“似然估计”的使用前提:

- 已经假定了概率模型,如二项分布,正态分布等;

- 已经有了一些观察结果的集合。

1、置信区间或称置信间距,是指在某一置信度时,总体参数所在的区域距离或区域长度。


2、置信度又称显著性水平,意义阶段,信任系数等,是指估计总体参数落在某一区间时,可能犯错误的概率,用符号α表示。


3、在估计总体参数时,一般都会给出一个较高的置信度,如95%或99%等。但是,当样本容量n为一定时,置信度越高,置信区间就越大,也即估计的参数的相对精度就会越低。反之,置信度越低,则精度相对就会越高。解决这一矛盾的方法就是增加样本容量n。

模型参数估计值的经济意义检验,是对模型参数估计值在理论上能否成立进行判别。经济意义检验又称为符号检验,依据模型参数估计值的符号(正号或负号)及取值的大小,判其是否符合经济理论的规定或社会经济实践的常规。
如果模型参数估计值符号和大小符合经济理论的规定或经济实践的常规,表明它在理论上有依据或在实践中能够被验证,可以成立。如果模型参数估计值符号和大小不符合经济理论的规定或违背经济实践的常规,表明它缺乏理论依据和实践证明,不能成立。没有理论依据又不被经济活动实践证明的模型参数估计值,在一般情况下是不正确的,不应被接受。

“^”,中文尚无通用名称,可以是乘方、插入符号、插入符、脱字符号等;

这里的“^”是一个用来表示第三级运算的数学符号, 表示的是乘方。

在电脑上输入数学公式时,因为不便于输入乘方,该符号经常被用来表示次方。例如2的5次方通常被表示为2^5;比如说5^2代表5的平方即5的二次方(关于乘方的运算,参见乘方)

比如:4^3=4×4×4=64 ,可以理解为4的3次方。

扩展资料

求n个相同因数乘积的运算,叫做乘方,乘方的结果叫做幂(power)。其中,a叫做底数(base number),n叫做指数(exponent)。当aⁿ看作a的n次乘方的结果时,也可读作“a的n次幂”或“a的n次方”。

同底数幂法则:

同底数幂相乘除,原来的底数作底数,指数的和或差作指数。

正整数指数幂法则

 ,其中  (即k为正整数)。

参考资料:乘方-百度百科 ^-百度百科

参数β的估计量具备有效性是指β^的方差最小。估计量具备有效性是指估计量与总体参数的离散程度。


如果两个估计量都是无偏的,那么离散程度较小的估计量相对来说是有效的,离散程度用方差来衡量。参数的点估计就是根据样本构造一个统计量,作为总体未知参数的估计。设总体的X未知参数为seta,样本根据样本构造一个统计量(只依赖于样本,不含总体分布的任何参数。
在统计学中,估计量是基于观测数据计算一个已知量的估计值的法则。

在统计学中,估计量是基于观测数据计算一个已知量的估计值的法则:于是估计量、被估量和估计值是有区别的。

估计量用来估计未知总体的参数,它有时也被称为估计子;一次估计是指把这个函数应用在一组已知的数据集上,求函数的结果。对于给定的参数,可以有许多不同的估计量。我们通过一些选择标准从它们中选出较好的估计量,但是有时候很难说选择这一个估计量比另外一个好。

假设存在一个固定的待估参数。那么"估计量"是样本空间映射到样本估计值的一个函数。的一个估计量记为。

很容易用随机变量的代数来阐述这个理论:因而如果用X来标记对应观测数据的随机变量,估计量(本身视为随机变量)的符号表示为该随机变量的函数,对特定观测数据集(即对于X=x)的估计值为一固定值。通常使用简化标记,用表示随机变量,不过这会造成误解。


欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/yw/10245886.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-05-06
下一篇2023-05-06

发表评论

登录后才能评论

评论列表(0条)

    保存