
Stata:数据导入及整理
山猪吃得了细糠
来自专栏面板数据模型(静态)
一、面板数据整理
(一)面板数据的意思:
面板数据是指涉及“时间、地点、人物”三要素的立体数据,也即截面数据与时间序列数据的混合版本。简而言之:“众多主体中的【某个主体】,在时间序列中的【某个时间点】,对应着众多变量指标中的【某个指标】,的那个数值(赋值)是什么。”
(二)面板数据的基本格式:
小白入门,可以先用Excel把数据搞好了再导进去Stata进行实证。假设,该数据有2个主体,年份一共3年,一共有3个变量指标,则面板数据在Excel中的排列格式如下:
若有N个主体,有T个年份,有n个指标,则按上述表格类推出去,形成一个NTn的平面数据集。
(三)面板数据的分类:
1、短面板和长面板:若T较大而N较小,则为长面板数据,反之则为短面板数据。
2、静态面板和动态面板:如果解释变量中包含着被解释变量的滞后项,则称为“动态面板”,反之则称为“静态面板”。
3、平衡面板和非平衡面板:若每个时期中,样本的个体都完全一样,则称为“平衡面板数据”,反之为“非平衡面板数据”。(即:每个个体的每个时间的每个指标都不缺失,是一个完完整整的NTn数据集,则平衡)
二、面板数据的Stata整理(以Stata/SE 160为例)
(一)导入Stata:
1、打开Stata—Stata基础页面—文件—导入—Excel电子表格
2、点击“浏览”—选择整理好数据的Excel表格“Stata示范数据xlsx"—勾选“将第一行作为变量名”—点击“确定”
(二)查看数据:
Stata基础页面—数据—数据编辑器—数据编辑器(编辑)(在这里可以看到所有数据,以及自由编辑各指标的名称、数据类型以及格式等等。)
(三)整理数据:
1、若发现某个指标的数据显示为红色,需要更改该指标的数据类型。
(1)命令:encode var1, gen(var1_new) (假设这个指标是“var1”,用encode命令处理后重新命名为“var1_new”)
2、将数据集命令为面板数据:
(1)命令:xtset id time(id为主体序列名称,time为时间序列名称) (2)返回结果如下: xtset id year panel variable: id (unbalanced) time variable: year, 2005 to 2018 delta: 1 unit (3)理解:unbalanced说明该面板为非平衡面板
至此,数据的导入和整理已经结束了。再次检查“数据编辑器”,所有数据均无红标。之后就开始进行实证检验了。
三、数据的描述性统计表
(一)常用命令:
1、summarize var1…var_n(该命令返回各变量的样本量、均值、标准差、最小值与最大值。) 2、sum var1…var_n, detail(该命令返回更详尽的描述性统计结果;sum为summarize的缩写
------------分---界---线------------
以上。
以上就是关于state中时间序列数据怎么导入全部的内容,包括:state中时间序列数据怎么导入、、等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)