• / 40
  • 下载费用:10 金币  

stata上机实验第五讲——面板数据的处理...ppt

关 键 词:
stata上机实验第五讲——面板数据的处理..ppt
资源描述:
面板数据一些面板数据教材• 面板数据分析 (美)萧政 著• 横截面与面板数据的经济计量分析 伍德里奇 著,王忠玉 译• Baltagi. Econometric Analysis of Panel Data• 最新动态可关注期刊:Journal of Econometrics面板数据一些前沿问题面板向量自回归模型 (Panel VAR)面板单位根检验 (Panel Unit Root test)面板协整分析 (Panel Cointegeration)门槛面板数据模型 (Panel Threshold)面板联立方程组面板空间计量静态面板数据• 静态面板数据模型,是指解释变量中不包含被解释变量的滞后项 (通常为一阶滞后项 ) 的情形。但严格地讲,随机干扰项服从某种序列相关的模型,如 AR(1), AR(2), MA(1) 等,也不是静态模型。静态面板数据主要有两种模型 ------固定效应模型和随机效应模型。面板数据的格式company year invest mvalue1 1951 755.9 48331 1952 891.2 4924.91 1953 1304.4 6241.71 1954 1486.7 5593.62 1951 588.2 2289.52 1952 645.5 2159.42 1953 641 2031.32 1954 459.3 2115.53 1951 135.2 1819.43 1952 157.3 2079.73 1953 179.5 2371.63 1954 189.6 2759.9面板数据模型• 考虑如下模型:• Yit=Xitb+Uit• uit=ai+εit其中, i=1,2,… N ; t=1, 2,…T( 既有 i又有 t的情况则一般是用面板数据)uit称为复合扰动项。固定效应模型• 对于特定的个体 i而言, ai 表示那些 不随时间改变的影响因素 ,如个人的消费习惯、国家的社会制度、地区的特征、性别等,一般称其为 “个体效应 ” (individual effects)。如果把 “个体效应 ”当作不随时间改变的固定性因素, 相应的模型称为 “固定效应 ”模型。固定效应模型• 固定效应模型的公式变为:• Yit=ai+Xitb+εit• 回 归结 果是每个个体都有一个特定的截距项 。( ai在这里就独立出来了 )随机效应模型• 随机效应模型将个体效应 ai视为 随机因素 ,即把个体效应设定为干扰项的一部分。公式将变为:• Yit=Xitb+(ai+εit)• 回归的结果是随机效应模型的所有的个体具有相同的截距项,个体的差异主要反应在随机干扰项的设定上。• 怎样选择固定效应和随机效应?• 随机效严格要求 个体效应与解释变量不相关 ,即• Cov(ai,XitB)=0• 而固定效应模型并不需要这个假设条件。• 这是两种模型选择的关键。面板数据基本命令• 1、指定个体截面变量和时间变量: xtset(• 2、对数据截面个数、时间跨度的整体描述:xtdes。分组内、组间和样本整体计算各个变量的基本统计量 xtsum。采用列表的方式显示某个变量的分布 xttab,较少使用。• 3、 list、 sum、 des、 tabstat、 histogram、kdensity等命令都可以用。• 4、对每个个体分别显示该变量的时间序列图: xtline。• 5、静态面板数据基本回归命令: xtreg, 系统默认 GLS估计(广义最小二乘法) 。use grunfeld,clearxtset company yearxtdesxtline invest混合回归: reg invest mvalue kstock( pool回归,其会扩大样本量,)固定效应: xtreg invest mvalue kstock ,fe随机效应: xtreg invest mvalue kstock ,re用 F值或 P值进行判断,如果 p值较大,则应该用pool回归)• xtreg Fixed-, between- and random-effects, and population-averaged linear models • xtregar Fixed- and random-effects linear models with an AR(1) disturbance • xtgls Panel-data models using GLS • xtpcse OLS or Prais-Winsten models with panel-corrected standard errors • xtrchh Hildreth-Houck random coefficients models • xtivreg Instrumental variables and two-stage least squares for panel-data models • xtabond Arellano-Bond linear, dynamic panel data estimator (动态面板估计) • xtabond2 Arellano-Bond system dynamic panel data estimator(需要从网上下载 ) • xttobit Random-effects tobit models • xtintreg Random-effects interval data regression models • xtreg Fixed-, between- and random-effects, and population-averaged linear models • xtregar Fixed- and random-effects linear models with an AR(1) disturbance • xtgls Panel-data models using GLS• xtpcse OLS or Prais-Winsten models with panel-corrected standard errors • xtrchh Hildreth-Houck random coefficients models • xtivreg Instrumental variables and two-stage least squares for panel-data models • xtabond Arellano-Bond linear, dynamic panel data estimator • xtabond2 Arellano-Bond system dynamic panel data estimator(需要从网上下载 ) • xttobit Random-effects tobit models • xtintreg Random-effects interval data regression models 结果解读• 固定效应• 随机效应• 特别注意:• 1、三个 R2哪个重要? 组内、组间、总体拟合优度。• 2、固定效应为什么有两个 F检验?• 3、 corr(u_i, Xb) 的含义。• 4、 sigma_u、 sigma_e、 rho的含义。• sigma_u是固定效应模型估计中的个体效应的方差估计值• sigma_e随机干扰项的方差估计值• rho: rho= sigma_u ^2/(sigma_u^2+ sigma_e^2) ,是 两者之间的关系 ( u-i))以及针对 u_i显著性的联合检验统计量( F值和 p值)。• corr(u_i, Xb) 个体效应与解释变量的相关系数,相关系数 为 0或者接近于 0,可以使用随机效应模型 ;相关系数不为 0,需要使用固定效应模型。 u-i不表示 残差 ,表示个体效应。模型选择• 固定效应 还是 混合 OLS?可以直接观测 F值• 随机效应还是混合 OLS?先用随机效应回归,然后运行 xttest0• 固定效应还是随机效应?Hausman检验• Hausman检验• 基本思想:如果 Corr(a_i,x_it) = 0, Fe 和 Re 都是一致的,但 Re更有效。如果 Corr(a_i,x_it)!= 0, Fe 仍然一致,但Re是有偏的。因此原假设是 Corr(a_i,x_it) = 0,即应该采用随机效应。• Hausman检验步奏• Step1:估计固定效应模型,存储估计结果; • Step2:估计随机效应模型,存储估计结果; • Step3:进行 Hausman检验; xtreg invest mvalue kstock ,feest store fixedxtreg invest mvalue kstock ,reest store randomhausman fixed random本题接受原假设,即应该用随机效应。几个常见问题• 1、既然固定效应每个个体都有单独的截距项,如何获得每个个体的截距项?xi:reg invest mvalue kstock i.company即 LSDV方法或者添加虚拟变量法。• 2、非平衡面板如何处理?use nlswork,clearxtset idcode yearxtdes这是一份典型的大 n小 t型非平衡面板数据。方法一:下载命令 xtbalance提取成一个平衡面板数据,但不推荐使用,因为会损失大量样本。方法二:利用算法填补缺失值,需要经济理论和算法的支撑。• 3、面板数据格式不符合要求的处理。• 例如如下表格格式该如何处理?• 处理方法:• 扁平数据变长条数据的命令: reshapeuse invest2,cleareditreshape long invest kstock, i(company) j(year)company invest2002 invest2003 invest2004 kstock2002 kstock2003 kstock20041 18.9 19.1 19.6 19.6 16.8 16.72 17.4 18.4 18.8 18.1 17.4 173 19 19.6 20.1 20.2 17 17.14 20 20.4 20.3 20.4 17.5 17.35 18.1 18.3 18.4 18.5 16.4 16.16 19.7 20 19.9 17.2 16.3 16.3其他回归方法• 1、聚类稳健的标准差• 通常可以假设不同个体之间的扰动项相互独立,但同一个体在不同时期的扰动项之间往往存在自相关。故须采用聚类稳健的标准差。use grunfeld,clearxtset company yearreg invest mvalue kstock,vce(cluster company) 同理有:xtreg invest mvalue kstock,fe vce(cluster company)xtreg invest mvalue kstock,re vce(cluster company)GLS的缺点就是要满足一些特定的条件• 2、对于固定效应模型,可采用虚拟变量法。• 基本思想:固定效应模型实质上就是在传统的线性回归模型中加入 N-1 个虚拟变量,使得每个截面都有自己的截距项。由于固定效应模型假设存在着 “个体效应 ”,每个个体都有其单独的截距项。这就相当于在原方程中引入 n−1个虚拟变量(如果省略常数项,则引入 n个虚拟变量)来代表不同的个体,获得每个个体的截据项。tab company,gen(dum)(批量生成变量)drop dum1reg invest mvalue kstock dum*( *表示未知数)与上述方法比较一下:xi:reg invest mvalue kstock i.company结果完全一样。组间估计法• 对于随机效应模型,还可以采用 “组间估计量 ”。对于那些每个个体的时间序列数据较不准确或 “噪音 ”较大的数据,可对每个个体取时间平均值,然后用平均值来回归。xtreg invest mvalue kstock ,be由于损失了较多信息量,组间估计法并不常用。
展开阅读全文
  微传网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
0条评论

还可以输入200字符

暂无评论,赶快抢占沙发吧。

关于本文
本文标题:stata上机实验第五讲——面板数据的处理...ppt
链接地址:https://www.weizhuannet.com/p-11246920.html
微传网是一个办公文档、学习资料下载的在线文档分享平台!

网站资源均来自网络,如有侵权,请联系客服删除!

 网站客服QQ:80879498  会员QQ群:727456886

copyright@ 2018-2028 微传网络工作室版权所有

     经营许可证编号:冀ICP备18006529号-1 ,公安局备案号:13028102000124

收起
展开