Stata学习10
在这次的学习中,我们主要学习如何使得Stata的结果变得显著的几种重要方法。1.缩尾处理winsor2在数据出现缺失值与异常值的时候,我们
在这次的学习中,我们主要学习如何使得Stata的结果变得显著的几种重要方法。
1.缩尾处理winsor2
在数据出现缺失值与异常值的时候,我们需要对于数据进行删除缺失值+缩尾处理。这里我们主要使用的函数命令是drop+winsor2。在理的参考视频来源:
https://www.bilibili.com/video/BV1jL4y1b7re/?spm_id_from=333.788&vd_source=79fa51e6cf567c9ea712fdbc769fd6f9
我们来看一段代码:
tabstat cash size debt dir indir soe, stat(mean sd min median max N) c(s) f(%6.2f)n/*后面的c(s)意思是column列;f(%6.2f)指的是format自动生成一个表格;N表示数据观测值*/n/*前面进行描述性统计分析*/ndrop if cash == .ndrop if size == .ndrop if debt == .ndrop if dir == .ndrop if indir == .ndrop if soe == .n/*在进行缩尾处理之前,我们需要对于样本数据进行删除缺失值*/nssc install winsor2 nwinsor2 cash size debt dir indir, cuts(1 99) replacen/*这里的winsor2指的是缩尾处理安装包,我们需要对于出现极端值的数据集进行缩尾处理,保证其能够出现一个稳定的回归*/
2. 挑选最优组合gsreg
这里的参考文献选择连玉君老师的主页教学网站:
https://www.lianxh.cn/news/61ae7a22439cf.html
教学视频网站参考:
https://www.bilibili.com/video/BV1s44y1V78J/?spm_id_from=333.999.0.0&vd_source=79fa51e6cf567c9ea712fdbc769fd6f9
gsreg y c1 c2 c3, fixvar(x) replace ncomb(n) cmdest(reghdfe) ncmdoptions(absorb(i.industry i.year))n//ncomb(写需要的控制变量个数,也可以是区间的形式)ncmdest(用到的回归模型,可以是xtreg、reghdfe、logit)ncmdoptions(absorb(相应模型用到的固定效应))//
这里同样利用视频里面的操作演示一下
sysuse auto.dtan//调用系统自带文件数据库//ngsreg price mpg weight foreign,replacen//请一定要养成好习惯,无论是reg还是gsreg都在最后需要添加replace//ngsreg price mpg weight foreign,fixvar(mpg) ncomb(1,2)replacen//ncomb(1,2)就是控制自变量的个数,最少1一个,最多2个//ngsreg price weight foreign,fixvar(mpg)replacen//这里在gsreg后面添加fixvar()的意思就是固定好前面的自变量,这里肯定的固定的//ngsreg price weight foreign,fixvar(mpg) cmdest(qreg)replacen//cmdest()意思是指定回归的方式,这里使用的是qreg分位数回归方式,同样的,///ncmdest()后面可以添加reghdfe指的是高维固定效应回归模型//ngsreg price weight foreign,fixvar(mpg)replace cmdest(reghdfe)///n cmdoptions(absorb(i.year)vce(cluster code))n //cmdoptions(absorb(i.year)vce(cluster code))这句命令的意思是:对年份进行吸收///n 也就是年份的固定效应。同时聚类到股票的代码//
3. OneClick一键显著命令
参考视频来源
https://www.bilibili.com/video/BV1ZT4y1m7Rs/?spm_id_from=333.788&vd_source=79fa51e6cf567c9ea712fdbc769fd6f9
4. 统一单位
5.取对数gen lnx=log(x)
6.中心化、标准化-调节效应 center var1 var2...,prefix(z_)standardize
7.增减控制变量
8.+平方
9.考虑非线性关系
10.更换变量(重新定义x、y)
11.缩小研究范围