干货!stata常用命令汇总
近些年来,数据科学的发展给予了数据分析类本科毕业论文的写作土壤。恰当运用各类数据分析方法与数据分析软件,别人忙活三个月还搞不定的毕业论文,您可以一周之内轻松搞定~有了数据分析,论文内容就变得翔实可信,分析起来也更加有理有据,想不顺利通过都没有道理。
STATA为常用统计软件,其编程化操作有助于程序复现,同时又有大量第三方库可以运用,是写作数据分析本科毕业论文与硕士毕业论文必备软件。下面给各位同学带来STATA常用命令汇总。
命令【1】 :导入数据一般做实证分析使用的是excel中的数据,其后缀名为.xls,需要将其修改为.csv
insheet using name.csv, clear
命令【2】 :删除重复变量
sort var1 var2
duplicatesdrop var1 var2, force
命令【3】 :合并数据
use data1, clear
merge m:m var1 var2 using data2
drop if _merge==2
drop if _merge==1
drop _merge
命令【4】 :描述性统计分析
tabstat var1var2, stat(n min mean median p25 p75 max sd), if groupvar==0 or 1
输出到word中:
logout, save(name) word replace: tabstat var, stat(n min mean p50 max sd) col(stat)f(%9.2g)
命令【5】 :结果输出
安装命令包
ssc install estout, replace
单个回归
reg y x
esttab using name.rtf, compress nogap r2 ar2 star(* 0.1 ** 0.05 *** 0.01)
多个回归一起
reg y x1
est store m1
reg y x2
est store m2
esttab m1 m2 using name.rtf, compress nogap r2 ar2 star(* 0.1 ** 0.05 *** 0.01)
【命令6】 生成滞后、差分数据
tsset code year
gen newvarname=l.varname
gen newvarname=d.varname
【命令7】 多重共线检验之方差膨胀因子
reg y x1 x2 x3
vif
【命令8】 多重共线修正之逐步回归
stepwise, pe(0.1): reg y x
【命令9】 检验是否遗漏高次项
reg y xestat ovtest
或者
estat ovtest, rhs
【命令10】 样本检验两样本均值T检验
ttest var, by(groupvar)
两样本中位数Z检验
ranksum var, by(groupvar)
【命令11】 生成虚拟变量
tab year, gen(year)
tab industry, gen(industry)
【命令12】 数据缩尾处理
findit winsor2
之后安装
winsor2 varname, replace cut(1 99)
【命令13】 异方差检验怀特检验
ssc install whitetst
reg y x1 x2
estat imtest, white
处理:“OLS+稳健标准差”
reg y x1 x2 x3, robust
【命令14】 DW检验
gen id=_n
tsset id
estat dwatson
【命令15】 计算两个日期之间的间隔天数
gen td=date(trading_date,'YMD')
gen ed=date(eventdate,'YMD')
form td ed %td
gen d=ed-td