1.如何删除某几行的数据

drop if year2==2014 | year2==2013

2.如何计算连续几年的标准差

*year2为int型

bys stkcd (year2):gen roa1=adjroa[_n-1]

bys stkcd (year2):gen roa2=adjroa[_n-2]

bys stkcd (year2):gen roa3=adjroa[_n+1]

bys stkcd (year2):gen roa4=adjroa[_n+2]

egen roasd=rowsd(roa1 roa2 adjroa roa3 roa4)

3.如何实现excel与stata的数据导入导出?

复制粘贴就行啦~

4.如何打开csv格式文件?

insheet using "路径+文件名",clear

5.如何实现分组并求平均值?

*bysort year group按照年份和行业来分组计算,mean为求平均值,meanroa为新的变量名,egen为生成一列新的变量

bysort year group:

egen meanroa=mean(roa)

6.如何对数据进行分组编号?

egen new_id = group(industry)

7.变量重新命名

ren f050201b ROA

8.缩尾处理

*winsor命令是用第1%的数据去替换前1%的数据,用第99%的数据去替换后1%的数据

. winsor roa, gen(newroa) p(0.01)

. winsor2 roa, cuts(1 99) by(group)

*winsor2相比于winsor命令的改进:

(1) 可以批量处理多个变量;

(2) 不仅可以 winsor,也可以 trimming;

(3) 附加了 by() 选项,可以分组 winsor 或 trimming;

(4) 增加了 replace 选项,可以不必生成新变量,直接替换原变量。

范例:

*- winsor at (p1 p99), get new variable "wage_w"

.   sysuse nlsw88, clear

.   winsor2 wage

*- left-trimming at 2th percentile

.   winsor2 wage, cuts(2 100) trim

*- winsor variables by (industry south), overwrite the old variables

.   winsor2 wage hours, replace by(industry south)

9.安装某个命令

. findit winsor2

10.分组比较两个正态总体样本的均值

. ttest roasd, by (vc) unequal

尤其注意by后面那个括号啊....被坑死(哭

11.分组比较两个样本的方差

. sdtest roasd, by (vc)

12.取某一行中的最大值最小值

egen roasd_max=rmax(roasd1 roasd2 roasd roasd3 roasd4)

13.Wilcoxon秩和检验

ranksum 观察值变量,by(分组变量)

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐