Stata:手动计算置信区间
·
阅读全文:Stata:手动计算置信区间
作者:刘东 (中国农业大学)
邮箱:ld01@cau.edu.cn
编者按:本文主要参考自以下文章,特此致谢!
- Title:Stata:手动计算置信区间
- Keywords:置信区间,coefplot,可视化
1. 均值的置信区间:手动操作
1.1 折线图
在描述性统计中,常常需要展示某些变量的年度均值及其时序特征,有时还需要附加显示均值的 95% 置信区间。在这个示例中,我们将使用 Stata 手册中的数据文件 nlswork.dta 进行演示。首先,我们将调入数据,并生成支出变量的年度均值,然后展示这些均值随年份变化的趋势:
. webuse "nlswork.dta", clear
. replace year = 1900 + year
. tab year
. gen wage = exp(ln_wage)
. label var wage "hourly wage/GNP deflator"
. egen wage_yr = mean(wage), by(year)
. sort year
. graph twoway connected wage_yr year, ///
> title("Average hourly wage of US young women (1968-1988)") ///
> ytitle("Average hourly wage ($)") ///
> xtitle("Year") ///
> xlab(1968(1)1988, angle(30)) ///
> ylab(, labsize(small) nogrid) ///
> graphregion(color(white)) ///
> bgcolor(white)
. graph export "nlswork_connected1.png", width(600) replace
输出结果如下:

1.2 添加置信区间
上图仅呈现了各年度的平均小时工资水平,但无法知晓各个年度上的平均工资的标准误。我们可以使用 ci mean 命令来估计年度均值的 95% 置信区间 (CI)。
. webuse "nlswork.dta", clear
. replace year = 1900 + year
. tab year
. gen wage = exp(ln_wage)
. label var wage "hourly wage/GNP deflator"
. egen wage_yr = mean(wage), by(year)
. * 添加置信区间
. gen high = .
. gen low = .
. * 为每年的均值生成置信区间
. forvalues i = 1968/1988 {
2. ci mean wage if year == `i'
3. replace high = r(ub) if year == `i'
4. replace low = r(lb) if year == `i'
5. }
. sort year
. graph twoway ///
> (rcap low high year) ///
> (connected wage_yr year, ///
> color(navy) msize(small) ///
> title("Average hourly wage of US young women (1968-1988)") ///
> ytitle("Average hourly wage ($)") ///
> xtitle("Year") ///
> xlab(1968(1)1988, angle(30) labsize(small)) ///
> ylab(, labsize(small) nogrid) ///
> graphregion(color(white)) ///
> bgcolor(white) ///
> color(navy) ///
> legend(ring(0) position(5)))
. graph export "nlswork_connected_CI_bars.png", width(600) replace
阅读全文:Stata:手动计算置信区间
DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐


所有评论(0)