STATA简单命令

2026/4/23 13:28:24

trim(x) 去除字符串前面和后面的空格

int(x) 去掉x的小数部分，得到整数

sum(X) 求和

max(x) min(x) 最大值最小值

_n 当前观察值的位置

_N 观察值的总个数

8、ren: 重命名

例：ren var1 var123 // 把var1重新命名为var123

9、des:描述数据库的基本情况

10、label: 为变量添加一些说明，以示说明

11、sort: 按照某一变量从小到大排序

9 / 19

gsort +/-：按照某一变量从大到小或者从小到大排序

sort var1 var2:按照var1大小排序，相同的var1按照var2大小排序

12、drop:删除变量或者记录

drop x1 x2

drop x1-x5

drop if x<0\\

drop in 1/100

drop if x==.|y==.

drop _all

13、keep: 与drop对应，保存变量

14、append:纵向连接数据库

//清空数据库 10 / 19

15、merge:横向连接数据库

16、gen: 生成新变量

gen bh=_n //将数据库的内部编号赋给变量bh

17、replace:更改变量值

replace z=. if z=9 //将所有z=9的值用缺失值代替

18、set obs: 增加空白记录

set obs 20 //增加20条空白记录

19、format: 改变数据格式

format tjrq %td //将tjrq改成日期形式

20、l: list 将结果列出

21、su: 对分析数据进行描述，均值标准差等，与des不同，des是描述数据库变量个数，格式等

11 / 19

su x, d // 对x进行统计描述，如果加了d，那么就会更加detail

22、centile: 百分位数计算

centile x, centile(2.5,50,97.5) //计算变量x的2.5,50.97.5百分位数

23、tab:頻数表达

tab sex //计算两个性别各自的頻数

tab sex group //看看各组性别分布的情况

tab group, sum(x1) //在各组内对x1统计分析

24、ci: 计算可信区间

25、直方图：gra x, bin(9) xlab(10,20,30,40) ylab(0,1,2,3) norm gap(4) b2(\

//对x画直方图，分为9组，X轴为10,20,30,40，y轴为0,1,2,3，加上正态分布曲线，标题与坐标轴的距离（1-8），下坐标轴加标题为height(cm)

12 / 19

STATA简单命令.doc 将本文的Word文档下载到电脑

下载这篇word文档