trim(x) 去除字符串前面和后面的空格
int(x) 去掉x的小数部分,得到整数
sum(X) 求和
max(x) min(x) 最大值最小值
_n 当前观察值的位置
_N 观察值的总个数
8、ren: 重命名
例:ren var1 var123 // 把var1重新命名为var123
9、des:描述数据库的基本情况
10、label: 为变量添加一些说明,以示说明
11、sort: 按照某一变量从小到大排序
9 / 19
gsort +/-:按照某一变量从大到小或者从小到大排序
sort var1 var2:按照var1大小排序,相同的var1按照var2大小排序
12、drop:删除变量或者记录
drop x1 x2
drop x1-x5
drop if x<0\\
drop in 1/100
drop if x==.|y==.
drop _all
13、keep: 与drop对应,保存变量
14、append:纵向连接数据库
//清空数据库 10 / 19
15、merge:横向连接数据库
16、gen: 生成新变量
gen bh=_n //将数据库的内部编号赋给变量bh
17、replace:更改变量值
replace z=. if z=9 //将所有z=9的值用缺失值代替
18、set obs: 增加空白记录
set obs 20 //增加20条空白记录
19、format: 改变数据格式
format tjrq %td //将tjrq改成日期形式
20、l: list 将结果列出
21、su: 对分析数据进行描述,均值标准差等,与des不同,des是描述数据库变量个数,格式等
11 / 19
su x, d // 对x进行统计描述,如果加了d,那么就会更加detail
22、centile: 百分位数计算
centile x, centile(2.5,50,97.5) //计算变量x的2.5,50.97.5百分位数
23、tab:頻数表达
tab sex //计算两个性别各自的頻数
tab sex group //看看各组性别分布的情况
tab group, sum(x1) //在各组内对x1统计分析
24、ci: 计算可信区间
25、直方图:gra x, bin(9) xlab(10,20,30,40) ylab(0,1,2,3) norm gap(4) b2(\
//对x画直方图,分为9组,X轴为10,20,30,40,y轴为0,1,2,3,加上正态分布曲线,标题与坐标轴的距离(1-8),下坐标轴加标题为height(cm)
12 / 19