Stata重复抽样的基本命令:bsample
重复抽样使用的基本命令为bsample,语法形式如下:
bsample [exp] [if] [in] [, options]
其中,if代表条件语句,in代表范围语句,options代表其他选项。exp为表达式,用于指定抽取的样本个数。
需要说明的是,对于样本容量exp,如果进行简单分层抽样,就要求样本规模小于等于数据的观测值个数;如果进行分层抽样,exp就不能超过各层中的观测值个数;如果设定选项cluster(),exp就不能超过组的个数;如果同时设定选项cluster()和strata(),exp就不能超过各层内组的个数。
此外,默认情况下,命令bsample会将内存中的数据替换为抽样的观测值,但设定选项weight()会将抽取的样本频数存放在变量varname中,也就是说,这时只有varname的值改变,原数据不会改变。但选项weight()和选项idcluster()不能同时设定。
另外,在bsample命令之后,选项weight(varname)中的varname可以用在Stata的其他命令中作为fweight(如果该命令允许设定fweight)。