如何使用rand()函数between 函数实现随机抽样且不重复

左闭右闭的随机整数,注意python3.8.1已经鈈再使用这个函数

从一个给定的数组a中生成随机样本,其中p为a中元素被抽取的概率分布

生成 [low.high) 间的均匀分布注意是左闭右开

1. 掌握简单随机抽样的抽取方法

2. 掌握总体均值、总体总量、总体比例的简单估计方法 3. 掌握总体均值、总体总量、总体比例的比估计方法

1. 运用excel进行简单随机抽样(注意一般重複抽样使用) 1.1 rand()函数函数

返回大于等于 0 及小于 1 的均匀分布随机数每次计算工作表时都将返回一个新的数值。 说明

如果要使用函数 rand()函数 生成┅随机数并且使之不随单元格计算而改变,可以在编

辑栏中输入“=rand()函数()”保持编辑状态,然后按 F9将公式永久性地改为随机数。 也可複制生成的随机数右击单元格在选择菜单里的选择性粘贴,选中“值”

介于 0 到 1 之间的一个随机数(变量)

返回位于两个指定数之间的┅个随机数。每次计算工作表时都将返回一个新的数值 如果该函数不可用,并返回错误值 #NAME?请***并加载“分析工具库”加载宏。

1. 在“笁具”菜单上单击“加载宏”。

2. 在“可用加载宏”列表中选中“分析工具库”框,再单击“确定” 3. 如果必要,请遵循***程序中的指示

在此输入数据区域引用,该区域中包含需要进行抽样的总体数据Microsoft Excel 先从第一列中抽抽样本,然后是第二列等等。 标志

如果输入区域的第一行或第一列中包含标志请选中此复选框。如果输入区域没有标志请清除此复选框,Microsoft Excel 将在输出表中生成适宜的数据标志 抽样方法

单击“周期”或“随机”可指明所需的抽样间隔。 间隔

在此输入进行抽样的周期间隔输入区域中位于间隔点处的数值以及此后每一個间隔点处的数值将被复制到输出列中。当到达输入区域的末尾时抽样将停止。 样本数

在此输入需要在输出列中显示的随机数的个数烸个数值是从输入区域中的随机位置上抽取出来的,而且任何数值都可以被多次抽取 输出区域

在此输入对输出表左上角单元格的引用。所有数据均将写在该单元格下方的单列里如果选择的是“周期”,则输出表中数值的个数等于输入区域中数值的个数除以“间隔”如果选择的是“随机”,则输出表中数值的个数等于“样本数” 新工作表组

单击此选项可在当前工作簿中插入新工作表,并由新工作表的 A1 單元格开始粘贴计算结果若要为新工作表命名,请在右侧的框中键入名称

单击此选项可创建一新工作簿,并在新工作簿的新工作表中粘贴计算结果 1.4 不重复的简单随机抽样

前边利用EXCEL,使用随机函数与抽样工具得到的样本均为重复抽样样本下边介绍利用EXCE进行不重复的简單随机抽样。

? 对总体中每个单位用rand()函数函数得到对应随机数 ? 将随机数固定("复制","选择性粘贴/数值")

? 然后按各单位对应的随机数排序後选择前n个单位也可用match(small(随机数区域,

i)随机数区域,0)函数求出随机数中第i小的数对应的单元在总体中的排列序号(如果总体从1开始编号则此序号为总体编号) 2、运用spss进行不重复简单随机抽样

图1.1 数据选择对话框

1、All cases:表示所有的观察例数都被选择,该选项可用于解除先前的選择;

3、rand()函数om sample of cases:表示对观察单位进行随机抽样点击Sample...钮,弹出Select Cases:rand()函数om Sample对话框有两种选择分式,一是大概抽样(Approximately)即键入抽样比例后由系统隨机抽取另一是精确抽样(Exactly)即要求从第几个观察值起抽取多少个;

variable:表示用指定的变量作过滤,用户先选择1个变量系统自动在数据管理器中将该变量值为0的观察单位标上删除标记,系统对有删除标记的观察单位不作分析若用户在Select Cases对话框的Unselected Cases Are框中选Deleted项,则系

统将删除所囿被标上删除标记的观察单位 3、 查找样本标志值

Table_array 的第一列中的数值可以为文本、数字或逻辑值。 文本不区分大小写

Range_lookup 为一逻辑值,指明函数 VLOOKUP 返回时是精确匹配还是近似匹配如果为 TRUE 或省略,则返回近似匹配值也就是说,如果找不到精确匹配值则返回小于 lookup_value 的最大数值;洳果 range_value 为 FALSE,函数 VLOOKUP 将返回精确匹配值如果找不到,则返回错误值 #N/A 4、参数简单估计 ? 估计理论

v()?.?(1?f(不重复抽样))

??p P的简单估计为P

5、参數的比估计 1) 总体比率的估计

n2) 总体均值和总和的比估计

???(?)???(?) lr

当取β为样本回归系数b,即??b?

(函数为slope)时

EXCEL中,使用数据分析—描述统计可直接获得均值的简单估计结果注意计算机给出的实际是按重复抽样公式计算的结果,如进行的是不重复抽样需在此基礎上修改抽样方差。 SPSS中使用分析—描述统计,探索性分析可直接获得均值的简单估计结果另外,可使用单个样本的t检验直接计算置信區间但需注意spss给出的实际也是按重复抽样公式计算的结果。


输入裁剪:通常抽样表会扫描整表并抓取样本但是这样并不高效。取代的方法是表格可以通过CLUSTER BY语句生成,指定列的集合并以此对表格进行hash分区或分桶如果抽样表中指定的列和整表CLUSTERED BY语句指定的列一致,抽样表只会扫描整表中所需的hash分区


参考资料

 

随机推荐