举例说明什么是单项式分组和组距式分组:适用情况
对于离散型变量,如果变量值的变动幅度小,并且变化很均匀,就可以一个变量值对应一组,称单项式分组。如居民家庭按儿童数或人口数分组、纺织工人按看管的机器台数分组等均可采用单项式分组。
如果离散型变量的变量值的变动幅度很大,变量值的个数很多,这时若采用单项式分组,很可能出现组数过多,各组又没有几个单位的情况,而且不能很好地反映总体各单位在各组的分布状况,这时分组就失去了意义。例如,按职工人数对工业企业进行分组,由于各企业的职工人数差别很大,采用单项式分组很不现实,这时就需要采用组距式分组。
对于连续型变量,由于其变量值是连续不断的,不能一一列举,故不能采用单项式分组,而只能采用组距式分组。
把全部变量值依次划分为几个区间,各个变量值则按其大小确定所归并的区间,区间的距离称为组距,这样的分组称为组距式分组。在组距式分组中,被分成的各个组不是一个具体的数值,而是一个数值区间。其中用于表示各组数量界限的变量值称为组限,组内的最小值为该组的下限,最大值为该组的上限。
进行组距式分组,组距和组数的确定是很重要的。在确定组距和组数时,应以能够显示数据分布特征和规律为目的,同时还应考虑到组内的同质性。如果组距过大,组数过少,分组虽然简单,但可能将性质不同的单位分在同一组,如果这样的话,数据分布特征的真实性将受到影响。而如果组距过小,组数过多,则数据的分布又过于分散,不便于了解数据分布的集中趋势。总之,分组时应根据统计研究的目的和数据本身的特点,确定适当的组距与组数。