当观察值个数较多时,可先将各观察值分组归纳成频数表,用加权法求均数。其计算步骤如例18.2。
例18.2 某地1993年随机测量了该地110名20岁健康男大学生的身高(cm),资料如下,试计算其均数。
173.9173.9166.9179.5171.2167.8177.1174.7173.8182.5173.6165.8168.7173.6173.7177.8180.3173.1173.0172.6173.6175.3178.4181.5170.5176.4170.8171.8180.7170.7173.8164.4170.0175.0177.7171.4162.9179.0174.9178.3174.5174.3170.4173.2174.5173.7173.4173.9172.9177.9168.3175.0172.1166.9172.7172.2168.0172.7172.3175.2171.9168.6167.6169.1166.8172.0168.4166.2172.8166.1173.5168.6172.4175.7178.8169.1175.5170.3171.7164.6171.2169.1170.7173.6167.2170.7174.7171.8167.3174.8168.5178.7177.3165.9174.0170.2169.5172.1178.2170.9171.3176.1169.7177.9171.1179.3183.5168.5175.5175.91.编制频数表
(1)求全距(range):找出观察值中的最大值(183.5)和最小值(162.9),它们的差值即全距,常用R表示。本例R=20.6。
(2)定组距和组段:相邻两组的最小值之差称组距,常用i表示,各组距可相等,也可不相等,一般用等距。常取全距的1/10,取整作组距。本例全距的1/10为2.06,取整为2,用等距共划分11个组段。第一组段应包括资料中最小值,最末组段应包括最大值,一般要求组段的起点为较整齐的数。本例第一组段的起点(即下限)取162,其止点(即上限)为第二组段的起点即164,然后每一组距(本例为2)就成为一组段,最末组段应同时写出下限和上限,本例为182~184。
(3)列表划记:按上述的组段序列排列制表,用正字划记法将例18.2中的数据归纳到各组段中,最后清点出频数得频数表,表18-1中的第(2)、(3)栏。
表18-1 110名20岁健康男大学生身高(cm)的频数分布
由频数表的频数分布可看出两个重要特征:集中趋势和离散趋势。集中趋势即频数分布向中央部分集中;离散趋势即频数分布由中央到两侧逐渐减少。频数分布可为①对称分布或近似正态分布,即集中位置在正中,两侧频数分布大致对称,如表18-1;②偏态分布,即集中位置偏向一侧,频数分布不对称,若集中位置偏向数值小的一侧,为正偏态分布;若集中位置偏向数值大的一侧,为负偏态分布。不同类型的分布,应采用相应描述指标和统计分析方法。
2.计算公式
公式(18.2)
式中,k为组段数;f1,f2,……,fk分别为各组段的频数;X1,X2,……,Xk分别为各组段的组中值,组中值为本组段的下限与相邻较大组段的下限相加除以2,如“162-”组段的组中值X1=(162+164)/2=163,余仿此。
3.列计算表(表18-2)计算均数
110名20岁健康男大学生身主的均数为172.73(cm)。
©2019-2025 学门教育网 版权所有 电脑版
网站备案/许可证号:鲁ICP备19034508号-2