对统计数据特征的测度的三个方面:(1)分布的集中趋势;(2)分布的离散程度;(3)分布的偏态和峰度。
一、集中趋势的测度(三星)
集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。
(一)众数
1.含义:一组数据中出现频数最多的那个数值,用M0表示。 2.特点:
(1)不仅适用于品质数据,也适用于数值型数据。
(2)众数是一个位置代表值,不受极端值的影响,抗干扰性强。
【教材190页例题】一家连锁超市的10个分店某月的销售额(单位:万元)分别为:61 65 73 78 80 80 80 80 96 97,这10个分店月销售额的众数是多少? 【答案】M0=80(万元)
【解析】众数是一组数据中出现频数最多的那个数值。 (二)中位数
1.含义:把一组数据按从小到大的顺序进行排列,位置居中的数值,用Me表示。 2.思路:数据排序→确定中位数的位置→确定中位数的具体数值
3.特点:
(1)主要用于顺序数据,也适用于数值型数据,但不适用于分类数据。 (2)中位数也是一个位置代表值,不受极端值的影响,抗干扰性强。 【教材191页例题】某地级市下辖9个县,每个县的面积如下,计算中位数: 1455 2019 912 1016 1352 1031 2128 1075 2000
【答案】先排序 912 1016 1031 1075 1352 1455 2000 2019 2128 中位数(9+1)/2=5,中位数1352。
【例题-单】(2008)某小学六年级8个班的学生人数由少到多依次为34人、34人、34人、34人、36人、36人、37人、37人,其中位数为( )。 A.34 B.35 C.36
D.37 【答案】B
【解析】个数为偶数,中位数=(34+36)/2=35。
【例题-单】(2011)2010年某省8个地市的财政支出(单位:万元)分别为: 59000 50002 65602 66450 78000 78000 78000 132100 这组数据的中位数和众数分别是( )万元。 A.78000 78000 B.72225 78000 C.66450 132100 D.75894.25 132100 【答案】B
【解析】本题考查中位数和众数的计算。把一组数据按从小到大的顺序进行排列,位置居中的数值叫做中位数。把题干中的数据按顺序排列就是50002,59000,65602,66450,78000, 78000,78000,132100。中位数就是(66450+78000)/2=72225。众数就是一组数据中出现频数最多的那个数值,即78000。所以答案是B。 (三)算术平均数
1.定义:算术平均数是全部数据的算术平均,又称均值,用 表示。 2.计算公式:
简单算术平处理未分组的原
均数
始数据
加权算术平处理经分组整理均数
的数据
Xi——各组的组中值 fi——各组的频数
【小窍门】组中值*频率(权重),再加总
3.特点:
(1)适用于数值型数据,但不适用于品质数据。
(2)算术平均数同时受到两个因素的影响:各组数值的大小、各组分布频数的多少。 (3)算术平均数易受极端值的影响。 4.地位:集中趋势中最主要的测度值。
【教材191页例题】某市商业企业协会根据100个会员样本,整理出一年销售额分布资料(表24-1),计算年平均销售额。
【答案】(125×4+175×16+225×40+275×28+325×10+375×2)÷100=240
或125×4/100+175×16/100+225×40/100+275×28/100+325×10/100+375×2/100=240 【例题-单】(2003)集中趋势最主要的测度值是( )。 A.众数 B.中位数 C.均值 D.几何平均数 【答案】C
【解析】算术平均数是全部数据的算术平均,又称均值,是集中趋势中最主要的测度值。 【例题-多】(2006)对于经分组整理的数据,其算术平均数会受到( )等因素的影响。 A.各组数值的大小 B.各组分布频数的多少 C.组数 D.数据个数 E. 极端值 【答案】ABE
【解析】算术平均数同时受到两个因素的影响:各组数值的大小、各组分布频数的多少。另外,算术平均数易受极端值的影响。
【例题-多】(2011)对分组数据计算加权算术平均数时,其平均数值会受到( )等因素的影响。 A.组内极差 B.极端值 C.组内标准差 D.各组数值大小 E.各组频数多少 【答案】BDE
【解析】本题考查算术平均数的相关知识。计算和运用算术平均数须注意:(1)算术平均数同时受到两个因素的影响:各组数值的大小;各组分布频数的多少。(2)算术平均数易受极端的影响。 (四)几何平均数
1.含义:n个观察值连乘积的n次方根就是几何平均数。 2.公式:
3.用途:
(1)对比率、指数等进行平均。 (2)计算平均发展速度。
【总结】集中趋势指标特点总结
品质数据
指标
极端值
分类数据
众数
位置平均数
中位数 算术平均数
数值平均数
几何平均数
受影响
不适用
不适用
连乘积关系的适用
不受影响
不适用 不适用
适用 不适用
适用 适用
适用
顺序数据 适用
适用 数值型数据
【例题-单】(2005、2006、2007)下列集中趋势中,适用于品质数据的是( )。 A.众数
B.简单算数平均数 C.标准差 D.加权算术平均数 【答案】A
【解析】众数不仅适用于品质数据,也适用于数值型数据。
【例题-单】(2008)下列数据特征的测度值中,受极端值影响的是( )。 A.中位数 B.众数
C.加权算术平均数 D.位置平均数 【答案】C
【解析】算术平均数易受极端值的影响,所以本题答案是C。 【例题-多】(2009)适于测度顺序数据的指标有( )。 A.离散系数 B. 中位数 C. 众数 D. 均值 E. 标准差 【答案】BC
【解析】适于测度顺序数据的指标有:众数、中位数。 二、离散程度的测度
1.定义:离散程度是指数据之间的差异程度或频数分布的分散程度。集中趋势的测度值对一组数据的代表程度,取决于该组数据的离散水平。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。 2.测度指标:主要包括极差、方差和标准差、离散系数等。
【例题-单】(2010)集中趋势的测度值对一组数据的代表程度,取决于该组数据的离散
水平。数据的离散程度越大,集中趋势的测度值对该组数据的代表性( )。 A.越好 B.越差 C.始终不变
D.在一定区间内反复变化 【答案】B
【解析】数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。 (一)极差(二星)
1.含义:极差是最简单的变异指标。它就是总体或分布最大的标志值与最小的标志值之差,又称全距,用R表示。 2.公式:
3.作用:极差反映的是变量分布的变异范围或离散幅度,在总体中任何两个单位的标志值之差都不可能超过极差。
4.特点:仅仅取决于两个极端值的水平,不能反映其间的变量分布情况,同时易受极端值的影响。
【例题-单】(2010)根据下表所列我国1998年至2003年人口数及构成情况,1998年至2003年我国男性人口占年底总人口比重的极差是( )。
年份
年底总人口(万人) 其中:男性(万人) 男性所占比重(%)
1998 124761 63940 51.25
1999 125786 64692 51.43
2000 126743 65437 51.63
2001 127627 65672 51.46
2002 128453 66115 51.47
2003 129227 66556 51.50
A.0.38% B.0.25% C.51.25% D.51.63% 【答案】A
【解析】男性所占比重的最大值为51.63%,最小值为51.25%,极差=51.63%-51.25%=0.38%。 (二)标准差和方差(一星)
1.含义:方差是总体所有单位标志值与其平均数离差之平方的平均数。标准差是方差的平方根,用σ表示。
2.地位:应用最广泛的统计离散程度的测度方法。 3.计算:(了解)
方差
= 标准差=
未整理数据
分组数据
方差= 标准差=
(三)离散系数(标准差系数)(三星)
1.作用:极差、标准差、方差都是反映数据分散程度的绝对值。为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。用于比较对不同组别数据的离散程度。离散系数大的说明数据的离散程度也就大,离散系数小的说明数据的离散程度也就小。
2.计算:一组数据的标准差与其相应的算术平均数之比,是测度数据离散程度的相对指标,用
表示。
【例题-单】(2004)某学校学生的平均年龄为20岁,标准差为3岁;该校教师的平均年龄为38岁,标准差为3 岁。比较该校学生年龄和教师年龄的离散程度,则( )。 A.学生年龄和教师年龄的离散程度相同 B.教师年龄的离散程度大一些
C.教师年龄的离散程度是学生年龄离散程度的1.9倍 D.学生年龄的离散程度大一些 【答案】D
【解析】平均值不同的情况下,用离散系数比较离散程度。学生年龄的离散系数=3/20*100%=15%。教师年龄的离散系数=3/38*100%=7.89%。离散系数大的说明数据的离散程度就大。
【例题-单】(2008)标准差系数是一组数据的标准差与其相应的( )之比。 A.算术平均数 B.极值 C.众数 D.几何平均数 【答案】A
【解析】离散系数也称标准差系数,是一组数据的标准差与其相应的算术平均数之比,是测度数据离散程度的相对指标。
【例题-单】(2011)下列离散程度的测度值中,能够消除变量值水平和计量单位对测度值影响的是( )。
A.标准差 B.离散系数 C.方差 D.极差 【答案】B 【解析】本题考查离散系数的相关内容。离散系数可以消除变量值水平和计量单位不同对离散程度测度值的影响。 【总结】集中趋势、离散趋势指标特点总结 品质数据 指标 极端值 分类数据 顺序数据 众数 位置平均数 中位数 算术平均数 数值平均数 几何平均数 极差 绝对指标 离散程度 方差 相对指标 离散系数 标准差 受影响 不适用 不适用 适用 受影响 不适用 不适用 连乘积关系的适用 不受影响 不适用 不适用 适用 不适用 适用 适用 适用 适用 适用 数值型数据 【例题-单】(2009)离散系数比标准差更适用于比较两组数据的离散程度,这是因为离散系数( )。 A.不受极端值的影响 B.不受数据差异程度的影响 C.不受变量值水平或计量单位的影响 D.计算更简单 【答案】C 【解析】极差、标准差、方差都是反映数据分散程度的绝对值。为消除变量值水平高低和计量单位不同对离散程度测度值的影响,需要计算离散系数。用于比较对不同组别数据的离散程度。 【例题-多】(2010)数值型数据离散程度的测度指标有( )。 A.中位数 B.几何平均数 C.极差 D.标准差 E.方差 【答案】CDE
【解析】极差、标准差、方差都是反映数据分散程度的绝对值,适于测度数值型数据的离散程度。
因篇幅问题不能全部显示,请点此查看更多更全内容