
第5章 基本描述统计.ppt
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第5章 基本描述统计.ppt
- 资源描述:
-
1、第五章 基本统计分析,1 频数分布表 2 描述统计分析3 探索分析4 列联表5 多选项分析6 基本统计分析的报表制作,频数分布表,利用频数分布表可以方便地对数据按组进行归类整理,形成各变量的不同水平(分组)的频数分布表及图形,以便对各变量的数据特征和观测量的分布状况有一个概括的认识; 单变量频数分布分析,可通过Frequencies频数分布对话框(Analyze Descriptive Statistics Frequencies)来具体实现。,Frequencies对话框,Frequencies对话框,四分位数:将一组个案由小到大(或由大到小)排序后,用3个点将全部数据分为四等份,与3个点上
2、相对应的变量称为四分位数,分别记为Q1(第一四分位数)、Q2(第二四分位数)、Q3(第三四分位数)。其中,Q3到Q1之间的距离又称为四分位距(interquartile range),记为IQR。四分位差(Quartile deviation )为1/2 IQR。 百分位数:将一组数据由小到大(或由大到小)排序后分割为100等份,与99个分割点位置上相对应的变量称为百分位数,分别记为P1,P2,P99,表示1%的数据落在P1下,2%的数据落在P2下,99%落在P99下。,四分位数、十分位数、百分位数,峰度:描述某变量所有取值分布形态陡缓程度的统计量。与正态分布相比较,峰度为0表示其数据分布与正
3、态分布的陡缓程度相同;峰度大于0表示比正态分布高峰要更加陡峭,为尖顶峰;峰度小于0表示比正态分布的高峰要平坦,为平顶峰。计算公式为,偏度:描述某变量取值分布对称性的统计量。与正态分布相比较,偏度为0表示其数据分布形态与正态分布偏度x相同;偏度大于0为正偏或右偏,即有一条长尾巴拖在右边;偏度小于0表示负偏或左偏,有一条长尾拖在左边。而偏度的绝对值数值越大表示分布形态的偏斜程度越大。 计算公式为,峰度、偏度,Frequencies对话框,输出结果:,本例均选系统默认项,描述统计分析,描述统计分析过程,是通过计算均值、算术和、标准差、极值、方差、均值、标准误等统计量来描述样本数据的集中趋势、离散趋势
4、及分布特征; 描述统计分析过程,可通过Descriptives对话框(Analyze Descriptive Statistics Descriptives) 来具体实现。,Descriptives对话框,Descriptives对话框,输出结果:,探索分析,探索分析是指对测得的数据进行初步考察与核实,目的是检查数据中是否存在奇异值、影响点或错误数据,判别数据分布特征,以及进行假设检验等; 探索分析过程,可通过Explore对话框实现(Analyze Descriptive Statistics Explore) ,该过程要求参与分析的变量是等距测度的数值型变量,分组变量可以是数值型或是字符型
5、。,Explore对话框,Explore对话框,不同分组的同一因变量显示在一个箱图中,同一组的不同因变量显示在一个箱图中,Spread versus Level : 横轴为各水平组的中位数及纵轴为四分位距的自然对数。 Power estimation: 对原始数据进行幂转换,直到各组间满足方差齐性。Transformed 为原始数据转换后,再划图。,输出结果(一),选项均为系统默认,输出结果(二),IQR,输出身高正态概率图(Normal Q-Q Plot of身高)。,男孩身高变量的正态概率图,输出结果(三),女孩身高变量的正态概率图,正态分布Q-Q检验图,横坐标为实际观测值按从小到大的顺序
6、排列,纵坐标为正态分布下的期望值。如果实际观测值取自正态分布的总体,图中所示的落点应该分布在趋势线的附近,并且应该表现出一定的集中趋势,即平均数附近应该聚集较多的落点,越靠近两个极端落点越少。,输出离散正态概率图(Detrended Normal Q-Q Plot of 身高)。以实际观测值为横坐标,以实际观测值与期望值的差为纵坐标。在符合正态分布的情况下,图中的落点应该分布在中央横线的附近,甚至完全落到这条横线上,而且也应表现出集中在平均数周围的趋势。,男孩身高离散正态概率图,女孩身高离散正态概率图,输出结果,输出结果(离散正态分布P-P概率图),Lilliefors 显著水平下,正态总体检
展开阅读全文
