分享
分享赚钱 收藏 举报 版权申诉 / 62

类型第5章 基本描述统计.ppt

  • 上传人:fmgc7290
  • 文档编号:8762075
  • 上传时间:2019-07-11
  • 格式:PPT
  • 页数:62
  • 大小:2.28MB
  • 配套讲稿:

    如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。

    特殊限制:

    部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。

    关 键  词:
    第5章 基本描述统计.ppt
    资源描述:

    1、第五章 基本统计分析,1 频数分布表 2 描述统计分析3 探索分析4 列联表5 多选项分析6 基本统计分析的报表制作,频数分布表,利用频数分布表可以方便地对数据按组进行归类整理,形成各变量的不同水平(分组)的频数分布表及图形,以便对各变量的数据特征和观测量的分布状况有一个概括的认识; 单变量频数分布分析,可通过Frequencies频数分布对话框(Analyze Descriptive Statistics Frequencies)来具体实现。,Frequencies对话框,Frequencies对话框,四分位数:将一组个案由小到大(或由大到小)排序后,用3个点将全部数据分为四等份,与3个点上

    2、相对应的变量称为四分位数,分别记为Q1(第一四分位数)、Q2(第二四分位数)、Q3(第三四分位数)。其中,Q3到Q1之间的距离又称为四分位距(interquartile range),记为IQR。四分位差(Quartile deviation )为1/2 IQR。 百分位数:将一组数据由小到大(或由大到小)排序后分割为100等份,与99个分割点位置上相对应的变量称为百分位数,分别记为P1,P2,P99,表示1%的数据落在P1下,2%的数据落在P2下,99%落在P99下。,四分位数、十分位数、百分位数,峰度:描述某变量所有取值分布形态陡缓程度的统计量。与正态分布相比较,峰度为0表示其数据分布与正

    3、态分布的陡缓程度相同;峰度大于0表示比正态分布高峰要更加陡峭,为尖顶峰;峰度小于0表示比正态分布的高峰要平坦,为平顶峰。计算公式为,偏度:描述某变量取值分布对称性的统计量。与正态分布相比较,偏度为0表示其数据分布形态与正态分布偏度x相同;偏度大于0为正偏或右偏,即有一条长尾巴拖在右边;偏度小于0表示负偏或左偏,有一条长尾拖在左边。而偏度的绝对值数值越大表示分布形态的偏斜程度越大。 计算公式为,峰度、偏度,Frequencies对话框,输出结果:,本例均选系统默认项,描述统计分析,描述统计分析过程,是通过计算均值、算术和、标准差、极值、方差、均值、标准误等统计量来描述样本数据的集中趋势、离散趋势

    4、及分布特征; 描述统计分析过程,可通过Descriptives对话框(Analyze Descriptive Statistics Descriptives) 来具体实现。,Descriptives对话框,Descriptives对话框,输出结果:,探索分析,探索分析是指对测得的数据进行初步考察与核实,目的是检查数据中是否存在奇异值、影响点或错误数据,判别数据分布特征,以及进行假设检验等; 探索分析过程,可通过Explore对话框实现(Analyze Descriptive Statistics Explore) ,该过程要求参与分析的变量是等距测度的数值型变量,分组变量可以是数值型或是字符型

    5、。,Explore对话框,Explore对话框,不同分组的同一因变量显示在一个箱图中,同一组的不同因变量显示在一个箱图中,Spread versus Level : 横轴为各水平组的中位数及纵轴为四分位距的自然对数。 Power estimation: 对原始数据进行幂转换,直到各组间满足方差齐性。Transformed 为原始数据转换后,再划图。,输出结果(一),选项均为系统默认,输出结果(二),IQR,输出身高正态概率图(Normal Q-Q Plot of身高)。,男孩身高变量的正态概率图,输出结果(三),女孩身高变量的正态概率图,正态分布Q-Q检验图,横坐标为实际观测值按从小到大的顺序

    6、排列,纵坐标为正态分布下的期望值。如果实际观测值取自正态分布的总体,图中所示的落点应该分布在趋势线的附近,并且应该表现出一定的集中趋势,即平均数附近应该聚集较多的落点,越靠近两个极端落点越少。,输出离散正态概率图(Detrended Normal Q-Q Plot of 身高)。以实际观测值为横坐标,以实际观测值与期望值的差为纵坐标。在符合正态分布的情况下,图中的落点应该分布在中央横线的附近,甚至完全落到这条横线上,而且也应表现出集中在平均数周围的趋势。,男孩身高离散正态概率图,女孩身高离散正态概率图,输出结果,输出结果(离散正态分布P-P概率图),Lilliefors 显著水平下,正态总体检

    7、验Kolmogorov-Smirnov统计量,如果样本量在3500之间还计算Shapiro-Wilk统计量。,输出结果(四),输出结果(五),Levene检验对数据进行方差齐次性检验时,不强求数据必须服从正态分布,它先计算出各个观测值减去组内均值的差,然后再通过这些差值的绝对值进行单因素方差分析。如果得到显著性水平小于0.05,那么就可以拒绝方差相同的假设。,列联表,列联表是指交叉分组的多维频数分析表,用来反映多个变量不同取值的数据分布情况、变量间的相互影响和关系等; 列联表分析过程,可通过Crosstabs对话框实现(Analyze Descriptive Statistics Crosst

    8、abs)。,定义变量(形成数据集3),指定freq为加权变量,Crosstabs对话框,Crosstabs对话框,本例中选择chi-square,Contingency coefficient:列联系数。用于名义变量之间的相关系数计算。计算公式由卡方统计量修改而得,公式为其中,N为样本个数,Phi and Cramers V:系数。用于名义变量之间的相关系数计算。计算公式由卡方统计量修改而得,公式为数值界于01之间,其中K为行数和列数较小的实际数。,Crosstabs对话框,本例中选择频数及频率输出项,输出结果:,输出结果:,多选项分析是对多选项问题的分析方法。多选项问题的编码方案有两种: 多

    9、选项二分法(Multiple Dichotomies Method) 将每个可能的答案设置为一个SPSS变量,变量的取值有两个,分别表示选中或没选中。比如一道题目有6个选项,则一道多选题目就需要用6个变量来表示。 多选项分类法(Multiple Category Method) 首先估计多选项问题可能出现的答案个数。比如一个多选题,如果最多有3个答案,那么就设置3个SPSS变量,分别用来存放3个可能的答案。如果某个案的答案只有两个,那么第3个SPSS变量取值为缺失值。,多选项分析,Analyze- Multiple Response,Frequencies,Define Multiple Re

    10、sponse Sets,“Multiple Response Crosstabs”,Define Multiple Response Sets,Multiple Response Frequencies,Multiple Response Crosstabs,Multiple Response Crosstabs: options,结果和讨论,(1)多选项二分法频数分析结果:,(2)多选项分类法频数分析结果:,结果和讨论,基本统计分析的报表制作,本章讨论了SPSS的一些基本统计功能。SPSS还提供了这些基本统计分析的报表制作功能,根据报表制作的侧重点不同,可以分为以下3种。,1个案简明统计报表

    11、(Cases Summary)2行形式报表(Report Summaries in Rows)3列形式报表(Report Summaries in Columns),Analyze-Report-Case Summaries, 实现步骤,Summary Report:Statistics,Summary Report: Options, 使用例7的数据,生成行形式报表,Analyze- Report Summaries in Rows,Format,Report:Summary Lines for 部门,Report:Break Options for 部门,Report:Final Summ

    12、ary Lines,Report:Options,Report:Layout,Report:Title(s, 使用例7的数据,生成列形式报表,Analyze- Report- Summaries in Columns,Format,Report:Summary Lines for 基本工资,Report:Summary Columns,(1)个案简明统计报表结果:,结果和讨论,(2)行形式报表结果如下表所示。,结果和讨论,(3)列形式报表结果:,结果和讨论,Analyze-Table-Custom Tables,小 结,描述性统计是进行其他统计分析的基础和前提。利用这些基本统计方法,可以对要分

    13、析数据的总体特征有比较准确的把握,同时也为更深入的分析提供了依据。,Frequencies命令可用于数字型或字符型变量的统计分析,如均值、标准差、最小值、最大值、众数、中位数、方差、全距等14种统计量。探索分析可对变量进行更为深入详尽的描述性统计分析,有助于用户思考对数据进行进一步分析的方案。,小 结,Frequencies命令可用于数字型或字符型变量的统计分析,如均值、标准差、最小值、最大值、众数、中位数、方差、全距等14种统计量。探索分析可对变量进行更为深入详尽的描述性统计分析,有助于用户思考对数据进行进一步分析的方案。,作业,Frequencies / Descriptives / Explore / Multiple Response / Table/ 每种程序任意完成两个,并贴在word里,描述结果。 文件“作业”。,

    展开阅读全文
    提示  微传网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:第5章 基本描述统计.ppt
    链接地址:https://www.weizhuannet.com/p-8762075.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    微传网用户QQ群:732276833  微博官方号:微传网官方   知乎号:微传网

    Copyright© 2025 微传网 weizhuannet.com 网站版权所有世界地图

    经营许可证编号:粤ICP备2021046453号   营业执照商标

    1.png 2.png 3.png 4.png 5.png 6.png 7.png 8.png 9.png 10.png


    收起
    展开