• / 41
  • 下载费用:10 金币  

教科研方法(十章)2011.ppt

关 键 词:
教科研方法(十章)2011.ppt
资源描述:
,,,,,,,第十章 研究假设的统计推断,一、教学要求 1.了解统计推断的基本概念 2.了解参数估计的基本方法 3.会用假设检验(Z检验、T检验、X2检验、F检验)的方法,第十章 研究假设的统计推断,二、内容要求 1.统计推断的意义、内容和概念 2. 参数的估计 3.假设检验 4.非参数统计,第十章 研究假设的统计推断,三、重点与难点 1.参数估计 2.假设检验(Z检验、T检验、X2检验、F检验) 3.非参数统计,第一节 假设检验的基本问题,假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。 假设检验的基本问题是要探索哪一个假设被接受的问题。 常用的假设检验方法有u—检验法、t—检验法、X2检验法、F—检验法等。,一、假设检验的意义,假设检验是抽样推断中的一项重要内容。它是根据原资料作出一个总体指标是否等于某一个数值,某一随机变量是否服从某种概率分布的假设,然后利用样本资料采用一定的统计方法计算出有关检验的统计量,依据一定的概率原则,以较小的风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择的一种检验方法。,二、假设检验的具体作法,具体作法是: 根据问题的需要对所研究的总体作某种假设,记作H0; 选取合适的统计量,这个统计量的选取要使得在假设H0成立时,其分布为已知; 由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设H0的判断。,分析1,用样本指标估计总体指标,其结论有的完全可靠,有的只有不同程度的可靠性,需要进一步加以检验和证实。通过检验,对样本指标与假设的总体指标之间是否存在差别作出判断,是否接受原假设。这里必须明确,进行检验的目的不是怀疑样本指标本身是否计算正确,而是为了分析样本指标和总体指标之间是否存在显著差异。从这个意义上,假设检验又称为显著性检验。,分析2,进行假设检验,先要对假设进行陈述。通过下例加以说明。 例如,设某工厂制造某种产品的某种精度服从平均数为方差为的正态分布,据过去的数据,已知平均数为75,方差为100。现在经过技术革新,改进了制造方法,出现了平均数大于75,方差没有变更,但仍存在平均数不超过75的可能性。试陈述为统计假设。,分析3,根据上述情况,可有两种假设,一个是假想平均数不超过75,即假设另一个假想是平均数大于75,即假设如果我们把作为原假设,即被检验的假设,称作零假设,记作于是,假设相对于假设来说,是约定的、补充的假设,记作它和有两者选择其一的意思,即作为被检验的假设,则就是备择的,故称为备择假设或对立假设。,分析4,还须指出,哪个是零假设,哪个是备择假设,是无关紧要的。我们关心的问题,是要探索哪一个假设被接受的问题。被接受的假设是要作为推理的基础。在实际问题中,一般要考虑事情发生的逻辑顺序和关心的事件,来设立零假设和备择假设。,三、假设检验的步骤,一个完整的假设检验过程,通常包括以下四个步骤: 第一,提出原假设(Null hypothesis)和备择假设(Alternative hypothesis) ; 第二,确定适当的检验统计量并计算检验统计量的值; 第三,规定显著性水平α; 第四,作出统计决策。,1、提出原假设和替换假设,在统计学中,把需要通过样本去推断其正确与否的命题称为原假设,用H0表示。例如,在新生儿体重这个例子中,我们可以事先提出一个命题(假设),“1990年出生的新生儿与1989年出生的新生儿在体重上没有什么差异”。于是可以这样表示: ,这里μ表示1990年新生儿总体的均值,它与1989年新生儿总体的均值3190g相同。 与原假设相对立的假设是备择假设,用H1表示。在上面这个例子中,备择假设H1意味着“1990年出生的新生儿与1989年出生的新生儿在体重上有明显差异”。,2、 确定适当的检验统计量,在参数的假设检验中,如同在参数估计中一样,要借助于样本统计量进行统计推断。用于假设检验问题的统计量称为检验统计量。在具体问题里,选择什么统计量作为检验统计量,需要考虑的因素与参数估计相同。例如,用于进行检验的样本是大样本还是小样本,总体方差已知还是未知,等等。在不同的条件下应选择不同的检验统计量 ,并计算统计量的值。,3、 规定显著性水平α,假设检验是围绕对原假设内容的审定而展开的。如果原假设正确我们接受了(同时也就拒绝了备择假设),或原假设错误我们拒绝了(同时也就接受了备择假设),这表明我们作出了正确的决定。但是,由于假设检验是根据样本提供的信息进行推断的,也就有犯错误的可能。有这样一种情况,原假设正确,而我们却把它当成错误的加以拒绝。犯这种错误的概率用α表示,统计上把α称为假设检验中的显著性水平,也就是决策中所面临的风险。所以,显著性水平是指当原假设为正确时人们却把它拒绝了的概率或风险。这个概率是由人们确定的,通常取α=0.05或α=0.01。这表明,当作出接受原假设的决定时,其正确的可能性(概率)为95%或99%。,“显著”的含义,假设检验中的“显著”与实际问题中效果的“显著”既有联系又有区别。前者是统计学概念而后者是专业上常用的术语,以两个样本平均数差异为例,当t检验的结果在0.05水平上“显著”,这是从统计学意义来说由样本平均数之间的差异可以作出“两个总体平均数存在差异”的结论。但两总体平均数之间的差异是否具有专业意义(即有否实际上的“显著效果”)还要根据专业上的标准而定。就是说,统计结论“显著”并不一定意味着实际效果的“显著”。,4、作出统计决策,根据显著性水平α和统计量的分布,可以找出接受域和拒绝域的临界点,用计算出的检验统计量的值与临界点值相比较,就可以作出接受原假设或拒绝原假设的统计决策。,四、假设检验的思路,假设检验的基本思想是一种“反证法”式的推理,即通过检验Ho的真伪来反证研究假设H1的真伪,若Ho为真,则H1必为假,而Ho为假,H1即为真,而且无论作出Ho是真还是假的结论都是在一个概率水平意义上的推断。,分析,在作出了统计假设之后,就要采用适当的方法来决定是否应该接受零假设。由于运用统计方法所遇到的问题不同,因而解决问题的方法也不尽相同。但其解决方法的基本思想却是一致的,即都是“概率反证法”思想。,概率反证法,(1)为了检验一个零假设(即虚拟假设)是否成立, 先假定它是成立的,然后看接受这个假设之后,是否会导致不合理结果。如果结果是合理的,就接受它;如不合理,则否定原假设。,概率反证法,(2)所谓导致不合理结果,就是看是否在一次观察中, 出现小概率事件。通常把出现小概率事件的概率记为0,即显著性水平。 它在次数函数图形中是曲线两端或一端的面积。因此,从统计检验来说,就涉及到双侧检验和单侧检验问题。在实践中采用何类检验是由实际问题的性质来决定的。 一般可以这样考虑:双侧检验和单侧检验,双侧检验,双侧检验。如果检验的目的是检验抽样的样本统计量与假设参数的差数是否过大(无论是正方向还是负方向),就把风险平分在右侧和左侧。比如显著性水平为0.05,即则概率曲线左右两侧各占,即0.0025。,单侧检验,单侧检验。这种检验只注意估计值是否偏高或偏低。如只注意偏低,则临界值在左侧,称左侧检验;如只注意偏高,则临界值在右侧,称右侧检验。 对总体的参数的检量,是通过由样本计算的统计量来实现的。所以检验统计量起着决策者的作用。,五、假设检验中的小概率原理,假设检验的基本思想是应用小概率的原理。所谓小概率原理,是指发生概率很小的随机事件在一次实验中是几乎不可能发生的。根据这一原理,可以作出是否接受原假设的决定。,例证,例如,有一个厂商声称其产品的合格品率很高,可以达到99%,那么从一批产品(如100件)中随机抽取1件,这一件恰好是次品的概率就非常小,只有1%。如果厂商的宣称是真的,随机抽取1件是次品的情况就几乎是不可能发生的,但如果这种情况确实发生了,我们就有理由怀疑原来的假设,即产品中只有1%次品的假设是否成立,这时就可以推翻原来的假设,可以作出厂商的宣称是假的这样一个推断,我们进行推断的依据就是小概率原理。,例证,当然,推断也可能会犯错误,即这100 件产品中确实只有1件是次品,而恰好在一次抽取中被抽到了。所以这个例子中犯这种错误的概率是1%,也就是说我们在冒1%的风险作出厂商宣称是假的这样一个推断。由此也可以看出,这里的1%正是前面所说的显著性水平。,六、假设检验中的两类错误,由前面的叙述中知道,假设检验是依据样本提供的信息进行判断的,也就是由部分来推断整体,因而假设检验不可能绝对准确,它也可能犯错误。所犯的错误有两种类型: α错误或弃真错误; β错误或取伪错误,α错误或弃真错误,一类错误是原假设H0为真却被我们拒绝了。犯这种错误的概率用α来表示,所以也称作α错误或弃真错误。,β错误或取伪错误,另一类错误是原假设为伪,却被我们接受了。犯这种错误的概率用β来表示 ,所以也称作β错误或取伪错误。,例证,在前面的例子中,厂商声称其产品的合格品率为99%,而实际上合格品率仅为90%,这意味着在100件产品中有90件合格品和10件次品。为了检验厂商的宣称是否真实,我们随机抽取了20件产品。结果都是合格品,于是我们由此推断厂商的宣称是真实的,这时我们就犯了第二类错误,犯这种错误的概率用β来表示 ,所以也称作β错误或取伪错误。,分析1,自然,人们希望犯这两类错误的概率越小越好。但对于一定的样本容量n ,不能同时做到犯这两类错误的概率都很小。如果减小α错误,就会增大犯β错误的机会;若减小β错误,也会增大犯α错误的机会。,分析2,当然,使α、β 同时变小的办法也有,这就是增大样本容量。但样本容量不可能没有限制,否则就会使抽样调查失去意义。因此,在假设检验中,就有一个对两类错误进行控制的问题。,分析3,一般地说,哪一类错误所带来的后果越严重,危害越大,在假设检验中就应当把哪一类错误作为首要的控制目标。但在假设检验中,大家都在执行这样一个原则,即首先控制犯α错误原则。从前面假设检验的步骤中我们会发现,步骤之三“规定显著性水平”就体现了这样的原则。这样做的原因主要有两点,一个是大家都遵循一个统一的原则,讨论问题就比较方便。但这还不是最主要的。最主要的原因在于,从实用的观点看,原假设是什么常常是明确的,而备择假设是什么则常常是模糊的。,总结,在具体应用假设检验时,一定要根据各种条件,使用相应的公式,不可错用,尤其是平均数差异的t检验,条件较多,相应的公式不少,切不能以一代全。每一种统计检验方法都有它的使用条件和对数据资料的要求,在实际应用中,一定要注意它们的使用条件和应用范围,要对相应的前提条件进行检验和证明。,第二节 平均数差异显著性检验,平均数的显著性检验是常用的参数检验的方法。平均数的显著性检验分两种情况,其一是关于样本平均数与总体平均数差异的显著性检验,在总体服从正态分布,总体方差已知的情况下,用Z检验;总体方差未知的情况下,用t检验。其二是平均数差异的显著性检验,在两个总体都服从正态分布,总体方差均已知的情况下,用Z检验(相关样本和独立样本所用统计量不同);在两个总体都服从正态分布,但是总体方差未知时,用t检验(所用检验统计量方法与两个总体是否独立以及方差是否相等有关)。,第三节 方差及方差差异性检验,方差的显著性检验分为两种情况:一个是样本方差与总体方差差异的检验,用卡方检验;另一个两个样本方差差异性的检验,用F检验。,第四节 相关系数的显著性检验,相关系数的显著性检验分两种情况:(1)样本相关系数与总体相关系数差异的显著性检验,在总体相关为零的假设下,用t检验;在总体相关不为零的假设下,将相关系数做正态性转换然后用Z检验;(2)两个样本相关系数差异性的检验,在两个样本相互独立时,用Z检验,当两个相关系数由同一组被试算得,用t检验。,第五节 计数数据的检验—检验,计数资料的统计检验主要用卡方检验,可以用来同时检验一个因素两项或多项分类的实际观测数据,与某理论次数分布是否相一致的问题,或有无显著差异的问题;还可用于检验两个或两个以上因素各有多项分类之间,是否有关联或是否具有独立性的问题。卡方检验用于计数资料的分析,对于数据资料本身的分布形态不作任何假设,所以从一定的意义上来讲,又是一种非参数检验的方法。,非参数检验,假设检验方法除了常用的参数检验方法外,还有非参数检验的方法。 常用的非参数检验的方法包括: 符号检验法 符号秩次检验法 中数检验法 秩和检验法,非参数检验的特点,非参数检验法与参数检验法相比,特点可以归纳如下: (1)非参数检验一般不需要严格的前提假设; (2)非参数检验特别适用于顺序资料; (3)非参数检验很适用于小样本,并且计算简单; (4)非参数检验法最大的不足是没能充分利用数据资料的全部信息; (5)非参数检验法目前还不能用于处理因素间的交互作用。,谢谢大家!,
展开阅读全文
  微传网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
0条评论

还可以输入200字符

暂无评论,赶快抢占沙发吧。

关于本文
本文标题:教科研方法(十章)2011.ppt
链接地址:https://www.weizhuannet.com/p-9819080.html
微传网是一个办公文档、学习资料下载的在线文档分享平台!

网站资源均来自网络,如有侵权,请联系客服删除!

 网站客服QQ:80879498  会员QQ群:727456886

copyright@ 2018-2028 微传网络工作室版权所有

     经营许可证编号:冀ICP备18006529号-1 ,公安局备案号:13028102000124

收起
展开