• / 76
  • 下载费用:10 金币  

04-第三章 假设检验的基本原理和步骤(研1309).ppt

关 键 词:
04-第三章 假设检验的基本原理和步骤(研1309).ppt
资源描述:
第三章 总体均数的估计与假设检验,何保昌 福建医科大学流行病与卫生统计学系,1,教学内容:,第一节 均数的抽样误差与标准误 第二节 t分布 第三节 总体均数估计 第四节 假设检验基本原理与步骤 第五节 t检验 第六节 假设检验的注意事项 第七节 正态性与方差齐性检验,2,假设检验的基本原理和步骤,3,4,法官的判决,法庭上,陪审团需要建立以下两种假设:事先并不知道哪种假设是正确的,需要根据呈庭证供,才可下结论,无罪,有罪,5,胎儿的性别,有人声称能够预测胎儿的性别,我们对此有两种假设: 事先并不知道哪种假设是正确的,需要根据她推测的结果,才可下结论,无此能力,有此能力,6,商家信誉,某商家宣称他所卖的鸡蛋绝对新鲜,可以达到“百里挑一”;是否可以相信商家信誉?事先并不知道哪种假设是正确的,需要对其鸡蛋检验后,才可下结论,商家有信誉,商家无信誉,7,?,,,否定,肯定,×,8,胎儿性别—统计学的思维方式,女士说她可以预测胎儿的性别暂时认为她是瞎猜,每个孕妇被猜对的可能性均为50% 让她对10个孕妇作推断,结果是全部说对了;在瞎猜的情况下,全对的可能性为0.510=0.000976563在一次试验中出现小概率事件是不太可能的,故认为她真的有这种能力!,9,关于商家信誉,某商家宣称他所卖的鸡蛋绝对新鲜,可以达到“百里挑一”;结果有人买了10个鸡蛋,其中2个坏了,是否还可以相信商家广告? 暂时认为商家是有信誉的,在此前提下10个鸡蛋中出现2个或更多变质的可能性为0.004,是小概率事件! 但是对于该顾客而言,他仅仅购买了一次,就碰上了小概率事件,所以商家的信誉度值得怀疑,10,假设检验,先对总体的参数提出某种假设,然后利用样本信息判断是否拒绝该假设过程反证法 + 小概率事件原理,【例3-5】某医生测量了100名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?,11,,未知总体,第二种可能性:,,已知总体,样本均数与拟比较的总体均数不等有两种可能:,抽样误差,本质差异-职业的影响,,n=36,,,第一种可能性:,,12,解析:(1)抽样误差(2)环境因素上述两种可能是对立的,互不相容的,事实上只能是其中的一个,如何进行判断呢?我们可通过假设检验来回答这个问题。,13,假设检验的基本思想,14,,无罪假设,无差异假设,统计推断,刑事诉讼,,,,作检验,,学术上:唯证据原则—反证法,找证据,,15,基本思路:首先假定该样本来自的总体就是已知总体,即=0,然后根据样本统计量的特征,找出它取样于或不取样于总体0的证据, 从而取得间接的判断。,16,,,H0:零假设,,t 界值,-t 界值,,根据P 值,得出结论,H1:备择假设,,,验证假设,建立假设,下结论,预设 α =0.05,,P 值,17,,假设检验的小概率事件原则和检验水准 α,小概率事件(0.05 or 0.01),检验水准 — α (level of test),,:假设检验中,定义发生概率≤ α的事件叫小概率事件,并称α为检验水准,一般α取0.05。故对于H0 为真而言,检验统计量超过α对应的临界值的概率P≤α,对于一次随机抽样而言,一般是不会发生的,所以如果出现这种情况,可以凭此作出拒绝H0的决策。,18,,假设检验中的 P 值,:所谓P 值,由H0所规定的总体中作一次随机抽样,获得依据现有样本获得的检验统计量的概率,也即是H0成立的概率。 换言之,是指在H0 成立的前提下,出现统计量目前值及更不利于零假设数值的概率。,假设检验中的 P 值,,-t 界值,t 界值,19,假设检验 (hypothesis test) 的概念: 亦称显著性检验(significance test),是依据样本提供的有限信息对总体作推断的统计学方法,是在对研究总体的两种对立的判断 之间做选择的决策程序。,选用适当方法根据样本对总体提供的信息作检验,对总体的参数或分布作出某种假设,推断此假设应当拒绝或不拒绝,提出假设,验证假设,得出结论,,,,,,20,假设检验的步骤,21,,,22,一、 对立假设、确定检验水准:,建立假设H0、H1确定检验水准α 根据实际情况、确定单、双侧检验 根据资料类型,选择检验方法;,,23,,1. 明确资料类型、选择检验方法:,假设检验的方法很多,如t 检验、F 检验及 检验等,各有其适用条件和范围。应根据研究目的、设计类型和资料特点等因素选择合适的检验方法,并计算出对应统计量。,,,24,,3. 根据数据特征和专业知识,确定单、双侧,t 临界值,- t 临界值,,,问:从事铅作业男性工人Hb与正常成年男性是否不同?,双侧检验:用于推断两总体有无差别时,对两总体间可能存在的两种位置关系均要考虑在内。,,25,,t 临界值,,,问:从事铅作业男性工人Hb是否高于正常成年男性?,2. 单侧检验:用于推断两总体有无差别时,仅考虑两总体间可能存在的两种位置关系的一种。,26,,一般情况下,如结果不明确时,采用双侧假设 H1:  某一数值,如  0(双侧,包括  0和  0 两方面),如果从专业上能肯定其中一侧是不可能的,则采用单侧对立假设H1:  某一数值;如 0 (左单侧) H1:  某一数值;如  0 (右单侧),单侧、双侧检验的确定原则及描述方法:,,27,,一般情况下,如结果不明确时,采用双侧假设 H1:  某一数值,如  0(双侧,包括  0和  0 两方面),如果从专业上能肯定其中一侧是不可能的,则采用单侧对立假设H1:  某一数值;如 0 (左单侧) H1:  某一数值;如  0 (右单侧),单侧、双侧检验的确定原则及描述方法:,,28,,3. 建立假设:提出无效假设和备择假设, 什么是零假设 (Null Hypothesis) ?,(1)一般是作没有差别的假设,又称“原假设”或“无效假设” ,表示为 H0,即H0:  = 某一数值,如 = 0 (2) 该假设将差异的原因归结为抽样误差,29,, 什么是备择假设 (Alternative Hypothesis) ?,(1)与无效假设相对立有差别的假设,由不等号 , 或  组成,常表示为 H1;即H1: 某一数值;或 某一数值, 某一数值。(2) 该假设将差异的原因归结为环境因素,或是一种本质差异。,30,,4. 确定检验水准  ,又称显著性水准,是判断应当拒绝或不拒绝H0 的水准。它规定什么是“不大可能”,规定概率不超过的事件就是小概率事件,依据的是 “小概率事件在一次随机试验中不大可能发生”的理论。,由研究者事先确定。 表示为 ,常用的  值有0.01、0.05; 是一个概率值,假设原假设为真时,拒绝原假设的概率,又被称为抽样分布的拒绝域。,注意:,31,二、 计算检验统计量:,检验统计量:属于样本指标,用来反应样本信息,用于计算“H0 成立”的概率P,从而抉择是否要拒绝H0。,32,各检验方法都有其相应的检验统计量,不同的检验统计量通常都依据于其特定的抽样分布。,,举例:,33,,三 、确定 p 值,P 值意义是:由 H0所规定的总体中作随机抽样,获得依据现有样本获得的检验统计量的概率,也即是H0成立的概率。换言之,在H0成立的前提下,统计量获得现有数值以及更不利于H0的可能性(概率)有多大。,34,指对 “ 假设的H0 是否真实” 作出判断的过程。即:比较 p 值和检验水准,得出拒绝或不拒绝无效假设的结论。,四 、做出推断结论,35,在两个对立的检验假设间二取一的规则是: (1)若 P ≤ ,意味着在H0成立的前提下不大可能发生当前,或是更不利的状况 拒绝 (2)若 P >,意味着在H0成立的前提下,发生当前状况或是更不利的状况的可能性还是比较大的 不拒绝,,95%,t 分布图,,,36,,,37,假设检验例子,38,变量变换 或秩和检验,单样本定量资料要依据不同的前题条件选择适当的假设检验方法。,①总体标准差σ已知时②或 σ 未知但 n 较大(如n>60),σ未知,n较小(n<60),且 样本来自正态分布的总体,,t 检验,样本例数 n<60且样 本来自偏态分布总体,,,39,40,【例3-5】某医生测量了100名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L?,,【案例解析】,首先考虑对原始数据进行正态性检验:结果表明,该样本所属总体来自正态分布。 2. 再者σ已知,故考虑用 u 检验。 3. u 检验统计量:,资料类型:定量资料设计类型:单样本,41,统计结论:已知 U(0.05/2)=1.96,则 P 0.05 ,故拒绝H0,接受 H1 ,认为 与μ0的差别有统计学意义. 专业结论:可认为从事铅作业男性工人的血红蛋白含量与正常成年男性不同。,,,检验过程:,1. 建立假设:,确定检验水平:,2. 计算检验统计量:,3. 确定 p 值,作出推断结论:,42,,某药物100mg溶解在1L溶剂中,溶解后的标准浓度是20.00mg/L。现采用某种测定方法进行溶解实验,重复实验11次获得的药物浓度分别为:20.99、20.41、20.10、…、21.11。请问:用该种方法测得的药物浓度与标准浓度20.0mg/l是否相同?,【案例2】,43,,【案例解析】 资料类型:定量资料 设计类型:单样本首先考虑对原始数据进行正态性检验:结果表明,该样本所属总体来自正态分布。另外总体σ未知,样本含量 n =11较小,所以考虑用 t 检验。,t的检验统计量为:,44,,,检验过程:,1. 建立假设:,确定检验水平:,2. 计算检验统计量:,3. 确定 p 值,作出推断结论:,统计结论:查t 界值表,得t (0.05/2,10) =2.228,按α=0.05 检验水准,拒绝H0,接受H1;认为这种方法测得的药物浓度与标准浓度不同。 专业结论:该方法测得的药物总体平均浓度高于标准,该方法的效果欠佳。,45,,46,【电脑实现】 —SPSS,样本的正态性检验:,,,,,47,【电脑实现】 —SPSS,单组样本均数t 检验:,,,48,结果输出:,,,49,,【结果报告】,单组样本的假设检验,主要报告以下内容:样本基本统计描述;假设检验的目的和实验设计方法;假设检验方法、单侧或双侧检验、检验水准、检验统计量及其P值总体参数的95%置信区间,50,假设检验的两类错误,51,假设检验是统计推的重要内容,它是应用数学上的反证法和小概率事件实际推断原则,根据样本 统计量对总体作出推断,结论具有概率性。,结论的风险性—两类错误,,52,53,,,,,,m=0,,,,高血压人群,,制定依据为小概率事件原理,,这是从正常人群中随机抽样的样本血压分布,,,诊断标准,,,极端的样本,小概率事件发生 这一部分正常人误判为高血压,,,依据标准,这一部分病人漏判,54,统计学中的两类错误,可见统计学假设检验过程中可能会发生两种不同类型的错误一种情况是:如果这个样本来源于正常人群(H0:m=m正常是正确的)结果由于它是一个极端的样本,超过了诊断标准(落在显著性水准a规定的范围内)使得我们根据小概率事件原理,拒绝了原假设,将其误判为高血压患者;这种拒绝了原本正确的H0的错误称为I类错误(type I error)另一种情况是:如果这个样本来源于高血压人群( H1:mm正常是正确的),结果由于这个样本看起来不是那么极端,比诊断标准低(并未落在显著性水准a规定的范围内),使得我们尚不认为他们是高血压患者;这种不拒绝原本不正确的H0的错误称为II类错误(type II error),55,统计学中的两类错误,犯一类错误的概率有多大? 如果样本信息落入拒绝域(拒绝域就是根据小概率事件原理构建的),我们就会拒绝正确的原假设,此时就会犯一类错误;所以I类错误的概率=a,就是小概率事件的标准(检验水准、诊断标准),故其大小表达为a 所以一类错误是在拒绝正确的原假设时发生,其大小在假设检验之前就已规定,一般为0.05或0.01 因为这种概率较小,所以在拒绝原假设时通常都意味着接受H1(认为这个样本来自于高血压人群,这种结论错误的可能性仅为0.05或0.01,非常小),56,统计学中的两类错误,犯二类错误的概率有多大? 二类错误是不拒绝错误的原假设——实际上就是漏诊的概率;要知道漏诊的概率必须要知道高血压患者的总体均值,而后根据正态分布的曲线下面积规律计算 但是在研究结束之间通常所谓“异常”的总体水平是未知的,即并不知道高血压患者的总体血压会比正常人高多少,所以通常情况下二类错误的概率是未知的;为了与一类错误的概率相区别,称之为b 因此在不拒绝原假设时需要特别注意,不拒绝原假设并不意味着接受它!因为如果此时漏诊的可能性较大,认为这群人是正常人的话就会有很大的代价(例如在当前的标准下, b =30%,意味着如果承认该样本来自正常人群会使30%的高血压人群的样本得不到及时的治疗),57,统计学中的两类错误,因此统计学上十分在意一种情况:如果这群人真的是来自高血压人群的样本,能够将他们准确的判断为患者的概率有多高? 这就是统计学检验的功效(power):即当研究总体与原假设确有差别时,按照当前规定的显著性水准能够发现这种差别的概率,其大小为1-b,58,如1   = 0.90,意味着若两总体确有差别,则理论上在100次检验中,平均有90次能够得出有统计学意义的结论。所作的检验若有较大的1-β值,我们说该检验方法的检验功效较高,因为H0不成立时能够被及时检出,59,统计学中的两类错误,假设检验的两类错误表,检验结果,实际 情况,拒绝H0,不拒绝H0,H0正确,I类错误(a),结论正确(1-a),H1正确,结论正确(1-b),I类错误(b),,,,,,,,,,由于所建立的检验主要是控制犯I类错误α的概率,而对犯II类错误的概率β却无法直接控制,即对一个检验犯II类错误的概率究竟怎样无所而知。,要谨慎对待 “不拒绝H0”的结论 — 即“阴性结果”,,60,“阴性”极可能是 II类错误的概率β 过高,或说检验功效(Power) 1- β过低,出现的假阴性结果。,某研究者对“中华医学杂志”、“中华血液学杂志”、“中华儿科杂志”、“解放军医学杂志”、“中华传染病杂志”的317篇研究报告中的641个阴性结论作Power分析,结果发现17.0%的阴性结果可靠、3.7%基本可靠,3.6%基本不可靠,75.7%不可靠。 国外Friedman等对Power低于0.9的65个阴性结果重新将Power值提高到0.9,发现70%的阴性结果可转为阳性结论。,61,因此,Power值的大小已成为某些国际会议审查论文设计内容之一;有的已明确规定,若研究者根据P0.05下阴性结论时,必须提供Power值。,62,,检验水准α定的越大 总体参数间的差异越大个体差异(标准差)越小 样本含量越大,影响检验功效的因素:,,,检验功效越大,63,1.  越大,  越小,则Power越大,,,,,,只有通过增加样本含量,你才可能同时减少两类错误!,,样本含量一定时,和的关系就像翘翘板,小就大, 大 就小。,当样本量取定时,要减小 b ,应把a 取大一些,64,,,,,2. 总体参数间的差异越大,Power越大,,65,,,,3. 个体差异越小,Power越大,,,,,,66,4. 若两样本总体确有差异时, 在一定范 围内,样本含量n 越大,Power越大。,通过增大n的方法,达到增大Power的目的,,67,,检验功效/样本含量估算常用软件:,SASnQuery AdvisorEGRET SIZSample powerSASAPASSEXCEL,68,,PASS (power analysis and sample size) 是Jerry开发的专业样本含量估算和效能分析软件。 PASS可以对均数间的比较、方差分析、相关和回归分析、计数资料的假设检验和病例随访资料分析等检验条件下的检验效能和样本含量进行估计。,69,,小 结,假设检验是依据样本提供的有限信息对总体做推断的过程。 假设检验的步骤为:建立假设→计算统计量→确定p值,作出推断结论 假设检验的基本思想是根据小概率的原理,认为“小概率事件在一次抽样中不太可能出现”。 假设检验中无论拒绝不拒绝H0,都有可能犯错误(Ⅰ类错误和Ⅱ类错误)。 假设检验的推断结果下结论时不能绝对化,并要结合专业知识。,70,步骤:,,,71,,最佳选择题:,1.统计推断的内容是: A.用样本指标推断总体指标 B.检验统计上的“假设” C.A、B均不是 D.A、B均是,2.两样本比较时,分别取以下检验水准,下列何者所取第二类错误最小: A.a=0.05 B.a=0.01 C.a=0.10 D.a=0.20,72,,3. 关于假设检验,下列那一项说法是正确的: A.单侧检验优于双侧检验 B.采用配对t检验还是两独立样本t 检验是由实验设计方法决定的 C.检验结果若P值大于0.05,则接受H0犯错误的可能性很小 D.用t 检验进行两样本总体均数比较时,不要求方差齐性,73,简答题:,1. 什么是一类错误?什么是二类错误?二者之间有什么关系?2. P 与α有什么区别和联系?3.既然假设检验的结论有可能有错,为什么还要进行假设检验?,74,答案:,P值的大小和α没有必然关系。,3. P是指H0成立的前提下,出现目前样本数据对应的统计量数值乃至比它更极端数值的概率。,α是事先确定的检验水准。,75,,4. 假设检验中,无论拒绝不拒绝H0,都可能会犯错误:表现为拒绝H0时,会犯第一类错误,不拒绝H0时,会犯第二类错误,但这并不能否认假设检验的作用。 . 因为只要涉及到抽样,就会有抽样误差的存在,因此就需要进行假设检验。 . 只是要注意假设检验的结论只是个概率性的结论,它的理论基础是“小概率事件不太可能原理”。 .,76,
展开阅读全文
  微传网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
0条评论

还可以输入200字符

暂无评论,赶快抢占沙发吧。

关于本文
本文标题:04-第三章 假设检验的基本原理和步骤(研1309).ppt
链接地址:https://www.weizhuannet.com/p-9803610.html
微传网是一个办公文档、学习资料下载的在线文档分享平台!

网站资源均来自网络,如有侵权,请联系客服删除!

 网站客服QQ:80879498  会员QQ群:727456886

copyright@ 2018-2028 微传网络工作室版权所有

     经营许可证编号:冀ICP备18006529号-1 ,公安局备案号:13028102000124

收起
展开