您好,欢迎来到华佗健康网。
搜索
您的当前位置:首页统计简答题

统计简答题

来源:华佗健康网
简答题:

1、标准差和标准误有何区别与联系?它们各有什么用途?

①区别:标准差,是描述资料离散程度的指标;标准误,是说明均数抽样误差的大小的指标,它反映了样本均数间的离散程度,也反映了样本均数与总体均数间的差异。②联系: 均数的标准误与标准差成正比,而与样本例数n的平方根成反比,若标准差固定不变,可通过增加样本含量来减少抽样误差。③用途:标准差,用于描述一组资料的离散程度,还可用于估计正常参考值范围;标准误,用于描述资料的抽样误差的大小,还可用于估计资料的可信区间。

2、为什么要进行抽样研究?抽样时为什么会产生抽样误差?

抽样研究就是从总体中随机抽取一个样本,用样本的信息推断总体特征。因为个体变异的存在,随机抽样就会引起样本统计量与总体参数间的差异,就产生了抽样误差。在抽样研究中,抽样误差是不可避免的。 3、为什么要作r和b的假设检验?

r和b与其它统计量一样,即使从总体回归系数β和总体相关系数ρ中做随机抽样,由于抽样误差的存在,其样本回归系数b和样本相关系数r也不全为0,故求得一个样本回归系数和相关系数后,仍需进行回归系数β和相关系数ρ为0的假设检验。

2

4、两个样本率的u检验和四格表的x检验有何异同? 区别:①两个样本率的u检验主要是通过在两个总体中分别进行抽样所得的样本率P1和P2来推断总体率л

2

②四格表x检验是推断两个总体率或构成比是否有差别,两个分类变量间有无相关关系。1和л2是否相等。

22

③x检验可用于2×2列联表资料有无关联的检验。相同点:①两个样本率的u检验和四格表的x检验关

222

系:u=x即凡是能使用u检验进行两个率比较检验的资料,都可使用x检验,两者是等价的。②二者都存在连续性校正的问题。

22

四格表的u检验和x检验有何关系?当样本例数足够大时,x检验的结论与产检验等效。

5、在进行直线回归分析时,应按哪些步骤进行,才不易犯统计学方向的错误?(直线回归分析中应注意的问题?)

①作回归分析一定要有实际意义;②回归分析之前首先应绘制散点图;③考虑建立线性回归模型的基本假定:理论上讲,按最小二乘估计回归模型应满足:线性、、正态和方差齐性(LINE)等条件;④取值范围,避免外延;⑤两变量间的直线关系不一定是因果关系,也可能是伴随关系。 6、什么叫抽样误差?如何度量抽样误差的大小?怎样减少抽样误差?

①由个体变异产生的,随机抽样引起的样本统计量与总体参数间的差异称为抽样误差。②抽样误差由标准误来表示, , 越大,表明抽样误差越大; 越小,抽样误差越小。③由标准误的公式可知,要减少抽样误差,只有增加样本含量。

7、LSD-t检验和Duncan检验和SNK-q检验都可用于均数间的多重比较,它们有何不同?

①q检验:用于多个样本均数间每两个作比较,公式为 ;②最小有意义差异法(LSD法):用于对照组与各处理组的比较,公式为 ;③新复极差法(Duncan新法):用于对照组与各处理组比较,公式为 。 8、均数的可信区间和参考值范围有何不同?

区别点:均数的可信区间 参考值范围

意义:按预先给定的概率确定的未知参数 “正常人”的解剖、生理、生化 的可能范围,实际上一次抽样获得 某项指标的波动范围。 的可信区间要么包括可信区间,要 么不包括。

计算公式: σ未知: 正态分布: σ已知或σ未知,n﹥50: 偏态分布:

用途: 估计总体均数。 判断观察对象的某项指标正常与否。

2

9、X检验的应用条件有哪些? 2

X检验用来推断两个及两个以上总体率或构成比是否有差别,两个分类变量间有无相关关系,多个率的趋势检验,以及两个率的等效检验等。

10、参数检验与非参数检验的区别在何处?优缺点?(秩和检验的优缺点是什么?)

区别:①参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。②非参数检验:不依赖总体分布的具体形式和检验分布(如位置)是否相同。

优、缺点:①参数检验:优点是符合条件时,检验效率高;缺点是对资料要求严格,如等效数据、非确定数据(如﹥50mg),不能使用参数检验,而且要求资料的分布型已知和总体方差相等。

②非参数检验:优点是应用范围广、简便、易掌握;缺点是若对符合参数检验条件的资料用非参数检验,则检验效率底于参数检验。如无效假设是正确的,非参数检验与参数检验等同,但如果无效假设是错误的,

1

则非参数检验效果差,如需检验出同样大小的差异往往需要较多的资料。另一点是非参数检验统计量是近似服从某一分布,检验的界值表也是近似的(如配对秩和检验),因此其结果有一定近似性。 11、秩相关适用条件?

不服从双变量正态分布,不宜从而得知只矩相关分析的资料;总体分布型未知;原始数据用等级表示的资料。

12、均数、几何均数和中位数的适用范围是什么?

①均数:描述一组同质计量资料的平均水平,其分布特征为正态分布或近似正态分布,图形为单峰对称图型;②几何均数:描述原始观察值呈偏态分布,但经对数变换后呈正态分布或近似正态分布的资料或等比资料;③中位数:适用于偏态分布、分布不明的资料。 13、值变量资料频数表的组段是否越细越好?

不是。制作频数表是为了简化资料,显示出数据的分布规律,故组段不宜过多。组段过多,计算较繁,组段太少,则误差较大,会掩盖数据的分布规律,适宜的组段与观察值个数n有关,一般以10-15为宜。 14、怎样正确使用单侧检验和双侧检验?

一种检验方法是用单侧还是双侧检验,若从专业知识判断一种方法的结果不可能低于或高于另一种方法的结果,拟用单侧检验;在尚不能从专业知识判断两种结果谁高谁低时,则用双侧检验,一般认为双侧检验较保守和稳定。

15、直条图、圆图、普通线图各适用于何种资料? 直条图(条图):适用于比较分析的或离散变量的多个组或多个类别的统计指标。圆图和百分比条图:适用于描述分类变量的各类别所占的构成比。普通线图(线图):适合于描述统计量随另一连续性数值变量变化而变化的趋势,常用于描述统计量随时间变化而变化的趋势。直方图:数值变量的频数分布。散点图:相关,双变量。箱式图:偏态分布的资料。统计地图:研究指标的地理分布。

16、对同一资料,又出自同一研究目的,用参数检验和非参数检验所得结果不一致时,宜以何者为准? 既不能一律宣称参数检验的结论可信轻易拒绝非参数检验的结果;也不能依哪个有显著性就选哪个;更不能随研究者主观愿望取舍检验的结果。要根据被处理资料是否满足该种检验方法的应用条件,在符合参数检验条件时,若两法检验结果不一致时,可接受参数检验的结论。以t检验为例,如总体分布为极度偏态或其它非正态形状,或者根本不知总体分布形状,此时若使用t检验,有关总体的基本假定得不到满足,故任何根据这些假定所进行的推断亦难达到准确,再用参数检验的界值判断检验假设就不适宜了。此时参数检验与非参数检验结果不一致,可接受非参数检验的结论。 17、1978年秋,某大学考生录取情况如下表。有人据此批评说:“该大学考生录取百分率男生明显高于女生。”校方不同意此看法,但找不到依据。你能用统计学方法协助解决以上争议吗?(不必计算)

是由于6个专业考生男女构成比不同。应先将6个专业的男女生选定统一标准进行标化,标化之后再求录取率才具有可比性。

18、贝努利试验序列的条件/特点是什么?(服从二项分布的条件是什么?) ①每次试验的结果只能是两种互斥结果中的一种(A或者非A);②各次试验的结果互不影响,即各次试验;③在相同试验条件下,各次试验中出现某一结果A具有相同的概率л(非A的概率为1-л)。 二项分布的应用:样本率及其概率分布列;总体率的区间估计;单个总体率的假设检验;两个总体率的假设检验。

19、相关系数和回归系数有什么区别和联系?

区别:①资料要求上:回归要求因变量Y服从正态分布,X是可以精确测量和严密控制的变量,称Ⅰ型回归;相关要求两个变量X、Y服从双变量正态分布,这种资料若进行回归分析称为Ⅱ型回归。②应用上:说明两变量间依存变化的数量关系用回归;说明变量间的相关关系用相关。③意义上: b表示X第增(减)一个单位,Y平均改变b个单位;r说明具有直线关系的两个变量间相关关系的密切程度与相关方向。④计算上:b= ,r= 。⑤取值范围: ; 。⑥单位:b有单位,r没有单位。

联系:①对一组数据若同时计算b和r,它们的正负号一致。②b和r的假设检验是等价的。③用回归解

2

释相关,回归平方和越接近总平方和,则r越接近1,说明引入相关的效果越好。

20、多个样本均数间的比较为什么不能用t检验?(有人说,多个样本均数间的比较无非就是做若干次的t检验,您的看法如何?)

多个样本均数间的比较如果用t检验,会增加犯第一类错误的概率,即可能把本来无差别的两个总体均数判为有差别。

21、t检验要求什么基本条件? σ未知且n较小时,要求样本来自正态分布总体;两样本均数比较时,还要求两样本所属总体的方差相等。 u检验的应用条件:σ未知但n足够大(如n﹥100)或σ已知。

2

22、同一资料的标准差是否一定小于均数?

不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。变异大,标准差就大,有时比均数大;变异小,标准差小。

23、极差、四分位间距、标准差、变异系数的适用范围有何异同? 相同点:四者都是描述资料的离散趋势的指标。

不同点:极差是最简单又较粗略的指标,可以用于各种分布的资料,常用于描述单峰对称分布小样本资料的变异程度或用于初步了解资料的变异程度。四分们间距常用于描述偏态分布资料,两端无确切值或分布不明确资料的离散程度。标准差描述对称分布,特别是正态分布或近似正态分布资料的离散程度。变异系数,为标准差与均数之比,用于比较计量单位不同的几组资料的离散程度或均数相差悬殊的几组资料的离散程度。

24、用什么方法考察回归直线图示是否正确? ①直线必须通过点( , )。②若纵横坐标无折断号时,将直线左端延长与纵轴相交,交点的纵从标必等于截距α。③直线是否在自变量X的实测范围内。 25、r与rs的应用条件有何不同?

积差相关系数r用于描述双变量正态分布资料的相关关系。

等级相关系数rs适用于下列资料:①不服从双变量正态分布而不宜作积差相关分析的资料。②总体分布型未知的资料。③原始数据是用等级表示的资料。 26、直线回归分析时怎样确定因变量和自变量?

Ⅰ型回归中,X为精密测定和严格控制的变量,Y为正态变量;Ⅱ型回归中,X、Y均服从正态分布。何者为X,何者为Y,根据研究目的确定。

27、中位数与百分位数在意义上、计算和应用上有何区别与联系?

①意义:中位数是百分位数中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位数是P50即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布特征。②计算:中位数和百分位数均可用同一公式计算,可根据研究目的选择不同的百分位数代入公式进行计算分析。③应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中更为常用。百分位数还可用来描述变量值的离散趋势(四分位数间距)。 28、测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些?

①样本含量的大小,样本含量大,标准差越稳定。②分组的多少。③分布形状的影响,偏态分布的标准差较近似正态分布大。④随机测量误差大小的影响。⑤研究总体中观察值之间变异程度的大小。 29、正态分布、标准正态分布与对数正态分布在概念上和应用上有何异同?

①概念上:相同点:三者都是变量的连续型分布。其特征是:分布曲线在横轴上方,略呈钟型,以均数为中心,两边对称,均数处最高,两边逐渐减小,向外延伸,不与横轴相交。相异点:表示方向不同,正态

2

分布用N(μ,б)表示,标准正态分布用N(0,1)表示,对数正态分布用N( )表示。②应用上:相同点:正态分布、对数正态分布都可以转换为标准正态分布。相异点:标准正态分布是标准正态变量μ的分布,标准正态曲线下的面积唯一的由μ决定,给应用带来极大方便。对医学资料呈偏态分布的数据,有的经对数变换后服从正态分布。正态分布、对数正态分布可描述变量值的分布特征,可用于正常值范围估计和质量控制等。正态分布是很多统计方法的理论基础。

30、医学中参考值范围的含义是什么?确定的原则和方法是什么?

①含义:参考值范围亦称正常值范围,它是指特定健康状况人群(排除了有关疾病和因素对所研究指标有影响的所谓“正常人”不同于“健康人”概念)的解剖、生理、生化等各种数据绝大多数人的波动范围。②原则:⑴抽取有代表性的足够例数的正常人群样本,样本分布越接近总体,所得结果越可靠。一般认为样本含量最好在100例以上,以能得到一个分布较为稳定的样本为原则。⑵对选定的正常人进行准确而统一的测定,保证测定数据可靠是确定正常值范围的前提。⑶判定是否要分组(如男女、年龄、地区等),确定正常值范围。⑷决定取双侧范围值还是单侧范围值。⑸选择适当的百分范围。⑹确定可疑范围。⑺估计界值。③方法:⑴百分位数法: ⑵正态分布法(对数正态分布法):双侧 单侧 百分位数法用于各种分布型(或分布不明)资料;正态分布法用于服从或近似正态分布(服从对数正态分布)的资料。

31、对称分布资料在 “均数 1.96倍标准差“的范围内,也包括95%的观察值吗? 不一定。均数 1.96倍标准差是正态分布的分布规律,对称分布不一定是正态分布。

32、常用的相对数指标有哪些?它们的意义和计算上有何不同?为什么不能以比代率?请联系实际加以说明。

常用的相对数指标有:率、构成比和相对比。意义和计算公式如下:①率又称频率指标,它说明某现象发

3

生的频率和强度。常用百分率、千分率、万分率或十万人率等表示,公式为:率=某时间内实际发生某现象的观察单位数/同时期可能发生某现象的观察单位总数×K。例如,某病患病率常用百分率或千分率,婴儿死亡率常用千分率,死因别死亡率常用十万分率等。②构成比说明事物内部各部分所占的比重。常用百分数表示,公式为:构成比=某一组成部分的观察单位数?同一事物各组成部分的观察单位总数×100%。例如脑血管疾病在某地5咱慢性疾病的构成比为(3805/76)×100%=48.19%,心血管疾病占该5种慢性病总数的比重为(1365/76)×100%=17.29%。③相对比说明一个指标是另一个指标的几倍或几分之几。两个指标可以是绝对数、相对数或平均数;可以性质相同,例如不同年份某地某病死亡率之比,也可以性质不同,例如某医院医护人员数与病床数之比。公式为:相对比=甲指标/乙指标(或×100%)

构成比与率所说明的问题是不同的,构成比说明事物内部各部分所占的比重,不能说明某再象的发生强度或频率大小。因此,在分析时不能用构成比代替率。 33、应用相对数的注意事项?

①计算相对数尤其是率时应有足够数量的观察单位数或观察次数②分析时不能以构成比代替率③应分别将分子和分母合计求合计率或平均率④相对数的比较应注意其可比性⑤样本率或构成比比较时应作假设检验。⑥两个总体率进行比较时,要注意使用率的标准化法。 34、非参数检验适用哪些情况?

①等级顺序资料。②偏态分布。当观察资料呈偏态或极偏态分布而又未经变量变换,或虽经变量变换但仍未达到正态分布或近似正态分布时,宜用非参数检验。③未知分布型资料。④要比较的各组资料变异度相差较大,方差不齐,且不能变换达到齐性。⑤初步分析,有些医学资料由于统计工作量过大,可采用非参数统计方法时行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容。⑥对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法。 35、可信区间和参考值范围有何不同?

参考值范围是指同质总体中个体变量值的分布范围。而可信区间是指在可信度为(1—α)时,估计总体参数可能存在的范围。

36、假设检验和区间估计有何联系?

二者都属于统计推断的内容,假设检验推断总体参数间是否有质的区别,并可获得样本统计量,以得到相对精确的概率值。而可信区间用于推断总体参数的大小,它不仅可用以回答假设检验的问题,尚可比假设检验提供更多的信息。但这并不意味着用可信区间代替假设检验,因为假设检验可得到P值,比较精确地说明结论的概率保证,而可信区间只能告诉我们在某α水准上有无统计意义,却不能像P那样提供精确的概率。因此,只有二者有机结合起来,互相补充,才是完整的分析。 37、假设检验时,一般当P<0.05时,则拒绝H0,理论依据是什么?

其理论依据是:在H0成立的条件下,出于大于、等于现有检验统计量的概率P<0.05,它是小概率事件,即在一次抽样中得到这么小概率的事件是不大可能发生的,因而拒绝它。由此可见,假设检验的结论是具有概率性的,它存在犯错误的可能性小于等于0.05。 38、t检验和方差分析应用条件有何异同?

①相同点:在均数比较中, t检验和方差分析均要求各样本来自正态总体;各处理组总体方差齐且各随机本间相互,尤其在小样本时更需注意。②不同点:t检验仅用于两组资料的比较,除双侧检验外,尚可进行单侧检验,亦可计算一定可信度的可信区间,提示差别有无实际意义。而方差分析用于两组及两组以上均数的比较,亦可用于两组资料的方差齐性检验。

39、第一类错误与第二类错误的区别及联系何在?了解两类错误的实际意义?

区别:①Ⅰ型错误:指拒绝了实际上成立的H0,即“弃真”的错误。Ⅰ型错误的概率用а表示。统计推断时,根据研究者的要求来确定。②Ⅱ型错误:指接受了实际上不成立的H0,即“存伪”的错误。Ⅱ型错误的概率用β表示。β值的大小很难确切估计,只有在已知样本含量n、两总体参数差值δ以及所规定的检验水准а的条件下,才能估算出β值的大小。

联系:①当抽样例数一定时а越大,β越小;反之,а越小,β越大。②统计推断中,Ⅰ、Ⅱ型错误均有可能发生,若要使两者都减小,可适当增加样本含量。③根据研究者要求,n一定时,可通过确定а水平来控制β的大小。

意义:①可用于样本含量的估计。②可用来计算可信度(1—а),表明统计推断可靠性的大小。③可用于计算把握度(1—β),来评价检验方法的效能等。④有助于研究者选择适当的检验水准。⑤可以说明统计结论的概率保证。

40、如何合理设置检验水准? 根据研究目的,结合专业知识和研究设计要求,在未获得样本信息之前决定,而不应受到样本结果的影响。一般在差别的假设检验中,若重点减小Ⅰ型错误,可取较小的а值,常用а=0.05,а=0.01;若重点减小Ⅱ型错误,可取较大的а值,常用а=0.10,а=0.20。

4

41、检验假设中а和P的区别何在?

以t检验为例,а和P都是用t分布尾部面积大小表示,所不同的是:а值,即检验水准,是指在统计推断时,预先设定的一个小概率值,就是说如果H0是真的,允许它错误地被拒绝的概率。P值是由实际样本规定的,它给人的概念是实际资料怎样与H0相矛盾,P值是指在H0成立的前提下,出现等于或大于现有检验统计量的概率。

根据P与а的关系来决定对H0的取舍,做出统计推断的结论。

42、配对比较的t检验与配伍组比较的方差分析之间的关系如何?两样本均数比较的t检验与成组设计多个样本均数比较的方差分析之间的关系如何?

配伍组比较的方差分析是配对比较t检验的推广,它们的基本原理相同。成组设计多个样本均数比较的方差分析是两样本均数比较的t检验的推广,当两组比较时,它们是等价的。不管配伍组还是成组设计,当对比样本为两组,可用t检验或方差分析,当对比样本在两组以上,只能用方差分析,而不能用t检验。 43、要使直线回归方程稳定性好,应当怎样做?

回归方程的稳定程度决定于b的波动大小,即Sb的大小,Sb的大小不仅取决于表示随机因素对Y影响程度的SY,X,而且取决于观测数据中X的波动范围及样本含量n的大小,SY,X越小,建立方程时X的取值范围越大,样本含量n越大,则b越稳定,从而此回归方程也越稳定。 44、相关分析应用中应注意的问题?

①相关分析资料要求x,y都应是来自双变量正态总体的随机变量。②进行相关分析前,应先绘制散点图。只有散点图有线性趋势时,才可进行相关分析。③满足应用条件的同一份双变量资料,回归系数b与相关系数r的正负号一致,假设检验等价。欲解释两变量间依存变化的数量关系,只能采用回归分析。④相关分析时,小样本资料经t检验只能推断两变量间有无直线关系,而不能推断其相关的密切程度。要推断两

2

变量间相关的程度,样本含量必须足够大。尤应注意,若两变量间相关系数r具有统计学意义,但r较小时,下结论要慎重。 45、直线回归的应用?

①直线回归方程可用来描述两分析变量间依存变化的数量关系②利用回归方程进行预测预报③用容易测量的指标估计不易测量的指标④利用回归方程获得精度更高的医学参考值范围⑤利用回归方程进行统计控制。

46、等效检验应注意的问题?

①等效检验目的在于推断两总体率是否等效,须在试验设计时规定检验水准а②两样本率比较的等效检验,两样本率差值必须小于等效界值Δ,Δ值最大不应超过对照组样本率的20%。 47、Poisson分布的性质?

2

Poisson分布的方差等于均数,即б=µ;Poisson分布的可加性。 48、Poisson分布的应用条件?

凡具有同努利试验序列3个特点且л很小,n很大时,其相应的变量一般可认为服从Poisson分布。

2

49、行×列表X检验注意事项?

22

①计算X值时,必须用绝对数,不能用相对数。②X检验要求理论频数不宜太小。对于理论频数太小的处理方法:⑴最好增大样本容量,以达到增大理论频数的目的⑵删去理论频数太小的格子所对应的行或列,但这样会损失信息,损害样本的随机性⑶将理论频数太小的行或列与性质相近的邻行或列中的实际频数合并,使重新计算的理论频数增大。(损失的信息比第2种方法小一些)。③关于单向有序行列表,应用秩和

2

检验或Ridit检验。④当多个样本率(或构成比)比较的X检验,结论为拒绝检验假设,只能认为各总体率之间总的来说有差别,但不能说明它们彼此之间都有差别,或某两者间有差别。 50、应用标准化法的注意事项?

①标准化率是通过选择同一参照标准而计算的,目的是为了消除因年龄构成不同等混杂因素的影响,从而达到可比性。但标准化率不代表真正的死亡(或患病、发病)率水平。②样本的标准化率是样本指标值,亦存在抽样误差,若要比较其代表的总体标准化率是否相同,同样需要做假设检验。③一般情况下,在已知被标化组各年龄组死亡率时,宜采且直接法计算标准化率。④当所比较的两组内部各分组率的变化呈现交叉或非平行变化趋势时,不宜采用标准化法。 目的:在于控制混杂因素对研究结果的影响。 51、假设检验的步骤?

①建立检验假设,确定检验水准②计算检验统计量③确定P值,作出统计推断。

5

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo0.com 版权所有 湘ICP备2023021991号-1

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务