1、卫生统计学练习试卷 14-1 及答案解析(总分:92.00,做题时间:90 分钟)一、A1 型题(总题数:46,分数:92.00)1.某假设检验,检验水准 0.05 其意义是(分数:2.00)A.不拒绝错误的无效假设,即犯第二类错误的概率是 0.05B.统计推断上允许犯假阴性错误的概率为 0.05C.当无效假设正确时,平均在 100 次抽样中有 5 次推断是错误的D.将实际差异误判为抽样误差的概率是 0.05E.实际上就是允许犯第二类错误的界限2.已知 t0.05,33.182(双侧),理论上有 95%的 t 值落在(分数:2.00)A.小于 3.182 的范围内,即:(-,3.182)B.小
2、于 -3.182 的范围内,即:(-,-3.182)C.大于 -3.182 的范围内,即:(-3.182,+)D.大于 3.182 的范围内,即;(3.182,+)E.(-3.182,3.182)3.估计医学参考值范围时,下面说法错误的是(分数:2.00)A.正常人是指排除了对研究指标有影响的疾病和因素的人B.需要足够数量,通常样本含量有 100 例以上C.正常是指健康,没有疾病D.需要考虑样本的同质性E.对于某些指标组间差别明显且有实际意义的,应先确定分组,再分别估计医学参考值范围4.t 检验,P0.05 说明(分数:2.00)A.两样本均数不相等B.两总体均数有差别C.两样本均数差别较大D
3、.两总体均数差别较大E.两样本均数差别有实际意义5.已知 t0.05,182.101(双侧),则区间(-2.101,+2.101)与曲线所围面积是(分数:2.00)A.95.0%.B.97.5%.C.99.0%.D.2.5%.E.5.0%.6.某人算得资料的 s -3.0,可认为(分数:2.00)A.变量值都是负数B.变量值负的比正的多C.计算有错D.变量值一个比一个小E.变量值多数为零7.若正常成年男子的血铅含量 X 取对数后的数值呈正态分布。欲描述血铅的平均水平,最适宜采用的指标是(分数:2.00)A.算术均数B.几何均数C.中位数D.百分位数E.众数8.已知 t0.01,35.841(双
4、侧),理论上有 99%的 t 值落在(分数:2.00)A.(-,+5.841)B.(-,-5.841)C.(-5.841,+)D.(+5.841,+)E.(-5.841,+5.841)9.标准误越大,表示此次抽样的(分数:2.00)A.系统误差越小B.可靠程度越好C.均数抽样误差越大D.可比性越差E.变量值离散程度越大10.随机事件的概率 P 的取值范围是(分数:2.00)A.P1B.P0C.0P1D.0P1E.-1P111.标准差指标表示一组同质变量值的(分数:2.00)A.变化范围B.集中趋势C.离散程度D.频数分布E.观察值间相差的大小12.假设检验的第一类错误是指(分数:2.00)A.
5、统计判断拒绝了实际上成立的 H0B.不拒绝实际上成立的 H0C.拒绝了实际上不成立的 H0D.接受实际上错误的 H0E.拒绝 H0 时所犯的错误13.统计工作的基本步骤是(分数:2.00)A.资料搜集统计分析B.统计设计资料搜集统计分析C.资料搜集资料整理统计分析D.统计设计资料搜集资料整理统计分析E.资料搜集统计设计资料整理统计分析14.有 12 名妇女分别用两种测量肺活量的仪器测最大呼气率(L/min),欲比较两种方法的检测结果有无差别,可进行(分数:2.00)A.成组设计 u 检验B.成组设计 t 检验C.配对设计 u 检验D.配对设计 t 检验E.配对设计检验15.下列有关负偏态资料的
6、描述,错误的是(分数:2.00)A.变量值大部分集中在大的一端B.人群中高血压病患者的年龄分布是负偏态的C.I 型糖尿病患者(先天胰岛功能不全)的发病年龄不服从该分布D.均数和中位数都可以表示其平均水平E.一般采用中位数指标来描述其集中位置16.原始数据都加(或减)一个不等于零的常数后,下列离散程度指标(分数:2.00)A.R 变化B.s 不变C.R、s 都改变D.R、s、CV 都改变E.R、s、CV 都不变17.关于正偏态分布资料的描述,说法错误的是(分数:2.00)A.变量值的频数分布不对称B.大多数变量值集中在小的一端C.绘成的曲线高峰偏右,长尾向左侧D.不宜用算术均数表示其平均水平E.
7、可考虑运用中位数指标来描述其集中位置18.标准正态分布的表示方法是(分数:2.00)A.N(1,0)B.N(0,1)C.N(1,1)D.N(0,0)E.N(1,2)19.常用的平均数指标分三类,选用时必须遵循下列原则,除了(分数:2.00)A.要根据资料分布情况,选择不同的平均数指标B.算术平均数适用于同质且对称分布的资料C.呈等比数列以及取对数后呈对称分布的资料,最适宜用几何均数表示其平均水平D.中位数的适用资料范围广泛,对称或偏态资料均可计算该指标E.资料只要服从对称分布,均数和中位数的计算结果就一定相等20.对同一份资料分别计算均数和中位数,若两者的数值接近,则(分数:2.00)A.资料
8、必定服从正态分布B.资料的分布有可能是正态的C.该资料必为偏态分布D.该资料必为正偏态分布E.该资料必为负偏态分布21.要减小抽样误差,最切实可行的方法是(分数:2.00)A.增加观察例数B.控制个体变异C.遵循随机化原则D.严格挑选观察对象E.有代表性的选取研究对象22.对于对称分布资料,理论上算术均数和中位数的大小是(分数:2.00)A.相等B.算术均数大于中位数C.算术均数小于中位数D.不能确定谁大谁小,两者之间无可比性E.接近23.常用的表示个体离散程度(变异程度)的指标包括(分数:2.00)A.标准差B.极差、标准差C.极差、标准差、变异系数D.极差、标准差、方差和变异系数E.极差、
9、标准差、标准误、方差和变异系数24.标准正态分布是(分数:2.00)A.=0,=1 的正态分布B.=0,=0 的正态分布C.=0, 任意的正态分布D. 任意,=1 的正态分布E.它的曲线位置和形状并不惟一25.标准差与标准误的主要区别在于(分数:2.00)A.两者是性质完全不同的两类指标B.标准差能反映一组数值的离散程度,而标准误不能C.标准误是样本均数的标准差D.标准误数值受标准差影响,当样本含量一定时,两者成正比例关系E.标准差大,表示变量值越分散,而标准误大,则均数分布的抽样误差大26.下列不属于整理资料的步骤是(分数:2.00)A.检查核对B.设计分组C.拟定整理表D.归组汇总E.进行
10、分析27.下列关于总体均数可信区间的论述都是正确的,除了(分数:2.00)A.总体均数的区间估计是一种常用的参数估计方法B.总体均数 95%可信区间的公式是 Xt0.05,C.求出总体均数可信区间后,即可推断总体均数一定会在此范围内D.大样本时估计总体均数时 t0.05, 可近似用 1.96 代替E.总体均数 99%可信区间的公式是 Xt0.01,28.一般说来,随着样本含量增加,标准差将(分数:2.00)A.随 n 增加而增大B.随 n 增加而减小C.不改变D.趋近于某个固定值E.不能确定,因为标准差是由变量值之间变异大小决定的29.关于标准误,下列论述错误的是(分数:2.00)A.由 、
11、已知的正态总体中固定样本例数反复抽样,抽得的样本均数会以 为中心,成为正态分布B.样本均数的标准差称为标准误C.当 已知时,标准误可利用公式:/n 求得D.当 未知时,常用 s 作近似估计标准误的大小E.当调查的样本例数足够大,如:n100 时,标准误的估计值会与理论值极为近似30.t 检验中,tt0.05,,P0.05,拒绝检验假设,其基本依据是(分数:2.00)A.H0 已不可能成立,故应该拒绝B.H0 成立的可能性很小,可以认为其不能成立C.计算结果表明检验假设是错误的D.原假设的内容极为荒谬,应予以拒绝E.H1 错误的概率很小,P0.05,因此有很大把握接受它31.描述一组偏态分布资料
12、的变异度时,最适宜选择的指标是(分数:2.00)A.极差B.百分位数C.中位数D.决定系数E.以上都可以32.如 t 值不变,自由度 增大则(分数:2.00)A.P 值不变B.P 值减小C.P 值增大D.给定 时,P 值减小E.给定 时,P 值增大33.一些以儿童为主的传染病,患者的年龄分布,集中位置偏向年龄小的一侧,称为(分数:2.00)A.正态分布B.正偏态分布C.负偏态分布D.偏态分布E.对称分布34.下列关于中位数的论述,正确的是(分数:2.00)A.中位数即一组任意排列的变量值中,位于正中间的数值B.中位数也就是第 50 百分位数,用 P50 表示C.对称分布资料不能计算中位数,该指
13、标只有偏态资料才适用D.频数表法计算中位数时,要求各组段的组距必须相等E.资料里有特大、特小值存在时,就不适合计算中位数35.编制组段数为 10 的频数表,在确定组距时(分数:2.00)A.常取最大值的 1/10 取整作为组距B.常取最小值的 1/10 取整作为组距C.常取极差的 1/10 取整作为组距D.组距等于极差E.常取极差的一半取整作为组距36.下列有关建立假设的论述,错误的是(分数:2.00)A.假设可分成两种,分别用符号 Ho 和 H1 表示B.无论 Ho 和 H1,都是对总体做出的某种假定C.检验假设用 Ho 表示D.备择假设用 H1 表示E.两样本均数比较的假设检验时,H1 的
14、表达式是:1237.频数分布的两个重要特征是(分数:2.00)A.集中趋势和分布类型B.集中趋势和离散趋势C.标准差和离均差D.对称分布和偏态分布E.资料的类型38.请根据医学常识判断,理论上不服从正态分布的资料是(分数:2.00)A.某地同年龄、同性别儿童的身高数值B.某一特定人群的血清胆固醇值C.某地所有现患麻疹病人的年龄分布D.某一特定人群的白细胞数E.某一特定人群血红蛋白含量39.平均数指标被用于表示一组同质变量值的(分数:2.00)A.离散趋势B.变化范围C.频数分布D.平均水平E.样本代表性40.关于标准差,下面说法错误的是(分数:2.00)A.标准差可综合反映各观察值的离散程度B
15、.总体标准差用 表示,样本标准差常用 s 表示C.标准差与原资料的单位相同D.两组资料的单位不同时,仍可以采用标准差来比较它们的离散程度E.标准差相等的两组资料仍不能判定其均数的大小关系41.用频数表法计算中位数时,要求(分数:2.00)A.组距相等B.组距不等C.组距相等或不等都可以D.组距呈倍数增加E.组距呈倍数减少42.从某地随机抽取 29 名山区健康成年男子,测得其脉搏均数为 74.3 次/min。根据经验一般地区健康成年男子脉搏均数为 72 次/min,现样本均数(74.3 次/min)与总体均数不同,是因为(分数:2.00)A.抽样误差或两总体均数不同B.个体变异C.抽样误差D.两
16、总体均数不同E.测量技术可能不规范43.关于标准差,下面说法正确的是(分数:2.00)A.标准差可以是负数B.标准差必定大于零C.标准差无单位D.同一资料的标准差一定比均数小E.同一资料的标准差一定比均数大44.对于偏态分布资料且测量值过高才有临床意义,95%单侧正常值范围可定(分数:2.00)A.上限为 P5B.上限为 P95C.P5P95D.P95 以上的值为正常E.P5 以上的值为正常45.关于随机抽样,下面正确的是(分数:2.00)A.随机抽样即随意抽取个体B.为了能使样本更好地代表总体,抽样时应精心挑选个体C.抽样时应使总体中的每一个观察单位都有同等机会被抽取D.抽样时样本量越大越好
17、E.随机抽样的首要目的是减少成本,以最小的花费达到预期结果46.关于几何均数,下面说法错误的是(分数:2.00)A.几何均数常用于等比资料或对数正态分布资料的平均水平描述B.观察值中若有零就不能计算几何均数C.观察值全是负数时,无法计算几何均数D.同一组资料的几何均数小于均数E.计算几何均数时,观察值不允许同时有正负值出现卫生统计学练习试卷 14-1 答案解析(总分:92.00,做题时间:90 分钟)一、A1 型题(总题数:46,分数:92.00)1.某假设检验,检验水准 0.05 其意义是(分数:2.00)A.不拒绝错误的无效假设,即犯第二类错误的概率是 0.05B.统计推断上允许犯假阴性错
18、误的概率为 0.05C.当无效假设正确时,平均在 100 次抽样中有 5 次推断是错误的 D.将实际差异误判为抽样误差的概率是 0.05E.实际上就是允许犯第二类错误的界限解析:2.已知 t0.05,33.182(双侧),理论上有 95%的 t 值落在(分数:2.00)A.小于 3.182 的范围内,即:(-,3.182)B.小于 -3.182 的范围内,即:(-,-3.182)C.大于 -3.182 的范围内,即:(-3.182,+)D.大于 3.182 的范围内,即;(3.182,+)E.(-3.182,3.182) 解析:3.估计医学参考值范围时,下面说法错误的是(分数:2.00)A.正
19、常人是指排除了对研究指标有影响的疾病和因素的人B.需要足够数量,通常样本含量有 100 例以上C.正常是指健康,没有疾病 D.需要考虑样本的同质性E.对于某些指标组间差别明显且有实际意义的,应先确定分组,再分别估计医学参考值范围解析:4.t 检验,P0.05 说明(分数:2.00)A.两样本均数不相等B.两总体均数有差别 C.两样本均数差别较大D.两总体均数差别较大E.两样本均数差别有实际意义解析:5.已知 t0.05,182.101(双侧),则区间(-2.101,+2.101)与曲线所围面积是(分数:2.00)A.95.0%. B.97.5%.C.99.0%.D.2.5%.E.5.0%.解析
20、:6.某人算得资料的 s -3.0,可认为(分数:2.00)A.变量值都是负数B.变量值负的比正的多C.计算有错 D.变量值一个比一个小E.变量值多数为零解析:7.若正常成年男子的血铅含量 X 取对数后的数值呈正态分布。欲描述血铅的平均水平,最适宜采用的指标是(分数:2.00)A.算术均数B.几何均数 C.中位数D.百分位数E.众数解析:8.已知 t0.01,35.841(双侧),理论上有 99%的 t 值落在(分数:2.00)A.(-,+5.841)B.(-,-5.841)C.(-5.841,+)D.(+5.841,+)E.(-5.841,+5.841) 解析:9.标准误越大,表示此次抽样的
21、(分数:2.00)A.系统误差越小B.可靠程度越好C.均数抽样误差越大 D.可比性越差E.变量值离散程度越大解析:10.随机事件的概率 P 的取值范围是(分数:2.00)A.P1B.P0C.0P1D.0P1 E.-1P1解析:11.标准差指标表示一组同质变量值的(分数:2.00)A.变化范围B.集中趋势C.离散程度 D.频数分布E.观察值间相差的大小解析:12.假设检验的第一类错误是指(分数:2.00)A.统计判断拒绝了实际上成立的 H0 B.不拒绝实际上成立的 H0C.拒绝了实际上不成立的 H0D.接受实际上错误的 H0E.拒绝 H0 时所犯的错误解析:13.统计工作的基本步骤是(分数:2.
22、00)A.资料搜集统计分析B.统计设计资料搜集统计分析C.资料搜集资料整理统计分析D.统计设计资料搜集资料整理统计分析 E.资料搜集统计设计资料整理统计分析解析:14.有 12 名妇女分别用两种测量肺活量的仪器测最大呼气率(L/min),欲比较两种方法的检测结果有无差别,可进行(分数:2.00)A.成组设计 u 检验B.成组设计 t 检验C.配对设计 u 检验D.配对设计 t 检验 E.配对设计检验解析:15.下列有关负偏态资料的描述,错误的是(分数:2.00)A.变量值大部分集中在大的一端B.人群中高血压病患者的年龄分布是负偏态的C.I 型糖尿病患者(先天胰岛功能不全)的发病年龄不服从该分布
23、D.均数和中位数都可以表示其平均水平 E.一般采用中位数指标来描述其集中位置解析:16.原始数据都加(或减)一个不等于零的常数后,下列离散程度指标(分数:2.00)A.R 变化B.s 不变 C.R、s 都改变D.R、s、CV 都改变E.R、s、CV 都不变解析:17.关于正偏态分布资料的描述,说法错误的是(分数:2.00)A.变量值的频数分布不对称B.大多数变量值集中在小的一端C.绘成的曲线高峰偏右,长尾向左侧 D.不宜用算术均数表示其平均水平E.可考虑运用中位数指标来描述其集中位置解析:18.标准正态分布的表示方法是(分数:2.00)A.N(1,0)B.N(0,1) C.N(1,1)D.N(
24、0,0)E.N(1,2)解析:19.常用的平均数指标分三类,选用时必须遵循下列原则,除了(分数:2.00)A.要根据资料分布情况,选择不同的平均数指标B.算术平均数适用于同质且对称分布的资料C.呈等比数列以及取对数后呈对称分布的资料,最适宜用几何均数表示其平均水平D.中位数的适用资料范围广泛,对称或偏态资料均可计算该指标E.资料只要服从对称分布,均数和中位数的计算结果就一定相等 解析:20.对同一份资料分别计算均数和中位数,若两者的数值接近,则(分数:2.00)A.资料必定服从正态分布B.资料的分布有可能是正态的 C.该资料必为偏态分布D.该资料必为正偏态分布E.该资料必为负偏态分布解析:21
25、.要减小抽样误差,最切实可行的方法是(分数:2.00)A.增加观察例数 B.控制个体变异C.遵循随机化原则D.严格挑选观察对象E.有代表性的选取研究对象解析:22.对于对称分布资料,理论上算术均数和中位数的大小是(分数:2.00)A.相等B.算术均数大于中位数C.算术均数小于中位数D.不能确定谁大谁小,两者之间无可比性E.接近 解析:23.常用的表示个体离散程度(变异程度)的指标包括(分数:2.00)A.标准差B.极差、标准差C.极差、标准差、变异系数D.极差、标准差、方差和变异系数 E.极差、标准差、标准误、方差和变异系数解析:24.标准正态分布是(分数:2.00)A.=0,=1 的正态分布
26、 B.=0,=0 的正态分布C.=0, 任意的正态分布D. 任意,=1 的正态分布E.它的曲线位置和形状并不惟一解析:25.标准差与标准误的主要区别在于(分数:2.00)A.两者是性质完全不同的两类指标B.标准差能反映一组数值的离散程度,而标准误不能C.标准误是样本均数的标准差D.标准误数值受标准差影响,当样本含量一定时,两者成正比例关系E.标准差大,表示变量值越分散,而标准误大,则均数分布的抽样误差大 解析:26.下列不属于整理资料的步骤是(分数:2.00)A.检查核对B.设计分组C.拟定整理表D.归组汇总E.进行分析 解析:27.下列关于总体均数可信区间的论述都是正确的,除了(分数:2.0
27、0)A.总体均数的区间估计是一种常用的参数估计方法B.总体均数 95%可信区间的公式是 Xt0.05,C.求出总体均数可信区间后,即可推断总体均数一定会在此范围内 D.大样本时估计总体均数时 t0.05, 可近似用 1.96 代替E.总体均数 99%可信区间的公式是 Xt0.01,解析:28.一般说来,随着样本含量增加,标准差将(分数:2.00)A.随 n 增加而增大B.随 n 增加而减小C.不改变D.趋近于某个固定值E.不能确定,因为标准差是由变量值之间变异大小决定的 解析:29.关于标准误,下列论述错误的是(分数:2.00)A.由 、 已知的正态总体中固定样本例数反复抽样,抽得的样本均数会
28、以 为中心,成为正态分布B.样本均数的标准差称为标准误C.当 已知时,标准误可利用公式:/n 求得 D.当 未知时,常用 s 作近似估计标准误的大小E.当调查的样本例数足够大,如:n100 时,标准误的估计值会与理论值极为近似解析:30.t 检验中,tt0.05,,P0.05,拒绝检验假设,其基本依据是(分数:2.00)A.H0 已不可能成立,故应该拒绝B.H0 成立的可能性很小,可以认为其不能成立 C.计算结果表明检验假设是错误的D.原假设的内容极为荒谬,应予以拒绝E.H1 错误的概率很小,P0.05,因此有很大把握接受它解析:31.描述一组偏态分布资料的变异度时,最适宜选择的指标是(分数:
29、2.00)A.极差 B.百分位数C.中位数D.决定系数E.以上都可以解析:32.如 t 值不变,自由度 增大则(分数:2.00)A.P 值不变B.P 值减小 C.P 值增大D.给定 时,P 值减小E.给定 时,P 值增大解析:33.一些以儿童为主的传染病,患者的年龄分布,集中位置偏向年龄小的一侧,称为(分数:2.00)A.正态分布B.正偏态分布 C.负偏态分布D.偏态分布E.对称分布解析:34.下列关于中位数的论述,正确的是(分数:2.00)A.中位数即一组任意排列的变量值中,位于正中间的数值B.中位数也就是第 50 百分位数,用 P50 表示 C.对称分布资料不能计算中位数,该指标只有偏态资
30、料才适用D.频数表法计算中位数时,要求各组段的组距必须相等E.资料里有特大、特小值存在时,就不适合计算中位数解析:35.编制组段数为 10 的频数表,在确定组距时(分数:2.00)A.常取最大值的 1/10 取整作为组距B.常取最小值的 1/10 取整作为组距C.常取极差的 1/10 取整作为组距 D.组距等于极差E.常取极差的一半取整作为组距解析:36.下列有关建立假设的论述,错误的是(分数:2.00)A.假设可分成两种,分别用符号 Ho 和 H1 表示B.无论 Ho 和 H1,都是对总体做出的某种假定C.检验假设用 Ho 表示D.备择假设用 H1 表示E.两样本均数比较的假设检验时,H1
31、的表达式是:12 解析:37.频数分布的两个重要特征是(分数:2.00)A.集中趋势和分布类型B.集中趋势和离散趋势 C.标准差和离均差D.对称分布和偏态分布E.资料的类型解析:38.请根据医学常识判断,理论上不服从正态分布的资料是(分数:2.00)A.某地同年龄、同性别儿童的身高数值B.某一特定人群的血清胆固醇值C.某地所有现患麻疹病人的年龄分布 D.某一特定人群的白细胞数E.某一特定人群血红蛋白含量解析:39.平均数指标被用于表示一组同质变量值的(分数:2.00)A.离散趋势B.变化范围C.频数分布D.平均水平 E.样本代表性解析:40.关于标准差,下面说法错误的是(分数:2.00)A.标
32、准差可综合反映各观察值的离散程度B.总体标准差用 表示,样本标准差常用 s 表示C.标准差与原资料的单位相同D.两组资料的单位不同时,仍可以采用标准差来比较它们的离散程度 E.标准差相等的两组资料仍不能判定其均数的大小关系解析:41.用频数表法计算中位数时,要求(分数:2.00)A.组距相等B.组距不等C.组距相等或不等都可以 D.组距呈倍数增加E.组距呈倍数减少解析:42.从某地随机抽取 29 名山区健康成年男子,测得其脉搏均数为 74.3 次/min。根据经验一般地区健康成年男子脉搏均数为 72 次/min,现样本均数(74.3 次/min)与总体均数不同,是因为(分数:2.00)A.抽样
33、误差或两总体均数不同 B.个体变异C.抽样误差D.两总体均数不同E.测量技术可能不规范解析:43.关于标准差,下面说法正确的是(分数:2.00)A.标准差可以是负数B.标准差必定大于零 C.标准差无单位D.同一资料的标准差一定比均数小E.同一资料的标准差一定比均数大解析:44.对于偏态分布资料且测量值过高才有临床意义,95%单侧正常值范围可定(分数:2.00)A.上限为 P5B.上限为 P95 C.P5P95D.P95 以上的值为正常E.P5 以上的值为正常解析:45.关于随机抽样,下面正确的是(分数:2.00)A.随机抽样即随意抽取个体B.为了能使样本更好地代表总体,抽样时应精心挑选个体C.抽样时应使总体中的每一个观察单位都有同等机会被抽取 D.抽样时样本量越大越好E.随机抽样的首要目的是减少成本,以最小的花费达到预期结果解析:46.关于几何均数,下面说法错误的是(分数:2.00)A.几何均数常用于等比资料或对数正态分布资料的平均水平描述B.观察值中若有零就不能计算几何均数C.观察值全是负数时,无法计算几何均数 D.同一组资料的几何均数小于均数E.计算几何均数时,观察值不允许同时有正负值出现解析: