教育测量与评价考研知识点.pdf
《教育测量与评价考研知识点.pdf》由会员分享,可在线阅读,更多相关《教育测量与评价考研知识点.pdf(23页珍藏版)》请在麦多课文档分享上搜索。
1、教育测量与评价 考研知识点 第一章 教 育 测评 概 述 第 一节 教育 测量 概述 一、什 么是 测量 (一) 测量 的定 义 一般认 为, 测量 是根 据法 则给事 物分 派数 字。 具体 来说, 是指 根据 一定 的法 则和程序 , 对事物 或现 象在 数量 上的 规定性 加以 描述 和确 定的 过程。 这里包 含了 测量 应有 的三 个特性 :1 、法 则。2 、事 物。3 、数 字。 (二) 测量 的三 要素 :1 、 单位。2、 参照 点。3 、量 表。 二、什 么是 教育 测量 (一) 教育 测量 的定 义 教育测 量是 根据 测量 学的 原理和 方法 对教 育现 象及 其属性
2、从量 的规 定性 上予 以确定 和 描述的 过程 。 (二) 教育 测量 的特 点 1 、测 量结 果的 间接 性。 2 、度 量单 位的 相对 性。 3 、测 量对 象的 复杂 性。 4 、测 量目 的的 针对 性。 第 二节 教育 评价 概述 一、什 么是 评价 评价就 是根 据某 种价 值观 对事物 及其 属性 进行 判断 、 衡 量, 或者 说是 衡量 、 判 断人或 事 物的价 值。 二、什 么是 教育 评价 教育评 价是 根据 一定 的价 值观或 价值 标准 , 运用 可行 的科学 手段 ( 包括 测量 或非 测量 ) , 通过系 统地 搜集 信息 、 分 析解释 , 对教 育现象
3、 进行 价值判 断 , 从 而为不 断优 化教育 和教 育 决 策提供 依据 的过 程。 三、教 育评 价与 教育 测量 的关系 测量是 依据 一定 的法 则和 程序 , 对 事物 或现 象在 数量 上的规 定性 加以 描述 和确 定的过 程 ; 评价是 泛指 根据 一定 的观 念和标 准衡 量、 判断 人物 或事物 的价 值。 测量 的结 果只有 通过 评价的解释 才能 揭示 其实 际意 义。 测量 是依 据, 评价 是 测量的 具体 体现 。 测 量关 心的是 数量 的多 少, 评 价关 心的 是价 值的 高 低; 测 量是 纯客 观的, 评价 带有主 观性 ; 测 量是 一种 单 一的活
4、 动, 评价则 是一 种综 合的 活动 。 教育测 量就 是借 助一 定的 工具 , 给 教育 现象赋 值 , 来获取 评价 对象 数量 的方 法。 教育 测 量是教 育评 价获 得数 据资 料的重 要手 段 。 教 育测 量可 以为教 育评 价提 供价 值判 断的基 本数 量 事实 , 是 教育 评价的 基础 ; 教 育评 价是 教育测 量过 程的延 续 , 是 对教育 测量 结果的 解释 与 应 用。 值得 指出 的是 , 教 育 评价并 非一 定以 教育 测量 为基础 , 有时 教育评 价和 教育测 量是 同义 词。比 如, 当教 师对 学生 的成绩 进行 测验 时, 可以 说是测 量学
5、 生的 成绩 或评 价学生 的成绩 。 四、教 育评 价的 种类 (一 ) 根 据评 价对 象和 范围 不同 , 可 分为 宏观 教育 评价 、 中 观教 育评 价和 微观 教育 评价 。 (二) 根据 评价 的时 间和 作用不 同, 可分 为定 位性 评价、 诊断 性评 价、 形成 性评价 和总 结性评 价 (三) 根据 评价 的基 准不 同,可 分为 相对 评价 、绝 对评价 个体 内差 异评 价 (四) 根据 评价 的性 质不 同,可 分为 需要 性评 价、 可行性 评价 和配 置性 评价 (五) 根据 评价 的主 客体 不同, 可分 为自 我 评 价和 他人评 价 (六 ) 按 被评
6、价对象 的变 量关系 不同 , 分为被 评价 对象整 体的 水平 评价 、 被 评价对 象 相 对的水 平评 价、 被评 价对 象特殊 相关 的评 价、 被评 价对象 专项 差异 的评 价。 第 三节 教育 测量 与评价 的发 展 一、教 育测 量的 发展 阶段 科举制 度的 特点 : 第 一, 要经过 严格 的政 治条 件方 面审查 ; 第 二, 要进 行严 格的文 化考 查;第 三, 历代 对考 生都 有健康 方面 的标 准。 科举制 度可 取之 处: 第一 , 政治 理论 考试 是最 主要 的考试 项目 ; 第 二, 文化 素养特 别是 写作能 力是 必考 项目 ;第 三,注 意考 查分
7、 析问 题和 解决问 题的 能力 。 科举制 度实 际上 就是 一个 关于学 生学 力检 测、 评价 制度 , 但 是它 缺乏对 人全 面的 、 科 学 的考察 ,并 且存 在着 许多 弊端。 在 18 世纪 以前 的西 方各 国 , 由 于学 校尚 未普 及 , 学 校考试 主要 是口 试 。1702 年, 英国 剑桥大 学首 先以 笔试 代替 口试, 开西 方学 校考 试先 河。 1864 年英 国格 林威 治医 院 附属学 校一 位名 叫费 舍的 教师收 集了 许多 学生 成绩 样本, 汇 集了一 本 量表 集 ,作 为度量 学生 各科 成绩 的标 准。可 以说 是客 观标 准化 测量的
8、 萌芽 。 1895 年, 比纳 等设 计了 一 套智力 测验 的方 法,1905 年在西 蒙(Simon) 的 协助 下 , 制 成了 著名的 比纳 西 蒙智 力量 表。 现代教 育测 量在 以下 方面 有了新 的发 展: 第一 ,开 始重视 学生 智力 和思 想品 德的测量 。 第二, 现代 教育 测量 量表 的编制 突破 了过 去单 一答 案的求 同式 思维 题, 发展 为包括 多种 答案 的求异 式思 维题 和论 文式 试题。 第三 ,教 育测 量的 范围由 过去 偏重 于学 生学 习成绩 的测量 , 发展到 涉及 到课 程设 置、 教材、 教育 改革 方案 等效 益方面 的测 量。
9、第四 , 现 代的教 育测 量由 过去单 一的 常模 参照 性测 验模式 发展 到常 模参 照性 测验与 目标 参照 性测 验相 结合的 模式 。 第 五,教 育测 量本 身的 理论 研究与 技术 开发 更加 深入 与完善 。 二、教 育评 价的 发展 阶段 1940 年, 泰勒 教授 提出 了 第一个 报告 ,第 一次 提出 了 “教 育评 价 ” 这个 概念 ,认为 实 施教育 评价 首先 必须 分析 教育应 达到 的目 标, 再用 这个目 标来 评价 教育 的效 果, 运 用评 价来 促进教 育活 动向 理想 的目 标逼近 。 被 人们 称为 “划 时代的 教育 评价 宣言 ”。 教育评
10、 价产 生的 标志是 “八 年研 究 ” ;泰 勒被称 为 “ 教育 评价 鼻祖 ”。 第二章 教 育 测量 的 质 量 指 标 第 一节 信度 一、信 度的 概念 信度指 测量 结果 的稳 定性 或可靠 性程 度, 亦即 测量 的结果 是否 真实 , 是 否客 观反映 了考 生的实 际水 平。 信度 的取 值范围 为0,1 。 在实际 测量 中主 要采 用计 算信度 系数 的方 法估 计信 度。 依 照计 算方 法的 不同, 可将信 度 分为4 种: 再测信 度 : 用一种 测验 对同 一被 试组 施测两 次 , 根 据两次 测验 分数计 算其 相关 系数 。 此 种信 度能表 示两 次测验
11、 结果 有无 变动 , 反 映测验 分数 的稳 定程 度, 故又称 稳定 性 系 数。在 没有 复本 可用 ,而 现实条 件又 允许 重复 施测 时,一 般采 用这 种再 测法 来估计 其信度 。 复本 信度 : 用一 种测 验的 两个等 值复 本施 测于 同一 被试组 , 然后 计算 两次 得分 的相关 系数 。 一般说 来, 复本 法是 考查 测验信 度最 好的 方法 。 内部一 致性 信度 : 测 验的 同质性 程度 。 如 果测验 中各 测题 得分 有正 相关 , 则 测验 是同 质的 。 考 查测验 内部 一致 性的 常用 方法有 分半 法、 库德尔 理查 森公 式和 克龙巴 赫 系
12、 数。 这样 求 得的信 度系 数也 叫做 内部 一致性 系数 。 分半法 是考 查测 验信 度最 常用的 方法 , 在 测验 没有 复本且 只能 实施 一次 时, 常用此 法估 计信 度, 即 把测 验题 分成 对等 的两半 (一 般按 奇数 题和 偶数题 分) , 根 据各 人在 这两半 测验 所得 分数计 算其 相关 系数 , 即 得分半 信度 。 但分半 法实 际只求 得半 个测 验的 信度 , 由 于在 其他 条件相等 的情 况下 , 测 验越 长, 信 度越 高, 因此 必须 使用斯 皮尔 曼 布 朗公 式加以 校正 , 以 估计整 个测 验的 信度 。 库 德尔 理 查森 公式
13、以测 验各个 项目 的正 确反 应为 基础, 或根 据各 人总分 的平 均数 和标 准差 计算信 度系 数, 即得 库德 尔 理查 森信 度。 它代 表一切 可能 的分 半信度 系数 的平 均数 。 但库 德 尔 理 查森 公式 只适 用于答 对一 题得 一分 、 答错 无分的 测验 。 克龙巴 赫 系 数则 适用 于 多重记 分的 测验 信度 估计 。 评 分者 信度 :随 机抽 取数份 试卷 , 由两位 或两 位以 上评 分者 分别评 分, 然后 计算 每份 试卷所 评各 分数 之间 的相 关系数 。 在 两人 评阅数 份试 卷 (或1 人 先 后两次 评阅 数份 试卷 ) 时 , 用 斯
14、皮 尔曼 等级 相关 公 式求相 关 ; 在3 人以上 评阅 数份 试卷 时, 则需计 算肯 德尔 和谐 系数 。 对 一些 无法 完全客 观记 分的测 验 , 常 需 考查评 分者 信度 。 以 上计 算信度 系数 的各 种方 法是 以不同 的假 定和 前提 条件 为基础 的, 故所 求得的 数值 意义 不尽 相同 ,因而 不能 单以 数值 来比 较其信 度高 低。 二、提 高测 验信 度的 方法 1 、适 当增 加测 验题 目的 数 量; 2 、测 验的 难度 要适 中; 3 、测 验的 内容 应尽 量同 质 ; 4 、测 验的 程序 应统 一; 5 、测 验的 时间 要充 分; 6 、评
15、 分要 尽量 做到 客观 化 、减少 评分 误差 。 第 二节 效度 一、效 度的 概念 效度指 测量 结果 的准 确性 和有效 性的 程度 ,亦 即测 量是否 达到 了预 期目 的。 二、效 度的 理论 公式 三、效 度的 分类 及估 计 与信度 计算 的理 论公 式一 样, 根 据效 度的 理论 公式 是不能 计算 出效 度的 大小 的。 在 实践 中常采 用以 下几 种方 法计 算效度 。 (一) 内容 效度 1 、内 容效 度的 定义 指测验 目的 代表 所欲 测量 的内容 和引 起预 期反 应所 达到的 程度 , 即测 量内 容的 代表性 程 度。 2 、内 容效 度的 估计 方法
16、: (1) 逻辑 判断 法。 一般 是 由本学 科的 专家 根据 所欲 测量的 属性 之定 义和 测量 内容范 围 的界定 , 依据 教育学 和心 理学的 理论 , 根据教 学大 纲要求 , 勾画 出学生 掌握 知识内 容的 范 围 和深度 , 提 出应 形成 的技 能名称 , 然 后以 逻辑 分析 的方法 估计 测验 在多 大程 度上代 表了 这些 内容, 在多 大程 度上 能够 测量出 所要 测量 的特 性和 功能。 (2) 比较 平均 数差 异的 显 著性 对同一 组被 试用 一个 测验 的两个 复本 在某 一学 科教 学或训 练前 后实 施测 验 , 该 测验内 容 的有效 性可 以由
17、 两次 测验 成绩差 异的 显著 性 来 加以 判断 。 若 两次 测验 分数 的平 均数有 显著 性 差异, 且教 学后 优于 教学 前, 则 表明 测验 所测 得的 内容正 是教 学或 训练 的内 容。 因 此, 可以 认为测 验的 内容 具有 有效 性。 若 两次 测验 分数 的平 均数无 显著 性差 异, 则表 明测验 所测 得的 内容与 教学 或训 练的 内容 不相符 合 。 因 此可 以认 为测 验的内 容效 度缺 乏有 效性 或内容 效度 较 低。 检验 两个 复本 测验 分数 平均数 之差 的显 著性 时 , 可 用相关 样本 平均 数之 差的 检验统 计 量 。 (3) 相关
18、 法 测验的 内容 效度 也可 以用 反映同 一内 容范 围的 两个 不同测 验 , 对 同一 组被 试施 测结果 的 相关系 数来 表示 。 若 相关 高, 表 明测 验的 内容 效度 较高; 若相 关 低 , 表 明测 验的内 容效 度较 低。 (二) 效标 关联 效度 效标就 是足 以显 示测 验所 欲测量 的特 性的 变量 或足 以显示 测验 所欲 测量 的特 性的变量 , 作为检 定效 度的 参照 尺度 。 效标 关联 效度 又称 经验 效度或 统计 效度 , 是 以测 验分数 和效 标之 间的相 关系 数来 表示 测验 的效度 高低 的。 效标 关联 效度又 可分 为同 时效 度和
19、 预测效 度。 同时 效度指 测验 与当 前效 标之 间的关 系程 度; 预测 效度 指测验 与将 来的 效标 之间 的关联 程度 。 如 用全国 高考 的成 绩作 为效 标来检 验高 中毕 业会 考的 成绩 , 计 算两 者的 相关 系数 就是会 考的 同 时效度 ; 而 用大 学一 年级 的成绩 作为 效标 来检 验高 考的成 绩, 两者 的相 关系 数就是 高考 的预 测效度 。 效 标是 用来 衡量 测验效 度的 尺度 。 具 体而 言, 效 标是 辨别 真伪 的尺 度, 当 事物 满足 该原则 要求 时, 才 能存 在 。 效标 是不能 违反 的。 当 然, 标准 可以 提高, 也可
20、 以降低。 效标 不 仅随着 测验 的种 类不 同而 不同, 也可 能随 时间 而改 变。 (三) 提高 效度 的办 法 1 、控 制系 统误 差。 2 、精 心编 制量 表。 3 、妥 善组 织测 验 4 、扩 充样 本的 容量 和代 表 性。 5 、合 理处 理效 度和 信度 的 关系。 6 、适 当增 加测 验的 长度 第 三节 难度 一、难 度的 概念 难度指 测验 试题 的难 易程 度。 在教育 测量 中 , 客 观题 的难 度一般 用正 确回 答试 题的 人数与 参加 测验 的 总 人数 的比值 来 表示。 二、难 度的 计算 1 、用 极端 分组 法计 算客 观 题的难 度 具体
21、步 骤如 下: (1) 先按 测验总 分的 高低 , 按 由高 到低依 次排 列试 卷; (2) 从得分 最 高的一 分试 卷开 始向 下依 次选出 全部 试卷 的27% 作 为高分 组; (3 )从 得分 最 低的一 份试 卷 向上依 次选 出全 部试 卷 的27%作 为低 分组 ;(4 )按 下列公 式计 算难 度。P(PHPL )/2 其中 PH 为 高分 组难 度,PL 为低 分组 难度 。高 低分 组的难 度按 基本 公式 计算 。 2 、用 极端 分组 法计 算主 观 题的难 度 论文式 试题 一般 不能 简单 地判定 对与 错或 通过 与不 通过, 难度 计算 比较 复杂。 具体
22、步 骤 如下: (1) 按测 验得 分排 列试 卷 , 确 定高 分组 与低 分组 , 各占总 人 数 25% ( 具体 办法 同前 ) ; (2) 分别 为高 分组 与低 分 组编制 每道 试题 的分 析表 ;(3 )按 下列 公式 计算 难 度。P (XH XL2nL )/2n(H-L) 其中XH 代 表高 分组 得分 总和 ,XL 代表 低分 组得 分总 和,n 代表总 人数 的25% ,H 为这 道题 的最 高 得分,L 为 这道 题的 最低 得分。 第 四节 区分 度 区分度 的定 义 区分度 指测 验对 考生 实际 水平的 区分 程度 , 用符 号 D 来表示 。 具有 良好 的区
23、 分度 的测验 , 实际水 平高 的应 该得 高分 ,实际 水平 低的 应该 得低 分,所 以区 分度 又叫 鉴别 力。 第三章 教育测 验的编制与实施 我国教 育工 作者 在吸 收布 卢姆目 标分 类法 合理 部分 的基础 上创 用的 认知 领域 目标有 五 分法 (知 识 、 理 解 、 应 用 、 分析综 合 、 创 造 ) 和 四分 法 (识 记 、 理 解 、 简 单应 用 、 综合运 用 ) 。 1 、识 记。 通过 牢记 、再 现 、再认 ,能 准确 地表 述所 学过的 基本 概念 、基 本原 理和基 本 知识, 能说 出它 们的 含义 或具体 内容 。 2 、理 解。 能用 自
24、己 的语 言 简述所 学过 的基 本概 念、 基本原 理, 掌握 有关 概念 、原理 的 区别和 联系 ,并 能辨 别或 判断最 基本 的问 题的 真伪 。 3 、简 单应 用。 4 、综 合运 用。 教育测 量中 的量 表一 般没 有绝对 零点 和相 等单 位, 所测的 原始 分数 没有 明确 的 意义 , 为 了正确 理解 与解 释由 测验 而来的 原始 分数 , 还须 把它 与可资 参考 的数 据或 行为 标准进 行比 较 , 才会显 示分 数的 含义 。 一、常 模的 含义 在教育 测量 学中 , 测 验的 常模 , 简 称常 模, 是指 一 个有代 表性 的样 组在 某种 测验上 的
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
5000 积分 0人已下载
下载 | 加入VIP,交流精品资源 |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教育 测量 评价 考研 知识点 PDF
