教育測(cè)量.PPT.ppt_第1頁
教育測(cè)量.PPT.ppt_第2頁
教育測(cè)量.PPT.ppt_第3頁
教育測(cè)量.PPT.ppt_第4頁
教育測(cè)量.PPT.ppt_第5頁
已閱讀5頁,還剩118頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

教育測(cè)量 楊福義講師博士華東師范大學(xué)Email yangfuyi 電話 021 62232680138160579672007年8月 教育測(cè)量 課程內(nèi)容 第一章教育測(cè)量的基本原理第二章測(cè)驗(yàn)的性質(zhì) 種類和功能第三章信度的理論定義 操作定義及其估計(jì)方法第四章效度的理論定義 操作定義及其估計(jì)方法第五章測(cè)題分析第六章測(cè)驗(yàn)量表和常模第七章測(cè)驗(yàn)編制的步驟和方法第八章測(cè)驗(yàn)例舉 教育測(cè)量 課程考核 總評(píng)成績(jī)由平時(shí)成績(jī) 考試成績(jī)組成平時(shí)成績(jī)占20 包括考勤和作業(yè) 考試成績(jī)占80 閉卷考試 時(shí)間為2小時(shí) 可以使用計(jì)算器 第一章教育測(cè)量的基本原理 一 測(cè)量的概念 1 測(cè)量的定義測(cè)量 根據(jù)法則給事物分派數(shù)字 史蒂文斯 1951 例1 測(cè)量學(xué)生體重測(cè)量的屬性 體重 規(guī)則 身穿極少量衣服 赤腳自然地站在體重計(jì)上 用來描述學(xué)生體重的數(shù) 體重計(jì)上指示的 數(shù)字 例2 評(píng)定學(xué)生道德品德 2 測(cè)量的三要素事物的屬性 測(cè)量的對(duì)象物理屬性 長度 重量 體積 溫度 時(shí)間等心理屬性 智力 個(gè)性 能力 知識(shí) 技能 態(tài)度 興趣等數(shù)字 描述事物屬性的符號(hào)同一性和區(qū)分性 每一個(gè)數(shù)的獨(dú)特性等級(jí)性或位次性 若干個(gè)數(shù)之間按其大小所形成的次序關(guān)系等距性等比性 規(guī)則 給事物的屬性分派數(shù)字的依據(jù)規(guī)則是指導(dǎo)我們?nèi)绾螠y(cè)量的一種準(zhǔn)則或方法 當(dāng)測(cè)量的其他條件相同時(shí) 使用不同的規(guī)則 會(huì)產(chǎn)生不同的測(cè)量效果 規(guī)則的好壞 取決于制定規(guī)則的程序和所欲測(cè)量的事物屬性本身是否易于建立規(guī)則和便于操作規(guī)則 二 教育測(cè)量 1 教育測(cè)量的定義廣義教育測(cè)量 就是對(duì)于教育領(lǐng)域內(nèi)的事物或現(xiàn)象 根據(jù)一定的客觀標(biāo)準(zhǔn) 作縝密的考核 并依據(jù)一定的規(guī)則將考核的結(jié)果予以數(shù)量的描述 狹義教育測(cè)量 是指對(duì)學(xué)生某些學(xué)科經(jīng)過學(xué)習(xí)和訓(xùn)練之后 所獲得的知識(shí) 技能的測(cè)量 2 教育測(cè)量的兩要素參照點(diǎn) 人為指定的相對(duì)零點(diǎn)單位 無統(tǒng)一單位 也不符合等距要求 三 教育測(cè)量的可能性 凡物之存在必有其數(shù)量 桑代克 1918 凡有數(shù)量的現(xiàn)象都可以測(cè)量 麥柯爾 1923 四 教育測(cè)量的特點(diǎn) 間接性相對(duì)性 五 四種測(cè)量量表 廣義量表 scale 任何可以使事物數(shù)量化的值和量的漸進(jìn)系列 測(cè)量的本質(zhì)是根據(jù)某一法則將事物數(shù)量化 即在一個(gè)定有參照點(diǎn)和單位的連續(xù)體上把事物的屬性表現(xiàn)出來 這個(gè)連續(xù)體即為量表 只要將預(yù)測(cè)的事物屬性放在這個(gè)連續(xù)體的適當(dāng)位置上 看它們距離參照點(diǎn)的遠(yuǎn)近 便會(huì)得到一個(gè)測(cè)量值 1 名稱量表 名稱是測(cè)量中最簡(jiǎn)單的形式 即分類 在名稱量表中 用來描述事物的數(shù)字僅僅是代表事物的符號(hào) 只能區(qū)分事物的類別 適用的統(tǒng)計(jì)方法 比率 百分比 相關(guān)系數(shù) 2檢驗(yàn) 2 等級(jí) 位次 量表 按某一標(biāo)準(zhǔn)對(duì)事物的屬性進(jìn)行分類 用來描述各個(gè)類別的數(shù)字不僅具有區(qū)分性 而且還具有等級(jí)性 用這樣的數(shù)字表示的量表稱為等級(jí)量表或位次量表 量表上的數(shù)字不能進(jìn)行加減乘除運(yùn)算 適用的統(tǒng)計(jì)方法 中位數(shù) 百分位數(shù) 等級(jí)相關(guān)系數(shù) 肯德爾和諧系數(shù) 符號(hào)檢驗(yàn) 秩次檢驗(yàn) 秩次方差分析 3 等距量表 有相等單位和人定參照點(diǎn)的量表稱為等距量表 量表上的數(shù)值不僅具有區(qū)分性 等級(jí)性 還有等距性 可以作加減運(yùn)算 但不能作乘除運(yùn)算 適用的統(tǒng)計(jì)方法 算數(shù)平均數(shù) 標(biāo)準(zhǔn)差 積差相關(guān)系數(shù) Z檢驗(yàn) t檢驗(yàn) F檢驗(yàn) 4 比率 等比 量表 有相等單位和絕對(duì)零點(diǎn)的量表稱為比率量表 量表上的數(shù)值可以進(jìn)行加減乘除運(yùn)算 適用的統(tǒng)計(jì)方法 算數(shù)平均數(shù) 標(biāo)準(zhǔn)差 積差相關(guān)系數(shù) Z檢驗(yàn) t檢驗(yàn) F檢驗(yàn) 幾何平均數(shù) 差異系數(shù) 六 教育測(cè)量的量表屬性 教育測(cè)量中上述四種量表都有 心理 知識(shí) 技能 測(cè)驗(yàn)多屬于等級(jí)量表 通常仍將測(cè)驗(yàn)分?jǐn)?shù)作為等距量表來處理 第二章測(cè)驗(yàn)的性質(zhì) 種類和功能 一 測(cè)驗(yàn)的概念 1 測(cè)驗(yàn)的定義心理測(cè)驗(yàn) 是一種對(duì)行為樣本的客觀和標(biāo)準(zhǔn)化的測(cè)量 阿納斯塔西 1967 廣義心理測(cè)驗(yàn)包括智力 人格 能力傾向 學(xué)業(yè)成就等測(cè)驗(yàn) 教育測(cè)驗(yàn)主要是學(xué)業(yè)成就測(cè)驗(yàn) 所以該定義也適用于教育測(cè)驗(yàn) 2 測(cè)驗(yàn)的三要素行為樣本測(cè)驗(yàn)的標(biāo)準(zhǔn)化測(cè)驗(yàn)的客觀性 二 行為樣本 行為樣本 對(duì)于所欲測(cè)量的心理屬性具有代表性的一組行為反應(yīng) 三 測(cè)驗(yàn)的標(biāo)準(zhǔn)化 測(cè)驗(yàn)的標(biāo)準(zhǔn)化 測(cè)驗(yàn)的編制 實(shí)施 記分 分?jǐn)?shù)的解釋都按照統(tǒng)一的標(biāo)準(zhǔn)和嚴(yán)格的規(guī)定進(jìn)行 使所有被試的測(cè)驗(yàn)條件一致 包括四方面 測(cè)驗(yàn)材料的標(biāo)準(zhǔn)化測(cè)驗(yàn)實(shí)施的標(biāo)準(zhǔn)化評(píng)分 記分的標(biāo)準(zhǔn)化測(cè)驗(yàn)分?jǐn)?shù)解釋的標(biāo)準(zhǔn)化 四 測(cè)驗(yàn)評(píng)價(jià)的客觀性 信度效度難度區(qū)分度 五 測(cè)驗(yàn)誤差的來源 1 測(cè)驗(yàn)本身測(cè)題本身的代表性測(cè)題的數(shù)量測(cè)題的種類2 測(cè)驗(yàn)實(shí)施測(cè)驗(yàn)情境主試的影響意外干擾 3 被試狀態(tài)生理狀況情緒狀況練習(xí)因素 六 標(biāo)準(zhǔn)化測(cè)驗(yàn)準(zhǔn)備和實(shí)施中應(yīng)注意的問題 一 測(cè)驗(yàn)的準(zhǔn)備1 主試準(zhǔn)備2 測(cè)驗(yàn)環(huán)境準(zhǔn)備房間座位材料人物3 被試準(zhǔn)備時(shí)間選擇主試與被試建立和睦關(guān)系 二 測(cè)驗(yàn)的實(shí)施測(cè)驗(yàn)前期工作測(cè)題的選定記錄正確對(duì)待被試的要求主試注意事項(xiàng) 三 測(cè)驗(yàn)結(jié)果解釋被試測(cè)驗(yàn)前后的行為是否一致被試在強(qiáng)項(xiàng)和弱項(xiàng)測(cè)驗(yàn)內(nèi)容方面的表現(xiàn)被試的測(cè)驗(yàn)行為是不是一般行為 即測(cè)驗(yàn)表現(xiàn)是否代表在校或在家的行為評(píng)定測(cè)驗(yàn)成績(jī)一般不要采用絕對(duì)化的語言 應(yīng)該綜合其他評(píng)定量表或評(píng)判標(biāo)準(zhǔn)作綜合界定 七 測(cè)驗(yàn)的種類 1 根據(jù)測(cè)量的屬性智力測(cè)驗(yàn)?zāi)芰A向測(cè)驗(yàn)人格測(cè)驗(yàn)教育測(cè)驗(yàn)2 根據(jù)測(cè)驗(yàn)的標(biāo)準(zhǔn)化程度標(biāo)準(zhǔn)化測(cè)驗(yàn)教師自編測(cè)驗(yàn) 3 根據(jù)測(cè)驗(yàn)的功能普通測(cè)驗(yàn)和診斷測(cè)驗(yàn)難度測(cè)驗(yàn)和速度測(cè)驗(yàn)預(yù)測(cè)測(cè)驗(yàn)和成績(jī)測(cè)驗(yàn)4 根據(jù)記分標(biāo)準(zhǔn)常模參照測(cè)驗(yàn)標(biāo)準(zhǔn)參照測(cè)驗(yàn) 5 根據(jù)同時(shí)受測(cè)的人數(shù)個(gè)別測(cè)驗(yàn)團(tuán)體測(cè)驗(yàn)6 根據(jù)測(cè)驗(yàn)所用的材料和形式語言或文字測(cè)驗(yàn)非語言文字測(cè)驗(yàn) 八 測(cè)驗(yàn)的功能 了解個(gè)別差異檢查和鞏固學(xué)習(xí)辨別智愚和分類安置選拔人才對(duì)比實(shí)驗(yàn)考查學(xué)習(xí)努力程度預(yù)測(cè)能力指導(dǎo)就業(yè)課程評(píng)價(jià) 第三章信度的理論定義 操作定義及其估計(jì)方法 第一節(jié)信度的理論定義和操作定義 一 信度的理論定義 1 信度與誤差的關(guān)系 1 一般統(tǒng)計(jì)資料的三種誤差抽樣誤差測(cè)量誤差系統(tǒng)誤差 2 信度與誤差的關(guān)系抽樣誤差可以忽略不計(jì)系統(tǒng)誤差影響不大測(cè)量誤差是影響信度的主要原因 2 信度的理論定義測(cè)驗(yàn)分?jǐn)?shù)都包括兩個(gè)部分 真分?jǐn)?shù) 測(cè)量誤差信度是一組測(cè)驗(yàn)分?jǐn)?shù)中真分?jǐn)?shù)方差與獲得分?jǐn)?shù)方差的比率 真分?jǐn)?shù)理論的三個(gè)假設(shè) 誤差分?jǐn)?shù)的平均數(shù)等于零誤差分?jǐn)?shù)與真分?jǐn)?shù)之間無相關(guān)兩次測(cè)量的誤差分?jǐn)?shù)之間相關(guān)為零 二 信度的操作定義 信度是同一個(gè)測(cè)驗(yàn) 或相等的兩個(gè) 多個(gè)測(cè)驗(yàn) 對(duì)同一組被試實(shí)施兩次或多次 所得結(jié)果的一致性程度 也即測(cè)驗(yàn)的可靠性 測(cè)驗(yàn)的信度以兩次測(cè)驗(yàn)結(jié)果的相關(guān)系數(shù)表示 第二節(jié)再測(cè)信度 一 再測(cè)信度及其估計(jì)方法 1 再測(cè)信度的定義再測(cè)信度 以同一個(gè)測(cè)驗(yàn)對(duì)同一組被試先后實(shí)施兩次 所得結(jié)果的相關(guān)系數(shù) 若對(duì)同一組被試先后實(shí)施多次 可用每?jī)纱螠y(cè)驗(yàn)結(jié)果的相關(guān)系數(shù)之平均數(shù)來表示 再測(cè)信度又稱為穩(wěn)定系數(shù) 2 再測(cè)信度的估計(jì)方法用原始數(shù)據(jù)計(jì)算用樣本平均數(shù)和樣本標(biāo)準(zhǔn)差計(jì)算用樣本平均數(shù)和總體標(biāo)準(zhǔn)差的估計(jì)值計(jì)算 某算術(shù)運(yùn)算速度兩次測(cè)驗(yàn)分?jǐn)?shù) 二 再測(cè)信度的優(yōu)缺點(diǎn) 優(yōu)點(diǎn)缺點(diǎn) 三 再測(cè)信度的適用范圍 異質(zhì)性測(cè)驗(yàn)速度測(cè)驗(yàn)運(yùn)動(dòng)技能測(cè)驗(yàn) 第三節(jié)復(fù)本信度 一 復(fù)本信度及其估計(jì)方法 1 復(fù)本信度的定義復(fù)本信度 等值性的兩個(gè)測(cè)驗(yàn)對(duì)同一組被試實(shí)施結(jié)果的一致性程度 復(fù)本測(cè)驗(yàn)是指在性質(zhì) 內(nèi)容 題型 題數(shù) 難度等方面都一致或相等的兩個(gè)或多個(gè)測(cè)驗(yàn) 若復(fù)本的個(gè)數(shù)在兩個(gè)以上 可用每?jī)蓚€(gè)復(fù)本測(cè)驗(yàn)結(jié)果的相關(guān)系數(shù)之平均數(shù)來表示 復(fù)本信度系數(shù)分等值系數(shù)和穩(wěn)定等值系數(shù)兩種 2 復(fù)本信度的估計(jì)方法用原始數(shù)據(jù)計(jì)算用樣本平均數(shù)和樣本標(biāo)準(zhǔn)差計(jì)算用樣本平均數(shù)和總體標(biāo)準(zhǔn)差的估計(jì)值計(jì)算 二 復(fù)本信度的優(yōu)缺點(diǎn) 優(yōu)點(diǎn)缺點(diǎn) 三 復(fù)本信度的適用范圍 是考察測(cè)驗(yàn)可靠性的最好方法 第四節(jié)內(nèi)在一致性信度 一 內(nèi)在一致性信度及其估計(jì)方法 再測(cè)信度 測(cè)驗(yàn)在不同時(shí)間的一致性復(fù)本信度 測(cè)驗(yàn)的兩種不同形式的一致性內(nèi)在一致性信度 測(cè)驗(yàn)內(nèi)部 測(cè)題之間的一致性 一 分半信度 斯皮爾曼 布朗公式矯正法盧農(nóng)公式矯正法弗拉南根公式矯正法 二 同質(zhì)性信度 0 1記分測(cè)驗(yàn)的同質(zhì)性信度非0 1記分測(cè)驗(yàn)的同質(zhì)性信度 二 內(nèi)在一致性信度的優(yōu)缺點(diǎn) 優(yōu)點(diǎn)缺點(diǎn) 三 內(nèi)在一致性信度的適用范圍 同質(zhì)性測(cè)驗(yàn)難度測(cè)驗(yàn) 第五節(jié)評(píng)分者信度 一 評(píng)分者信度的定義 評(píng)分者信度是指多位評(píng)分者對(duì)同一組被試作答反應(yīng)評(píng)分的一致性程度 二 評(píng)分者信度的估計(jì)方法 積差相關(guān)或等級(jí)相關(guān)估計(jì)法 系數(shù)估計(jì)法肯德爾和諧系數(shù)估計(jì)法 信度估計(jì)方法的總結(jié) 第四章效度的操作定義及其估計(jì)方法 效度 一個(gè)測(cè)驗(yàn)對(duì)其所欲測(cè)量的屬性能夠確實(shí)測(cè)到的程度 即測(cè)驗(yàn)的正確性 根據(jù)美國心理學(xué)會(huì)的標(biāo)準(zhǔn) 測(cè)驗(yàn)的效度分為三大類 效標(biāo)關(guān)聯(lián)效度內(nèi)容效度結(jié)構(gòu)效度 效度的相對(duì)性 一個(gè)測(cè)驗(yàn)的有效性 總是就其特殊的目的 功能和適用范圍而言的 并不是就任何目的 功能和任何適用范圍而言的 按照特定的目的精心編制的測(cè)驗(yàn) 其效度不是全有全無的區(qū)別 只是程度上的不同 第一節(jié)效標(biāo)關(guān)聯(lián)效度 一 效標(biāo)關(guān)聯(lián)效度的概念 效標(biāo)關(guān)聯(lián)效度是指以某一種測(cè)驗(yàn)分?jǐn)?shù)與其效標(biāo)分?jǐn)?shù)之間的相關(guān)來表示的效度 又稱為統(tǒng)計(jì)效度 效標(biāo) 指確能顯示或反映所欲測(cè)量的屬性的變量 是考察檢定測(cè)驗(yàn)效度的參照標(biāo)準(zhǔn) 智力測(cè)驗(yàn)效標(biāo) 學(xué)科成績(jī) 教師評(píng)定等級(jí) 受教育年限 年齡等 能力傾向測(cè)驗(yàn)效標(biāo) 特殊能力或特殊訓(xùn)練的成績(jī)教育測(cè)驗(yàn)效標(biāo) 相應(yīng)的學(xué)科成績(jī)或教師的等級(jí)評(píng)定職業(yè)興趣測(cè)驗(yàn) 實(shí)際工作成績(jī)或記錄 同時(shí)效度和預(yù)測(cè)效度 根據(jù)獲得測(cè)驗(yàn)分?jǐn)?shù)和效標(biāo)分?jǐn)?shù)的時(shí)間關(guān)系 可以將效標(biāo)關(guān)聯(lián)效度分為同時(shí)效度和預(yù)測(cè)效度 同時(shí)效度 以測(cè)驗(yàn)分?jǐn)?shù)與現(xiàn)有效標(biāo)分?jǐn)?shù)之間的相關(guān)表示的效度 預(yù)測(cè)效度 以被試的測(cè)驗(yàn)分?jǐn)?shù)與其未來效標(biāo)分?jǐn)?shù)之間相關(guān)表示的效度 二 效標(biāo)關(guān)聯(lián)效度系數(shù)的計(jì)算 測(cè)驗(yàn)分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)之間的相關(guān)系數(shù)稱為效標(biāo)關(guān)聯(lián)效度系數(shù) 1 積差相關(guān)法當(dāng)測(cè)驗(yàn)分?jǐn)?shù)和效標(biāo)分?jǐn)?shù)均為正態(tài)連續(xù)變量時(shí)采用2 二列相關(guān)法當(dāng)測(cè)驗(yàn)分?jǐn)?shù)和效標(biāo)分?jǐn)?shù)均為正態(tài)連續(xù)變量 而其中一個(gè)變量被人為地分成二分變量時(shí) 3 點(diǎn)二列相關(guān)法當(dāng)測(cè)驗(yàn)分?jǐn)?shù)和效標(biāo)分?jǐn)?shù)其中一個(gè)變量為連續(xù)變量 而另一個(gè)為真正的二分變量或雙峰分布變量時(shí) 4 等級(jí)相關(guān)法當(dāng)測(cè)驗(yàn)成績(jī)和效標(biāo)成績(jī)兩個(gè)都 或其中一個(gè) 以等級(jí)次序排列或以等級(jí)次序表示時(shí) 5 四分相關(guān)及 相關(guān)法當(dāng)測(cè)驗(yàn)成績(jī)和效標(biāo)成績(jī)都是二分變量或以二分變量表示時(shí) 6 列聯(lián)相關(guān)當(dāng)測(cè)驗(yàn)和效標(biāo)成績(jī)中有一個(gè)不止分為兩個(gè)類別時(shí) 第二節(jié)內(nèi)容效度和結(jié)構(gòu)效度 一 內(nèi)容效度 1 概念及意義內(nèi)容效度 指測(cè)驗(yàn)內(nèi)容對(duì)所要測(cè)量的內(nèi)容的代表性程度 2 建立過程3 檢定方法 1 邏輯判斷法一般由本學(xué)科的專家根據(jù)所欲測(cè)量屬性的定義和測(cè)量?jī)?nèi)容范圍的界定 以及各部分內(nèi)容 各認(rèn)識(shí)層次的比重 用邏輯分析的方法對(duì)策得體性能是否能代撥所欲測(cè)量的內(nèi)容及教育目標(biāo)作出判斷 2 比較平均數(shù)差異的顯著性對(duì)同一組被試用一個(gè)測(cè)驗(yàn)的兩個(gè)復(fù)本在某一學(xué)科教學(xué)或訓(xùn)練前后實(shí)施測(cè)驗(yàn) 根據(jù)兩次測(cè)驗(yàn)成績(jī)差異的顯著性來判斷該測(cè)驗(yàn)內(nèi)容的有效性 3 相關(guān)法用反映同一內(nèi)容的兩個(gè)不同測(cè)驗(yàn)對(duì)同一組被試施測(cè)結(jié)果的相關(guān)系數(shù)表示 4 提高內(nèi)容效度的方法增加測(cè)題的同質(zhì)性專家小組平行作業(yè)法多人裁判法5 表面效度表面效度 指測(cè)驗(yàn)在表面上使被試直覺感到的有效性程度 為了使測(cè)驗(yàn)具有表面效度 必須根據(jù)測(cè)驗(yàn)的性質(zhì) 被試的年齡和知識(shí)背景來選擇測(cè)驗(yàn)材料和習(xí)慣用語 表面效度不是測(cè)驗(yàn)的真正效度 二 結(jié)構(gòu)效度 1 概念指測(cè)驗(yàn)對(duì)于人的假設(shè)屬性或理論概念測(cè)量到的程度 2 建立過程對(duì)所欲測(cè)量的屬性根據(jù)某種理論提出假定的結(jié)構(gòu)根據(jù)假定的結(jié)構(gòu)擬定測(cè)題和編制測(cè)驗(yàn)尋求測(cè)驗(yàn)分?jǐn)?shù)與其它評(píng)定之間的關(guān)系根據(jù)測(cè)驗(yàn)結(jié)構(gòu)來驗(yàn)證假設(shè)結(jié)構(gòu)中的各種因素是否成立修改測(cè)驗(yàn) 重新實(shí)施有關(guān)步驟 3 檢定方法用內(nèi)容效度為結(jié)構(gòu)效度提供證據(jù)用相容效度來確定結(jié)構(gòu)效度相容效度 一個(gè)新編的尚待確定其結(jié)構(gòu)的測(cè)驗(yàn)與另一個(gè)已知其結(jié)構(gòu)的測(cè)驗(yàn)共同測(cè)量相同結(jié)構(gòu)的程度 多元特質(zhì)與多重方法矩陣輻合效度 用多種方法對(duì)同一種特質(zhì)進(jìn)行測(cè)量 所得結(jié)果具有高相關(guān) 辨別效度 用同一種方法對(duì)多種不同特質(zhì)進(jìn)行測(cè)量 所得結(jié)果的相關(guān)低于用多種方法測(cè)量同一種特質(zhì)的相關(guān) 三 效度系數(shù)的顯著性檢驗(yàn) 積差相關(guān)系數(shù)表示的效度系數(shù)之檢驗(yàn) 檢驗(yàn)和 檢驗(yàn) 第五章測(cè)題分析 第一節(jié)測(cè)題的難度 一 測(cè)題難度的概念 測(cè)題難度指測(cè)題的難易程度表示測(cè)題難易程度的數(shù)量稱為測(cè)題的難度指數(shù) 用P表示 二 測(cè)題難度的估計(jì) 一 0 1記分測(cè)題難度的估計(jì)1 P R n 所有被試該題答對(duì)的人數(shù)比率 2 P PH PL 2 高分組和低分組答對(duì)人數(shù)比率的平均數(shù) 二 0 1記分多重選擇題難度的校正CP kP 1 k 1 如果要比較兩個(gè)選項(xiàng)數(shù)目不同的測(cè)題難度 必須先用此公式對(duì)兩測(cè)題的難度進(jìn)行校正 三 非0 1記分測(cè)題難度的估計(jì)P 所有被試該題得分的平均數(shù) 該題滿分分?jǐn)?shù) 三 難度的評(píng)價(jià) 1 0 1記分測(cè)題的平均數(shù)和標(biāo)準(zhǔn)差每個(gè)測(cè)題得分的平均數(shù)就是其難度指數(shù)P每個(gè)測(cè)題得分的標(biāo)準(zhǔn)差為pq2 測(cè)題難度的理論評(píng)價(jià)測(cè)題方差的大小表示測(cè)題對(duì)被試反應(yīng)的鑒別能力中等難度 即難度指數(shù)P 0 5 的測(cè)題鑒別力最好 3 測(cè)題難度的選擇測(cè)驗(yàn)中各測(cè)題難度的選擇與測(cè)驗(yàn)的性質(zhì)和目的有關(guān) 對(duì)于測(cè)量某門學(xué)科知識(shí)或技能掌握程度的測(cè)驗(yàn)來說 測(cè)驗(yàn)中大部分測(cè)題難度指數(shù)P分布在0 35 0 65為宜 所有測(cè)題難度指數(shù)的平均數(shù)在0 5左右為宜 如果測(cè)驗(yàn)的目的在于選拔人才 測(cè)題難度指數(shù)的平均數(shù)應(yīng)根據(jù)錄取率而定 如果測(cè)驗(yàn)的目的在于測(cè)量速度 則要求所有的測(cè)題難度指數(shù)接近相等 測(cè)題難度還應(yīng)該考慮接受測(cè)驗(yàn)的對(duì)象 第二節(jié)測(cè)題的區(qū)分度和效度 一 測(cè)題的區(qū)分度 一 區(qū)分度的概念測(cè)題的區(qū)分度指測(cè)題對(duì)于被試反應(yīng)的區(qū)分程度和鑒別能力 區(qū)分度一般用某測(cè)題的得分與測(cè)驗(yàn)總分之間的相關(guān)系數(shù)來表示 二 測(cè)題區(qū)分度的估計(jì)1 0 1記分測(cè)題區(qū)分度的估計(jì)分組法 鑒別指數(shù)D PH PL點(diǎn)二列相關(guān)法二列相關(guān)法 2 非0 1記分測(cè)題區(qū)分度的估計(jì)積差相關(guān)法 二 測(cè)題的效度 一 測(cè)題效度的概念測(cè)題效度是指測(cè)題分?jǐn)?shù)與外部效標(biāo)分?jǐn)?shù)的相關(guān)程度 測(cè)題的效度對(duì)測(cè)驗(yàn)的效度有很大的貢獻(xiàn) 如果把測(cè)驗(yàn)總分視為內(nèi)部效標(biāo) 測(cè)題的區(qū)分度就是測(cè)題的內(nèi)部效標(biāo)效度 從測(cè)題效度對(duì)被試反應(yīng)的鑒別能力來說 它也是一種區(qū)分度 二 測(cè)題效度的估計(jì)方法凡是可以用來估計(jì)測(cè)題區(qū)分度的方法都可以用來估計(jì)測(cè)題的效度 只是將內(nèi)部效標(biāo)換成了外部效標(biāo)而已 可以采用二列相關(guān) 點(diǎn)二列相關(guān) 積差相關(guān)等 三 測(cè)題區(qū)分度和效度的評(píng)價(jià) 測(cè)題區(qū)分度和效度的取值范圍都是 1 1之間 如果區(qū)分度或效度為正值 其數(shù)值越大 則測(cè)題越好 測(cè)題鑒別指數(shù)評(píng)鑒 如果測(cè)驗(yàn)的目的在于評(píng)定學(xué)生的學(xué)習(xí)成績(jī) 而且測(cè)驗(yàn)是同質(zhì)性的 則應(yīng)選擇區(qū)分度作為評(píng)價(jià)指標(biāo) 如果測(cè)驗(yàn)的目的在于預(yù)測(cè)被試未來的表現(xiàn) 則應(yīng)選擇測(cè)題的效度作為評(píng)價(jià)指標(biāo) 第六章測(cè)驗(yàn)量表和常模 第一節(jié)測(cè)驗(yàn)分?jǐn)?shù)的解釋 一 測(cè)驗(yàn)分?jǐn)?shù)與所測(cè)屬性的關(guān)系 對(duì)于人類心理屬性的測(cè)量很少有絕對(duì)的測(cè)度測(cè)驗(yàn)分?jǐn)?shù)相同的增量很難代表相同的心理增量 二 原始分?jǐn)?shù)和導(dǎo)出分?jǐn)?shù) 原始分?jǐn)?shù) 根據(jù)測(cè)驗(yàn)的記分標(biāo)準(zhǔn) 對(duì)被試的測(cè)驗(yàn)結(jié)果所計(jì)算出的測(cè)驗(yàn)分?jǐn)?shù) 對(duì)于同一個(gè)學(xué)生不同學(xué)科的原始分?jǐn)?shù) 由于缺乏參照點(diǎn)和一定的單位 所以既不能相互比較 也不能相加求和 導(dǎo)出分?jǐn)?shù) 經(jīng)過統(tǒng)計(jì)整理的 具有一定參照點(diǎn)和單位的 可以相互比較的分?jǐn)?shù) 常用的導(dǎo)出分?jǐn)?shù)有百分等級(jí) 標(biāo)準(zhǔn)分?jǐn)?shù) 年級(jí)等值分?jǐn)?shù) 年齡等值分?jǐn)?shù) 對(duì)一個(gè)標(biāo)準(zhǔn)化樣本施行某一個(gè)測(cè)驗(yàn)之后 將所獲得的原始分?jǐn)?shù)以常模 平均數(shù) 為參照點(diǎn)轉(zhuǎn)換成某種導(dǎo)出分?jǐn)?shù) 并以等值表的形式將原始分?jǐn)?shù)與導(dǎo)出分?jǐn)?shù)之間的對(duì)應(yīng)值表示出來 這就是測(cè)驗(yàn)量表 常用的測(cè)驗(yàn)量表有百分等級(jí)量表 標(biāo)準(zhǔn)分量表 年級(jí)量表和年齡量表 三 常模與標(biāo)準(zhǔn) 常模 某年級(jí) 某年齡或具有某種共同特征的被試團(tuán)體在某一測(cè)驗(yàn)上實(shí)際達(dá)到的平均水平 常模是一個(gè)相對(duì)的數(shù)量 不適一種絕對(duì)的 永久性的 固定不變的標(biāo)準(zhǔn) 它會(huì)隨著時(shí)間和空間的不同而變化 標(biāo)準(zhǔn)化樣本 對(duì)于使用某測(cè)驗(yàn)的總體具有代表性的那部分個(gè)體 標(biāo)準(zhǔn) 某年級(jí) 某年齡或具有某種共同特征的被試團(tuán)體在某一測(cè)驗(yàn)上應(yīng)當(dāng)達(dá)到的水準(zhǔn) 第二節(jié)百分等級(jí)量表 一 百分等級(jí)量表的含義 百分等級(jí)量表 以標(biāo)準(zhǔn)化樣本測(cè)驗(yàn)分?jǐn)?shù)的中位數(shù)為參照點(diǎn) 以百分等級(jí) 百分位 為單位的測(cè)驗(yàn)量表 與百分等級(jí)相對(duì)應(yīng)的原始分?jǐn)?shù)稱為該百分等級(jí)的百分位數(shù) 根據(jù)標(biāo)準(zhǔn)化樣本的測(cè)驗(yàn)分?jǐn)?shù)計(jì)算出各相應(yīng)的百分位數(shù) 即建立百分等級(jí)與原始分?jǐn)?shù)的等值對(duì)照表 即為百分等級(jí)量表 二 百分等級(jí)量表的評(píng)價(jià) 一 優(yōu)點(diǎn)百分等級(jí)量表上的等級(jí)的意義容易被人理解 同一被試在不同測(cè)驗(yàn)上的百分等級(jí)可以相互比較 不同被試在同一測(cè)驗(yàn)上的百分等級(jí)可以相互比較 在較高層次的學(xué)校中 當(dāng)年齡或年級(jí)量表不甚適用時(shí) 可采用百分量表 百分等級(jí)可轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù) 二 缺點(diǎn)百分等級(jí)的單位距離不相等 在百分等級(jí)量表上 靠近分布中央的原始分?jǐn)?shù)稍有變化 其百分等級(jí)就會(huì)有較大的變化 而靠近分布兩端的原始分?jǐn)?shù) 雖然變化較大 其百分等級(jí)卻變化較小 百分等級(jí)量表屬于四種測(cè)量量表種的等級(jí)或位次量表兩個(gè)不同樣本中的百分等級(jí)不能相互比較百分等級(jí)量表對(duì)測(cè)驗(yàn)成績(jī)的普遍水平不夠敏感 與T量表相比 其可靠性較差 第三節(jié)線性標(biāo)準(zhǔn)分?jǐn)?shù)量表 標(biāo)準(zhǔn)分?jǐn)?shù)量表是以平均分?jǐn)?shù)為參照點(diǎn) 以標(biāo)準(zhǔn)差為單位的測(cè)驗(yàn)量表 其量表值稱為標(biāo)準(zhǔn)分?jǐn)?shù) 線性標(biāo)準(zhǔn)分?jǐn)?shù)就是由原始分?jǐn)?shù)轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù)之后 只改變了分布的平均數(shù)和標(biāo)準(zhǔn)差 并不改變分布的形態(tài) 常見的線性標(biāo)準(zhǔn)分?jǐn)?shù)有線性Z分?jǐn)?shù) 線性CEEB分?jǐn)?shù) 線性ITED分?jǐn)?shù) 線性T分?jǐn)?shù) 一 線性Z分?jǐn)?shù)量表 一 線性Z分?jǐn)?shù)的含義線性Z分?jǐn)?shù)是以平均數(shù)為0 標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)分?jǐn)?shù) 線性Z分?jǐn)?shù)量表是線性Z分?jǐn)?shù)與原始分?jǐn)?shù)的等值對(duì)照表 二 線性Z分?jǐn)?shù)量表的編制方法根據(jù)標(biāo)準(zhǔn)化樣本中每個(gè)被試測(cè)驗(yàn)的原始分?jǐn)?shù) 計(jì)算其平均數(shù)及標(biāo)準(zhǔn)差 根據(jù)公式計(jì)算原始分?jǐn)?shù)全距中每一個(gè)原始分?jǐn)?shù)的線性Z分?jǐn)?shù) 三 線性Z分?jǐn)?shù)量表的評(píng)價(jià)1 優(yōu)點(diǎn)線性Z分?jǐn)?shù)的單位是等距的 如果幾個(gè)不同測(cè)驗(yàn)分?jǐn)?shù)的分布形態(tài)是很相近的 那么同一個(gè)被試在幾個(gè)不同測(cè)驗(yàn)上的線性Z分?jǐn)?shù)可以相互比較 如果幾個(gè)不同測(cè)驗(yàn)分?jǐn)?shù)的分布形態(tài)是很相近的 可以將一個(gè)被試幾個(gè)不同測(cè)驗(yàn)上的線性Z分?jǐn)?shù)相加求和 或計(jì)算幾個(gè)測(cè)驗(yàn)線性Z分?jǐn)?shù)的平均數(shù) 同時(shí)還可以比較不同被試幾個(gè)線性Z分?jǐn)?shù)的總分或平均數(shù) 2 缺點(diǎn)小于平均數(shù)的原始分?jǐn)?shù)轉(zhuǎn)換成線性Z分?jǐn)?shù)后都是負(fù)值 這既不容易理解 也不便于運(yùn)算 標(biāo)準(zhǔn)化樣本 線性Z分?jǐn)?shù)的全距一般不超過6個(gè)單位 由于單位太大 難以區(qū)分個(gè)別被試測(cè)驗(yàn)成績(jī)的差異 若要精確地區(qū)分個(gè)別被試的差異 線性Z分?jǐn)?shù)的值在小數(shù)點(diǎn)后必須保留一到兩位數(shù)字 這也不便于運(yùn)算 線性Z分?jǐn)?shù)的分布形態(tài)與原始分?jǐn)?shù)的分布形態(tài)完全一樣 當(dāng)兩個(gè)測(cè)驗(yàn)的分布形態(tài)不同時(shí) 它們的線性Z分?jǐn)?shù)既不可以相互比較 又不可以相加求和 二 線性CEEB量表 一 線性CEEB分?jǐn)?shù)的意義及其量表的編制CEEB分?jǐn)?shù)是平均數(shù)為500 標(biāo)準(zhǔn)差為100的線性標(biāo)準(zhǔn)分?jǐn)?shù) CEEB 100Z 500線性CEEB分?jǐn)?shù)量表是線性CEEB分?jǐn)?shù)與原始分?jǐn)?shù)的等值對(duì)照表 先將原始分?jǐn)?shù)全距中每一個(gè)原始分?jǐn)?shù)轉(zhuǎn)換成線性Z分?jǐn)?shù) 再利用上述公式將每個(gè)線性Z分?jǐn)?shù)轉(zhuǎn)換成線性CEEB分?jǐn)?shù) 二 線性CEEB分?jǐn)?shù)量表的評(píng)價(jià)1 優(yōu)點(diǎn)線性CEEB分?jǐn)?shù)全為正數(shù) 容易理解 也便于運(yùn)算 線性CEEB分?jǐn)?shù)的單位為1 100 大大小于線性Z分?jǐn)?shù)的單位1 這不僅使它全部變成了整數(shù)而不帶小數(shù) 而且使其能精確地區(qū)分個(gè)別被試的差異 因而特別適用于大規(guī)模選拔性測(cè)驗(yàn) 盡管線性CEEB分?jǐn)?shù)是一種線性轉(zhuǎn)換 并未改變?cè)挤謹(jǐn)?shù)的分布形態(tài) 但通常來說 它為一個(gè)被試幾種不同測(cè)驗(yàn)分?jǐn)?shù)的相互比較及相加求和提供了條件 也為不同被試之間多科總分的比較提供了條件 2 缺點(diǎn)兩個(gè)分布形態(tài)不同的線性CEEB分?jǐn)?shù)不可以相互比較 也不可以相加求和 對(duì)于單位不需要過細(xì)的測(cè)驗(yàn)來說 CEEB分?jǐn)?shù)的數(shù)字太大 計(jì)算起來不甚方便 三 線性標(biāo)準(zhǔn)分?jǐn)?shù)轉(zhuǎn)換的通式 CEEB 100Z 500 大規(guī)模選拔性測(cè)驗(yàn) T 10Z 50 智力測(cè)驗(yàn)和教育測(cè)驗(yàn) 九段分?jǐn)?shù) 2Z 5 輔導(dǎo)與咨詢 軍隊(duì)選拔 ITED 5Z 15 教育發(fā)展測(cè)驗(yàn) 第四節(jié)年級(jí)和年齡量表 一 年級(jí)量表 一 年級(jí)量表的含義及編制測(cè)驗(yàn)的原始分?jǐn)?shù)與年級(jí)的等值對(duì)照表稱為年級(jí)量表 將某種測(cè)驗(yàn)施于由各年級(jí)組成的標(biāo)準(zhǔn)化樣本 然后求出各年級(jí)測(cè)驗(yàn)分?jǐn)?shù)的平均數(shù) 或中位數(shù) 這些平均數(shù)與年級(jí)分?jǐn)?shù)的對(duì)應(yīng)表就是年級(jí)量表 一般將一個(gè)學(xué)年分成十個(gè)學(xué)月 然后再定出每一個(gè)學(xué)月相對(duì)應(yīng)的原始分?jǐn)?shù) 二 年級(jí)量表的評(píng)價(jià)年級(jí)量表常會(huì)被誤解年級(jí)量表不能比較不同測(cè)驗(yàn)的得分年級(jí)量表的可靠性較差年級(jí)量表僅適用于低年級(jí)而不適用于高年級(jí) 二 年齡量表 一 年齡量表的含義及編制測(cè)驗(yàn)的原始分?jǐn)?shù)與年齡的等值對(duì)照表稱為年齡量表 年齡量表可以分為心理年齡量表和教育年齡量表

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論