測量心理學匯總(匯編)_第1頁
測量心理學匯總(匯編)_第2頁
測量心理學匯總(匯編)_第3頁
測量心理學匯總(匯編)_第4頁
測量心理學匯總(匯編)_第5頁
已閱讀5頁,還剩22頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、第五章心理測量學知識重點在于理解和掌握心理測量的定義、測驗的常模、信度、效度以及項目分析等基本概念。第一節(jié)概述第一單元測量與測量量表一、什么是測量測量:就是依據(jù)一定的法則用數(shù)字對事物加以確定。事物:指的是要測量的事物的屬性或特征。該定義包括三個元素彳數(shù)字:代表某一事物或事物某一屬性的量。法則:代表的是測量所依據(jù)的規(guī)則和方法。二、 測量要素:參照點 單位(一)參照點:參照點:絕對參照點、相對參照點(二)單位:好的單位必須具備兩個條件:一是有確定的意義二是有相同的價值心理測量的單位不夠完善,如智力年齡以年齡為單位,45歲之間的差別大于1415歲之間三、測量量表測量的本質是根據(jù)某一法則在一個定有單位

2、和參照點的連續(xù)體上把事物的屬性表現(xiàn)出來。量表是一個定有單位和參照點的連續(xù)體。廠命名量表最低水平-斯蒂文斯,按從低級到高級劃分的四種水平:分兩種:代號(如學生編號);類別(如1代表男,2代表女)四種水平順序量表一一次低水平不能做數(shù)量化分析,既不能比大小,也不能加減乘除(短跑名次)心理測量是在順序量表上進行等距量表一一較高水平(溫度計),其數(shù)值可做加減,不能做乘除 。I等比量表一一最高水平第二單元:心理測量的基本概念、心理測驗的定義 所謂心理測驗,就是依據(jù)心理學理論,使用一定的操作程序,通過觀察人的少數(shù)有代表性的 行為,對于貫穿在人的全部行為活動中的心理特點作出推論和數(shù)量化分析的一種科學手段。廠測

3、量的對象是人的做測驗的行為從心理測驗的定義看出J選取的是行為樣本測量要標準化I測量的原始分數(shù)沒有意義,要與其他人的分數(shù)相比較、心理測驗的性質:間接性相對性客觀性第三單元心理測驗的分類按測驗功能分類:智力測驗 特殊能力測驗 人格測驗按測驗的材料分類:文字測驗操作測驗心理測驗分類* 按測驗材料的嚴謹程度分類:客觀測驗投射測驗按測驗的方式分類:個別測驗 團體測驗按測驗的要求分類:最高行為測驗典型行為測驗第四單元:糾正錯誤的測驗觀一、錯誤的測驗觀:測驗萬能論測驗無用論心理測驗即智力測驗二、正確的測驗觀:心理測驗是重要的心理學研究方法之一,是決策的輔助工具(例如,升學指導測驗)心理測驗作為研究方法和測量

4、工具尚不完善第五單元 心理測驗在心理咨詢中的應用較多地使用以下三類測驗:智力測驗 人格測驗 心理評定量表第六單元心理測驗的發(fā)展史、科學心理測驗的產(chǎn)生與發(fā)展高爾頓(F.Galton)三個重要人物 卡特爾(J.M.Cattell)比內(nèi)(A.Binet)19世紀80年代19世紀90年代20世紀頭十年(達爾文的表弟)20世紀心理測驗的主要發(fā)展操作測驗的發(fā)展團體智力測驗的發(fā)展能力傾向測驗的發(fā)展人格測驗的發(fā)展(誕生于美國)、現(xiàn)代心理測驗在我國的發(fā)展源于1914年前后。20世紀二、三十年代兩次修訂比內(nèi)-西蒙量表。1979年后,協(xié)作修訂國外智力和人格測驗工具。近年來致力于編制適合我國文化背景的測驗工具。第二節(jié)

5、測驗的常模第一單元:常模團體一、常模團體的性質常模團體是由具有某種共同特征的人所組成的一個群體,或者是該群體的一個樣本。它用一個標準的、規(guī)范的分數(shù)表示出來,以提供比較的基礎。確定常模團體時,先確定一般總體,再確定目標總體,最后確定樣本。廣群體的構成必須明確界定二、常模團體的條件 J 常模團體必須是所測群體的 代表性樣本樣本的大小要適當 I標準化樣組是一定時空的產(chǎn)物樣本的大小要適當:如果總體數(shù)目小,只有幾十個人,則需要 100%樣本;如果總體數(shù)目大,相應樣本也大。 一般不小于30或100個,全國性常模,一般應有 2000 3000人為宜。樣本大小適當?shù)年P鍵是樣本要有代表性三、 取樣的方法取樣即:

6、從目標人群中選擇有代表性的樣本。(多選)簡單隨機抽樣取樣方法:J 系統(tǒng)抽樣(又叫等距抽樣)首先計算組距:K二N/n分組抽樣 分層抽樣兩種方法:分層比例抽樣、分層非比例抽樣四、常模分數(shù)與常模(一)常模常模:是一種供比較的標準量數(shù),由標準化樣本測試結果計算而來, 它是心理測驗時用于比 較和解釋測驗結果的參照分數(shù)標準。按照樣本的大小和來源:全國常模、區(qū)域常模和特殊常模。根據(jù)具體應用標準和分數(shù)特征:百分位常模和標準分常模等。(二)常模分數(shù)(也叫導出分數(shù),又叫標準分數(shù),也叫量表分)常模分數(shù):就是施測常模樣本后,將受測者的原始分數(shù)按照一定規(guī)則轉換出來的導出分數(shù)。 導出分數(shù)具有一定的參照點和單位,它實際上是

7、一個有意義的測驗量表,它與原始分數(shù)等值,可以進行比較。從原始分數(shù)轉換為導出分數(shù)時,既要根據(jù)原始分數(shù)的分布特點,又要按照現(xiàn)代統(tǒng)計方法的基本原理,才能轉換出等單位、帶參照點的有意義的導出分數(shù)。第二單元:常模的類型(很重要)常模的類型有:發(fā)展常模百分位常模標準分常模智商及其意義k發(fā)展順序量表一、 發(fā)展常模(也叫年齡量表)智力年齡(簡稱智齡)比內(nèi)一西蒙年級當量 (又叫年級量表)廣百分等級指在常模樣本中低于這個分數(shù)的人數(shù)百分比百分點 是百分點也稱百分位數(shù),與百分等級的計算方法正好相反。百分等級是二、百分位常模 0.85時,才能用來鑒別或預測個人成績或作為。信度不能低于0.7三、 解釋個人分數(shù)的意義(多選

8、)其一是估計真實分數(shù)的范圍;其二是了解實得分數(shù)再測時可能的變化情形。這就是測量標準誤的應用。 VIQ是言語智商,PIQ是操作智商,四、比較不同測驗分數(shù)的差異這種比較包括兩個人不同分數(shù)的差別和同一被試在兩個測驗上的差別。這就是差異分數(shù)的標準誤問題。第四單元:影響信度的因素一、樣本特征:樣本團體異質性的影響能力低者兩次分數(shù)都低,雖然處在同一水平的受測者其分數(shù)也受機遇影響,但從整體上來看,兩次分數(shù)的相關是很高的,因此信度就高。樣本團體平均能力水平的影響二、測驗長度:測驗越長測題取樣或內(nèi)容取樣越有代表性。測驗越長被試的猜測因素影響就越小。三、測驗難度:難度與信度不存在簡單的對應關系。如果因為難度過大或

9、過小,造成分數(shù)范圍縮小,可使信度降低。四、時間間隔再測法求信度,間隔時間越短信度系數(shù)越大;間隔時間越久,信度系數(shù)越低。注意事項:(看看)斯皮爾曼-布朗公式為校正分半信度的經(jīng)驗公式, 它的假設是兩半測驗分數(shù)的變異數(shù)相等。當假設不成立時,可用下列兩種公式之一,直接求得測驗的信度系數(shù)。弗朗那根(Flanagan)公式:盧倫(Kulon)公式:rxx = 2S2 + S2 1 j-SaSx2Sbjr _1Sd2r xx - I -對于一些復雜的、異質的心理學變量,采用單一的同質性測驗是不行的,因而常常采用若干 相對異質的分測驗,使每個分測驗內(nèi)容具有同質性。第四節(jié):測驗的效度第一單元:測驗的效度一、效度

10、的定義在心理測驗中,效度是指所測量的與所要測量的心理特點之間的符合程度,或者簡單地說是指一個心理測驗的準確性。測量的效度除受隨機誤差影響外,還受系統(tǒng)誤差的影響??尚诺臏y驗未必有效,而有效的測驗必定可信。二、效度的性質(多選)效度具有相對性任何測驗的效度都是針對一定的目標而言。效度具有連續(xù)性 測驗效度通常用相關系數(shù)表示, 它只有程度上的不同,不是“全有”或“全無”的區(qū)別。三、信度和效度的關系信度是效度的必要而非充分條件效度受信度制約第二單元:效度評估的方法效度分為三大類:內(nèi)容效度、構想效度、效標效度一、內(nèi)容效度(一)什么是內(nèi)容效度指的是測驗題目對有關內(nèi)容或行為取樣的適用性,從而確定測驗是否是所欲

11、測量的行為領域的代表性取樣。這種測驗的效度主要與測驗內(nèi)容有關,故而得名。(二)內(nèi)容效度的評估方法: (多選)-1專家判斷法(三個步驟)-定義好測驗內(nèi)容的總體范圍;精品文檔編制雙向細目表,確定內(nèi)容的具體細節(jié)各自所占的比例;由每位評判者在評定量表上作出判斷。2、統(tǒng)計分析法計算兩個評分者之間評定的一致性(評分者信度)兩個測驗復本上得分之相關(復本信度)再測法也可用于內(nèi)容效度的評估(測驗-學習-再測驗)3、經(jīng)驗推測法這種效度是通過實踐來檢驗效度(三)內(nèi)容效度的特性內(nèi)容效度與所有效度一樣,并非普遍適用。只有編制者與使用者定義的內(nèi)容范圍相同, 編制者報告的內(nèi)容效度對使用者才有意義。內(nèi)容效度也有時間上的特定

12、性。內(nèi)容效度與表面效度不同。、構想效度(一)什么是構想效度是指測驗能夠測量到理論上的構思或特質的程度,即測驗的結果是否能證實或解釋某一理論的假設、術語或構思,解釋的程度如何。-要回答的問題是:該測驗欲測量什么心理構想?對該構想測得有多好?測驗分數(shù)中有多少比例的變異數(shù)是來自測驗所欲測之構想?測驗的內(nèi)容效度(對測驗本身的分析S測驗的內(nèi)部一致性指標分析被試者對題目的反應特點(多選)構想效度的評估方法相容效度是構思效度的一個證據(jù)測驗間的相互比較V區(qū)分效度是構思效度的又一個證據(jù)因素分析法也是建立構思效度的常用方法X-效標效度的研究證明根據(jù)效標分成相對照的兩組,比較測驗成績i 觀察分析測驗高分組與低分組的

13、心理特質 實驗法和觀察法證實、效標效度精品文檔(一)什么是效標效度亦稱實證效度,反映的是測驗預測個體在某種情境下行為表現(xiàn)的有效程度。分為同時效度和預測效度。一個好的效標必須具備4個條件。廣效標本身必須有效好效標的4個條件效標必須具有較高的信度,不隨時間等因素而變化效標可以客觀地加以測量,可用數(shù)據(jù)或等級來表示效標測量的方法簡單,省時省力,經(jīng)濟實用(二)相關法:相關法是評估效標效度最常用的方法,它是求測驗分數(shù)與效標資料間的相關,這一相關系數(shù)稱為效度系數(shù) 效標效度的評估方法區(qū)分法:分析高分組與低分組分布的重疊量, 或者計算每一組內(nèi)得分超過(或低于)另一組平均數(shù)的人數(shù)百分比,或者計算兩組分布的共同區(qū)的

14、百分比。重疊量越大,說明兩組分數(shù) 差異越小,即測驗的效度越差、命中率法:命中率法是當測驗用來做取舍的依據(jù)時,用其正確決定的比例作為效度指標的一種方法命中率的計算有兩種方法:計算總命中率 (Per) 計算正命中率(Pep)(見P385)正命中率高低常隨劃分測驗分數(shù)成功與失敗的臨界分數(shù)的高低而變化,臨界分數(shù)越高,正命中率越高;臨界分數(shù)越低,則正命中率也越低第三單元:效度的功能一、預測誤差效度系數(shù)的實際意義常常以決定性系數(shù)來表示,意旨相關系數(shù)的平方,其表達式是rxy2,它表示能夠正確預測或解釋效標的測驗分數(shù)的方差占總方差的比例。另一種表達方法是估計的標準誤,簡寫為Sest,它是指所有具有某一測驗分數(shù)

15、的被試其效標分數(shù)(Y分布的標準差,也即真正效標分數(shù)落在某一范圍內(nèi)有多大可能性。二、預測效標分數(shù)在測驗工作中,人們感興趣的是從測驗分數(shù)預測效標成績,因此最常用的是丫對X的回歸方程。 丫是預測的效標分數(shù),a是縱軸的截距,用來糾正平均數(shù)的差異;byx是斜率,亦即丫向X回歸精品文檔的系數(shù);X為測驗分數(shù)。 為了得到這個回歸方程,必須確定 a和b,這兩個常數(shù)的值,在計算中必須用到效度系數(shù)血三、預測效率指數(shù) E值的大小表明使用測驗比盲目猜測能減少多少誤差。E=100 (1 K)第四單元:影響效度的因 素(為了提高效度,要做到以下5條)r測驗材料必須對整個內(nèi)容具有代表性測題設計時應盡量避免容易引起誤差的題型(

16、如是非題)一、測驗本身的因素 測題難度要適中,具有較高的區(qū)分度測驗長度要恰當,即要有一定的測題量、測題的排列按先易后難順序二、測驗實施中的干擾因素:主測者的影響因素:主試不符合標準化要求的任何做法受測者的影響因素: 興趣、動機、情緒、態(tài)度和健康狀況等三、樣本團體的性質(一)樣本團體的異質性異質性越高,分數(shù)分布范圍大,測驗效度越高。1、如果只以選拔出來的被試為樣本團體參加研究,會降低測驗的效度。2、選拔標準太高,樣本團體的同質性增加,會降低測驗的效度。(二)干涉變量包括年齡、性別、教育水平、智力、動機、興趣、職業(yè)等。美國心理學家吉塞利(E.E.Ghiselli )尋找干涉變量的方法:1、用回歸方

17、程求每個人的預測效標分數(shù),與實際效標分數(shù)相比較;2根據(jù)樣本團體的組成,設立對照組,分別計算效度。3、根據(jù)顯而易見的干涉變量將其分為預測性高和預測性低的兩個亞團體。三、效標的性質效標效度是以測驗分數(shù)與效標測量的相關系數(shù)來表示,所以,效標測量本身的可靠性如何亦是值得考慮的問題。如果效標測量的信度不可靠,它與測驗分數(shù)之間的關系也就失去了可靠性。(信度是效度的必要而非充分條件效度高必然信度高,而信度高并不一定保證效度高,說明信度高只是效度高的必要條件,并不是效度高的充分條件精品文檔信度與效度的關系效度是受信度制約的信度系數(shù)與效度系數(shù)之間有這樣一種關系:信度系數(shù)的平方根是效度系數(shù)的最高限度。用公式表示如

18、下:XX信度系數(shù)的平方根又稱信度指數(shù),也就是說,效度系數(shù)的最高限度是信度指數(shù)第五節(jié):項目分析第一單元:項目的難度一、難度的定義定義:是指項目的難易程度。難度的指標通常以通過率表示,通過人數(shù)越多(即P值越大),難度越低;P值越小,難度越高二、計算方法(難度的計算)二分法記分的項目非二分記分的項目三、難度水平的確定:項目的難度,P值越接近于0.50,區(qū)分力越好測驗的難度,最好使測驗中所包含的試題的難度在0.50土0.20之間,平均難度接近0.50第二單元:項目的區(qū)分度一、區(qū)分度的定義項目區(qū)分度也叫鑒別力。取值范圍在-至+1之間。二、計算方法鑒別指數(shù)D = Ph PlD為鑒別指數(shù),Ph為高分組在該項

19、目上的通過率或得分率,Pl為低分組在該項目上的通過率或得分率相關法常用的計算方法:點二列相關二列相關中相關法:三、區(qū)分度與難度的關系 見P392注意事項:(看看)當測驗用于選拔或診斷時,應較多地選擇難度值接近錄取率的項目。如選拔提高難度, 診斷應降低難度。對于選擇題來說,P值一般應大于概率水平。如是非題,難度應該為0.75最為合適;而對于四選一的題目,其難度約為0.63時最為合適。為了使測驗具有更大的鑒別力,應該選擇難度在0.50左右的試題比較合適。但是,在實際工作中并非如此簡單。如果難度都是 0.50,而試題間都完全相關,則易形成U”分布。區(qū)分度取值范圍介于-1+1之間,假如項目得分與實際能

20、力之間呈負相關,則區(qū)分度為負。這 種情況一般很少發(fā)生,如果出現(xiàn),該題目應該淘汰。第六節(jié):檢測編制的一般程序第一單元:測驗的目標分析一、 測驗的對象韋氏成人智力量表分為城市版和農(nóng)村版二、測驗的用途:顯示性測驗預測性測驗三、測驗的目標目標分析以測驗不同而異,分三種情況:(一)工作分析(用于預測性測驗)(兩個步驟:)確定哪些心理特征和行為可以使要預測的活動達到成功建立衡量受測者是否成功的標準一一效標(二)對特定概念下定義(用于測量心理特質)必須發(fā)現(xiàn)所要測量的心理特質所包含的維量將通過什么行為表現(xiàn)出來或怎樣進行測量(三)確定測驗的具體內(nèi)容(用于顯示性測驗)編制雙向細目表(例如表5-8)第二單元:測題的

21、編寫編制測驗題目是心理測驗編制過程中最重要一環(huán),涉及從寫出、編輯到預試、修改等一個循環(huán)過程一、(多選)搜集資料:已出版的標準測驗理論和專家的經(jīng)驗臨床觀察和記錄二、命題原則內(nèi)容方面: 符合測驗目的;取樣有代表性;題引間相互獨立文字方面: 準確;簡明;一句話說明一個概念;盡量少用雙重否定句理解方面: 應有確切答案;題目內(nèi)容不超出受測團體的知識水平和理解力;題目格式不會被人誤解社會敏感性方面:菲利普(Philips, D.L )提出的幾條策略:廣1、命題時假定被試有某種行為,使他不得不在確實沒有該行為時才否定。如“你平均多久手淫一次? V2 、命題時假定規(guī)范不一致,如“有的醫(yī)生認為吸煙有害,另一些醫(yī)

22、生認為有益,你呢?”-3、指出該行為時常見的,“多數(shù)人在看色情電影是有性沖動,你呢?”三、編制要領(題干明確,意義完整選項簡明扼要(一)選擇題每題只給一個正確答案各選項長度盡量相等避免題干含有選擇答案的線索選項最好用同一形式,隨機排列廣內(nèi)容應以有意義的概念、事實或基本原則為基礎每道題只能包含一個概念(二)是非題 盡量避免否定的敘述,尤其要避免用雙重否定的敘述若是表達意見的題目,最好說明意見的來源和根據(jù)L“是”“非”題的數(shù)目應有適當比例,基本相等,隨機排列*宜用問句形式。如果用填充形式,空格盡量放到最后(三)簡答題如果是填充形式,空格不宜太多,空出來的應是關鍵詞句每題應只有一個正確答案,而且答案

23、要簡短而具體。對不完整的答案,應事先規(guī)定評分標 廣明確所要測的目標,將其操作化(四)操作題盡量選擇真實性程度(即逼真度)較高的項目|指導語要簡明扼要.制定好評分標準和計分方法第三單元:測驗的編排和組織、合成測驗(一)選擇與審定試題廠測驗的目的和材料的性質1、選擇試題形式 J接受測驗的團體的特點各種實際因素(如,人數(shù)多少、經(jīng)費)廣題目的范圍應與雙向細目表一致2、 審定題目題目的數(shù)量要比最后所需的數(shù)量多一至幾倍題目的難度必須符合測驗目的的要求題目的說明必須清楚明白沒另外,各類題目的比例要適當。測題要適合施測對象和施測條件,難度和區(qū)分度好,題目之間要相互獨立,重疊測題的難度排列宜逐步上升(二)測題的

24、編排盡可能將同類型的測題組合在一起,注意各種類型測題本身的特點例如,是非題和選擇題應避免將選擇相同選項的測題安排在一起;匹配題和重組題, 所有的選項應在一張紙上等測題常見的編排方式:1、并列直進式:分成若干分測驗,同一分測驗的試題由易到難排列。如韋氏智力測驗。2、混合螺旋式:先將各類試題依難度分成若干不同的層次,再將不同性質的試題交叉排列,難度漸次升進。如比內(nèi)量表。二、測驗的預試廣預測對象應取自將來正式測驗準備應用的群體預測預測的實施過程與情境應力求與將來正式測驗時的情況相近似預測的時限可以稍寬一些,最好使每個受測者都能做完,便于統(tǒng)計分析I預測過程中,應對受測者的反應情況隨時加以記錄項目分析三、 信度和效度考察:信度效度四、常模制訂廣測驗的目的和功用測驗編制的理論背景以及編制方法五、編寫指導手冊J如何實施測驗的說明內(nèi)容包括:測驗的標準答案和計分標準常模資料I測驗的基本特征,包括難度、區(qū)分度、信度、效度、因素分析等資料,以及這些資料取得的條件和情境等兩個實例:招飛紙筆測驗;軍人心理量表第七節(jié):心理測驗的使用第一單元主測者的資格一、知識結構二、專業(yè)理論知識和專業(yè)技能三、 職業(yè)道德:測驗的保密和控制使用測驗中個人隱私的保護 第二單元測驗的選擇選擇測驗必須

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論