測量的信度
第一節(jié) 什么是信度
一、信度的定義
信度又叫可靠性,指的是測量的一致性程度。一個好的測量工具必須穩(wěn)定可靠,即多次測量的結(jié)果要保持一致,否則便不可信。信度只受隨機誤差影響。隨機誤差越大,信度越低。因此,信度亦可視為測量結(jié)果受機遇影響的程度。系統(tǒng)誤差產(chǎn)生恒定效應(yīng),不影響信度。
在測量理論中,信度被定義為:一組測量分數(shù)的真變異數(shù)與總變異數(shù)(實得變異數(shù))的比率。即,
(5.1)
式中rxx代表測量的信度,S 代表真分數(shù)的變異數(shù), 代表實得分數(shù)的變異數(shù),即總變異數(shù)。
根據(jù)公式(4.3),信度還可表示為
(5.2)
該定義有兩點要注意: 1)信度指的是一組測驗分數(shù)或一列測量的特性,而不是個人分數(shù)的特性。2)真分數(shù)的變異數(shù)是不能直接測量的,因此信度是一個理論上構(gòu)想的概念,只能根據(jù)一組實得分數(shù)作出估計。
任何測驗只能包含特定樣本的題目,由特定的施測者,對特定的被式,在特定的時間、地點施測,情況不同便會得到不同的分數(shù)。信度涉及的主要問題是對測驗分數(shù)的意義的概化能力,即從一次測量來推論總體(真實分數(shù))能達到何種正確程度。
根據(jù)現(xiàn)代信息論,每組信息可包括一些真正信息(信號)和一些錯誤的信息(噪音)。為了提供有用的數(shù)據(jù),任何測量必須有高的信號噪音比率——即提供更多真正的信息。信號可由真實分數(shù)的變異數(shù)表示,噪音可由誤差分數(shù)的變異數(shù)表示。
信噪比與信度有如下關(guān)系:
信號/噪音= (5.3)
公式(5.3)并不難證明,將 代入上式的右端可得:
=信號/噪音
假如一個測驗的信度為0.90,則信噪比為0.90/(1—0.90)=9.0即真正變異數(shù)對誤差變異數(shù)的比率為9:1。
一個測驗的信度只要稍微增加一點就會使信噪比大大改變。例如,信度從0.90增為0.91,可使信噪比從9:1,變?yōu)?0.1:1。因此,即使一個相當可靠的測驗也應(yīng)努力改善其信度。
二、信度系數(shù)
大部分的信度指標都以相關(guān)系數(shù)表示,即用同一被試樣本所得的兩組資料的相關(guān)作為測量一致性的指標,稱作信度系數(shù)。
與信度系數(shù)有關(guān)的一個概念叫信度指數(shù),是實得分數(shù)與真分數(shù)的相關(guān),這是部分與整體的相關(guān),可用下式表示:
信度指數(shù)的平方就是信度系數(shù),可用下列公式表示,
(5.4)
換言之,信度系數(shù)是實得分數(shù)與真正分數(shù)相關(guān)的平方。相關(guān)系數(shù)的平方表示兩個變量間共有的變異數(shù)比例。因此,信度系數(shù)實際是真正分數(shù)與實得分數(shù)之間的決定系數(shù)?梢越忉尀樵趯嵉梅謹(shù)的變異數(shù)中有多少比例是由真分數(shù)的變異決定的。例如,當rxx =0.90時,我們可以說實得分數(shù)中有90%的變異數(shù)是來自真正分數(shù)的差別,僅有10%是來自測量誤差,在極端例子中,如rxx=1.00,則無測量誤差,所有的變異都來自真分數(shù),若rxx=0,則所有的變異均反映了測量誤差。
對信度系數(shù)也要注意三點,1)在不同情況下,對不同樣本,采用不同方法會得到不同的信度系數(shù),因此一個測驗可能不止一個信度系數(shù)。2)信度系數(shù)只是對測量分數(shù)不一致性程度的估計,并沒有指出不一致的原因。3)獲得較高的信度系數(shù)并不是心理測量追求的最終目的,它只是邁向目標的一步,是使測驗有效的一個必要條件。
信度系數(shù)達到多高才可以接受呢?最理想的情況是 rxx=1.00m,但這是辦不到的。不過我們可用已有的同類測驗作為比較的基準。一般能力與學(xué)績測驗的信度系數(shù)在0.90以上,有的可以達0.95,至于性格、興趣、價值觀等人格測驗的信度系數(shù),通常在0.80到0.85或更高些。當 rxx<0.70時,不能用測驗來對個人作評價,也不能在團體間作比較,當 rxx="">0.70時,可用于團體間比較;當 rxx>0.85時,可用于鑒別個人。
由于信度系數(shù)總是在特定情況下獲得的,因此只有當一個測驗在很多情況下都被證實具有較高的信度時,才可以說它是比較可靠的測驗。
三、信度與測驗分數(shù)的解釋
信度系數(shù)有兩個實際用處:一是用來解釋個人分數(shù)的意義,二是用來比較不同測驗分數(shù)的差異.
(一)個人測驗分數(shù)的誤差
信度僅表明一組測量的實得分數(shù)與真分數(shù)的符合程度,但并沒直接指出個人測驗分數(shù)的變異量。由于存在測量誤差,一個人所得分數(shù)有時比真分數(shù)高,有時比真分數(shù)低,有時二者相等。理論上我們可對一個人施測無限多次,然后求所得分數(shù)的平均數(shù)與標準差。在這個假設(shè)的分布里,平均數(shù)就是這個人的真分數(shù),而標準差則為測量誤差大小的指標。這在實際上是行不通的。然而,我們可以用一組被試(人數(shù)足夠多)兩次施測的結(jié)果來代替對同一個人反復(fù)施測,、以估計測量誤差的變異數(shù)。此時,個人在兩次測驗中的分數(shù)差異就是測量誤差。據(jù)此可制成誤差分數(shù)的分布。這個分布的標準差就是測量的標準誤,是表示測量誤差大小的指標。
測量的標準誤可用下式求出:
SE=S
這里SE為測量的標準誤, 為所的分數(shù)的標準差, 為測量信度。從式中可以看出,測量的標準差與信度之間有互為消長的關(guān)系:信度越高,標準誤越小;信度越低,標準誤越大。
測量的標準誤實際上是在一組測量分數(shù)中誤差分布的標準差,可以象其它標準差一樣地解釋。因此,個人每次測量所得分數(shù)(X)有68%的可能性落在真分數(shù)(T)加減一個單位標準誤(SE)的范圍內(nèi),有95%的機會落在真分數(shù)加減1.96個標準誤的范圍內(nèi)。圖5—1表明實得分數(shù)在真實分數(shù)上的回歸,以及距回歸線一個標準誤的平行線。
初級會計職稱中級會計職稱經(jīng)濟師注冊會計師證券從業(yè)銀行從業(yè)會計實操統(tǒng)計師審計師高級會計師基金從業(yè)資格稅務(wù)師資產(chǎn)評估師國際內(nèi)審師ACCA/CAT價格鑒證師統(tǒng)計資格從業(yè)
一級建造師二級建造師消防工程師造價工程師土建職稱房地產(chǎn)經(jīng)紀人公路檢測工程師建筑八大員注冊建筑師二級造價師監(jiān)理工程師咨詢工程師房地產(chǎn)估價師 城鄉(xiāng)規(guī)劃師結(jié)構(gòu)工程師巖土工程師安全工程師設(shè)備監(jiān)理師環(huán)境影響評價土地登記代理公路造價師公路監(jiān)理師化工工程師暖通工程師給排水工程師計量工程師
人力資源考試教師資格考試出版專業(yè)資格健康管理師導(dǎo)游考試社會工作者司法考試職稱計算機營養(yǎng)師心理咨詢師育嬰師事業(yè)單位教師招聘公務(wù)員公選考試招警考試選調(diào)生村官
執(zhí)業(yè)藥師執(zhí)業(yè)醫(yī)師衛(wèi)生資格考試衛(wèi)生高級職稱護士資格證初級護師主管護師住院醫(yī)師臨床執(zhí)業(yè)醫(yī)師臨床助理醫(yī)師中醫(yī)執(zhí)業(yè)醫(yī)師中醫(yī)助理醫(yī)師中西醫(yī)醫(yī)師中西醫(yī)助理口腔執(zhí)業(yè)醫(yī)師口腔助理醫(yī)師公共衛(wèi)生醫(yī)師公衛(wèi)助理醫(yī)師實踐技能內(nèi)科主治醫(yī)師外科主治醫(yī)師中醫(yī)內(nèi)科主治兒科主治醫(yī)師婦產(chǎn)科醫(yī)師西藥士/師中藥士/師臨床檢驗技師臨床醫(yī)學(xué)理論中醫(yī)理論