试卷分析的四个度:难度、区分度、信度、效度
?
一、難度
?難度是指試題的難易程度,它是衡量試題質(zhì)量的一個(gè)重要指標(biāo)參數(shù),它和區(qū)分度共同影響并決定試卷的鑒別性。
?一般認(rèn)為,試題的難度指數(shù)在0.3-0.7之間比較合適,整份試卷的平均難度最好在0.5左右,高于0.7和低于0.3的試題不能太多。
?1、難度的兩種定義:
(1)P=1—x/w??? x為某題得分的平均分?jǐn)?shù),w為該題的滿分。這種定義法,難度值小時(shí)表明試題容易,值大時(shí)表明試題難,最小值為0,最大值為1。
(2)P=x/w??? 這種定義法,難度值小時(shí)表明試題難,值大時(shí)表明試題容易,最小值為0,最大值為1。
2、難度的計(jì)算:
(1)主觀性試題的難度
?A?? 基本公式法:P=1—x/w
?B?極端分組法 P=1—(XH+XL)∕2W??? XH :高分組的平均得分(前27%),XL:低分組的平均得分(后27%)。
(2)客觀性試題的難度
A? 基本公式法:P=1—R/N????? R 為答對人數(shù),N 為全體人數(shù)。
B? 極端分組法: P=1—(PH+PL)∕2??
?PH=RH/n 叫高分組通過率,RH:高分組答對人數(shù),n:總?cè)藬?shù)的前27%。PL=RL/n 叫低分組通過率,RL:低分組答對人數(shù)。
二、區(qū)分度
?區(qū)分度是區(qū)分應(yīng)試者能力水平高低的指標(biāo)。試題區(qū)分度高,可以拉開不同水平應(yīng)試者分?jǐn)?shù)的距離,使高水平者得高分,低水平者得低分,而區(qū)分度低則反映不出不同應(yīng)試者的水平差異。
?試題的區(qū)分度與試題的難度直接相關(guān),通常來說,中等難度的試題區(qū)分度較大。另外,試題的區(qū)分度也與應(yīng)試者的水平密切相關(guān),試題難度只有等于或略低于應(yīng)試者的實(shí)際能力,其區(qū)分性能才能充分顯現(xiàn)出來。
?? 區(qū)分度指標(biāo)的評價(jià): -1.00≤D≤+1.00,區(qū)分度指數(shù)越高,試題的區(qū)分度就越強(qiáng)。一般認(rèn)為,區(qū)分度指數(shù)高于0.3,試題便可以被接受。
?2、?區(qū)分度的計(jì)算方法:
?基本公式法:D=(H-L)÷N(D代表區(qū)分度指數(shù),H代表高分組答對題的人數(shù),L代表低分組答對題的人數(shù),N代表一個(gè)組的人數(shù)即高分組與低分組人數(shù)之和)。
?極端分組法:
(1)主觀性試題:D=SH—SL∕n(WH-WL)
?SH:高分組得分總數(shù),SL:低分組得分總數(shù),WH:該題的最高得分,WL:該題的最低得分,n為高分組(或低分組)的人數(shù),即總?cè)藬?shù)的27%。
(2)客觀性試題:D= PH—PL? ,或D= RH—RL∕n
(3)?一般也可以用D=XH—XL∕X滿計(jì)算。XH:高分組某試題的平均分,XL:低分組某試題的平均分,X滿:該題的滿分。
三、信度
?信度是指測得結(jié)果的一致性或穩(wěn)定性,穩(wěn)定性越大,意味著測評結(jié)果越可靠。相反,如果用某套試題對同一應(yīng)試者先后進(jìn)行兩次測試,結(jié)果第一次得80分,第二次得50分,結(jié)果的可靠性就值得懷疑了。
?信度通常以兩次測評結(jié)果的相關(guān)系數(shù)來表示。相關(guān)系數(shù)為1,表明測評工具如試卷完全可靠;相關(guān)系數(shù)為0,則表明該試卷完全不可靠。一般來說,要求信度在0.7以上。
?1、評價(jià)信度的方法:
?(1)重測法,(2)復(fù)本法—副題,(3)折半法,或者說:用再測信度、復(fù)本信度和內(nèi)部一致信度三種方法來進(jìn)行評估。
?再測信度是指將同一試卷在相同的條件下對同一組考生先后實(shí)施兩次,兩次測評結(jié)果的相關(guān)系數(shù)。
?復(fù)本信度是指用兩份或幾份在構(gòu)想、內(nèi)容、難度、題型和題量等方面都平行的試卷進(jìn)行測試,測評結(jié)果之間的相關(guān)系數(shù)。
?內(nèi)部一致信度是指試卷內(nèi)部各題之間的一致性,通常是將試卷一分為二,然后計(jì)算一半試卷與另一半試卷之間的相關(guān)系數(shù)。
?2、? 信度系數(shù)? γxx=ST2∕SX2???? ST2? 叫真分?jǐn)?shù)方差,SX2? 為獲得分?jǐn)?shù)方差。信度系數(shù)的最大值為1,表示測驗(yàn)的可靠性高,最小值為0,表示測驗(yàn)的信度低。當(dāng)γxx≥0.70時(shí),測驗(yàn)可用于團(tuán)體間的比較。當(dāng)γxx≥0.85時(shí),測驗(yàn)可用于個(gè)體之間的比較。
四、效度
?效度是一個(gè)測試能夠測試出它所要測試的東西的程度,即測試結(jié)果與測試目標(biāo)的符合程度.
?任何測試工具,無論其它方面有多好,若效度太低,測試的結(jié)果不是它要測試的東西(如用英語試卷測試學(xué)生的數(shù)學(xué)能力),那么,對目前所要測試的東西,這個(gè)測試將是無價(jià)值的。
?由于心理現(xiàn)象本身的特點(diǎn),測評的效度尤為重要。心理屬于精神方面的東西,目前人們還無法直接觀察它,只能通過一個(gè)人的行為模式或者對測試題目的反應(yīng),來推論其心理特質(zhì)。如智力水于主要是借助于個(gè)體對一些問題的反應(yīng)及正誤等結(jié)果來推斷的。
?效度是一個(gè)相對概念,即效度只有高低之分,沒有全部有效和全部無效之分。效度從種類上可分為卷面效度、內(nèi)容效度、構(gòu)想效度、預(yù)測效度和共時(shí)效度。
? 試卷質(zhì)量分析的兩個(gè)類:試題分析和試卷分析
?一、?試題分析?
對試題(考試)的性質(zhì)、來源、內(nèi)容范圍、難度等進(jìn)行概述。
?1、? 測驗(yàn)內(nèi)容的覆蓋面如何,
2、? 各知識點(diǎn)所占的比例是否恰當(dāng),
3、? 試題內(nèi)容的選擇是否合理,是否有錯(cuò)題,超綱等題目。
4、? 各層次行為目標(biāo)所占的分?jǐn)?shù)比例是否恰當(dāng)。如果是自命題,列出試題的雙向細(xì)目表。如果是非自命題,要對試題分析列出考查知識的細(xì)目表,或者是直條圖(各部分知識所占比例)。
從效度、信度(考試成績),難度、區(qū)分度(試題)四個(gè)角度分析。
??? 二、? 試卷分析
分定量分析和定性分析兩部分。
(一)?? 定量分析:
1、逐題統(tǒng)計(jì)分析(可用列表法、或統(tǒng)計(jì)圖法)
填空題,統(tǒng)計(jì)答對率。如:
選擇題,按選項(xiàng)統(tǒng)計(jì),如:
計(jì)算題,按等級統(tǒng)計(jì)。如得零分人數(shù),得滿分人數(shù),得部分分的人數(shù),計(jì)算出難度和平均分。
?2、? 統(tǒng)計(jì)學(xué)生成績頻率分布情況(次數(shù)分布圖)。
3、? 三率一分,即優(yōu)秀率、及格率、低分段率及平均分。要注明試卷的總分是多少,最高和最低分是多少。
?(二)? 定性分析
1、診斷:指出問題,分析原因。問題應(yīng)分共性和個(gè)性,找出共性問題及原因,教與學(xué)兩方面都要分析。
2、制定措施:改進(jìn)、矯正。
總結(jié)
以上是生活随笔為你收集整理的试卷分析的四个度:难度、区分度、信度、效度的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ContentProvider解析-获取
- 下一篇: [再寄小读者之数学篇](2014-07-