我們的學海生涯中或者工作中常常會遇到考試,我們會不斷的努力思考如何應對這些考試,如何考好試,但可能比較多人都不知道 一份試卷的難度與區分度也是可以計算的,下面請參考一下以下的算法:
1、區分度的計算
區分度是指試題對被試者情況的分辨能力的大小。一般在-1~+1之間,值越大區分度越好。
試題的區分度在0.4以上表明此題的區分度很好,0.3~0.39表明此題的區分度較好,0.2~0.29表明此題的區分度不太好需修改,0.19以下表明此題的區分度不好應淘汰。
計算區分度的方法很多,特別需要注意的是對同一個試題的考試成績采用不同的方法所得到的區分度的值是不同的。
我們可以使用下面的兩種方法計算區分度:
(1)先將分數排序,P1=27﹪高分組的難度,P2= 27﹪低分組的難度。區分度D=P1-P2或區分度D=(27﹪高分組的平均分-27﹪低分組的平均分)÷滿分值。
(2)利用積差系數r計算區分度D。當兩個變量都是正態連續變量,而且兩者之間呈線性關系,表示這兩個變量之間的相關成為積差相關。積差相關的使用條件:
a、兩個變量都是由測量獲得的連續性數據。如百分制分數。
b、兩個變量的總體都呈正態分布,或接近正態分布,至少是單峰對稱的分布。
c、必須是成對的數據,而且每對數據之間是相互獨立的。
d、兩個變量之間呈線性關系。
積差相關系數r的計算在計算機上是很容易進行的。
2、難度的計算
(1)難度是指正確答案的比例或百分比。這個統計量稱為試題的難度或容易度。
難度一般用字母P表示,P越大表示試題越簡單,P越小表示試題越難。試題要有梯度,因此各試題的難度應有不同,這是命制試題時要加以特別考慮的。
(2)計算公式:P=平均分/滿分值。例如:第一題平均分為8.5分,此題的滿分值為10分,則第一題的難度P=8.5÷10=0.85。例:第1小題選擇題滿分是4分,全班50名學生中有20名學生答對,則第1小題的難度為,P=正確答案的比例或百分比=20÷50=0.4或平均分=4×20÷50=1.6。P=平均分÷滿分值=1.6÷4=0.4。
(3)關于難度的幾個問題難度水平的確定是為了篩選題目。平時測驗難度要利于學生的學習,但一定的難度能增加區分度,這對全面了解、掌握學生學習情況有十分重要的作用。難度水平的確定要考慮及格率,防止損傷學困生的自尊心。難度水平的確定要考慮對分數分布的影響,一般以偏正態分布為前提,有時偏正態分布更能激發學生的學習積極性。
3,效度
效度是一個測試能夠測試出它所要測試的東西的程度,即測試結果與測試目標的符合程度.任何測試工具,無論其它方面有多好,若效度太低,測試的結果不是它要測試的東西(如用英語試卷測試學生的數學能力),那么,對目前所要測試的東西,這個測試將是無價值的。由于心理現象本身的特點,測評的效度尤為重要。心理屬于精神方面的東西,目前人們還無法直接觀察它,只能通過一個人的行為模式或者對測試題目的反應,來推論其心理特質。如智力水于主要是借助于個體對一些問題的反應及正誤等結果來推斷的。
效度是一個相對概念,即效度只有高低之分,沒有全部有效和全部無效之分。效度從種類上可分為卷面效度、內容效度、構想效度、預測效度和共時效度。
4、試卷分析的幾個特殊問題
試卷分析的四個度:難度、區分度、信度、效度
(1)難度是指試題的難易程度,它是衡量試題質量的一個重要指標參數,它和區分度共同影響并決定試卷的鑒別性。一般認為,試題的難度指數在0.3-0.7之間比較合適,整份試卷的平均難度最好在0.5左右,高于0.7和低于0.3的試題不能太多。
難度的兩種定義:
a、P=1—x/w x為某題得分的平均分數,w為該題的滿分。這種定義法,難度值小時表明試題容易,值大時表明試題難,最小值為0,最大值為1。
b、P=x/w 這種定義法,難度值小時表明試題難,值大時表明試題容易,最小值為0,最大值為1。
難度的計算:
a、主觀性試題的難度。A、基本公式法:P=1—x/wB 極端分組法 P=1—(XH+XL)∕2W XH:高分組的平均得分(前27%),XL:低分組的平均得分(后27%)。
b、客觀性試題的難度。A、基本公式法:P=1—R/N。R為答對人數,N為全體人數。B、極端分組法:P=1—(PH+PL)∕2 PH=RH/n 叫高分組通過率,RH:高分組答對人數,n:總人數的前27%。PL=RL/n 叫低分組通過率,RL:低分組答對人數。
(2)區分度
區分度是區分應試者能力水平高低的指標。
試題區分度高,可以拉開不同水平應試者分數的距離,使高水平者得高分,低水平者得低分,而區分度低則反映不出不同應試者的水平差異。試題的區分度與試題的難度直接相關,通常來說,中等難度的試題區分度較大。另外,試題的區分度也與應試者的水平密切相關,試題難度只有等于或略低于應試者的實際能力,其區分性能才能充分顯現出來。
區分度指標的評價:-1.00≤D≤+1.00,區分度指數越高,試題的區分度就越強。一般認為,區分度指數高于0.3,試題便可以被接受。
區分度的計算方法:
基本公式法:D=(H-L)÷N(D代表區分度指數,H代表高分組答對題的人數,L代表低分組答對題的人數,N代表一個組的人數即高分組與低分組人數之和)。
極端分組法
主觀性試題:D=SH—SL∕n(WH-WL)SH:高分組得分總數,SL:低分組得分總數,WH:該題的最高得分,WL:該題的最低得分,n為高分組(或低分組)的人數,即總人數的27%。
客觀性試題:D= PH—PL ,或D= RH—RL∕n
一般也可以用D=XH—XL∕X滿計算。XH:高分組某試題的平均分,XL:低分組某試題的平均分,X滿:該題的滿分。
(3)信度
信度是指測得結果的一致性或穩定性,穩定性越大,意味著測評結果越可靠。相反,如果用某套試題對同一應試者先后進行兩次測試,結果第一次得80分,第二次得50分,結果的可靠性就值得懷疑了。信度通常以兩次測評結果的相關系數來表示。相關系數為1,表明測評工具如試卷完全可靠;相關系數為0,則表明該試卷完全不可靠。一般來說,要求信度在0.7以上。
評價信度的方法:
重測法,復本法—副題,折半法,或者說:用再測信度、復本信度和內部一致信度三種方法來進行評估。
再測信度是指將同一試卷在相同的條件下對同一組考生先后實施兩次,兩次測評結果的相關系數。
復本信度是指用兩份或幾份在構想、內容、難度、題型和題量等方面都平行的試卷進行測試,測評結果之間的相關系數。
內部一致信度是指試卷內部各題之間的一致性,通常是將試卷一分為二,然后計算一半試卷與另一半試卷之間的相關系數。
信度系數
γxx=ST2∕SX2 ST2 叫真分數方差,SX2 為獲得分數方差。信度系數的最大值為1,表示測驗的可靠性高,最小值為0,表示測驗的信度低。當γxx≥0.70時,測驗可用于團體間的比較。當γxx≥0.85時,測驗可用于個體之間的比較。