G-DINA模型在DINA模型的基礎上放寬了假設條件,使之能夠更好地擬合實際數據的情形,是模型擬合一般化資料的一個很好的結果。馮戴維提出了一個更加一般化的診斷模型框架(general diagnostic models,GDM)。
一、模型定義
記n個被試在i道題目上的觀察作答反應數據為xn=(xn1,xn2,…,xni),每道題目上的得分為xni∈{0,1,2,…,mi}。
記被試水平離散潛變量an=(an1,an2,…,ank),其取值形式為ank∈{sk(0),…,sk(lk)},sk(l)是被試在第k個屬性上掌握水平的具體取值,該取值可以是0或1,也可以是-1或1,也可以是其他的取值範圍。
記矩陣Q=(qik)i=1,2,…,i;k=1,2,…,K,qik表示在作答項目i時,屬性k的作用及大小。如果正確作答項目i需要掌握屬性k,那麽,qik>0,否則,qik=0。另外,qik>0情形下的取值可能有多種。
假設題目之間局部獨立性成立,那麽,被試作答反應模式的邊際概率可以表示為:
其中,p(a=(a1,…,ak)|g)表示在總體g中a的分布,p(xn1,xn2,…,xni|a,g)表示以總體g中的a為條件,觀察反應模式(xn1,xn2,…,xni)的條件分布。這個式子蘊含著被試可以來自多個不同的總體,假設被試間局部獨立性也成立,那麽,被試作答反應模式的條件概率就可以表示為:
也就是說,被試作答反應模式的條件概率可以表示為被試在各個題目上的作答反應的條件概率(項目反應函數)之積。
在以上定義的基礎上,一般診斷模型族(GDM)的項目反應函數定義為:
其中,x為被試在項目上的作答反應得分,x∈(1,2,…,mi),βxig為得分難度指標,γxig=(γxig1,…,γxigK)為K維區分度指標,在式子中使用了轉置的形式,g仍然指的是不同總體。當然,如果假設被試總體是單一的,那麽就不用考慮這個指標的影響了。
在這個模型中,h(qi,a)起著至關重要的作用。它的作用是定義項目屬性向量和被試屬性掌握狀態之間的組合模式,並且根據其不同組合模式將GDM模型族具體化為具有不同特性的實例模型。如果h(qi,a)的定義模式如下:
GDM將具體化為一個離散的、多維項目反應理論模型。如果qik取值為0或1,那麽,
從GDM模型定義可以知道,隻有當qik不為0時,被試對屬性k的掌握水平才會對項目的作答結果產生影響。以上定義模式中,ak的取值模式可以是任意的,但qik的取值隻有0或1。
qik有時候會用於表示被試答對第i題時需要掌握屬性k的水平層次。被試在屬性k上的掌握水平大於或等於該層次時可以答對,但低於該層次時就會答錯。當qik的取值形式不為0和1時,上麵關於h(qi,a)的定義形式就不合適了。這時,它的定義模式可以如下:
二、模型的特性
從以上介紹可以知道,GDM其實是定義了一個模型族或認知診斷模型框架。研究者可以通過重定義h(qi,a)的具體形式,以及被試屬性掌握水平ak與題目測量的屬性水平qik的取值模式,從而獲得適合當前數據情境的具體模型。
GDM模型族結合了IRT模型、對數線性模型(log-linear models)和潛類別模型(latent class models),除了能夠進行一般的被試認知屬性掌握模式分類之外,還能夠處理多級記分作答數據和屬性掌握水平多級化情形,同時又能夠處理補償和非補償作答數據。
另外,模型提出者還基於EM算法,編製了該模型的參數估計程序——mdltm。