江西师范大学学报(自然科学版)JOURNALOF激ANGXINORMALUNIVERSITY(NATURALSCIENCE)第35卷第5期2011年9月Vol.35No.5Sep.2011:1000-5862(2011)05-0548-03计算机化自适应诊断测验新的选题策略丹,潘奕娆,丁树良*,杨庆红余(江西师范大学计算机信息工程学院,江西南昌330022)摘要:提出了一种既能满足属性平衡又能有效处理相似属性模式的新方法——改进的极大化整体判别认知诊断模型信息量指标法(M共产党I).对无结构型的属性,讨论定长CD-CAT的选题策略.研究结果表明,使用相同选题策略选题时,先选择可达矩阵的所有列对应的项目比不使用这些项目的诊断准确率高.关键词:计算机化自适应诊断测验;选题策略;可达矩阵;诊断准确率:TP18文献标识码:A的总和为GDIj(αˆi)引言02K⎡1⎤⎛P(Xx|αˆ)⎞iji∑⎢∑log⎜P(X⎟P(Xijx|αˆi)⎥.传统的基于项目反应理论的计算机化自适应测验(computerizedadaptivetestingbasedonitemresponsetheory,IRT-CAT)只从宏观上为被试提供一个测验分数,并不从微观上分析被试内在的知识结构及认知技能[1].计算机化自适应诊断测验(computerizedadaptivetestingwithcognitivediagnosis,CD-CAT)不仅为被试提供一个测验分数,而且能够提供详细的诊断信息,即被试掌握了哪些属性(正确作答一个项目需要的任务、子任务、认知加工或技能),未掌握哪些属性,还需要在哪些方面进行补救[2].CD-CAT正如IRT-CAT一样,其关键也是选题策略.本文在属性满足无结构型的条件下,讨论定长CD-CAT的3种选题策略,并讨论题库是否含可达矩阵对这3种选题策略诊断准确率的影响.⎜⎟x|α⎢⎥c1⎣x0⎝⎠⎦ijc虽然GDI方法能够有效地揭示被试认知剖面图(profiles),但是没有考虑属性覆盖.平衡属性覆盖类似于IRT-CAT中的内容平衡,但是IRT-CAT中大部分内容平衡方法无法直接应用于CD-CAT.因为,在IRT-CAT中模型通常需要的内容区域是互斥的.换句话说,如果一个项目属于一个内容区域,那它就不属于另一个内容区域.但在CD-CAT中,一个项目可以同时测量多个属性.修正的极大化判别指标法(modifiedmaximumglobaldiscriminationindexmethod,MMGDI)中的指标是通过将属性平衡指标与整体判别指标(GDI)相乘,即可获得修正GDI指标(MGDI),其具体计算公式为1CD-CAT选题策略Kqjkji∏(BkMGDI(αˆ)(αˆ),−b)Bkkjik11.1MMGDI方法尽管Kullback-Leibler(KL)信息量在统计上可以有效地区分被试估计的知识状态与真实的知识状态,但在实际操作中,被试真实的知识状态是未知的.当属性个数为K时,被试真实的知识状态最多有2K种可能.因此,Xuxueli等[3]提出整体判别指标(globaldiscriminationindex,GDI),GDI为f(Xij|αˆi)与所有其他模式条件下Xij条件分布之K其中∏(Bk−bk)Bkq为属性平衡指标,Bk为测量jkk1属性k需要的最小项目数,即最少需要Bk个项目测量属性k,bk表示测量属性k已选择的项目数.1.2CDI方法如果一个测验可以有效地区分2个相似的属性模式,那它一定可以很好区分彼此不相似的属性模收稿日期:2011-06-09基金项目:国家自然科学基金(30860084,60263005,31160203,31100756)资助项目.作者简介:丁树良(1949-),男,江西樟树人,教授,博士生导师,主要从事计算机辅助教学、应用统计及教育和心理测量方面的研究.informationindex,CDI)的主要思路是在比较2个相似的属性模式时赋予更大的权重.通常情况下,比较任意2个属性模式α与α*之间相似度的指标是欧式距离的平方N+1种.每种属性掌握模式产生30名被试,则模拟被试人数为(63+1)×30=1920.2.2题库的生成(1)含可达矩阵的题库无结构型的R阵共有6列,Qr阵共有63列,题库中题型含8个可达阵,4个Qr−R(即将Qr中减去R对应的列),即8×6+4×(63-6)=276,每一类题型放5个具体的项目,则模拟的题库中所包含的项目总数为276×5=1380.(2)不含可达矩阵的题库直接从Qr−R中随机抽取,直到与含可达矩阵的题库容量相同为止.由于无结构型中各个属性是相互独立的,故测量每个属性需要的最小项目总数均设定为4.2.3测验的构建本文采用DINA模型,使用2种方式生成项目参数,一种是失误(s)参数和猜测(g)参数,均为定值且s=0.10、g=0.15,主要是消除项目参数对诊断准确率的影响;另一种是失误(s)和猜测(g)参数均服...