基于差分优化语义相似模型的智能组卷系统

第1页共8页基于差分优化语义相似度模型的智能组卷系统摘要文章针对组卷系统中容易对同一语义内容但不同形式的题目多次出现在同一张试卷中的问题,提出了基于差分优化语义相似度模型的组卷系统。此系统引入语义相似度模型,在组卷的过程较好地避免了重复知识点的考查,增加了组卷的成功率;在语义相似度模型的基础上,对一些参数不再用手动的方式调整,采用差分算法对模型中的相关参数进行动态的调控,不仅可以避免手动调整参数的辛苦,又在全局范围中获得最优化的参数,从而保证了自动组卷系统的科学性、公正性、高效性,该系统对题目知识结构,数据延展进行全方位的跟踪管理,多种考试形式丰富组织方式。关键词自动组卷系统语义相似度模型余弦相似度差分优化:TP391.3文献标识码:ADOI:10.16400/ki.kjdks.2016.02.073第2页共8页0引言现阶段,有不断增加的考试类型和不断提高的考试要求,随即而来,也越来越增加了教师的工作量。为适应现代考试的需要,传统的考试方法应该慢慢地被淘汰了。目前有着迅速发展的计算机应用,网络应用不断扩大,如远程教育和虚拟大学的出现等等,且这些应用正逐步深入到千家万户。在线考试都会需要这些网络应用技术,期待减轻教师的工作负担以及提高工作效率,与此同时提高了考试的质量,从而使考试更趋于公正、客观,更加激发学生的学习兴趣。鉴于以上现状和结合当前市面上考试系统的特点与不足,一种新型的语义相似度模型的自动组卷系统应运而生。1基于差分优化语义相似度模型的自动组卷系统针对现有自动组卷系统的不足,本论文提出基于差分优化语义相似度模型的自动组卷系统,以提高所组试卷的质量。例如避免在组卷过程中产生选择、填空、判断三者之间对同一知识点考查多次的问题;改进传统的组卷系统,借助语义相似度模型实现对填空,第3页共8页问答的审阅,使得组卷变得更科学、更智能,以减轻老师负担和提高系统工作效率。基于差分优化语义相似度模型的自动组卷系统具有以下特点:(1)引入语义相似度模型;(2)具有普适性,基于语义层面的相似度模型使得系统不再局限于少数几门学科;(3)提高组卷效率,借助语义相似度模型,在组卷的过程较好地避免了重复知识点的考查,增加了组卷的成功率;(4)题型更加全面,借助文本相似度的计算实现了对填空,问答等主观题的组卷;(5)组卷具有高效性,省去了人工组卷环节,系统的工作效率得到了质的飞跃;(6)采用差分算法对模型中的相关参数进行动态的调控,不仅可以避免手动调整参数的辛苦,又在全局范围中获得最优化的参数,从而保证了自动组卷系统的科学性、公正性、高效性。1.1语义相似度模型的设计与实现文本语义相似度量方法大多将文比文本看作一组词的集合体,分析每个词在文本中出现的次数以及在整个文本集合中出现的次数,第4页共8页进而利用这些词频信息将文本建模为一个向量,并利用向量间的余弦相似度、Jaccard相似度等方法计算文本之间的相似度。基于语义的文本相似度量方法则通过同义词、冗余和蕴涵等语义关系来考查文本之间的相似度。鉴于已经存在的问题的一些不足,在本文中将采用一种能有效降低文本表示模型的维度,又能结合词项语义信息进行相似度量计算的方法。1.2语义相似度模型具体算法对于语义相似度模型的算法,主要有两个关键操作:关键词的提取、关键词项向量间的相似度计算。1.2.1关键词的提取(1)首先预处理文本中的人名、地名、无实意的常用字(在TF-IDF方法中有相关识别技术),将它们用per,loc,org等词代替,因为这类词具有较高的TF-IDF值,从而容易导致对文本关键词项的错误选择;然后,必须对文本中的词项进行词性分析,给出词第5页共8页项的语义属性,即该词项是名词、动词还是副词等。(2)关键词项的选择:文本预处理完成后,需要对整个文本集合中的词项进行TF-IDF值计算,并将词项的TF-IDF值进行排序,选取TF-IDF值大于P(P为百分比)的名词动词词项作为关键词项(3)由于关键词项代表了一篇文本中最重要的信息,因此文本的相似度就可以由关键词项向量间的相似度来描述。因此,文本之间的相似度就转换为关键词项向量间的相似度。1.2.2关键词项向量间的相似...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?