基于领域本体的学习资源语义检索模型摘要:为解决e??learning领域内学习资源的有效检索,提出了一个基于领域本体的e??learning学习资源语义检索模型。用Protégé构建了教育技术领域本体,通过对检索方法的研究分析和算法实现,开发了基于本体语义检索原型系统;并由对比全文检索和基于本体的语义检索两种方法的查准率,证明了基于本体的语义检索方式,在一定程度上能解决目前传统检索中存在的不足。关键词:e??learning;学习资源;领域本体;语义检索??:TP391文献标志码:A:1001-3695(2008)07-1977-02??Researchondomainontology??basedsemanticretrievalmodeloflearningresources??NIUQiang,QIUBo,XIAShi??xiong,ZHOUYong,ZHANGLei??(Dept.ofInformationScience,SchoolofComputerScienceTechnology,ChinaUniversityofMiningTechnology,Xuzhou激angsu221008,China)??Abstract:Tofacilitatetheeffectiveretrievaloflearningresources,thepaperproposedadomainontology??basedmodeloflearningresources.EducationtechnologyontologywasconstructedbyProtégé.Throughstudyingandanalyzingtheretrievalmodeland??realizing??thealgorithm,aprototypesystemwasdeveloped.Precisionratiooffull??textretrievalandontology??basedretrievalwascalculatedseparatelyandthelatterwasmoreaccurate.Itisprovedthatthesystemcanovercometheshortcomingsoftraditionalretrievalatacertainextent.Keywords:e??learning;learningresources;domainontology;semanticretrieval?お?目前正在研究和使用的信息检索技术可以分为三类[1],即全文检索、数据检索和语义检索(知识检索)。其中:全文检索是基于词语的机械匹配,比较好地保证了检索的查全率,但是查准率不能令人满意;数据检索是基于一定的格式和结构对特定字段的检索,但是这种方法要求人工基于特定的字段对信息资源进行标志,检索的效果取决于标志方法的优劣以及用户对标识字段的理解;语义检索则是基于知识的、语义的匹配,在提高检索的查准率和查全率方面都有很好的表现。??本文以解决e??learning领域内学习资源的有效检索为目标,研究以本体作为知识组织方式实现语义检索的方法,设计了基于领域本体的学习资源语义检索模型,开发了教育技术领域学习资源语义检索系统,该系统在一定程度上实现了复杂概念层次下的语义检索。??1基于领域本体的学习资源语义检索模型的框架??本体最早是个哲学概念,本意是本体论或存在论。关于本体的定义,最著名并被引用得最---本文来源于网络,仅供参考,勿照抄,如有侵权请联系删除---为广泛的是由Gruber提出的“本体是概念化的明确的规范说明”[2]。领域本体是面向特定领域,用于描述领域知识的概念模型,并要求模型中的概念在某个特定领域或范围内是公认的。领域本体的目标是捕获相关领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇(术语)和词汇间相互关系的明确定义[3]。基于领域本体的学习资源语义检索模型(DOSRM)主要由三大模块组成,即分词、语义和检索(图1)。??DOSRM模型的第一步就是对用户输入的查询语句进行分词,取出查询中的中心词,然后将它们递交给语义模块。语义模块对递交过来的查询进行分析,并将查询请求??Q????1,2,…,n????分为两个部分:a)在本体库中所覆盖到的关键词??Q1????l,2,…,n????;b)不在本体库中的其他单词??Q2????l,2,…,n????。语义模块开始在本体库中查找到??Q????1,2,…,n????的语义描述,为检索模块提供了比一般检索方式更准确丰富的信息内容,然后把语义描述交给检索模块得到检索结果Resultl。??Q2????l,2,…,n????则直接传递给检索模块,得到检索结果Result2。最后返回给用户的结果是Result1与Result2的和。过程如图2所示。??2模型关键技术研究??2.1教育技术领域本体的构建??领域本体实际上是一张机器可读的相关领域的术语(概念)及其关系的词表,它的作用是使人们对相关领域内的术语、规则达到共同认识。从图1可以看出,本体库是用户提问语义和计算机检索语义取...