信息集成中语义异构问题研究

信息集成中语义异构问题研究摘要:为了对多个分布异构的数据源进行无缝访问必须解决数据源之间的语义异构。分析了三个层次的语义异构,即模式异构、上下文异构和个体异构,并重点给出了消除上下文异构和个体异构的解决方法。针对已有语义信息集成片面解决三个层次语义异构中的一种的现状,提出了一个语义信息集成的体系结构,能够全面解决三个层次的语义异构。关键词:语义信息集成;本体;语义异构;上下文仲裁;个体识别:TP311.131文献标志码:A:1001-3695(2008)08-2349-03ResearchofsemanticheterogeneityininformationintegrationZHOU激an-fang,XUHai-yin,LUZheng-ding(SchoolofComputer,HuazhongUniversityofScienceTechnology,Wuhan430074,China)Abstract:Toaccessmultipledistributedheterogenousdatasourcesseamlessly,thesemanticheterogeneitybetweendatasourcesmustbereconciled.Analyzedthethreekindsofsemanticheterogeneityincludingschemaheterogeneity,contexthetero-geneityandindividualheterogeneityandproposedcorrespondingsolution.Theexistedsemanticinformationintegrationsolutionsreconciledsemanticheterogeneitypartially,thispaperconstructedasemanticinformationintegrationarchitecturetoresolveallofthethreekindsofsemanticheterogeneitycompletely.Keywords:semanticinformationintegration;ontology;semanticheterogenous;contextmediation;individualidentification随着网络通信技术的发展,用户可以访问的信息越来越多,这些信息以不同的格式、不同的组织方式分布在不同的地点。这些数据源中的信息,一般采用一些语义表达比较弱的模型如关系数据库模型、XML等来描述,信息的语义主要通过与数据源关联的应用程序来表达。这就导致数据源中信息的语义只能在系统内部交换,不同的信息系统之间彼此无法交换有意义的信息,成为互相隔离的信息孤岛,为信息的共享和重用带来了极大的障碍。语义信息集成的目标是为分布异构的信息源提供统一的接口,通过该接口对多个异构数据源进行无缝访问,使得分布异构的信息系统之间可以交换有意义的信息,即信息系统之间可以互操作。其核心问题是消除多个分布异构的数据源之间的语义异构。本体作为一种描述机器语义(知识)的强有力工具,应用到语义信息集成系统中来构建全局模式、描述相关领域知识。由本体描述的知识可以被计算机理解并进行推理,从而在人类和计算机之间建立起知识理解的桥梁并提供知识共享和重用。1研究现状在已有文献中关于语义信息集成的研究[1],基本上都是采用ontology+mediator的模式,即利用本体(ontology)建立全局模式来描述领域知识(类、属性、关系、公理等),数据存放在各个数据源中,由与数据源关联的应用程序来维护;然后在本体和数据源之间建立起一个中间层来调解(mediating)分布数据源之间的语义异构。从上面描述的语义信息集成的原理可以看出,语义信息集成主要是通过在本体和数据源之间建立语义映射,然后由查询引擎根据元数据和语义映射规则进行查询重写和对结果进行处理来实现异构数据源之间的语义异构的消解。由于数据存储在数据源本地,本体主要描述领域知识,因此在信息集成中本体和数据源之间的语义映射是模式级的,即本体所描述的模式和数据源模式之间的对应关系。信息集成根据应用的领域可以分为横向集成和纵向集成。横向集成主要指参加集成的数据源描述的是不同但相关的领域的信息,如B2B电子商务活动中的合作伙伴之间的信息集成,制造业供应链上的合作伙伴之间的信息集成等;纵向集成主要指参加集成的数据源描述的是相同领域的信息,如Web上不同的零售商店(比较购物)、不同航空公司的机票预定(智能订票)等。2相关研究与存在的问题2.1三个层次的语义异构数据源之间的语义异构表现在以下三个层次:a)模式异构,主要是由不同的数据源采用不同的逻辑结构或不一致的元数据来描述数据源模式引起的[2]。b)上下文异构,是对于不同数据源中具有相同模式语义的信息(包括实体和属性)。由于不同数据源在设计数据模型时采用了不同的假设导致对信息具有不同的解释[3]...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

文秘专家
机构认证
内容提供者

1

确认删除?