数据仓库中元数据标准对比研究

数据仓库中元数据标准对比研究字体大小:大中小2009-10-2015:17:22来源:万方数据本文从用户的角度分类了数据仓库的元数据,在分类的基础上比较分析了奋共仓序元模型CWM(ConnunonWarehouseMeatamodel)与开放信息模型OIM(OpenInformationModel)这两个元数据标准,最后讨论了CWM标准在实际开发工作中的作用和发展趋势。引言元数据是描述数据的数据。数据仓库与元数据之间的关系就像是图书馆和图书目录的关系,有了图书目录,读者才能更简捷、更清楚地查找所需要的图书,而且,图书管理员借着图书目录也能更方便地管理图书。事实证明,数据仓库的成功操作和使用很大程度上依赖于海量元数据的有效管理。元数据贯穿了数据仓库的创建、维护和管理的各个方面,描述了与数据仓库所有相关方面的数据。1元数据的分类从用户的角度可以把元数据的内容分为技术元数据和业务元数据。技术元数据,由数据库管理员、数据库设计者和程序员使用,是关于数据仓库系统技术细节的元数据。主要包括以下方面:(1)可操作的数据库、数据仓库和数据集市的模式。可操作的数据库系统模式是异构的,有面向记录的、面向文件的、关系的、面向对象的、多层次的和网状的等模式。而相反的,在数据仓库和数据集市中,模式是一致的、协调的,或是关系型的或是多维的模式。(2)不同的操作数据派、数据仓库和数据集市之间在物理和实现级上的映射和依赖关系的描述,包括从不同的数据源到数据仓库的抽取、清洗、转换过程的信息。(3)管理目的的元数据,包含了为了协调性能的系统统计(CPU和I/O的需求,……),数据刷新,数据清除和存档的相关信息等。业务元数据,由业务经理和业务分析员等使用,帮助业务用户理解数据含义和支持面向业务的数据分析。主要包括以下方面:(1)企业概念模型,定义了主要的业务信息对象、对象间的关系、整体约束(业务规则)等。(2)业务术语,描述了终端用户熟悉的、定义一致的企业模型。(3)业务术语与数据仓库或数据集市之间的映射信息,便于面向业务的数据存取,如用业务数据来代替专业的查询语言SQL。(4)对预定义查询、报表和数据立方体的理解,与此相关的元数据还有数据负贵人、数据所有者、创建时间、更新频率、相应的主题和业务领域等。(5)数据挖掘,由于业务元数据通常明确地描述了语义关联和专有的业务概念层次关系,因此,基于元数据的假设、生成和结果过滤可以支持数据挖掘。2MDC的OIM和OMG的CWM的比较与分析2.1元数据标准化的必要性典型的数据仓库和业务分析环境通常都是根据信息供应链ISC(InformationSupplyChain,Kimbal1996)来描述的。这个比喻反映了在该环境中信息流动的实际情形:从源头(即原始数据的提供者)流出,通过一系列的精练过程,最终产生对企业决策者具有很大战略价值的信息产品。而每一个精练过程都是通过使用一个或多个与该步骤特定目标相关的软件产品来实现的。为了有效地实现一个ISC,其各阶段的不同的软件工具和产品都要依赖元数据来描述它们需要处理和转换的数据,所以对该数据的元数据必然要有一个共同的理解,也就是元数据应集成。在元数据没有标准化之前,我们是通过建立元数据桥来实现拥有不同元数据的工具间的集成。元数据桥是一种能够将一个产品的元数据转换成另一个产品所要求的格式的软件。元数据桥的构造不仅必须具备与其集成的每个产品的元数据结构和接口的详细知识,而且,还要掌握不同模型如何互相映射的知识。更复杂的是,需要对每一对产品类型都建立一个元数据桥,桥的这种不可重用性,大大降低了数据仓库的投资回报。如果有了元数据的存储和交换标准,每个软件产品只需要实现一个元数据适配器(软件层)来取代元数据桥。这个元数据适配器对每一个指定的产品都只需创建一次,因为所有的产品都使用公共的元数据标准。2.2元数据标准化的发展早在1993年,电子信息组织EIG就发布了计算机辅助软件工程数据交换格式CDIF。随后的两三年相继有多个研究机构发布了相关的标准。到1996年,元数据联盟MDC发布了元数据交换规范MDISV1.0。MDIS定义了一种与特定产品无关的元数据交换机制,支持MDIS的工具之间能自由地进行元数据交换。与此同时,微软公司也联合了其他一些合...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供参考,付费前请自行鉴别。
3、如文档内容存在侵犯商业秘密、侵犯著作权等,请点击“举报”。

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

客服邮箱:

biganzikefu@outlook.com

所有的文档都被视为“模板”,用于写作参考,下载前须认真查看,确认无误后再购买;

文档大部份都是可以预览的,笔杆子文库无法对文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;

文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为依据;

如果您还有什么不清楚的或需要我们协助,可以联系客服邮箱:

biganzikefu@outlook.com

常见问题具体如下:

1、问:已经付过费的文档可以多次下载吗?

      答:可以。登陆您已经付过费的账号,付过费的文档可以免费进行多次下载。

2、问:已经付过费的文档不知下载到什么地方去了?

     答:电脑端-浏览器下载列表里可以找到;手机端-文件管理或下载里可以找到。

            如以上两种方式都没有找到,请提供您的交易单号或截图及接收文档的邮箱等有效信息,发送到客服邮箱,客服经核实后,会将您已经付过费的文档即时发到您邮箱。

注:微信交易号是以“420000”开头的28位数字;

       支付宝交易号是以“2024XXXX”交易日期开头的28位数字。

确认删除?