[中图分类号]TP311.52[文献标识码]A 当前许多企业,因为内部部门缺乏沟通,或开发时间上的差异,采用了不同的技术开发数据信息系统。这些系统彼此独立,数据不能交流或共享,形成一个个的"信息孤岛",大大降低了数据的应用和企业的工作效率。 数据集成技术可以将这些相互独立的数据系统中的数据,通过统一的应用标准和数据结构,进行整合,从而使各个系统或不同的用户可以对数据进行有效的访问。 所以使用数据集成技术,统一数据平台,与各个异构数据库数据进行交互,是解决企业现有问题的主要手段。 1数据集成技术的好处 1.1降低企业内的信息系统存储数据、维护数据的成本。 1.2提高企业用户使用数据的效率,加快企业进行决策和运营的效率。 1.3充分利用现有的数据系统进行数据集成,降低数据整合的成本,加快数据整合的速度。 2数据集成分类 2.1基本数据集成 在对基本数据集成时,数据异构问题是最难解决的问题之一。如果同一个实体对象存在于多个异构的数据源中,由于其名称、定义或数据类型等不一致,还有对同一个对象描述的内容不一致,甚至无法确定这些实体对象是否是同一个实体时,就可以采取以下方法进行处理: 2.1.1分离。在无法确定的情况下,对每次遇到的实体对象都分配一个唯一标识符。 2.1.2合并。分辨出哪些实体对象实际上是同一实体对象,然后将这些实体对象进行合并。如果一个目标数据对应多个数据源,则还要指定发生冲突时,哪个数据源占据主导地位。 如果出现数据丢失,则需要产生一个接近实际数据的估算值来代替丢失的数据。 2.2多级视图集成 在进行数据集成时,还需要集成各个数据源之间的关系,这就要使用多级视图来进行。基本的数据存在于单个的数据源中,是数据的来源根本;中间视图则是符合公共模型格式的数据视图;综合视图是对中间视图数据的进一步整理和导出。 2.3模式集成 在异构数据源中存在多个数据库系统时,就需要进行模式集成。模式集成可以将异构数据源中不同的模式集成为一个统一的模式。 2.4数据粒度的集成 数据粒度指的是在数据库设计过程中,数据保存的综合程度或细化程度。数据保存的精度越低,数据综合程度就越高,粒度就越大。反之,数据保存的精度越高,数据细化程度就越高,粒度就越小。 3数据集成架构
3.1单系统数据集成架构 |