数据仓储与企业资源计划

  自从1990年“数据仓储”的术语得以介绍之后,为便于分析、决策支持,许多企业已施行了许多方法存储、利用其数据。同时,一些公司试图制定企业资源计划(ERP)以协调企业中各种共通的功能。ERP软件通常以一个中心数据库作为其枢纽,允许共享、重复有效地利用数据,而不是让数据被孤立地应用。ERP的应用在资源数据搜寻过程中已带来一场革新,中心ERP数据库已为用作分析的数据仓库的发展创造了机会。围绕着两种信息系统概念以及它们之间的交融,有一些争论与疑问。

  信息系统运行时,数据仓库是其决策支持系统的基础之一。作为无数事项处理的存储工具,数据仓库被格式化以备比较、分析。“数据仓库之父”William H.Inmon认为,数据仓库是“一种面向数据库的、完整的集合体,其中每一数据单元相对于某段时间都是特定的。数据仓库能容纳详细的、稍加概括的、高度概括的数据,以及所有用于分析与决策支持的被格式化的数据”(《建立一个数据仓库》,W.H;Wiley,1996)。在《数据仓库工具包》中,Ralph Kimball给出了一个非常简洁的定义:“专为查询、分析构建的事项处理数据的一种摹本”(《数据仓库工具包》,Kimball,R.;Wiley,2000)。两种定义都强调了数据仓库的分析功能,并着重强调了建于数据仓库中的数据的历史特征。

  ERP 软件是生产与信息系统的一种最新的补充,后两者一般用来控制自程序开始至结束的数据流。最初的生产者与最初的商人发生交易时,信息流便已存在,但是直到 ERP软件及相关程序出现,这种信息才被严重忽视,一直未被搜寻。ERP软件试图将公司所有内部流程嵌入一套普通的应用软件包中,以共享普通数据库。正是由于普通数据库,ERP充当强大数据仓库的一种资源以支持复杂的决策与分析才得以实现。

  ERP软件被分成一些运行功能区,每一功能区都包括一系列事务流程。大多数公司中最主要、最普通的运行功能区包括:市场与销售;生产与操作(材料管理, 财产目录等);帐目清算与财政;人力资源。 历史地说,以上每一个功能区中,商业领域内都已有清晰的功能分割,信息系统的发展被清晰详细地描述出来,以至系统并不共享数据或程序,对信息交叉作用的分析也不太可能。既然所有功能区相互依赖,这种分割并非一个关于商业活动的合理的解释,信息系统中的功能分割便造成了一些急待克服的人为障碍。

  公司为实现某一功能而设计、实施信息系统时,ERP软件便被用来消除障碍以共享数据与程序。ERP软件协调了全部的商业流程,并在公共数据库中储存了所有可获得的数据,从而实现了所有ERP软件包的集成应用。正如BRAdy、MONK在其《企业资源计划中的概念》一文中所解释的,在事务流程处理与报表管理中,公司应用ERP普通数据库以及管理报表工具,可节约大量成本并获取相关利润。

  然而,21世纪,由知识型员工与管理者完成的许多工作并非是事务处理或基于报表的管理,他们主要的活动是分析,这种分析由决策支持系统的应用与发展支撑着。今天的公司里,最普通的DSS的应用软件是数据仓库。随着 ERP普通数据库以及DSS/DW用户支持产品的实施,企业可设计一个决策支持/数据存储数据库,借助它完成交互功能区的分析与比较,从而达到方便决策的目的。

  除流行的应用软件外,由于企业经常实施一个ERP系统,因此从众多数据资源到数据仓库的数据集成成为一个难题。事实上,随着ERP的实施,不管企业是否计划去发展一个数据仓库,多个数据资源的存在都是一个问题;在ERP工程开始阶段,为避免多重数据源的复杂性,这个问题必须得以处理、解决。在数据库发展中,数据通常从最可靠或最稳定的数据资源系统中获取,在需要时则移动到数据仓库中去。正确的资源系统的鉴别对于任何数据仓库的发展都具有根本的意义,对于包含ERP系统以及许多旧有处理系统的数据仓库来说就更为关键。来自多种数据源的数据集成(ERP及其他一些数据库)需要极为重视元数据及商业逻辑,因为后两者移植了源数据元素,如此正确的数据源才得以选择。

  另一个关于ERP数据的麻烦是对历史数据的需要。就以往来说,企业数据仓库需要历史数据(见Inmon解说)。但按照先例,ERP技术并不储藏历史数据, 在企业数据仓库中至少如此。当大量的历史数据在ERP环境中累积时,ERP环境常被净化,或者数据被存于远程的储藏工具中。例如,假定一个企业数据仓库需要5年之久的历史数据作储备,而ERP仅仅拥有顶多相当于6个月价值的数据时,以上情况便常发生。随着时间流逝,只要企业满意于历史数据的搜集,ERP充作数据仓库的一种资源就没有问题。但当企业数据仓库带进先前未被ERP搜集与保存的历史数据 时,使用ERP作为数据仓库的主要资源就不太可行了。

  在 ERP环境中建立数据仓库时,ERP中的元数据是另一个必须考虑的事项。元数据从ERP传输到数据仓库环境,必须被转换成数据仓库基础结构所要求的格式与结构。在元数据与DSS/DW数据中间有一个显著的差别:前者主要针对开发者与程序员,而后者针对的则是最终使用者。存在于ERP应用软件数据库中的元数据必须被转换,这一转换并不容易,它需要极富经验的数据管理员及使用者共同的努力。

  MR Inmon就使用ERP数据库提出了一些指导方针。其中一条建议是要有一个可靠的接口,可以将数据从ERP环境移到数据仓库环境中。ERP与企业数据仓库的接口需要达到以下目标:

  1、易用

  2、能访问ERP数据

  3、理解传输进数据仓库的数据的意义

  4、访问ERP数据时意识到可能存在于ERP中的限制

  5、明白所指的完整性

  6、明白等级关系

  7、明白逻辑定义的、固有的关系

  8、了解应用软件的协议

  9、 明白ERP支持的数据结构

  10、能高效地访问数据,并且支持:

  (1)支持直接数据移动

  (2)改变数据保存状态

  11、及时支持访问ERP数据

  12、理解数据的格式

  总之,作为信息系统理论更新的重要因素,数据仓库的发展及ERP的产生必须由有经验的信息系统专家处理、解决,并对每种环境的挑战都有一种非常清晰的理解。如果数据被格式化用以查询或汇报,如果ERP环境与一个组织的决策支持协调一致,ERP数据集成到数据仓库便可形成一个庞大的数据源用做分析或决策。忽视来自ERP的数据与信息的价值就是忽视全部的资源,而数据仓库正以此为基础。

未经允许不得转载:金蝶精斗云 » 数据仓储与企业资源计划