El proceso de DataWarehouse consiste en el almacenamiento de información homogénea y fiable, en una estructura basada en la consulta y el tratamiento jerarquizado de la misma, en un entorno diferenciado de los Sistemas Operacionales.
En el siguiente cuadro mostramos las diferencias entre el sistema tradicional y el DataWarehouse.
| Sistema tradicional | DataWarehouse |
|---|---|
| Predomina la consulta | Predomina la actualización |
| Actividad operativa (diaria) | Actividad analítica y estratégica |
| Proceso puntual | Proceso masivo |
| Estabilidad | Dinamismo |
| Datos desagregados | Niveles de agregación y detalle |
| Importancia del dato actual | Importancia del dato histórico |
| Transacción instantánea | Respuesta masiva |
| Estructura relacional | Visión multidimensional |
| Usuarios de perfiles medios | Usuarios de perfiles altos |
| Explotación de la información | Explotación de la información |
| relacionada con la operativa | interna y externa relacionada |
| de cada aplicación | con el negocio |
De este modo concepto DataWarehouse (figura
) podria
ser traducido por almacén de datos.
Un DataWarehouse [9] es un documento de una empresa más allá de la información transaccional y operacional, almacenado en una base de datos diseñada para favorecer el análisis y la divulgación eficiente de datos (especialmente OLAP 4.1. No se utilitza para un almacenamiento de datos ''en vida'', sino para datos históricos y para obtener datos estadísticos sobre estos.
Los DataWarehouse almacenan habitualmente grandes montones de información que subdividen en pequeñas unidades lógicas llamadas dependent data marts.
Los dependent data marts [6] son las bases de
datos locales o departamentales (figura
) basadas en
subconjuntos de la información contenida en el DataWarehouse
central o maestro. Soportan una línea de negocio simple con las
mismas características que el DataWarehouse. Representan una
estrategia apropiada cuando el DataWarehouse central crece muy
rápidamente y los distintos departamentos requieren sólo una
pequeña porción de los datos contenidos en él.
Resulta interesante el concepto de datamining. Hace referencia a un proceso analítico que, a través del descubrimiento y cuantificación de relaciones predictivas en los datos, permite transformar la información disponible en conocimiento útil de negocio. Constituye una de las vías clave de explotación del DataWarehouse, dando sentido al contenido de la información.
Generalmente, dos ideas básicas dirigen la creación de un DataWarehouse:
Periódicamente se importan datos de sistemas ERP 4.2 y de otros sistemas software relacionados con el negocio en el DataWarehouse para su transformación posterior.