miércoles, 30 de enero de 2013

Data Warehouse


Data Warehouse




1¿Que es Data Warehouse?
Es un proceso, no un producto. Es una técnica para consolidar y administrar datos de variadas fuentes con el propósito de responder preguntas de negocios y tomar decisiones, de una forma que no era posible hasta ahora.
Desde el punto de vista de la construcción de un Data Warehouse, podemos decir que es una colección de base de datos integradas, no volátil que ayuda a la toma de decisiones donde cada unidad de datos es relevante en un momento de tiempo.

2¿Qué es un Datamart?
Es un subconjunto de una bodega de datos para un propósito específico.
Es un almacén de datos históricos relativos a un departamento de una organización, así que puede ser una copia de parte de un datawarehouse para uso departamental.

3¿Cómo se construye un DataWarehouse?
El Proceso de arquitectura de un datawarehouse puede ser vista como un proceso de cuatro pasos:
-Fuentes (Externas/Internas)
-Extracción (Monitor)
-Integrador
-DW
El proceso de construcción es el encargado de llevar la información de las fuentes de datawarehouse.
La extracción lo que hace es recuperar los datos de las fuentes, el extractor es un componente de software que traduce datos del formato de las fuentes a un formato arbitrario,  así es que el extractor limpia los datos y los escribe en formatos específicos del datawarehouse.
La integración tiene como objetivo, integrar los datos provenientes de múltiples fuentes para finalmente integrarlos  en el datawarehouse.
4¿Qué es OLAP?
(Procesamiento analítico en Línea), Es una solución utilizada en el campo de la Inteligencia de Negocios (Business Intelligence), la cual consiste en consultas a estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes Bases de Datos o Sistemas Transaccionales (OLTP). Se usa en informes de negocios de ventas, marketing, informes de dirección, minería de datos y áreas similares.

5¿Cual es la diferencia con OLTP?
La razón por el cual se utiliza OLAP, es por la velocidad de respuesta que da para las consultas, de selección, en contraposición de con OLTP, que es la mejor opción para hacer  inserciones, modificaciones y eliminación de datos.

6¿Qué es una base  de datos multidimensional?
Las bases de datos multidimensionales se utilizan principalmente para crear aplicaciones OLAP y podemos pensarlas como bases de datos de una sola tabla, su peculiaridad es que por cada dimensión tienen un campo y otro campo por cada métrica o hecho.

7¿Qué es un cubo?
Un cubo es una estructura multidimencional que almacena información, cada cara del cubo es información.
Es la instancia de un modelo de datos multidimencionales, un modelo multidimencional soporta el manejo de una bata cantidad de datos empresariales y temporales.

8¿Qué operaciones soporta un cubo?
Un Cubo soporta 3 Dimensiones y  n operaciones.

9¿Qué topología existe para construir una base de datos dimensional?
Las topologías que existen son
-Copo  de Nieve
-Esquema Estrella



10¿Qué es una dimensión?
Una dimensión son valores reales que se necesita para describir cualquier punto en el espacio.

11¿Qué es una tabla de Hechos?
Es la tabla central en un esquema dimensional y contiene los valores de la medida de negocio.

12¿En base al ejemplo que plantee el disertante identifique cuales son las tablas de hechos?
Las tablas de hechos según el ejemplo son dos: Tipo de aportación y ubicación, esta se divide en tres tablas calle, zona y barrio.

13¿Metodología que existe para construir una Datawarehouse?
La metodología CRISP es un proceso jerárquico formado por varias tareas que ofrece a las organizaciones la estructura necesaria para obtener mejores y más rápidos resultados en la minería de datos