Data Warehouse
1¿Que es Data Warehouse?
Es
un proceso,
no un producto.
Es una técnica para consolidar y administrar datos de variadas fuentes
con el propósito de responder preguntas de negocios y tomar decisiones, de una
forma que no era posible hasta ahora.
Desde el
punto de vista de la construcción de un Data Warehouse, podemos decir que es
una colección de base de datos integradas, no volátil que ayuda a la toma de
decisiones donde cada unidad de datos es relevante en un momento de tiempo.
2¿Qué es un Datamart?
Es un
subconjunto de una bodega de datos para un propósito específico.
Es un
almacén de datos históricos relativos a un departamento de una organización,
así que puede ser una copia de parte de un datawarehouse para uso
departamental.
3¿Cómo se construye un DataWarehouse?
El Proceso
de arquitectura de un datawarehouse puede ser vista como un proceso de cuatro
pasos:
-Fuentes
(Externas/Internas)
-Extracción
(Monitor)
-Integrador
-DW
El proceso
de construcción es el encargado de llevar la información de las fuentes de
datawarehouse.
La
extracción lo que hace es recuperar los datos de las fuentes, el extractor es
un componente de software que traduce datos del formato de las fuentes a un
formato arbitrario, así es que el
extractor limpia los datos y los escribe en formatos específicos del
datawarehouse.
La
integración tiene como objetivo, integrar los datos provenientes de múltiples
fuentes para finalmente integrarlos en
el datawarehouse.
4¿Qué es OLAP?
(Procesamiento
analítico en Línea), Es una solución utilizada en el campo de la Inteligencia de
Negocios (Business Intelligence), la cual consiste
en consultas a estructuras multidimensionales (o Cubos OLAP)
que contienen datos resumidos de grandes Bases
de Datos o Sistemas Transaccionales (OLTP). Se usa en
informes de negocios de ventas, marketing, informes de dirección, minería de datos y áreas similares.
5¿Cual es la diferencia con OLTP?
La razón
por el cual se utiliza OLAP, es por la velocidad de respuesta que da para las
consultas, de selección, en contraposición de con OLTP, que es la mejor opción
para hacer inserciones, modificaciones y
eliminación de datos.
6¿Qué es una base
de datos multidimensional?
Las bases
de datos multidimensionales se utilizan principalmente para crear aplicaciones OLAP y podemos
pensarlas como bases de datos de una sola tabla, su
peculiaridad es que por cada dimensión
tienen un campo y
otro campo por
cada métrica
o hecho.
7¿Qué es un cubo?
Un cubo es
una estructura multidimencional que almacena información, cada cara del cubo es
información.
Es la
instancia de un modelo de datos multidimencionales, un modelo multidimencional
soporta el manejo de una bata cantidad de datos empresariales y temporales.
8¿Qué operaciones soporta un cubo?
Un Cubo
soporta 3 Dimensiones y n
operaciones.
9¿Qué topología existe para construir una base de
datos dimensional?
Las
topologías que existen son
-Copo de Nieve
-Esquema
Estrella
10¿Qué es una dimensión?
Una
dimensión son valores reales que se necesita para describir cualquier punto en
el espacio.
11¿Qué es una tabla de Hechos?
Es la tabla
central en un esquema dimensional y contiene los valores de la medida de
negocio.
12¿En base al ejemplo que plantee el disertante
identifique cuales son las tablas de hechos?
Las tablas
de hechos según el ejemplo son dos: Tipo de aportación y ubicación, esta se
divide en tres tablas calle, zona y barrio.
13¿Metodología que existe para construir una
Datawarehouse?
La
metodología CRISP es un proceso jerárquico formado por varias tareas que ofrece
a las organizaciones la estructura necesaria para obtener mejores y más rápidos
resultados en la minería de datos