2015/08/24

ETL

Por sus siglas en inglés Extract, Transform y Load, o Extraer, Transformar y Cargar es un proceso diseñado para obtener datos de diferentes fuentes ( como bases de datos en SQL SERVER, MySQL, ORACLE, entre otros; archivos de textos plano, archivos XML, archivos EXCEL ), manipularlos a través de conversiones de tipos de datos, aplicar filtros, limpieza de datos, unión de las diferentes fuentes de información, y cargarlos en una base de datos en común. Además se pueden realizar otras tareas como mantenimiento de bases de datos, envío de correos, monitoreo de servicios, entre otras.
Existen muchas herramientas para realizar una ETL, para el caso de SQL SERVER utilizaremos SQL SERVER DATA TOOLS que incluye el SQL SERVER INTEGRATION SERVICES, esta herramienta en SQL SERVER 2014 ya no se incluye en la instalación por lo que es necesario descargar de la siguiente liga:


Y con esto ya podemos acceder a la herramienta para poder crear nuestros paquetes DTSx

Al abrir la herramienta nos encontraremos con algo así
Crearemos un nuevo proyecto

Y así es como lucirá nuestro ambiente de desarrollo:

Con algunas ventanas que las mantengo escondidas pero que les mostraré cuales son las más comunes:

VARIABLES

Sirven para modificar las propiedades de algunos objetos de SSIS, para almacenar información que podrá ser utilizada posteriormente, generar expresiones, utilizar como contadores de algún bucle entre algunas otras cuestiones.

SERVER EXPLORER

Funciona para realizar conexiones a bases de datos.
SSIS TOOLBOX

Contiene los objetos que podemos utilizar en la generación de un ETL.

SOLUTION EXPLORER

Muestra los archivos que están contenidos dentro de la solución o proyecto.

PROPERTIES

Muestra todas las propiedades de cada objeto o componente.

También para el área de trabajo incluye unas pestañas que son importantes

CONTROL FLOW

Es el área de trabajo de nuestro ETL. Es donde serán arrastrados los objetos de la ventana SSIS ToolBox

DATA FLOW

Esta área de trabajo es para los objetos DATA FLOW TASK, cuando ingresamos en esta pestaña, los objetos del SSIS ToolBox cambian.

PARAMETERS

Aquí es donde podremos indicar los parámetros para nuestro ETL, con algunas limitantes, que luego detallaré.


EVENT HANDLERS

En esta parte podemos manejar o controlar algunos errores que nuestro ETL pudiera generar.

PACKAGE EXPLORER

Podemos observar de una forma jerárquica o de árbol, los componentes de nuestro ETL.

En posteriores artículos explicaré y mostraré algunos problemas con los que me he encontrado.

SALUDOS



COMPARTE ESTA INFORMACION SI TE PARECIO INTERESANTE

0 comentarios:

Publicar un comentario