Extract, transform and load (ETL)

Beschreibung

Mindmap am Extract, transform and load (ETL), erstellt von Jonathan Vargas Roa am 13/04/2014.
Jonathan Vargas Roa
Mindmap von Jonathan Vargas Roa, aktualisiert more than 1 year ago
Jonathan Vargas Roa
Erstellt von Jonathan Vargas Roa vor mehr als 10 Jahre
170
0

Zusammenfassung der Ressource

Extract, transform and load (ETL)
  1. Es el Proceso que permite a las Organizaciones mover Datos desde multiples fuentes
    1. Extraer
      1. La extración convierte los datos a un formato preparado para iniciar el proceso de transformación
        1. Analizar los datos Extraídos
          1. Causar un impacto mínimo en el sistema origen
      2. Transformar
        1. Fase de transformación, aplica una serie de reglas de negocio o funciones sobre los ddatos extraídos
          1. Traducir Códigos
            1. Codificar valores Libres, Transponer, Dividir una columna en varias datos
              1. Obtener nuevos valores calculados
                1. Calcular totales de múltiples filas de datos
                  1. Generación de campos clave en el destino
        2. Cargar
          1. Momento en el cual los datos de la fase anterior(transformación) son cargados en el sistema de destino
            1. En algunas bases de datos se sobre escribe la información antigua con nuevos datos
              1. 2 Formas de procesos de carga
                1. Acumulación Simple
                  1. Consiste en realizar un resumen de todas las transacciones comprendidas en el periodo de tiempo selecionado
                  2. Rolling
                    1. Se almacena información resumuda a distintos niveles, correspondientes a distintas agrupaciones de la unidad de tiempo diferentes niveles jerarquicos
          2. Procesamiento paralelo
            1. De Datos
              1. Consiste en dividir un único archivo secuencial en pequeños archivos de datos para proporcionar acceso paralelo
              2. De segmentación (pipeline)
                1. Permite el funcionamiento simultaneo de varios componentes en el mismo flujo de datos
                2. De componentes
                  1. Consiste en el funcionamiento simultaneo de múltiples procesos en diferentes flujos de datos
                3. Desafios
                  1. Los procesos ETL pueden ser muy complejos
                    1. Un sistema ETL mal diseñado puede provocar importantes problemas operativos
                      1. Es un sistema operacional el rango de valores de los datos o la calidad de éstos pueden no coincidir con las expectativas de los diiseñadores a la hora de especificarse las reglas de validación o transformación
                        1. El proceso ETL es clave para lograr que los datos extraídos asíncronamente de orígenes heterogéneos
                  2. Herramientas ETL
                    1. XMLoader http://www.analitica.com.co/website/productos-analitica/xmloader
                      1. Microsoft SQL Server Integration Services (SSIS) (a partir de MS SQL Server 2005)
                      Zusammenfassung anzeigen Zusammenfassung ausblenden

                      ähnlicher Inhalt

                      Lern-Fitness-Test aus der Bestnote
                      Studienstrategie
                      Aufbau Quellenanalyse
                      barbara91
                      Einführung für GoConqr - Ausführlich
                      Laura Overhoff
                      [Geschichte] Nachkriegsdeutschland - Die Stunde null
                      Marcel Pabst
                      Netzwerktechnik
                      DFairy
                      Vetie - Radiologie Übungs-K
                      Fioras Hu
                      Vetie Radiologie 2013
                      Péroline de Gail
                      GESKO A PR WS 2018/19
                      Caroline Hannah
                      METH QUANTI SS 2019
                      Caroline Hannah
                      Vetie Viro 2017
                      sylva Heise