Zusammenfassung der Ressource
Data Warehouse: conceitos básicos
- Data
Warehouse
- Definição
- Kimball: Conjunto de ferramentas e técnicas de projeto que,
aplicadas aos interesses dos usuários e aos BDs, permitirão o
planejamento e construção de um DW
- Laudon&Laudon: Banco de dados, com ferramentas de
consulta e relatório, que armazena dados atuais e históricos
para fins de análises
- Inmon: Coleção de dados orientada por assunto, integrados,
variáveis com o tempo e não voláteis para suportar tomada
de decisão
- Características
- Orientação por assunto
- Armazena informações sobre temas específicos
importantes para o negócio da empresa
- Integração
- Refere-se a consistência de dados:
Nomes, Unidades e variáveis
- Faz mapeamento de dados em
um único padrão
- Exemplo: Toda informação de sexo
será mapeada para F/M
- Não
volatilidade
- Permite apenas carga
inicial e consulta aos dados
- Após integração e transformação de dados,
eles ficam disponíveis para acesso
- Não permite atualizações como
em ambientes operacionais
- Variante no tempo
- Um registro se refere a algum
momento específico no tempo
- Dados não são atualizados
- Caso haja uma mudança no dado,
uma nova entrada é inserida
- Contém snapshots dos
dados
- Granularidade
- Nível de detalhamento ou
resumo dos dados
- Quando maior a granularidade,
menor o nível de detalhe
- Credibilidade dos dados
- Tipos de Data warehouses
- Data Mart
(DM)
- Um subconjunto de um Data
Warehouse
- Tipos de DM
- Dependente
- Um subjconjunto criado diretamente de um
DW, o que requer que o DW seja construído
primeiro
- Vantagens
- Usa um modelo de dados
consistente
- Fornecimento de dados de
qualidade
- Garante que o usuário final está vendo a mesma
versão dos dados armazenados para todos os
usuários do DW
- Independente
- Não se origina de um DW já
existente
- Concebido para uma unidade estratégica
de negócios ou um departamento
- Geralmente constituído de uma única área
temática: Marketing, Operações
- Volátil
- Em um DW, dados só são alterados quando
de uma carga feita de forma errada
- Um DM é mais frequentemente modificado
por ser baseado em aplicações
- Data Warehouse Empresarial (EDW)
- DW de larga escala usado por toda
organização
- Congrega informações de
diversas fontes de dados
- Requer um compromisso
enorme de recursos
- Usado para decisões de
médio e longo prazo
- Armazenamento de dados
operacionais
- Banco de dados protótipo
para um DW
- Diferente de um DW, seu conteúdo é atualizado
durante todo curso das operações de negócio
- Usado para decisões de curto prazo
envolvendo aplicações de missão
crítica
- Subconjunto definido no tempo
- Exemplo: apenas os dados
desta semana
- Kimball x Inmon
- Kimball
- Defensor da abordagem
bottom-up
- Construção de data marts orientados
por assuntos
- Tabelas Fato e Dimensões são os pontos de
conexão para criação do DW a partir dos
DMs
- Seu modelo é batizado de Data
Warehouse Bus Architecture
- Criador do conceito star
schema
- InmoN
- Defesor da abordagem Top-dowN
- Construção de um Data warehouse
modelando toda empresa
- Modelo corporativo
único
- Construção posterior dos
data marts
- Por assuntos ou departamentais
- Ponto de partida seriam os Corporate
Information Factory - CIFs
- Uma infraestrutura ideal para
ambientar os dados da empresa
- Seriam alimentados pelos
sistemas transacionais