Data Warehouse ou Data Mart, por onde começar?

Uma das principais dúvidas no início de um projeto sistemas de suporte à decisão: O que criar primeiro, um Data Warehouse ou um Data Mart?

Data Warehouse é um conjunto de dados orientado para o assunto, integrado, não volátil, variante ao tempo, no apoio de decisões gerenciais. (Bill Inmon, em seu livro Building the Data Warehouse). Tem como foco a organização como um todo, englobando várias áreas de assunto, consequentemente criando Data Marts que se relacionam entre si.

Um Data Warehouse é construído definindo um modelo de dados empresarial, apresentando as principais entidades e seus relacionamentos. Mesmo que o preenchimento de todas as entidades não seja feito de forma simultânea, o relacionamento entre elas já estará definido, facilitando posteriormente o cruzamento de informações entre as áreas de assunto. Neste modelo a apresentação de resultados aos usuários levará mais tempo, pois a prioridade está em definir todos os relacionamentos, para depois montar os Data Marts com os dados relevantes para cada departamento.

Data Mart

É um pequeno data warehouse, abrangendo uma determinada área de assunto e oferecendo informações mais detalhadas sobre o mercado (ou departamento) em questão.

Um Data Mart pode ser criado de duas maneiras:

  1. Capturando dados diretamente de sistemas transacionais, cada Data Mart buscando as informações relevantes para o seu mercado;
  2. Capturando dados de todos os sistemas transacionais em um Data Warehouse central, que por sua vez alimenta todos os Data Marts.

A primeira opção irá fornecer um Data Mart de forma mais rápida, porém sem levar em consideração o cruzamento de informações entre as demais áreas de assunto. A segunda opção tende a ser mais eficiente, porém demandará mais tempo para apresentar resultados.

Construa Pouco Pensando Grande

Como nenhuma organização que investe numa solução de Data Warehouse quer aguardar a conclusão total do projeto para obter resultado do mesmo e também não quer abrir mão da qualidade deste resultado simplesmente por uma maior agilidade, o ideal é começar a definir o Data Warehouse empresarial lógico, apresentando apenas as principais entidades e seus relacionamentos na organização. Em seguida, defina uma área de assunto e desenvolva a arquitetura para preencher essa área. Determine se as consultas podem ocorrer diretamente no Data Warehouse ou se os dados relevantes devem ser movidos para um Data Mart. Se for necessária a construção de um Data Mart, os dados serão obtidos a partir do Data Warehouse e não dos sistemas transacionais, agilizando o processo de consulta, pois não será necessário acessar os sistemas transacionais novamente.

Em resumo, defina um Data Mart, mas invista tempo para entender como ele se encaixa em uma arquitetura de Data Warehouse em nível organizacional, possibilitando a inclusão de novos Data Marts ao Data Warehouse sem deixar de oferecer o relacionamento entre as áreas de assuntos da empresa.

Destaque Guia do Programador Android
Fonte:
  • Livro: Oracle Data Warehouse
  • Autores: Michael Corey, Michael Abbey, Ian Abramson e Bem Taub
  • Editora: Oracle Press

Artigos relacionados