Processo de modelagem de Data Warehouse

Este artigo apresenta como devemos proceder para definirmos uma base para um data warehouse. Será apresentado um estudo de caso referente a um DW de seguro de vida com foco nas informações dos clientes.

Fique por dentro
A construção de ambientes baseados em um Data Warehouse é complexa e demasiadamente diferente da forma como a fazemos com as tradicionais bases de dados relacionais.

Este artigo o instruirá nesse processo de migração, explicando todos os passos necessários para criação de um Data Warehouse, partindo desde do entendimento das fontes de dados, sua extração e transformação, até a criação da base DW propriamente dita.

Para apoiar este entendimento, será apresentado um estudo de caso referente a um DW de seguro de vida com foco nas informações dos clientes.

Em grandes organizações, e cada vez mais em pequenas também, é necessário que informações coerentes e confiáveis possam ajudar o administrador a tomar decisões que podem mudar uma ou mais estratégias para que a corporação cresça ou saia de alguma situação incômoda. Essas informações devem ser sucintas e objetivas, mostrando apenas os dados relevantes ao gestor, que não tem tempo para perder analisando dados transacionais.

É preciso entender que relatórios operacionais são diferentes de relatórios gerenciais. Pensando desta forma, devemos saber que:

· Relatório Operacional: São informações geradas a partir da base de dados do sistema transacional/relacional. São dados que informam qual o estoque atual da empresa, qual o valor de cada item do estoque, qual o apontamento de horas de um funcionário, qual a folha de pagamento de um determinado mês e etc.

· Relatório Gerencial: É baseado em informações que ajudam um gestor a tomar uma decisão e a origem deste dado deve vir de uma base tratada, que possa reunir dados de um ou mais sistemas, sendo que os dados são agrupados por assunto e devidamente estruturados.

Uma base de dados para data warehouse é diferente do modelo de dados relacional. A arquitetura dos dados muda um pouco, pois dependemos de mais de uma estrutura de base de dados para chegarmos em uma base de data warehouse, conforme pode ser observado na Figura 1.

Figura 1. Estrutura e processo de geração de uma base de dados DW.

A mesma figura mostra a origem dos dados, a extração e o tratamento, passando pelos ambientes de dados intermediários até chegar na base de dados DW.

O desenho parece complexo, mas todas as etapas serão explicadas detalhadamente no decorrer deste artigo. O importante neste momento é entender que uma base de dados de DW tem sua origem a partir de diversos sistemas, tendo a possibilidade de estar em SGBDs diferentes.

A partir das diferentes bases de dados, é iniciado um processo ETL de extração e tratamento dos dados, chegando em uma base de dados Stage. Esta se refere a uma estrutura temporária e no formato relacional, onde as tabelas são limpas a cada nova carga.

Em seguida, chega-se à ODS que é uma estrutura de dados intermediária onde não existe a forma normalizada e serve de apoio para o último passo que é a base de dados DW, que se resume às tabelas Dimensão e Fatos. Agora vamos entender cada passo da Figura 1 detalhadamente.

Modelagem de DW

A modelagem de um data warehouse é tradicionalmente realizada de duas formas: esquema estrela e floco de neve. No esquema estrela, fazemos uso dos mesmos conceitos já utilizados no diagrama entidade relacionamento (como entidades, atributos e relacionamentos), mas nesta abordagem trabalhamos especificamente com dois tipos de tabelas:"

[...] continue lendo...

Artigos relacionados