Introdução à tecnologia Data Warehouse

Veja neste artigo o que é e como funciona a Data Warehouse, tecnologia que permite o agrupamento de grandes volumes de informações otimizados para consulta.

Introdução

Com este artigo teremos como objetivo conhecer um pouco da tecnologia Data Warehouse. O Data Warehouse surgiu principalmente devido às dificuldades que muitas empresas começaram a enfrentar devido a quantidade de dados que suas aplicações estavam gerando e à dificuldade de reunir estes dados de maneira integrada para uma análise mais eficiente. A ideia, então, foi armazenar em um único local, somente os dados considerados uteis no momento de tomar decisões.

Um exemplo que podemos citar são as empresas de transporte aéreo, que através da tecnologia Data Warehouse, podem obter a informação de qual mês do ano há maior procura de voos para São Paulo, ou então, para quais locais os jovens com menos de vinte e cinco anos então viajando através dos meios aéreos.

Conseguindo essas informações em tempo hábil – podemos dizer em outras palavras, antes da concorrência- os responsáveis dessa empresa área podem dispor de voos para São Paulo no mês de maior procura e, em relação aos jovens, fica interessante a disponibilização de vantagens e algum tipo de lazer diferenciado durante a viagem.

De posse dessas informações, os executivos e usuários do Data Warehouse dispõem de mecanismo que possibilita, através de seu velho e volumoso banco de dados, extraírem dados que serão de grande utilidade e que darão maior lucratividade em médio e longo prazo.

O exemplo que mencionamos anteriormente se refere a empresas privadas, mas o Data Warehouse também pode ser usado em empresas governamentais públicas. Tendo em mãos um Data Warehouse, o secretário da saúde pode obter a informação de qual região da cidade ocorreram mais casos de dengue nos últimos dois anos, e em quais meses desse ano ocorreu o maior índice desses vírus.

Surgiram avanços na tecnologia da informação para garantir a possibilidade das empresas manipularem grandes volumes de dados e dessa forma atingirem um alto índice de integração. Dados de todos os setores de uma empresa podem estar em uma única base de dados, integrados, padronizados e resumidos para serem analisados pelos tomadores de decisões.

O que é um Data Warehouse

Segundo Willian H. Inmon (1997), que foi um dos primeiros no assunto Data Warehouse, Data Warehouse é uma coleção de dados orientados por assunto, integrado, variável com o tempo e não volátil, que tem por objetivo dar suporte aos processos de tomada de decisões.

Podemos dizer também dizer, em outras palavras, que um Data Warehouse é um banco de dados contendo dados extraídos do ambiente de produção da empresa, que foram selecionados e depurados, tendo sido otimizados para processamentos de consultas e não para processamento de transações. Em geral, Data Warehouse necessita da consolidação de outros recursos de dados, além dos armazenados em bancos de dados relacionais, incluindo informações contidas em planilhas eletrônicas, documentos de texto, etc.

Para Campos (1999): É importante considerar, no entanto, que um Data Warehouse não possui apenas dados resumidos, pode conter também dados primitivos. É importante disponibilizar ao usuário a capacidade de aprofundar-se num determinado tópico, investigando níveis de agregação menores ou mesmo dados primitivos, possibilitando também a geração de novas agregações ou correlações com outras variáveis. Além do mais, é extremamente difícil prever todos os possíveis dados resumidos que serão necessários: limitar o conteúdo de um Data Warehouse apenas a dados resumidos significa limitar os usuários apenas às consultas e analises que eles puderem antecipar diante de seus requisitos atuais, não deixando qualquer flexibilidade para nossa necessidades.

Vejamos a imagem de tabela que contém uma comparação entre as características dos bancos de dados operacionais com um Data Warehouse.


Figura 1: Tabela de comparação entre as características dos bancos de dados operacionais com um Data Warehouse

O Data Warehouse é a base do processamento dos SADs. Por possuir uma única fonte de dados integrados, e uma vez que os dados apresentam condições facilitadas de acesso e interpretação, a tarefa do analista de SAD no Data Warehouse fica incomensuravelmente mais fácil do que no ambiente clássico.

Características

Artigos relacionados