Normalização e desnormalização de dados

Por que eu devo ler este artigo:Este artigo trata de técnicas de normalização de dados para implementação de um modelo de dados considerando um banco de dados relacional. Trata também da técnica de desnormalização de dados para obter ganhos de performance em bancos de dados relacionais. A normalização de dados é uma etapa importantíssima na modelagem de um banco de dados relacional que garante principalmente a eliminação de redundâncias indesejadas, enquanto a desnormalização de dados se aplica à construção de algumas redundâncias de dados que, em termos práticos, contribuirão para o ganho de performance geral do banco de dados relacional.

No momento da modelagem de dados, o processo de normalização irá evitar que dados sejam duplicados desnecessariamente gerando certas perdas de performance geral do banco de dados bem como consumo excessivo de espaço em disco para armazenamento de dados. Em contrapartida a desnormalização, apesar de apresentar o efeito colateral da redundância de informações, permite que a performance geral do banco de dados seja significativamente melhorada fazendo com que, por exemplo, menos junções entre tabelas sejam necessárias para o retorno de determinada informação.

Uma das etapas primordiais no projeto de bancos de dados é a normalização de dados. Esta técnica permite, entre outras coisas, evitar a duplicidade de informações, garantindo uma economia de espaço de armazenamento e também tornando o modelo de dados mais simples e fácil de gerenciar. Esta técnica é composta por um conjunto de regras que definem a metodologia de normalização e cada conjunto de regra forma uma camada de normalização. Basicamente, as camadas de normalização são 5 onde chamamos cada uma delas de Forma Normal, portanto teremos a 1ª, 2ª, 3ª, 4ª e 5ª Formas Normais. A aplicação de todas as formas normais é uma característica marcante em ambientes acadêmicos, mas que, na prática, podem causar problemas sérios de performance geral do banco de dados devido à necessidade de junções excessivas para se encontrar determinada informação. Para evitar este problema, algumas dicas são apresentadas nesta primeira parte do artigo e, uma abordagem mais “hard core” será apresentada na segunda parte, que é a Desnormalização de dados.

Ver mais

Em minhas “andanças” pela internet, encontrei dois artigos fantásticos escritos por Gavin JT Powell falando exatamente sobre normalização e desnormalização, porém de uma forma bastante informal. São dois artigos realmente interessantes que auxiliam muito no entendimento deste “bicho de sete cabeças” e me senti na obrigação de escrever este artigo, com base nestes dois, para compartilhar com o leitor estas pérolas que encontrei.

Modelos de dados para um banco de dados relacional envolvem a necessidade de remoção de duplicidades e, para atingir este objetivo, usamos um processo chamado de “normalização”. Este processo é composto por um conjunto de regras conhecidas como “formas normais” (ou simplesmente “FN”).

A normalização é aplicada a um conjunto de dados ou tabelas em um banco de dados relacional, enquanto as tabelas são utilizadas para armazenar diretamente os dados associados a ela. As tabelas podem ser relacionadas ou ligadas entre sí através de índices identificadores. Este índice identificador é usado para identificar a linha de dados da mesma forma que um índice tradicional em um livro. Veja que o índice é usado para encontrar uma determinada informação de interesse sem a necessidade de leitura de todo o livro.

Basicamente existem 5 níveis de normalização conhecidos como 1ª, 2ª, 3ª, 4ª e 5ª formas normais (ou 1FN, 2FN, 3FN, 4FN e 5FN) e cada uma das formas normais é um refinamento da forma normal anterior, ou seja, para dizermos que o modelo se encontra na 2ª forma normal, entende-se que este modelo também atende as regras da 1ª forma normal.

Quando desenhamos uma tabela considerando a performance do SGBDr (Sistema de Gerenciamento de Banco de Dados Relacional), é comum ignorar os primeiros passos da normalização e pular diretamente para a 2FN. A 3FN também é muitas vezes ignorada, a não ser que junções muitos-para-muitos (n:m), no nível da aplicação, necessitem demasiadamente de valores únicos. As 4FN e 5FN também são raramente usadas.

Vale lembrar que a normalização excessiva pode ser a causadora de perda considerável de performance tanto para ambientes de banco de dados transacionais (conhecidos como OLTP – OnLine Transational Processing, ou Processamento Transacional em Tempo Real) (ver Nota 1) quanto para ambientes de bancos de dados analíticos (conhecidos como OLAP – OnLine Analitical Processing, que significa Processamento Analítico em Tempo Real ou também como DSS – Decision Support System, que significa Sistema de Suporte a Decisão ou ainda os famosos DatawareHouse) (ver Nota 2).

Nota 1: OLTP

Online transaction processing (Processamento de transações em tempo real), ou OLTP, refere-se a uma classe de sistemas que facilitam o gerenciamento de aplicações orientadas a transações, normalmente para a entrada de dados e processamento de transações de recuperação. O termo é um pouco ambíguo, alguns entendem uma "transação" no contexto de operações de computador ou banco de dados, enquanto outros definem em termos de negócios ou transações comerciais. OLTP também tem sido utilizada para se referir ao processamento no qual o sistema responde imediatamente a pedidos do usuário.

OLTP é uma metodologia para fornecer aos usuários finais o acesso a grandes quantidades de dados em uma forma intuitiva e rápida para ajudar com as deduções com base em raciocínio investigativo.

Em aplicações de grande porte, sistemas OLTP eficientes podem depender de um sofisticado software de gerenciamento de transações e / ou táticas de otimização de banco de dados para facilitar o processamento de um grande número de atualizações simultâneas para um banco de dados orientado a OLTP.

Para ainda mais exigentes sistemas de banco de dados descentralizados, programas de intermediação de OLTP podem distribuir o processamento de transações entre vários computadores em uma rede. OLTP é muitas vezes integrado em arquitetura orientada a serviços (SOA) e Web Services.

Nota 2: OLAP

Em computação, processamento analítico em tempo real, ou OLAP, é uma abordagem para responder rapidamente consultar analíticas multidimensionais. OLAP é parte da categoria mais ampla de inteligência de negócios, que também abrange relatórios relacionais e mineração de dados.

Aplicações típicas de OLAP são relatórios de negócios para vendas, marketing, relatórios gerenciais, business process management (BPM)(processo de gerenciamento de negócio), orçamento e previsão, relatórios financeiros e áreas similares, e também para novas aplicações que estão surgindo, como os de agricultura. O termo OLAP foi criado como uma ligeira modificação do tradicional banco de dados OLTP (online Transaction Processing).

Ferramentas OLAP permitem que os usuários, de forma interativa, analisem dados multidimensionais através de múltiplas perspectivas. OLAP é composta por três operações básicas de análise: consolidação, drill down, e fatiamento. Consolidação envolve a agregação de dados que podem ser acumulados e computados em uma ou mais dimensões. Por exemplo, todos os escritórios de vendas são acumulados para o departamento de vendas ou divisão de vendas para antecipar as tendências de vendas. Em contraste, o drill down é uma técnica que permite aos usuários navegar através dos detalhes. Por exemplo, os usuários podem acessar as vendas por produtos individuais que compõem as vendas de uma região. Fatiamento é um recurso pelo qual os usuários podem tirar (cortar) um conjunto específico de dados do cubo e ver as fatias de diferentes pontos de vista.

Bancos de dados configurados para OLAP usam um modelo de dados multidimensional, permitindo consultas analíticas complexas e ad-hoc com um tempo de execução rápida.

O núcleo de qualquer sistema OLAP é um cubo OLAP (também chamado de "cubo multidimensional", ou um hipercubo). Ele consiste de fatos numéricos chamados medidas que são classificados por dimensões. Os metadados do cubo são normalmente criados a partir de um esquema de estrela ou esquema floco de neve de tabelas em um banco de dados relacional. As medidas são derivadas dos registros na tabela de fatos e dimensões são derivadas das tabelas de dimensão.

Cada medida pode ser pensada como tendo um conjunto de etiquetas, ou metadados associado a ele. A dimensão é o que descreve esses rótulos, que fornece informações sobre a medida.

Um exemplo simples seria um cubo que contém as vendas de uma loja como uma medida, e Data/Hora como uma dimensão. Cada venda tem um rótulo Data/Hora que descreve mais sobre essa venda.

Qualquer número de dimensões pode ser adicionado à estrutura, tais como loja, caixa, ou do cliente por adição de uma coluna de chave estrangeira para a tabela fato. Isto permite que um analista veja as medidas ao longo de qualquer combinação das dimensões.

Esta normalização excessiva é bastante comum em aplicações orientadas a objeto. Nesta situação, a estrutura do objeto é imposta ao banco de dados relacional. Mas vale lembrar que estruturas de orientação a objetos e a estrutura de dados relacionais são metodologias completamente distintas.

A normalização é algo muito formal e, em muitos casos não se aplica a aplicações comerciais. Pense na normalização como uma maneira poética e, principalmente, acadêmica de se pensar em termos de modelagem de dados e o motivo disso é o fato de que usar a normalização de dados de forma estrita é impraticável quando se fala em desempenho, especialmente as 3FN, 4FN e 5FN.

...

Quer ler esse conteúdo completo? Tenha acesso completo

Confira outros conteúdos:

Por Ricardo Em 2012

Faça a sua matrícula

Assinatura DevMedia

de: R$ 79,00

por: R$ 64,90 /mês

Total: R$ 778,80

Garanta o desconto

Formação FullStack Completa
Aprenda Automações e IA para Devs
Módulo como ganhar dinheiro com Tech
+10.000 exercícios gamificados
+50 projetos reais com acompanhamento
Clube de alunos e professores no WhatsApp
Mentorias online em grupo toda semana
Estude pelo Aplicativo (Android e iOS)
Suporte 24h / 7 dias por semana
Biblioteca com +40 Tecnologias
Fidelidade de 12 meses

<Perguntas frequentes>

Carreira

Metodologia

Assinatura e Pagamentos

Cadastro

Nossos casos de sucesso

Leonardo Carlos

Eu sabia pouquíssimas coisas de programação antes de começar a estudar com vocês, fui me especializando em várias áreas e ferramentas que tinham na plataforma, e com essa bagagem consegui um estágio logo no início do meu primeiro período na faculdade.

Lucas Rodrigues

Estudo aqui na Dev desde o meio do ano passado! Nesse período a Dev me ajudou a crescer muito aqui no trampo.
Fui o primeiro desenvolvedor contratado pela minha empresa. Hoje eu lidero um time de desenvolvimento!
Minha meta é continuar estudando e praticando para ser um Full-Stack Dev!

Heráclito Júnior

Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a pena, pois a plataforma é bem intuitiva e muuuuito didática a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito obrigado!

Julio Cablen

Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento front-end, tinha coisas que eu ainda não tinha visto. A didática é do jeito que qualquer pessoa consegue aprender. Sério, to apaixonado, adorando demais.

Joelberth Sena

Adquiri o curso de vocês e logo percebi que são os melhores do Brasil. É um passo a passo incrível. Só não aprende quem não quer. Foi o melhor investimento da minha vida!

Felipe Nunes

Foi um dos melhores investimentos que já fiz na vida e tenho aprendido bastante com a plataforma. Vocês estão fazendo parte da minha jornada nesse mundo da programação, irei assinar meu contrato como programador graças a plataforma.

Wanderson Oliveira

Comprei a assinatura tem uma semana, aprendi mais do que 4 meses estudando outros cursos. Exercícios práticos que não tem como não aprender, estão de parabéns!

José Lucas

Obrigado DevMedia, nunca presenciei uma plataforma de ensino tão presente na vida acadêmica de seus alunos, parabéns!

Eduardo Dorneles

Aprendi React na plataforma da DevMedia há cerca de 1 ano e meio... Hoje estou há 1 ano empregado trabalhando 100% com React!

Adauto Junior

Já fiz alguns cursos na área e nenhum é tão bom quanto o de vocês. Estou aprendendo muito, muito obrigado por existirem. Estão de parabéns... Espero um dia conseguir um emprego na área.

Ver todos os casos de sucesso

Normalização e desnormalização de dados

Este artigo trata de técnicas de normalização de dados para implementação de um modelo de dados considerando um banco de dados relacional.

Confira outros conteúdos:

<Perguntas frequentes>

Por onde devo iniciar os estudos?

Em quanto tempo vou me tornar um programador?

Eu preciso de um diploma de faculdade para começar a atuar como programador?

Por que a programação se tornou a profissão mais promissora da atualidade?

Quais são os principais diferenciais da DevMedia?

O que eu irei aprender estudando pela DevMedia?

Quais as vantagens de aprender programação através da linguagem JavaScript?

A plataforma oferece certificados?

A plataforma tem suporte ao aluno, como funciona?

A DevMedia me forma como programador Full Stack?

Tem horário para as aulas?

Por que a DevMedia não usa videoaulas em sua didática?

Preciso de um computador específico para estudar na DevMedia?

Eu consigo estudar pelo celular?

A DevMedia tem aplicativo?

Preciso estar na faculdade para acompanhar os estudos na DevMedia?

Quais são os planos de assinatura disponíveis?

Adquirindo o plano, terei acesso a todo o conteúdo?

A plataforma tem planos vitalícios?

A DevMedia tem fidelidade?

Como funciona o cancelamento?

A renovação é automática?

Como excluir meus dados da plataforma?