Por que eu devo ler este artigo:Sistemas de informação geram milhares de novos dados que serão utilizados por seus gestores e analistas em forma de relatórios gerenciais e painéis analíticos. Essas informações servem como base para tomada de decisões, muitas vezes estratégicas, que direcionam as atividades da organização. Para administrar essas informações, as empresas cada vez mais recorrem à contratação de DBAs, analistas de dados e de business intelligence para garantir que a informação chegue íntegra em seus relatórios. Porém, em muitas empresas, essa administração ainda é feita pelos profissionais de suporte e de desenvolvimento de aplicações (profissionais não especializados na extração de dados). Neste artigo você irá aprender os conceitos fundamentais para administrar a qualidade da informação.

Informação nunca é demais. Nós de TIC (Tecnologia da Informação e Comunicação) sempre ouvimos isso com certa euforia e receio, por mais especialista que um profissional seja. É sabido que empresas geram todos os dias milhares de dados que muitas vezes são utilizados apenas em apoio a relatórios gerenciais, como de totais de vendas, posição de estoque e fechamento de caixa, gerados pelos próprios sistemas transacionais que possuem. Porém, existem muitas tecnologias no mercado especializadas em transformar esses dados em resultados (BI, Big Data, etc.) para tomar decisões, definir estratégias, traçar metas ou qualquer plano de ação que leve a empresa a obter algum tipo de vantagem. As organizações arquivam todas ou a maioria de suas atividades digitalmente (dados) através de seus sistemas de automação, que podem ser desde sistemas especialistas (Enterprise Resource Planning – ERP, Supply Chain Management – SCM, Warehouse Management System – WMS, Customer Relationship Management – CRM, etc.) a sistemas customizados (pequenos ou grandes). Todos esses sistemas devem garantir ao menos a obtenção, o armazenamento e a recuperação dos dados. Porém, como esses sistemas podem gerar diretamente (através de seus relatórios) ou indiretamente (através do uso de queries em suas fontes de dados) os mais importantes relatórios para os administradores das organizações, a responsabilidade em mantê-los íntegros é grande.

O saneamento desses dados torna-se fundamental para qualquer empresa pois apoia a tomada de decisões corretas pelos administradores. Visando isso, faz-se necessário que as informações da organização estejam disponíveis de forma íntegra, precisa, confiável e verídica. Um relatório de BI (Business Intelligence) pode gerar um falso positivo que consequentemente levará a empresa a uma estratégia errada.

Existe uma falta de preocupação de muitos sistemas em executar técnicas de saneamento dos dados antes da informação chegar no banco, ou seja, esses sistemas costumam jogar a responsabilidade no arquivamento dos dados para seus usuários, que, consequentemente, acabam gerando nomes e descrições erradas e/ou duplicadas (quando a mesma informação está representada com dados distintos).

Outro cenário que podemos observar ocorre quando a mesma informação existe em mais de um sistema com identidades distintas, ou seja, enquanto em um sistema o produto “X” carrega um id (identificador exclusivo) “12”, em outro carrega o id “4032”. Nesse cenário, que é algo muito comum nos dias atuais, é importantíssimo definir um identificador exclusivo entre os sistemas, conhecido como Master Key.

...
Quer ler esse conteúdo completo? Tenha acesso completo