Informações com Qualidade
por Eliete Colucci Sousa
Objetivo
Atualmente um tema bastante palpitante é a geração de informações que agreguem valores às instituições, isto é, informações com qualidade e que deve ser uma das principais preocupações que uma instituição deve ter.
Neste artigo algumas considerações serão tecidas sobre os principais meios e as suas influências para se obter informações com qualidade.
São eles os dados e os modelos de dados, e por isso aqui é tratado sobre como obter qualidade nesses dois meios tão ligados entre si.
Qualidade de modelo de dados
Quando pensamos em elaborar ou homologar um modelo de dados, temos que pensar em obter um modelo com qualidade.
E como podemos garantir que um modelo de dados possua qualidade?
Na realidade para que possamos ter um bom modelo de dados temos que pensar em atendimento ao negócio da instituição a que se destina o modelo e garantia da qualidade da informação.
Focando-se nisso, então um modelo de dados deverá garantir que:
1.Todas as informações necessárias e importantes ao negócio deverão estar disponíveis, isto é, devem trazer benefícios e vantagens em seu uso. Além disso, devem estar representadas de forma clara, profunda, objetiva e de fácil manipulação.
2.As informações contidas no modelo devem possuir facilidade de serem aplicáveis em outros negócios da instituição, pois assim poderemos ter um modelo corporativo da instituição.
3.A obtenção de uma representação concisa, pois dados em que o usuário não tem condição de mantê-lo não é importante. Lembre-se que excesso de informações pode não auxiliar na análise, além de se gastar mais tempo na escolha de informações relevantes.
4.A representação das informações nele contidas está de acordo com a realidade e de forma correta e confiável. Para isso ao se elaborar / homologar um modelo de dados devemos ter regras implementadas no mesmo para atingir tais objetivos, além do fato de que as informações devem ser bem conceituadas quanto a sua origem, conteúdo e legislação vigente, além de apresentar uma representação consistente, isto é, informações do mesmo tipo deverão ser apresentadas sempre no mesmo formato.
5.Todos os elementos contidos no modelo de dados devem estar documentados com definições completas e inequívocas isto é, a finalidade de cada um deve estar definida com precisão, clareza e de forma específica No caso das tabelas a sua finalidade deve deixar clara o que os dados nela contidos representam, o que fazem e para que servem. E para as colunas, estando a tabela bem definida as suas descrições soa facilitadas, mas é preciso deixar claro o que aquela coluna representa na tabela.
É importante salientar que a Administração de Dados defina um processo formal, que pelo menos em parte pode ser automático e que faça uma análise de um modelo de dados que possa garantir a Qualidade do Modelo de Dados.
Outro ponto importante é que para que se possa atender aos itens descritos acima é preciso que a Administração de Dados tenha acesso aos manuais normativos e a legislação vigente sobre o assunto que estiver sendo tratado.
Qualidade de Dados
Antes de mais nada, precisamos definir o que é Qualidade de Dados.
Qualidade de Dados é um conjunto de regras importantes que os dados devem obedecer para que possam gerar informações com valor para a instituição.
Com essas regras os dados devem estar representados:
Figura 1 – Regras para Qualidade de Dados
Observando a figura acima e mais o que é necessário para garantir um bom modelo de dados descritos neste artigo, temos a forte ligação entre Qualidade de Modelo de Dados e o que será armazenado de dados nos objetos pertencentes a esse modelo.
E o que conseguiremos com isso:
Figura 2 – Informação com Qualidade
Garantia da Qualidade de Dados
E o que podemos fazer para garantia da qualidade dos dados?
Bem nesse sentido temos que trabalhar sob dois sentidos:
Manutenção do Modelo de Dados
De nada adianta a preocupação durante a construção de um modelo de dados com qualidade, se essa mesma preocupação não continuar em sua manutenção.
A decisão de se alterar um modelo de dados pode ter três origens conforme figura a seguir:
Figura 3 – Manutenção de Modelo de Dados
A identificação de um problema no modelo de dados é bastante grave, pois além de poder implicar em alterações no(s) aplicativo(s), normalmente os dados já foram afetados, o que pode colocar em risco a credibilidade do(s) aplicativo(s) que o usa(m), como também do modelo corporativo e às vezes até a Área de Tecnologia da Informação da instituição.
Monitoramento Constante dos Dados
Para que seja possível um controle efetivo da qualidade nos dados é preciso conhecimento profundo sobre a arquitetura dos dados e a área que tem esse melhor domínio é a Administração de Dados.
É importante ficar claro que o trabalho de qualidade de dados não deve ser uma tarefa isolada, mas sim um trabalho contínuo para que não haja degradação da qualidade dos dados com o passar do tempo.
Devem ser definidos mecanismos de monitoração e depuração que avaliem os dados e que permitem atuar sempre que são encontrados problemas.
E o que pode ser feito nesse sentido:
Ø Definir mecanismos de validação da eficácia dos procedimentos que populam as bases de dados e introduzi-los nos processos de migração, integração e carga de dados devem ser introduzidos;
Ø Definir procedimentos de monitoração da qualidade dos dados visando obter a sincronização entre a origem e o destino nos processos de migração, integração e carga de dados;
Ø Definir procedimentos de monitoração constante dos dados em todos os ambientes de produção, de forma que seja assegurada a não exista degradação da qualidade dos dados ao longo do tempo;
Ø Definir variáveis que permitam mensurar a situação de Qualidade dos Dados e a eficácia dos procedimentos que estão sendo aplicados no monitoramento contínuo da qualidade dos dados.
Para a monitoração contínua da qualidade dos dados é importante observar os seguintes indicativos de má qualidade dos dados entre outros::
Ø Ocorrências de erros na execução dos aplicativos;
Ø Relatórios com informações inconsistentes ou desatualizadas;
Ø Não compartilhamento de dados;
Ø Os usuários não conseguem compreender com clareza o significado dos dados;
Ø Dados constantes na base de dados não estão de acordo com o que foi definido para a estrutura implementada;
Ø Existência de “dados sujos”, por exemplo: colunas com ausência de valores, colunas com dados com múltiplos objetivos; valores de domínios em desacordo com o negócio, formatos fora do padrão ou em desacordo com as necessidades, intervalos de dados inválidos, pendências de datas inválidas. etc;
Ø Falta de sincronismo dos dados entre bancos diferentes;
Ø Ocorrência de problemas de integridade nos dados, por exemplo: regras de negócio violadas, existência de valores contraditórios, falta de relacionamentos entre os dados ou relacionamentos inadequados quanto ao negócio, falta de chave negocial (isto implica em duplicação de registros de dados).
E para efetuar as correções identificadas nos problemas encontrados em dados devemos:
Ø Definir quais são os dados críticos para a instituição;
Ø Priorizar a execução das correções;
Ø Definir os critérios de correções;
Ø Definir recursos humanos e técnicos necessários;
Ø Definir condições necessárias para os processos de correções;
Ø Definir cronograma de execução das correções de acordo com a prioridade definida.
Conclusão
Não restam dúvidas que sem um modelo de dados com qualidade é impossível obter dados com qualidade.
É importante realçar que não bastam criar sistemas de informação com a melhor tecnologia sem assegurar que a informação se apresente correta, normalizada, consolidada, enriquecida e atualizada, pois somente assim teremos condições de apresentar produtos finais ao usuário com a garantia qualidade e confiabilidade.
Assim, entendo que as instituições devem dar bastante atenção a essas atividades, criando no organograma uma área que tenha essas responsabilidade e que em minha opinião é a Administração de Dados.
Obviamente, não basta dar a responsabilidade, mas também as condições para que o objetivo maior seja atendido, que é de gerar informações de valores para a instituição que permitam não apenas a execução das atividades operacionais com segurança, mas também informações que auxiliem na tomada de decisões.
Eliete Colucci Sousa é Bacharel em Ciência da Computação pelo Instituto de Matemática e Estatística da Universidade de São Paulo desde 1978. Possui experiência tanto na iniciativa privada como governamental. Já atuou nas áreas de suporte em microinformática, desenvolvimento de sistemas, análise negócios e desde 1997 vem trabalhando na área de Administração de Dados em vários órgãos públicos e privados, conhecendo realidades de instituições diferenciadas. Pode ser contactada através do e-mail colucci@terra.com.br.