Descoberta de conhecimento utilizando o processo KDD

Este artigo apresenta o processo de KDD, apresentando em um estudo de caso de uma pizzaria como seguimos desde a coleta dos dados até a descoberta do conhecimento.

Fique por dentro
As técnicas de mineração de dados tem ganhado bastante espaço nos últimos anos, sendo processos essenciais para a descoberta de conhecimento em bases de dados. Essas técnicas visam explorar grandes quantidades de dados com o intuito de encontrar padrões consistentes de relacionamentos entre os atributos das bases de dados. Isso pode ser utilizado, por exemplo, para auxiliar na tomada de decisões sobre estratégias e vantagens competitivas na gestão de pizzaria. Por meio da aplicação de algoritmos específicos de mineração de dados em uma base de dados de pizzaria, o resultado dessas análises pode ser utilizado para planejamento estratégico. Por exemplo, a previsão de vendas pode ser utilizada para planejamento de compra de matéria prima, a identificação dos sabores das pizzas pode levar a empresa a realizar algum tipo de promoção de vendas, enquanto que a identificação de grupos de clientes pode levar a empresa a planejar uma estratégia de marketing para recomendação de produtos similares. Ou seja, a aplicação de técnicas de mineração de dados pode ser considerada como um diferencial competitivo para as empresas, já que este tipo de conhecimento não pode ser obtido pela utilização de softwares tradicionais.
Autores: José Adair Fabricio, Jones Granatyr e Heitor Murilo Gomes

As informações chegam a grandes quantidades e mudam numa velocidade muito rápida. É importante armazenar essas informações em grandes bases para filtrá-las, estudá-las e transformá-las em conhecimento afim de que possam ser úteis ao traçar estratégias e tomar decisões. O uso de ferramentas de extração do conhecimento possibilita tratar as informações e apresentá-las numa forma clara, precisa e de fácil compreensão aos tomadores de decisões e gestores, auxiliando-os no planejamento de ações de marketing e nas mais diversas atividades que requerem ações decisivas.

Os avanços contínuos na área da Tecnologia da Informação têm gerado grandes quantidades de informações, que são consequentemente armazenadas em grandes bases de dados. As diversas tecnologias existentes, como computadores, celulares, leitores de códigos de barras, sistemas gerenciadores de banco de dados viabilizam a proliferação de inúmeras bases de informações, que precisam ser trabalhadas, analisadas e transformadas em informações úteis, que possam gerar conhecimento. É impossível ao ser humano tratar todas essas informações sem o auxílio de ferramentas apropriadas, daí a necessidade do desenvolvimento de técnicas de mineração de dados, que auxiliem o homem a selecionar, analisar, interpretar e relacionar os dados para desenvolver estratégias de ação em cada contexto.

O processo de KDD (Knowledge Discovery in Databases) foi formalizado em 1989 em referência a procura de conhecimento a partir de bases de dados. Seu objetivo principal é extrair conhecimento de grandes bases dados. A descoberta do conhecimento envolve uma sequência de fases que devem ser obedecidas, iniciando-se com a coleta de informações, passando pelo tratamento e, por fim, a apresentação do resultado final da extração do conhecimento.

Para trabalhar com o processo de KDD, faz-se necessário ter objetivos definidos, saber quais resultados deseja-se atingir e ter conhecimento do domínio da aplicação. Nesse processo, três profissionais são envolvidos:

Processos de extração do conhecimento - KDD

O processo de KDD é composto por cinco fases: seleção de dados, pré-processamento, transformação, mineração e interpretação/avaliação. Trata-se de um processo iterativo, pois poderá ser repetido quantas vezes for necessário na busca de melhores resultados, mas também é considerado um processo interativo devido à participação de profissionais como o usuário final, o especialista do domínio e o analista do domínio. Esse processo é aplicado na identificação de padrões compreensíveis, válidos, novos e potencialmente úteis a partir de grandes bases de dados. Embora cada fase do processo de KDD seja independente, podendo ser tratada individualmente, existe uma forte dependência entre elas. Assim, para que seja feita uma correta transformação dos dados, é necessário ter uma base de dados corretamente modelada. Da mesma maneira, para que os dados sejam devidamente preparados, é necessário ter como objetivo a aplicação de ferramentas de extração do conhecimento, como um algoritmo da mineração de dados para atingir o objetivo pretendido. Na "

[...] continue lendo...

Artigos relacionados