Descoberta de conhecimento utilizando o processo KDD
Este artigo apresenta o processo de KDD, apresentando em um estudo de caso de uma pizzaria como seguimos desde a coleta dos dados até a descoberta do conhecimento.
Autores: José Adair Fabricio, Jones Granatyr e Heitor Murilo Gomes
As informações chegam a grandes quantidades e mudam numa velocidade muito rápida. É importante armazenar essas informações em grandes bases para filtrá-las, estudá-las e transformá-las em conhecimento afim de que possam ser úteis ao traçar estratégias e tomar decisões. O uso de ferramentas de extração do conhecimento possibilita tratar as informações e apresentá-las numa forma clara, precisa e de fácil compreensão aos tomadores de decisões e gestores, auxiliando-os no planejamento de ações de marketing e nas mais diversas atividades que requerem ações decisivas.
Os avanços contínuos na área da Tecnologia da Informação têm gerado grandes quantidades de informações, que são consequentemente armazenadas em grandes bases de dados. As diversas tecnologias existentes, como computadores, celulares, leitores de códigos de barras, sistemas gerenciadores de banco de dados viabilizam a proliferação de inúmeras bases de informações, que precisam ser trabalhadas, analisadas e transformadas em informações úteis, que possam gerar conhecimento. É impossível ao ser humano tratar todas essas informações sem o auxílio de ferramentas apropriadas, daí a necessidade do desenvolvimento de técnicas de mineração de dados, que auxiliem o homem a selecionar, analisar, interpretar e relacionar os dados para desenvolver estratégias de ação em cada contexto.
O processo de KDD (Knowledge Discovery in Databases) foi formalizado em 1989 em referência a procura de conhecimento a partir de bases de dados. Seu objetivo principal é extrair conhecimento de grandes bases dados. A descoberta do conhecimento envolve uma sequência de fases que devem ser obedecidas, iniciando-se com a coleta de informações, passando pelo tratamento e, por fim, a apresentação do resultado final da extração do conhecimento.
Para trabalhar com o processo de KDD, faz-se necessário ter objetivos definidos, saber quais resultados deseja-se atingir e ter conhecimento do domínio da aplicação. Nesse processo, três profissionais são envolvidos:
- Analista de dados: conhece as ferramentas aplicadas ao processo, como algoritmos e inteligência computacional, mas nem sempre conhece o domínio ao qual os dados pertencem;
- Especialista no domínio: tem conhecimento do domínio dos dados e sabe onde aplicá-los;
- Usuário (pessoa ou empresa): quem fará uso das informações resultantes do processo de KDD.
Processos de extração do conhecimento - KDD
O processo de KDD é composto por cinco fases: seleção de dados, pré-processamento, transformação, mineração e interpretação/avaliação. Trata-se de um processo iterativo, pois poderá ser repetido quantas vezes for necessário na busca de melhores resultados, mas também é considerado um processo interativo devido à participação de profissionais como o usuário final, o especialista do domínio e o analista do domínio. Esse processo é aplicado na identificação de padrões compreensíveis, válidos, novos e potencialmente úteis a partir de grandes bases de dados. Embora cada fase do processo de KDD seja independente, podendo ser tratada individualmente, existe uma forte dependência entre elas. Assim, para que seja feita uma correta transformação dos dados, é necessário ter uma base de dados corretamente modelada. Da mesma maneira, para que os dados sejam devidamente preparados, é necessário ter como objetivo a aplicação de ferramentas de extração do conhecimento, como um algoritmo da mineração de dados para atingir o objetivo pretendido. Na "
[...] continue lendo...Artigos relacionados
-
Artigo
-
Artigo
-
Artigo
-
Artigo
-
Artigo