Mineração de dados na Prática – Parte 2

Por que eu devo ler este artigo:A mineração de dados apoia a descoberta de informações úteis que normalmente estão ocultas em bases de dados com grande quantidade de registros. Neste artigo apresentaremos dois casos práticos do uso de técnicas de mineração para análise do problema de evasão em cursos universitários utilizando duas técnicas distintas: agrupamento e árvore de decisão. Esta discussão é útil pois mostra na prática como problemas reais podem ser tratados com o uso de técnicas de mineração.
Autores: Péricles Magalhães e Rodrigo Oliveira Spínola

Ver mais

Demais posts desta série:
Mineração de dados na Prática – Parte 1

Artigo no estilo: Curso

Neste artigo, os arquivos gerados para a mineração de dados (apresentados na primeira parte) serão utilizados em estudos de caso em uma aplicação de algoritmo de clustering e em uma aplicação de algoritmo de classificação.

Caso 1 – Aplicação de Algoritmo de Clustering

O agrupamento ou clustering identifica similaridades entres os valores dos atributos analisados e, a partir dessa análise, particiona a base de dados em grupos. Para a execução da técnica, no estudo de caso, foi selecionado o algoritmo SimpleKMeans que, a partir da indicação da quantidade (k) de clusters desejada, divide a base de dados de forma que a similaridade dos elementos de cada cluster seja alta e, entre os clusters seja baixa.

O arquivo de entrada de dados gerado para essa aplicação, descrito no artigo anterior, foi carregado no WEKA onde algumas análises e considerações foram realizadas sobre a distribuição dos valores dos atributos e seu impacto na atividade. A Figura 1 apresenta as distribuições dos valores de cada atributo da base de dados carregada. Como pode ser observado, os atributos PendenciasAcademicas, PeriodosConcluidos e IndicadorEvasao apresentam apenas um valor, cada, em toda a base utilizada. Dessa forma, não possuem nenhuma interferência na criação dos agrupamentos.

abrir imagem em nova janela

Figura 1. Representação gráfica da distribuição dos valores do arquivo de entrada para o caso 1

O algoritmo simpleKmeans apresenta algumas variáveis de configuração para a sua execução:

· displayStdDevs: indica a exibição de desvios padrão dos atributos numéricos e contagens de atributos nominais. Seu valor padrão é false;

· distanceFunction: determina a função de distância a ser usada para comparação das instâncias. Como padrão, é utilizada a weka.core.EuclideanDistance;

· dontReplaceMissingValues: indica se os valores faltantes devem ser ...

Quer ler esse conteúdo completo? Tenha acesso completo

Confira outros conteúdos:

Por Devmedia Em 2015

Faça a sua matrícula

Assinatura DevMedia

de: R$ 79,00

por: R$ 64,90 /mês

Total: R$ 778,80

Garanta o desconto

Formação FullStack Completa
Aprenda Automações e IA para Devs
Módulo como ganhar dinheiro com Tech
+10.000 exercícios gamificados
+50 projetos reais com acompanhamento
Clube de alunos e professores no WhatsApp
Mentorias online em grupo toda semana
Estude pelo Aplicativo (Android e iOS)
Suporte 24h / 7 dias por semana
Biblioteca com +40 Tecnologias
Fidelidade de 12 meses

<Perguntas frequentes>

Carreira

Metodologia

Assinatura e Pagamentos

Cadastro

Nossos casos de sucesso

Leonardo Carlos

Eu sabia pouquíssimas coisas de programação antes de começar a estudar com vocês, fui me especializando em várias áreas e ferramentas que tinham na plataforma, e com essa bagagem consegui um estágio logo no início do meu primeiro período na faculdade.

Lucas Rodrigues

Estudo aqui na Dev desde o meio do ano passado! Nesse período a Dev me ajudou a crescer muito aqui no trampo.
Fui o primeiro desenvolvedor contratado pela minha empresa. Hoje eu lidero um time de desenvolvimento!
Minha meta é continuar estudando e praticando para ser um Full-Stack Dev!

Heráclito Júnior

Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a pena, pois a plataforma é bem intuitiva e muuuuito didática a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito obrigado!

Julio Cablen

Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento front-end, tinha coisas que eu ainda não tinha visto. A didática é do jeito que qualquer pessoa consegue aprender. Sério, to apaixonado, adorando demais.

Joelberth Sena

Adquiri o curso de vocês e logo percebi que são os melhores do Brasil. É um passo a passo incrível. Só não aprende quem não quer. Foi o melhor investimento da minha vida!

Felipe Nunes

Foi um dos melhores investimentos que já fiz na vida e tenho aprendido bastante com a plataforma. Vocês estão fazendo parte da minha jornada nesse mundo da programação, irei assinar meu contrato como programador graças a plataforma.

Wanderson Oliveira

Comprei a assinatura tem uma semana, aprendi mais do que 4 meses estudando outros cursos. Exercícios práticos que não tem como não aprender, estão de parabéns!

José Lucas

Obrigado DevMedia, nunca presenciei uma plataforma de ensino tão presente na vida acadêmica de seus alunos, parabéns!

Eduardo Dorneles

Aprendi React na plataforma da DevMedia há cerca de 1 ano e meio... Hoje estou há 1 ano empregado trabalhando 100% com React!

Adauto Junior

Já fiz alguns cursos na área e nenhum é tão bom quanto o de vocês. Estou aprendendo muito, muito obrigado por existirem. Estão de parabéns... Espero um dia conseguir um emprego na área.

Ver todos os casos de sucesso

Mineração de dados na Prática – Parte 2

Veja nesse artigo um exemplo do uso da mineração de dados para análise do problema de evasão em cursos universitários. Será apresentada a aplicação de duas técnicas de mineração: agrupamento e árvore de decisão.

Confira outros conteúdos:

<Perguntas frequentes>

Por onde devo iniciar os estudos?

Em quanto tempo vou me tornar um programador?

Eu preciso de um diploma de faculdade para começar a atuar como programador?

Por que a programação se tornou a profissão mais promissora da atualidade?

Quais são os principais diferenciais da DevMedia?

O que eu irei aprender estudando pela DevMedia?

Quais as vantagens de aprender programação através da linguagem JavaScript?

A plataforma oferece certificados?

A plataforma tem suporte ao aluno, como funciona?

A DevMedia me forma como programador Full Stack?

Tem horário para as aulas?

Por que a DevMedia não usa videoaulas em sua didática?

Preciso de um computador específico para estudar na DevMedia?

Eu consigo estudar pelo celular?

A DevMedia tem aplicativo?

Preciso estar na faculdade para acompanhar os estudos na DevMedia?

Quais são os planos de assinatura disponíveis?

Adquirindo o plano, terei acesso a todo o conteúdo?

A plataforma tem planos vitalícios?

A DevMedia tem fidelidade?

Como funciona o cancelamento?

A renovação é automática?

Como excluir meus dados da plataforma?