Introdução à Mineração Textual de dados

Por que eu devo ler este artigo:A mineração de texto permite a descoberta de informação útil a partir de dados não estruturados. Trata-se de uma área da mineração de dados que envolve uma série de desafios. Neste artigo apresentaremos alguns conceitos que fundamentam a área e técnicas que podem ser utilizadas para realizar esta atividade. Ao final, serão apresentados os conceitos utilizados no desenvolvimento de uma ferramenta que apoia a descoberta de informações em dados não estruturados. A discussão deste tema é útil uma vez que mineração textual possui diversas áreas de aplicação como gerenciamento do relacionamento com o cliente, suporte técnico e monitoramento de opinião pública, dentre outras.
Autores: Mário André de Freitas Farias, Methanias Colaço Júnior e Evandro de Barros Costa

Ver mais

A informação é vista como parte sutil do capital e consiste em um dos bens mais valiosos dentro de uma organização. Dispor da informação correta no momento oportuno vem sendo caracterizado como um imprescindível diferencial para gestores de empresas.

A coleta intensiva de dados não estruturados através de atividades diárias como relatórios de sistemas, listas de discussão, questionários eletrônicos, código fonte de sistemas e log de erros provê informações valiosas que podem se revelar como uma fonte promissora para a mineração de dados, em específico a mineração de texto. Contudo, dispor de uma mina de dados não é garantia de um diferencial competitivo. Uma vasta quantidade informacional não assegura uma posição de destaque no ranking das melhores organizações – além de possuir a informação, é necessário dispor de mecanismos que facilitem esse processo de recuperação, objeto de estudo da área conhecida como recuperação da informação.

Uma definição de mineração de dados infere que se trata de uma tecnologia que visa extrair automaticamente conhecimento útil, confiável e não trivial de uma base de dados. De forma análoga à mineração de dados, a mineração de texto procura descobrir conhecimentos úteis em ‘minas’ de dados textuais, ou seja, não estruturadas. Desta forma, apresenta-se como uma forma de garimpar grandes bases em busca da informação necessária para o processo de tomada de decisão.

A mineração de texto vem sendo uma alternativa importante para a descoberta de padrões ocultos em diversas áreas do conhecimento, entre elas a de engenharia de software. Entretanto, minerar dados na forma de linguagem natural não é uma tarefa trivial. Textos são escritos e organizados de forma livre e na maioria das vezes as informações não estão disponíveis em apenas uma fonte de dados. Técnicas refinadas de mineração e recuperação da informação combinadas com métodos estatísticos e um dicionário especializado são comuns na construção de ferramentas de mineração de texto, retratando um verdadeiro processo de mineração.

Embora o termo mineração de texto seja relativamente novo, esta área está ligada diretamente a pesquisas em recuperação da informação - RI. No contexto de RI, as informações podem ser oriundas de textos, imagens, áudio, vídeo e outros objetos multimídia. Nos últimos anos, houve um crescimento em pesquisas relacionadas à recuperação da informação em virtude da disseminação dessas informações digitais.

Recuperação da Informação

O termo recuperação da informação originou-se na década de 60, quando grandes sistemas foram desenvolvidos para mainframes com o objetivo de tratarem coleções de documentos não estruturados. Nos anos 80, esses sistemas ganharam interfaces intermediárias para PC’s com o propósito de viabilizar pesquisas e a recuperação de dados. Eram pesquisas baseadas em palavras chave, ainda hoje utilizadas em alguns motores de busca na web. Em meandros da década de 90, os esforços no desenvolvimento de sistemas de RI foram focados em desempenho, conectividade e em pequenas melhorias na utilização de processamento de linguagem natural.

A utilização de palavras chave em questões simples é suficiente para a recuperação de informação, mas quando se tem questões mais complexas, o uso apenas desse recurso não é condição para se ter respostas satisfatórias. Portanto, a utilização crescente de processamento de linguagem natural (PLN) vem crescendo em ferramentas de recuperação de informação textual. Em sistemas de recuperação de informação que não uti ...

Quer ler esse conteúdo completo? Tenha acesso completo

Confira outros conteúdos:

Por Devmedia Em 2015

Faça a sua matrícula

Assinatura DevMedia

de: R$ 79,00

por: R$ 64,90 /mês

Total: R$ 778,80

Garanta o desconto

Formação FullStack Completa
Aprenda Automações e IA para Devs
Módulo como ganhar dinheiro com Tech
+10.000 exercícios gamificados
+50 projetos reais com acompanhamento
Clube de alunos e professores no WhatsApp
Mentorias online em grupo toda semana
Estude pelo Aplicativo (Android e iOS)
Suporte 24h / 7 dias por semana
Biblioteca com +40 Tecnologias
Fidelidade de 12 meses

<Perguntas frequentes>

Carreira

Metodologia

Assinatura e Pagamentos

Cadastro

Nossos casos de sucesso

Leonardo Carlos

Eu sabia pouquíssimas coisas de programação antes de começar a estudar com vocês, fui me especializando em várias áreas e ferramentas que tinham na plataforma, e com essa bagagem consegui um estágio logo no início do meu primeiro período na faculdade.

Lucas Rodrigues

Estudo aqui na Dev desde o meio do ano passado! Nesse período a Dev me ajudou a crescer muito aqui no trampo.
Fui o primeiro desenvolvedor contratado pela minha empresa. Hoje eu lidero um time de desenvolvimento!
Minha meta é continuar estudando e praticando para ser um Full-Stack Dev!

Heráclito Júnior

Economizei 3 meses para assinar a plataforma e sendo sincero valeu muito a pena, pois a plataforma é bem intuitiva e muuuuito didática a metodologia de ensino. Sinto que estou EVOLUINDO a cada dia. Muito obrigado!

Julio Cablen

Nossa! Plataforma maravilhosa. To amando o curso de desenvolvimento front-end, tinha coisas que eu ainda não tinha visto. A didática é do jeito que qualquer pessoa consegue aprender. Sério, to apaixonado, adorando demais.

Joelberth Sena

Adquiri o curso de vocês e logo percebi que são os melhores do Brasil. É um passo a passo incrível. Só não aprende quem não quer. Foi o melhor investimento da minha vida!

Felipe Nunes

Foi um dos melhores investimentos que já fiz na vida e tenho aprendido bastante com a plataforma. Vocês estão fazendo parte da minha jornada nesse mundo da programação, irei assinar meu contrato como programador graças a plataforma.

Wanderson Oliveira

Comprei a assinatura tem uma semana, aprendi mais do que 4 meses estudando outros cursos. Exercícios práticos que não tem como não aprender, estão de parabéns!

José Lucas

Obrigado DevMedia, nunca presenciei uma plataforma de ensino tão presente na vida acadêmica de seus alunos, parabéns!

Eduardo Dorneles

Aprendi React na plataforma da DevMedia há cerca de 1 ano e meio... Hoje estou há 1 ano empregado trabalhando 100% com React!

Adauto Junior

Já fiz alguns cursos na área e nenhum é tão bom quanto o de vocês. Estou aprendendo muito, muito obrigado por existirem. Estão de parabéns... Espero um dia conseguir um emprego na área.

Ver todos os casos de sucesso

Introdução à Mineração Textual de dados

Este artigo mostra como podemos proceder para descobrir informações úteis em dados não estruturados. Será apresentada a mineração textual de dados e os conceitos envolvidos na execução desta atividade.

Confira outros conteúdos:

<Perguntas frequentes>

Por onde devo iniciar os estudos?

Em quanto tempo vou me tornar um programador?

Eu preciso de um diploma de faculdade para começar a atuar como programador?

Por que a programação se tornou a profissão mais promissora da atualidade?

Quais são os principais diferenciais da DevMedia?

O que eu irei aprender estudando pela DevMedia?

Quais as vantagens de aprender programação através da linguagem JavaScript?

A plataforma oferece certificados?

A plataforma tem suporte ao aluno, como funciona?

A DevMedia me forma como programador Full Stack?

Tem horário para as aulas?

Por que a DevMedia não usa videoaulas em sua didática?

Preciso de um computador específico para estudar na DevMedia?

Eu consigo estudar pelo celular?

A DevMedia tem aplicativo?

Preciso estar na faculdade para acompanhar os estudos na DevMedia?

Quais são os planos de assinatura disponíveis?

Adquirindo o plano, terei acesso a todo o conteúdo?

A plataforma tem planos vitalícios?

A DevMedia tem fidelidade?

Como funciona o cancelamento?

A renovação é automática?

Como excluir meus dados da plataforma?