Mineração de Textos

11/09/2014

0

Pessoal, estou realizando com trabalho acadêmico em cima da mineração de textos. Estou com certa dificuldade em utilizar a ferramenta Rapidminer. Alguns tutoriais desatualizados, com informações "soltas". Alguém pode por favor me ajudar?

Dese já agradeço muito
Franciele Manica

Franciele Manica

Responder

Post mais votado

13/09/2014

A mineração de textos é uma subárea da mineração de dados que consiste em extrair informações de dados não estruturados ou semi-estruturados.
Esses dados são encontrados em documentos de texto como: livros, jornais, revistas, páginas Web, blogs, perfis de redes sociais, e-mails, arquivos PDF, documentos XML, arquivos JSON, etc.
Com a mineração de texto pode-se extrair informação relevante de uma grande base de textos, sem precisar lê-los previamente. Outra utilização, seria o auxílio na navegação para encontrar o que se deseja.

Marisiana Battistella

Marisiana Battistella
Responder

Mais Posts

11/09/2014

Marisiana Battistella

Olá Franciele!
Do que exatamente você precisa?
Você precisa de material de apoio, estudo?
Responder

11/09/2014

Mariana Carvalho

Mineração textos? poderia informar com mais detalhes?
Responder

11/09/2014

Franciele Manica

Oi Mari!

Isso, preciso saber como minerar textos com ela, como gerar relatórios, como aplicar duas técnicas em sequência, como utilizar o complemento do Weeka que tem disponível... na verdade preciso de tudo! hehehehe

Se puder me ajudar te agradeceria muito!
Responder

12/09/2014

Marisiana Battistella

Quando a gente está começando é dificil de conseguir juntar as informações e conseguir entender tudo em um contexto maior. Já passei por uma situação parecida e sei como é...
Eu não conheço essa ferramenta que vc está utilizando, mas, por experiência própria, as melhores informações então nos manuais da própria ferramenta ([url]http://rapidminer.com/documentation/[/url]). Por mais que as vezes não tenha versões em português, vale utilizar o google translator (no caso de ter dificuldades com inglês) pra tentar entender as idéias principais pra saber pra onde direcionar as pesquisas sem q os assuntos fiquei tão desligados uns dos outros.

Encontrei este tutorial que parece ter um conteúdo mais completo: [url]http://www.dataprix.com/rapidminer-tutorial-online-operadores[/url]
Você também pode utilizar os videos disponíveis no youtube, por mais que sejam outro idioma, assistindo sempre se consegue assimilar alguma coisa nova.
Canal do youtube: [url]https://www.youtube.com/user/RapidIVideos[/url]
Tem esse tutorial: [url]https://www.youtube.com/user/neuralmarkettrends1/videos[/url]

Espero que esse material te ajude...
Responder

12/09/2014

Marisiana Battistella

Essa ferramenta é free?
Responder

12/09/2014

Mariana Carvalho

Marisiana, para que server o a mineração de textos?
Responder

13/09/2014

Alex Lekao

Legal,

Desconhecia. rsrsr

Acho que a IBM tem ferramentas para fazer isso tambem. rsrsr

Se nao me engano isso foi utilizado na copa aqui no Brasil para tentar prever e "monitorar" comportamentos na web a respeito da copa, a ferramenta monitorava os Twits e com uma padrao iria medindo grau de satisfacao, contentamento, raiva, entre outros, a respeito dos jogos, etc.

Sei que aparentemente nao tem nada a ver com o post, mas acho que reforca a explicacao dada pela Marisiana. rsrsr

Abraco.
Responder

13/09/2014

Mariana Carvalho

Imagino como deve ser, mas não assimilei bem como pode ser possivel pegar dados de um "texto". mas tudo bem :-)
Responder

13/09/2014

Alex Lekao

Oi Mariana, eu tambem nao conheco mas imagino que seja da seguinte forma.

Normalmente os arquivos respeitam uma padronizacao, pensando em csv, a tabulacao define a troca de campos, ou o pipe( | ), ou o ponto e virgula( ; ), e tudo isso sera tomado como parametro para fazer a coleta, terceira coluna, vigesima linha, essas coisas.

Como disse, imagino que seja dessa forma, afinal desconheco as ferramentas e a metodologia. rsrsr

Abraco.
Responder

13/09/2014

Mariana Carvalho

csv(é excel?)esqueci! mas se for excel, acho que muitos bancos conseguem fazer uma extração deles ou acharia mais complicado retirar de arquivos do word ou pdf.
Responder

14/09/2014

Franciele Manica

Oi Mari!

Realmente nos sentimos bem perdidas no começo.

Estou usando o translate sim, pois meu inglês não é dos melhores.

Estou com dificuldade em estruturar os dados a serem minerados. A aplicação das técnicas está bem complicado.

OS tutorias estou revirando para ver ser encontro algo que me ajude.

Muito obrigado pela ajuda!
Responder

16/09/2014

Alex Lekao

Nao necessariamente, o excel abre o csv normalmente.

Ele eh mais um arquivo de estrutura padronizada para exportacao e importacao de dados ou compartilhamento de dados, etc.

No caso listas de contatos, arquivos de dados, como vc mencionou do excel, entre outros.

nao sei se esse tecnica/ ferramente seja especificamente para retirar dados de arquivos word ou pdf, mas acredito que nao seja dificil, visto que ja eh feito isso de muitas formas, inclusive pesquisas do google por exemplo, ja leem os arquivos.

csv(é excel?)esqueci! mas se for excel, acho que muitos bancos conseguem fazer uma extração deles ou acharia mais complicado retirar de arquivos do word ou pdf.
Responder

17/09/2014

Marisiana Battistella

Imagino como deve ser, mas não assimilei bem como pode ser possivel pegar dados de um "texto". mas tudo bem :-)

São as próprias ferramentas que fazem isso, elas possuem os recursos necessários para isso...
O que se precisa saber, de um modo mais geral, é utilizar a ferramenta, entender as funcionalidades dela e saber refinar as informações.
Responder

17/09/2014

Marisiana Battistella

Legal,

Desconhecia. rsrsr

Acho que a IBM tem ferramentas para fazer isso tambem. rsrsr

Se nao me engano isso foi utilizado na copa aqui no Brasil para tentar prever e "monitorar" comportamentos na web a respeito da copa, a ferramenta monitorava os Twits e com uma padrao iria medindo grau de satisfacao, contentamento, raiva, entre outros, a respeito dos jogos, etc.

Sei que aparentemente nao tem nada a ver com o post, mas acho que reforca a explicacao dada pela Marisiana. rsrsr

Abraco.


Tem a ver com o post sim, Alex!
A IBM tem ferramentas para diversas finalidades inclusive essas que vc citou, uma delas é a SmarterAnalytics que é utilizada para extrair informações dos Big Data, utilizando análises preditivas, probabilidades, etc.
Responder

17/09/2014

Marisiana Battistella

Oi Mari!

Realmente nos sentimos bem perdidas no começo.

Estou usando o translate sim, pois meu inglês não é dos melhores.

Estou com dificuldade em estruturar os dados a serem minerados. A aplicação das técnicas está bem complicado.

OS tutorias estou revirando para ver ser encontro algo que me ajude.

Muito obrigado pela ajuda!


Por nada Franciele!
Vc utiliza a modelagem multidimensional de dados?
Responder

Utilizamos cookies para fornecer uma melhor experiência para nossos usuários, consulte nossa política de privacidade.

Aceitar