Mineração de Textos
11/09/2014
0
Dese já agradeço muito
Franciele Manica
Post mais votado
13/09/2014
Esses dados são encontrados em documentos de texto como: livros, jornais, revistas, páginas Web, blogs, perfis de redes sociais, e-mails, arquivos PDF, documentos XML, arquivos JSON, etc.
Com a mineração de texto pode-se extrair informação relevante de uma grande base de textos, sem precisar lê-los previamente. Outra utilização, seria o auxílio na navegação para encontrar o que se deseja.
Marisiana Battistella
Mais Posts
11/09/2014
Marisiana Battistella
Do que exatamente você precisa?
Você precisa de material de apoio, estudo?
11/09/2014
Mariana Carvalho
11/09/2014
Franciele Manica
Isso, preciso saber como minerar textos com ela, como gerar relatórios, como aplicar duas técnicas em sequência, como utilizar o complemento do Weeka que tem disponível... na verdade preciso de tudo! hehehehe
Se puder me ajudar te agradeceria muito!
12/09/2014
Marisiana Battistella
Eu não conheço essa ferramenta que vc está utilizando, mas, por experiência própria, as melhores informações então nos manuais da própria ferramenta ([url]http://rapidminer.com/documentation/[/url]). Por mais que as vezes não tenha versões em português, vale utilizar o google translator (no caso de ter dificuldades com inglês) pra tentar entender as idéias principais pra saber pra onde direcionar as pesquisas sem q os assuntos fiquei tão desligados uns dos outros.
Encontrei este tutorial que parece ter um conteúdo mais completo: [url]http://www.dataprix.com/rapidminer-tutorial-online-operadores[/url]
Você também pode utilizar os videos disponíveis no youtube, por mais que sejam outro idioma, assistindo sempre se consegue assimilar alguma coisa nova.
Canal do youtube: [url]https://www.youtube.com/user/RapidIVideos[/url]
Tem esse tutorial: [url]https://www.youtube.com/user/neuralmarkettrends1/videos[/url]
Espero que esse material te ajude...
12/09/2014
Mariana Carvalho
13/09/2014
Alex Lekao
Desconhecia. rsrsr
Acho que a IBM tem ferramentas para fazer isso tambem. rsrsr
Se nao me engano isso foi utilizado na copa aqui no Brasil para tentar prever e "monitorar" comportamentos na web a respeito da copa, a ferramenta monitorava os Twits e com uma padrao iria medindo grau de satisfacao, contentamento, raiva, entre outros, a respeito dos jogos, etc.
Sei que aparentemente nao tem nada a ver com o post, mas acho que reforca a explicacao dada pela Marisiana. rsrsr
Abraco.
13/09/2014
Mariana Carvalho
13/09/2014
Alex Lekao
Normalmente os arquivos respeitam uma padronizacao, pensando em csv, a tabulacao define a troca de campos, ou o pipe( | ), ou o ponto e virgula( ; ), e tudo isso sera tomado como parametro para fazer a coleta, terceira coluna, vigesima linha, essas coisas.
Como disse, imagino que seja dessa forma, afinal desconheco as ferramentas e a metodologia. rsrsr
Abraco.
13/09/2014
Mariana Carvalho
14/09/2014
Franciele Manica
Realmente nos sentimos bem perdidas no começo.
Estou usando o translate sim, pois meu inglês não é dos melhores.
Estou com dificuldade em estruturar os dados a serem minerados. A aplicação das técnicas está bem complicado.
OS tutorias estou revirando para ver ser encontro algo que me ajude.
Muito obrigado pela ajuda!
16/09/2014
Alex Lekao
Ele eh mais um arquivo de estrutura padronizada para exportacao e importacao de dados ou compartilhamento de dados, etc.
No caso listas de contatos, arquivos de dados, como vc mencionou do excel, entre outros.
nao sei se esse tecnica/ ferramente seja especificamente para retirar dados de arquivos word ou pdf, mas acredito que nao seja dificil, visto que ja eh feito isso de muitas formas, inclusive pesquisas do google por exemplo, ja leem os arquivos.
17/09/2014
Marisiana Battistella
São as próprias ferramentas que fazem isso, elas possuem os recursos necessários para isso...
O que se precisa saber, de um modo mais geral, é utilizar a ferramenta, entender as funcionalidades dela e saber refinar as informações.
17/09/2014
Marisiana Battistella
Desconhecia. rsrsr
Acho que a IBM tem ferramentas para fazer isso tambem. rsrsr
Se nao me engano isso foi utilizado na copa aqui no Brasil para tentar prever e "monitorar" comportamentos na web a respeito da copa, a ferramenta monitorava os Twits e com uma padrao iria medindo grau de satisfacao, contentamento, raiva, entre outros, a respeito dos jogos, etc.
Sei que aparentemente nao tem nada a ver com o post, mas acho que reforca a explicacao dada pela Marisiana. rsrsr
Abraco.
Tem a ver com o post sim, Alex!
A IBM tem ferramentas para diversas finalidades inclusive essas que vc citou, uma delas é a SmarterAnalytics que é utilizada para extrair informações dos Big Data, utilizando análises preditivas, probabilidades, etc.
17/09/2014
Marisiana Battistella
Realmente nos sentimos bem perdidas no começo.
Estou usando o translate sim, pois meu inglês não é dos melhores.
Estou com dificuldade em estruturar os dados a serem minerados. A aplicação das técnicas está bem complicado.
OS tutorias estou revirando para ver ser encontro algo que me ajude.
Muito obrigado pela ajuda!
Por nada Franciele!
Vc utiliza a modelagem multidimensional de dados?
Clique aqui para fazer login e interagir na Comunidade :)