Elasticsearch: Analisando Logs

Fique por dentro

Analisar logs � uma tarefa cansativa e desestimulante para muitos desenvolvedores, principalmente quando procurando por erros de codificaç�o.

Pensando nisso, este artigo discorrer� sobre uma maneira de simplificar esse problema. Este artigo abordar� a ferramenta Elasticsearch, uma soluç�o criada em cima do Apache Lucene com o objetivo de facilitar a indexaç�o e busca de dados em tempo real, podendo processar tanto dados estruturados como, tamb�m, dados n�o-estruturados.

Al�m disso, tamb�m iremos discutir sobre a ferramenta Kibana e a ferramenta Logstash, bastante utilizadas em conjunto com o Elasticsearch para prover um ambiente de an�lise e processamento de dados.

Feito isso, visando demonstrar uma soluç�o pr�tica da utilizaç�o dessas aplicaç�es, apresentaremos um cen�rio onde � necess�rio ao desenvolvedor ser capaz de analisar, em tempo real, o que acontece em sua aplicaç�o, mostrando a grande vantagem de se utilizar o Elasticsearch para a an�lise de logs.

A an�lise de dados � um dos t�picos mais proeminentes e interessantes dos �ltimos anos. Com o surgimento de novas ferramentas e tecnologias capazes de prover um ambiente perform�tico e eficiente para a busca e indexaç�o de dados nos mais diversos formatos, o campo da Big Data, aliado � an�lise de informaç�es, vem se mostrando como o grande nome dos pr�ximos anos.

Entre essas tecnologias, a biblioteca da Apache chamada Lucene ganhou bastante destaque no campo de indexaç�o e busca de dados. Capaz de prover as implementaç�es necess�rias para o tratamento, an�lise e busca de conte�dos textuais, essa API acabou sendo utilizada por diversas implementaç�es, como o Apache Solr e, tamb�m, o foco de nosso artigo, o Elasticsearch.

Essa ferramenta, por sua vez, aliou os benef�cios previamente citados do Apache Lucene com uma plataforma de alta confiabilidade e performance, produzindo assim um servidor de buscas capaz de realizar as funcionalidades de indexaç�o e armazenamento em um ambiente distribu�do para qualquer tipo de aplicaç�o.

Ainda mais interessante, juntamente com as ferramentas Logstash e Kibana, o Elasticsearch vem, a cada dia, sendo mais utilizado no campo de an�lise de dados para aplicaç�es dos mais diversos tipos, provendo uma interface altamente customiz�vel e funcional para o monitoramento e an�lise de dados de sistemas.

Dito isso, nosso objetivo nesse artigo ser� mostrar um pouco sobre essa incr�vel ferramenta e suas aplicaç�es no mundo real, demonstrando como realizar uma configuraç�o inicial do Elasticsearch e como utiliz�-lo dentro de seu projeto, principalmente focando nas melhores pr�ticas de utilizaç�o dessa ferramenta para sanar a dificuldade em monitorar e ter uma vis�o clara do que acontece nos logs de sua aplicaç�o.

O problema do monitoramento de logs

Tal dificuldade, para os desenvolvedores acostumados a trabalhar com grandes sistemas, pode realmente se tornar um �monstro de 7 cabeças�. A busca por trechos de textos em diversas linhas de log � uma tarefa que todo programador j� passou ou ir� passar um dia e �, com certeza, uma atividade desgastante.

O primeiro dos problemas que temos em uma abordagem tradicional � que, atrav�s de um simples arquivo de log, n�o conseguimos ter uma vis�o macro de nosso sistema.

Por mais que seja poss�vel encontrar trechos de eventos dentro de arquivos textos atrav�s de comandos do Unix, como grep ou tail, n�o conseguimos ter gr�ficos ou tabelas capazes de nos mostrar claramente quantos eventos e quais os tipos de eventos que temos em um determinado per�odo de tempo.

Ainda mais cr�tico, n�o conseguimos buscar de forma simples um determinado trecho de texto ou padr�o em nossos logs, tendo que partir para funç�es complexas do Unix para execut�-lo.

Uma simples busca por intervalo de valores de um determinado evento em arquivos de logs pode se tornar uma tarefa quase que imposs�vel para algu�m com conhecimentos intermedi�rios em comandos do Shell.

Monitoramento de logs atrav�s da linha de comando

Para deixar mais claro como esse tipo de abordagem n�o � nada pr�tica, a seguir exemplificaremos alguns comandos bastante utilizados por desenvolvedores para ler os logs de suas aplicaç�es, expondo suas falhas e principais problemas.

O primeiro desses comandos (e talvez o mais utilizado para leitura de logs) � o chamado tail. Respons�vel por exibir no console apenas o fim de um arquivo, esse comando � usado para monitorar logs em tempo real e, com a ajuda do par�metro -f, permite acompanhar os dados conforme novos conte�dos s�o adicionados ao log.

Seu uso, por sua vez, tem duas falhas bastante graves. A primeira � relacionada � dificuldade de acompanhar o progresso do log em um sistema muito grande, uma vez que as linhas de log ser�o adicionadas em alta velocidade, complicando o monitoramento tradicional realizado por uma pessoa em um ambiente produtivo.

A segunda se trata do fato de que normalmente, quando queremos ler um log, queremos somente certos trechos dele e n�o o log inteiro. Fazer esses filtros �manualmente� � um trabalho praticamente imposs�vel, exigindo a ajuda de uma ferramenta ou de comandos extras no shell para minimizar esses resultados.

Um desses comandos � o grep, utilizado para filtrar os resultados de acordo com uma palavra ou express�o regular. Aliado ao tail, � poss�vel ao usu�rio visualizar somente as linhas de log que interessam no momento, resolvendo parcialmente os dois problemas que citamos anteriormente.

Como exemplo de uso dos comandos tail e grep, a Figura 1 apresenta como empreg�-los para ler um arquivo com algumas linhas de texto."

[...] continue lendo...

Elasticsearch: Analisando Logs

Veja neste artigo o poder da análise de dados em sua aplicação, através da ferramenta Elastic search com inúmeras possibilidades para a análise de logs.

O problema do monitoramento de logs

Monitoramento de logs atrav�s da linha de comando

Artigos relacionados