Big Data e Hadoop: descubra o que �

Fique por dentro

Um grande volume de informaç�es � gerado diariamente em todas as partes do mundo e informaç�es das mais variadas poss�veis. Esta tend�ncia � conhecida pelo termo Big Data.

Mas para lidar com Big Data � necess�rio uma infraestrutura capaz de gerenciar o armazenamento e recuperaç�o destas informaç�es de maneira r�pida e confi�vel. Neste contexto, o Hadoop se apresenta como uma �tima soluç�o para o armazenamento de grandes volumes de dados n�o estruturados, oferecendo bom desempenho e confiabilidade atrav�s de alta disponibilidade.

O artigo trata da tecnologia de armazenamento de dados n�o estruturados, conhecido como Hadoop.

Big Data � o termo usado para definir uma coleç�o de dados t�o grande e complexo que se torna dif�cil de processar usando as tradicionais ferramentas de gerenciamento de banco de dados ou aplicaç�es de processamento de dados tradicionais. Os desafios incluem a captura, gerenciamento, armazenamento, busca, compartilhamento, transfer�ncia, an�lise, e visualizaç�o.

A partir de 2012, a limitaç�o de tamanho dos conjuntos de dados que s�o vi�veis para serem processados em uma quantidade razo�vel de tempo foi na ordem de ExaBytes de dados.

Cientistas encontram v�rias limitaç�es devido a grandes volumes de dados em diversas �reas como: meteorologia, simulaç�es de f�sica complexa, pesquisa biol�gica e ambiental. As limitaç�es tamb�m afetam pesquisas na internet, finanças e inform�tica de neg�cios.

O volume de dados cresce, em parte, porque est�o cada vez mais sendo geradas informaç�es atrav�s de dispositivos m�veis de detecç�o de informaç�o, tecnologias sensoriais a�reas (sensoriamento remoto), registros de software, c�meras, microfones, leitores de identificaç�o de radiofrequ�ncia e redes de sensores sem fio.

A capacidade tecnol�gica mundial (por habitante) para armazenar informaç�es praticamente dobra a cada 40 meses desde a d�cada de 1980; desde 2012, diariamente 2,5 ExaBytes (2,5 � 1018) de dados foram criados.

� muito complexo trabalhar com Big Data atrav�s de sistemas de gerenciamento de banco de dados relacionais e pacotes de visualizaç�o, pois necessitam de �sistemas de execuç�o massiva em paralelo, sendo executados em dezenas, centenas ou mesmo milhares de servidores�.

O que � considerado �Big Data� varia dependendo dos recursos da organizaç�o que gerencia estes dados, e tamb�m das capacidades dos aplicativos que s�o tradicionalmente utilizados para processar e analisar o conjunto de dados no dom�nio espec�fico.

Big Data geralmente inclui conjuntos de dados com tamanhos al�m da capacidade de ferramentas de software tradicionais para capturar, gerenciar e processar os dados dentro de um tempo de execuç�o toler�vel.

O tamanho de Big Data � algo que est� em constante movimento, algo que vai desde algumas dezenas de TeraBytes at� muitos PetaBytes de dados em um �nico conjunto de dados.

Em um relat�rio de 2001, o analista Douglas Laney (do Grupo META - atualmente Gartner) definiu os desafios do crescimento de dados e oportunidades como sendo tridimensional, ou seja, o aumento de volume (quantidade de dados), velocidade (velocidade de dados entrando e saindo) e variedade (gama de tipos de dados e as fontes). " [...] continue lendo...

Big Data e Hadoop: descubra o que �

O artigo trata da tecnologia de armazenamento de dados não estruturados, conhecido como Hadoop. Veremos uma introdução completa sobre o assunto.

Artigos relacionados