Artigo no estilo Mentoring Este artigo apresenta a discussão de como lidar com o armazenamento
de 1, 10, 100 e 1024 GB de dados. Serão analisadas diversas recomendações,
práticas e sugestões gerais a respeito do armazenamento, hardware, distribuição,
modelagem, acesso a dados, backup/restore, importação/exportação e novas
tecnologias. Além disso, vale ressaltar que o artigo não se concentra em um
servidor de banco de dados específico, mas cita alguns detalhes de tecnologias
do SQL Server como exemplos. Lembre-se que trabalhar com grandes quantidades de
dados é uma das habilidades necessárias para qualquer profissional que manipula
dados.
A demanda atual para armazenamento de dados no ambiente corporativo é cada vez maior e é responsabilidade do profissional que trabalha com banco de dados saber lidar com esta demanda.
Se levarmos em consideração que hoje em dia praticamente todo tipo de negócio pode gerar muita informação digital, é imprescindível conhecer técnicas adequadas para o correto armazenamento e gerenciamento de grandes quantidades de dados.
Apesar de existirem muitas ferramentas, técnicas, recomendações e recursos para o armazenamento de dados é relativamente comum encontrar situações onde profissionais da área ainda comentem erros e tomam atitudes inadequadas em relação ao redimensionamento, gerenciamento e manipulação de grandes quantidades de dados.
Este artigo tem como objetivo fornecer uma discussão sobre como lidar com muitos dados baseado na tendência atual de manipulação de volumes cada vez maiores por meio de inúmeras opções para armazenamento.
Os tópicos discutidos incluem o cenário de armazenamento, o hardware, a modelagem, o acesso aos dados e também aspectos técnicos como backup/restore, importação/exportação, processamento distribuído e outros.
Os profissionais que souberem lidar corretamente com o armazenamento das quantidades de dados atuais e futuras certamente estarão preparados para encarar os diversos desafios e problemas enfrentados por muitas empresas no dia a dia.
Portanto, esta habilidade é muito desejada pelas corporações, especialmente aquelas que dão o devido valor aos dados e à possível vantagem comercial que eles podem gerar no futuro.
Cenário
Para começar a discussão sobre armazenamento de grandes quantidades de dados, vamos descrever uma situação típica que pode ser encontrada em muitas empresas. Neste cenário vamos imaginar que o profissional receba a tarefa de armazenar 1, 10, 100 ou 1024 GB. A propósito, estes números não foram escolhidos de forma aleatória.
O leitor mais atento pode estar se perguntado por que não foram escolhidos os números 1, 16, 128 ou 1024 GB, uma vez que esta segunda sequência contém apenas números gerados a partir da base exponencial 2.
O motivo pelo qual os números 1, 10, 100 e 1024 foram escolhidos é para alertar que atualmente temos muita confusão em relação aos valores que representam quantidades de armazenamento. Por exemplo: é comum comprar um smartphone com 32 GB de memória para armazenamento e posteriormente notar que, na prática, pode-se armazenar apenas algo entre 20 a 25 GB devido a detalhes da arquitetura do sistema operacional e decisões do fabricante e da operadora de telefonia móvel.
Outra situação onde o número de armazenamento não condiz com o que é indicado é na descrição de discos rígidos (HD): é comum que o tamanho real útil seja de 5% a 10% menor do que o volume total e que o valor indicado na embalagem não seja em base 2.
Além disso, muitas pessoas com pouco conhecimento técnico, tal como alguns gerentes de projetos e coordenadores, não estão a par do fato que computadores trabalham internamente com números baseados no sistema binário.
Estes exemplos mostram que estamos muito
longe da época dos mainframes que, diga-se de passagem, possuem uma forte
influência na arquitetura dos bancos de dados atuais. Quando se trabalha com
este tipo de computador é necessário especificar os mínimos detalhes de
armazenamento para a alocação de espaço, incluindo informações de trilhas,
setores e outros números específic ...