O HD da Nuvem: Guia Prático do Amazon EBS
Toda instância EC2 precisa de um lugar para instalar seu sistema operacional e armazenar dados. Esse lugar é o Amazon EBS (Elastic Block Store).
Analogia: Pense no EBS como o "SSD ou HD de alta performance" que você conecta ao seu "computador virtual" (sua instância EC2).
1. A Diferença Fundamental: Bloco vs. Objeto
Esta é a distinção mais importante que você precisa saber.
- A Dor (O Desafio): "Eu preciso alterar um único caractere em um arquivo de 1 Gigabyte."
Tipo | Armazenamento em Bloco (EBS) | Armazenamento de Objetos (S3) |
---|---|---|
Analogia | Uma "Tábua de Cortar". | Um "Saco de Grãos Selado". |
Como funciona | Você pode acessar e modificar pequenos "blocos" do arquivo diretamente, sem tocar no resto. | Para alterar um único grão, você precisa abrir o saco inteiro, trocar o grão e selar um saco novo. |
Resultado | A alteração é extremamente rápida e eficiente. | A alteração é lenta e ineficiente, pois requer a reescrita do objeto inteiro. |
Ideal para | Cargas de trabalho que exigem leituras e escritas rápidas e granulares, como sistemas de arquivos de SO e bancos de dados. | Cargas de trabalho que lidam com arquivos inteiros, como backups, imagens e vídeos. |
2. O Catálogo de Discos (Tipos de Volume EBS)
Assim como em uma loja de computadores, a AWS oferece diferentes "modelos" de HD/SSD, cada um otimizado para uma necessidade e um orçamento.
Família SSD (Foco em Performance - IOPS)
- IOPS (Input/Output Operations Per Second): A métrica de "velocidade" para bancos de dados. Mede quantas operações de leitura/escrita o disco aguenta por segundo.
Tipo de Volume | Analogia | Ideal Para... |
---|---|---|
SSD de IOPS Provisionado (io1/io2) | O "SSD de Nível de Competição". | Cargas de trabalho de banco de dados de missão crítica que exigem a mais alta e consistente performance. |
SSD de Uso Geral (gp2/gp3) | O "SSD de Excelente Custo-Benefício". | A escolha padrão para 99% das cargas de trabalho, incluindo volumes de boot, servidores web e bancos de dados de pequeno a médio porte. |
Família HDD (Foco em Volume - Taxa de Transferência)
- Taxa de Transferência (Throughput): A métrica de "largura de banda" do disco. Mede quantos Megabytes por segundo o disco consegue ler/escrever.
Tipo de Volume | Analogia | Ideal Para... |
---|---|---|
HDD com Taxa de Transferência Otimizada (st1) | O "HD para Grandes Arquivos". | Cargas de trabalho com grandes volumes de dados que são acessados com frequência e sequencialmente, como Data Warehouses e processamento de logs. |
Cold HDD (sc1) | O "HD de Arquivo Morto". | Dados que são acessados com pouca frequência e onde o custo é o fator mais importante. |
3. A Rede de Segurança (Snapshots do EBS)
A Dor que Resolve: "Como eu faço o backup do 'HD' da minha instância EC2?"
A Solução: Snapshots. * O que são? Um backup "point-in-time" (uma "fotografia") do seu volume EBS, que é salvo de forma durável no Amazon S3. * Analogia: Uma "cópia de segurança mágica" do seu HD.
Superpoderes do Snapshot:
- Incrementais: O primeiro snapshot copia o disco inteiro. Os seguintes copiam apenas os blocos que mudaram, economizando tempo e dinheiro.
- Recuperação Rápida: Você pode criar um novo volume EBS a partir de um snapshot em minutos.
- Criação de AMIs: Um snapshot é a base para criar sua própria Imagem de Máquina da Amazon (AMI) customizada.
- Recuperação de Desastres: Você pode copiar snapshots para outras Regiões da AWS, garantindo que seus backups estejam seguros mesmo que uma região inteira fique indisponível.
HACK PARA CERTIFICAÇÃO: Para a prova: 1. EBS é um serviço de armazenamento em BLOCO, persistente e para UMA ÚNICA instância EC2. 2. S3 é um serviço de armazenamento de OBJETOS. 3. Snapshots são o mecanismo de backup para volumes EBS e são armazenados no S3. 4. Lembre-se da diferença entre os tipos de volume: SSD (gp2/io1) é para performance de IOPS (bancos de dados). HDD (st1/sc1) é para performance de taxa de transferência (big data).
O SSD Inteligente: Guia dos Recursos Chave do Amazon EBS
Já estabelecemos que o EBS é o "HD/SSD" da nossa instância EC2. Mas ele é muito mais do que um simples disco. É um serviço de armazenamento inteligente, projetado para a resiliência e a flexibilidade que a nuvem exige.
1. Os Superpoderes do EBS
Persistência e Durabilidade
- O que é? Os dados em um volume EBS persistem independentemente da vida da sua instância EC2.
- Analogia: É como um "HD externo". Se o seu "computador" (instância) quebrar ou for desligado (
Stop
), o HD e todos os seus arquivos continuam intactos. - A Dor que Resolve: O risco de perda de dados. Diferente do armazenamento de instância (que é temporário), o EBS foi feito para ser durável. Além disso, cada volume é automaticamente replicado dentro da sua Zona de Disponibilidade para protegê-lo contra falhas de hardware.
Backups com Snapshots
- O que são? "Fotografias" pontuais do seu volume, salvas de forma durável no Amazon S3.
- A Dor que Resolve: A necessidade de ter um plano de backup e recuperação de desastres.
- Como Funciona: Você pode criar um novo volume a partir de um snapshot a qualquer momento. Para a máxima proteção (DR), você pode copiar snapshots para outras Regiões da AWS.
Criptografia Integrada
- A Dor que Resolve: A necessidade de proteger dados sensíveis em repouso e em trânsito.
- Como Funciona: Você pode optar por criar volumes EBS criptografados. A AWS cuida de todo o processo de criptografia e gerenciamento de chaves (usando o AWS KMS) sem custo adicional e de forma transparente para sua aplicação.
- O Resultado: Segurança e conformidade aprimoradas. Os dados no volume e os dados se movendo entre a instância e o volume são protegidos.
Elasticidade
- A Dor que Resolve: "O HD do meu servidor está quase cheio! No mundo antigo, isso seria um projeto de migração complexo."
- A Solução na Nuvem: Os volumes EBS são elásticos. Você pode:
- Aumentar a capacidade de um volume (ex: de 50GB para 1TB).
- Alterar o tipo de um volume (ex: de um HDD mais lento para um SSD de alta performance).
Insight de Especialista: Para a maioria dos tipos de volume modernos, você pode fazer essas modificações dinamicamente, sem precisar desligar sua instância EC2, garantindo a continuidade do serviço.
2. Como os Custos Funcionam
Você paga por duas coisas principais com o EBS:
- O Armazenamento Provisionado: Você paga pelo tamanho do "HD" que você pediu, por GB/mês, mesmo que não o use completamente.
- Os Snapshots: Você paga pelo espaço que seus backups ocupam no Amazon S3, também por GB/mês. > Hack de Custo: Como os snapshots são incrementais, você não paga pelo tamanho total do seu disco a cada novo backup. Você paga apenas pelos "blocos" de dados que foram alterados desde o último snapshot, o que torna os backups muito mais econômicos.
HACK PARA CERTIFICAÇÃO: Para a prova: 1. EBS é um serviço de armazenamento em BLOCO, persistente e para UMA ÚNICA instância EC2 por vez. 2. Snapshots são o mecanismo de backup para volumes EBS e são armazenados no S3. 3. Saiba que os volumes EBS podem ser redimensionados e ter seu tipo alterado dinamicamente. 4. Lembre-se que um volume EBS vive em uma única Zona de Disponibilidade. Para resiliência entre AZs, você precisa usar snapshots para recriar o volume em outra AZ.
A Garagem da Performance: Guia dos Tipos de Volume do Amazon EBS
Ao montar seu "computador virtual" (EC2), não basta apenas escolher o tamanho do "HD" (o volume EBS); você precisa escolher o tipo certo. Escolher o tipo errado é como usar uma moto para transportar uma geladeira ou uma carreta para entregar uma pizza: tecnicamente possível, mas terrivelmente ineficiente.
Analogia: Pense que você está montando a frota de veículos de uma empresa de logística.
1. Decodificando a Performance (IOPS vs. Taxa de Transferência)
Existem duas formas de medir a "velocidade" de um disco. Entender a diferença é crucial.
Métrica | Analogia | O que Mede? | Ideal Para... |
---|---|---|---|
IOPS (Operações de I/O por Segundo) | A "agilidade de uma moto de delivery". | O número de pequenas operações (leituras e escritas) que o disco faz por segundo. | Bancos de dados transacionais (muitos SELECT s, UPDATE s e INSERT s pequenos e rápidos). |
Taxa de Transferência (Throughput - MB/s) | A "capacidade de carga de uma carreta". | O volume total de dados que o disco consegue mover por segundo em grandes operações. | Big Data, Data Warehouses, streaming de vídeo, processamento de logs (poucas leituras, mas de arquivos enormes). |
2. O Catálogo de Veículos (Os Tipos de Volume EBS)
Família SSD (As Motos de Delivery - Foco em IOPS)
Otimizados para cargas de trabalho transacionais com muitas operações pequenas e rápidas.
SSD de IOPS Provisionadas (io1/io2):
- Analogia: Uma "moto de corrida de MotoGP".
- Uso: Bancos de dados de missão crítica (Oracle, SQL Server, etc.) que exigem a mais alta e consistente performance de IOPS. É a opção mais cara e de maior desempenho.
SSD de Uso Geral (gp2/gp3):
- Analogia: Uma "moto de delivery versátil e econômica".
- Uso: A escolha padrão e de melhor custo-benefício para 99% das cargas de trabalho, incluindo volumes de boot, servidores web, ambientes de desenvolvimento e bancos de dados de pequeno a médio porte.
Família HDD (As Carretas - Foco em Taxa de Transferência)
Otimizados para cargas de trabalho com grandes volumes de dados e operações sequenciais.
HDD com Taxa de Transferência Otimizada (st1):
- Analogia: Uma "carreta de 18 rodas".
- Uso: Cargas de trabalho com grandes volumes de dados que são acessados com frequência, como Data Warehouses (Redshift) e processamento de logs.
Cold HDD (sc1):
- Analogia: Um "vagão de trem de carga".
- Uso: O menor custo por GB. Ideal para dados que são acessados com pouca frequência, como arquivamento de arquivos e backups onde a velocidade de acesso não é a prioridade.
3. O Fluxograma de Decisão do Arquiteto
Se a sua necessidade é... | A escolha certa é... |
---|---|
O volume de boot de uma instância EC2? | SSD de Uso Geral (gp3) |
Um banco de dados transacional de missão crítica? | SSD de IOPS Provisionadas (io2) |
Um banco de dados transacional normal ou de uso geral? | SSD de Uso Geral (gp3) |
Big Data, Data Warehousing, processamento de logs? | HDD com Taxa de Transferência Otimizada (st1) |
Armazenamento de baixo custo para dados acessados com pouca frequência? | Cold HDD (sc1) |
HACK PARA CERTIFICAÇÃO: Para a prova: 1. Lembre-se das duas famílias: SSD é otimizado para IOPS (transações pequenas e rápidas). HDD é otimizado para Taxa de Transferência (dados grandes e sequenciais). 2. Saiba que o SSD de Uso Geral (gp2/gp3) é o tipo de volume padrão e mais versátil. 3. Associe IOPS Provisionadas (io1/io2) com bancos de dados de altíssima performance.
A Ferramenta Certa para a Carga: Guia de Casos de Uso do Amazon EBS
Já conhecemos os "veículos" na nossa garagem de performance (os tipos de volume EBS). Agora, vamos aprender exatamente para qual "tipo de entrega" (carga de trabalho) cada um deles foi projetado. Escolher o veículo certo é a chave para uma operação logística (sua aplicação) eficiente e lucrativa.
O Playbook de Casos de Uso do EBS
SSD de Uso Geral (gp2/gp3)
- Analogia: A "Moto de Delivery Versátil e Econômica".
Quando Usar:
-
Volumes de Inicialização do Sistema (Boot Volumes)
- O "Porquê": Sistemas operacionais precisam de tempos de boot rápidos e uma resposta ágil para o usuário, o que depende de muitas pequenas leituras/escritas (IOPS). O
gp3
oferece isso com o melhor custo-benefício.
- O "Porquê": Sistemas operacionais precisam de tempos de boot rápidos e uma resposta ágil para o usuário, o que depende de muitas pequenas leituras/escritas (IOPS). O
-
Aplicações Interativas de Baixa Latência
- O "Porquê": A experiência do usuário em aplicações como desktops virtuais ou sistemas de resposta rápida depende da rapidez com que a interface responde, um caso de uso clássico de IOPS.
-
Ambientes de Teste e Desenvolvimento
- O "Porquê": Oferece performance mais do que suficiente para a maioria das atividades de desenvolvimento e compilação, com um preço acessível.
SSD de IOPS Provisionadas (io1/io2)
- Analogia: A "Moto de Corrida de MotoGP".
Quando Usar:
Cargas de Trabalho Intensivas de E/S
- O "Porquê": Quando sua aplicação precisa de um número garantido e consistente de operações por segundo, sem variações.
Bancos de Dados Relacionais e NoSQL de Missão Crítica
- O "Porquê": Grandes bancos de dados (como Oracle, SQL Server, Cassandra) que suportam o coração do seu negócio não podem arriscar ter picos de latência. O
io2
garante a performance de IOPS que você contratou, faça chuva ou faça sol.
- O "Porquê": Grandes bancos de dados (como Oracle, SQL Server, Cassandra) que suportam o coração do seu negócio não podem arriscar ter picos de latência. O
HDD com Taxa de Transferência Otimizada (st1)
- Analogia: A "Carreta de 18 Rodas".
Quando Usar:
Big Data e Data Warehouses
- O "Porquê": Processar um arquivo de log de 1TB é uma única e longa operação de leitura sequencial. Você não precisa da agilidade de uma moto (IOPS); você precisa da capacidade de carga de uma carreta (Taxa de Transferência).
Cargas de Trabalho de Streaming
- O "Porquê": Entregar grandes arquivos de vídeo ou áudio depende da largura de banda (MB/s) do disco, não de quantas pequenas operações ele pode fazer.
!!! warning "Atenção"
Este tipo de volume não pode ser usado como volume de inicialização (boot volume).
- O "Porquê": Entregar grandes arquivos de vídeo ou áudio depende da largura de banda (MB/s) do disco, não de quantas pequenas operações ele pode fazer.
Cold HDD (sc1)
- Analogia: Um "Vagão de Trem de Carga".
Quando Usar:
Armazenamento para Dados Acessados com Pouca Frequência
- O "Porquê": É o "veículo" com o menor custo por "tonelada" (GB). Ideal para dados que você precisa manter online, mas que raramente acessa, como backups mais antigos ou arquivos de projetos concluídos, onde a velocidade de acesso não é a prioridade.
!!! warning "Atenção"
Este tipo de volume também não pode ser usado como volume de inicialização.
- O "Porquê": É o "veículo" com o menor custo por "tonelada" (GB). Ideal para dados que você precisa manter online, mas que raramente acessa, como backups mais antigos ou arquivos de projetos concluídos, onde a velocidade de acesso não é a prioridade.
HACK PARA CERTIFICAÇÃO: A prova é cheia de perguntas de cenário sobre armazenamento. A regra de ouro é: * Sua aplicação precisa de velocidade para muitas pequenas transações (banco de dados, SO)? -> Pense em SSD (gp3 para o padrão, io2 para o extremo). * Sua aplicação precisa mover grandes volumes de dados de uma vez (big data, logs)? -> Pense em HDD (st1).
O Ciclo de Vida do Disco: Guia Prático de Volumes e Snapshots do EBS
Criar um volume EBS é só o começo. A verdadeira maestria de um administrador de nuvem está em como ele gerencia esse volume no dia a dia: como o conecta a um servidor, como faz seu backup de forma eficiente e como o prepara para uma recuperação de desastres.
Analogia: Pense que sua instância EC2 é o "computador de edição de vídeo" do seu estúdio, e um volume EBS é um "HD externo de alta performance" onde seus projetos estão salvos.
1. A Conexão (Anexando um Volume EBS)
A Dor que Resolve: "Minha instância EC2 está ficando sem espaço. Preciso de um novo 'drive D:' para os dados da minha aplicação."
O processo envolve dois estágios: conectar o "hardware" e configurar o "software".
- Anexar o Volume (O Lado da AWS):
- Você usa o comando
aws ec2 attach-volume
para "plugar" o HD externo na sua máquina de edição.aws ec2 attach-volume \ --volume-id vol-1234567890abcdef0 \ --instance-id i-01474ef662b89480 \ --device /dev/sdf
- Você usa o comando
- Formatar e Montar o Volume (O Lado do Linux): >
INSIGHT DE ESPECIALISTA: Anexar o volume não é suficiente! Assim como um HD novo, o sistema operacional ainda não sabe como usá-lo. Você precisa se conectar à instância via SSH e: > 1. Formatar o novo disco (ex:
sudo mkfs -t xfs /dev/sdf
). > 2. Montá-lo em um diretório (ex:sudo mount /dev/sdf /data
).
2. O Backup Inteligente (Criando Snapshots)
A Dor que Resolve: "Fazer um backup completo de um HD de 10TB toda noite é lento e consome um espaço imenso."
A Solução: Snapshots do EBS, que são incrementais.
- Analogia (O Backup do Estúdio):
- Backup de Domingo (Snapshot 1): O sistema faz uma cópia completa de todos os 10TB de vídeo.
- Backup de Segunda (Snapshot 2): Em vez de copiar tudo de novo, o sistema é inteligente. Ele "apenas olha o que mudou" desde domingo. "Ah, você só editou aquele clipe de 30 segundos. Vou copiar apenas esses pedacinhos (blocos) novos."
- O Resultado: O backup é super rápido e economiza muito espaço. No entanto, para restaurar o projeto, o sistema sabe que precisa pegar a base do backup de domingo e aplicar as "pequenas mudanças" de segunda por cima.
A Melhor Prática (Consistência de Dados)
!!! warning "Atenção"
Você pode tirar um snapshot de um volume em uso, mas para dados críticos (como um banco de dados), a forma mais segura de garantir um backup 100% consistente é parar a instância (Stop
) ou, no mínimo, pausar as operações de escrita no disco antes de criar o snapshot.
3. O Plano de Contingência (Copiando Snapshots entre Regiões)
A Dor que Resolve: "Meus backups estão seguros, mas o que acontece se a Região inteira de São Paulo ficar indisponível?"
A Solução: Copiar seus snapshots para outra Região. É a sua apólice de seguro para Recuperação de Desastres (DR).
- Analogia: "Enviar uma cópia do HD de backup para um cofre em outra cidade."
- O Comando:
aws ec2 copy-snapshot \ --source-region us-west-2 \ --source-snapshot-id snap-1234567890abcdef0 \ --region us-east-1 \ --description "Copia de DR do meu volume de dados"
- O Resultado: Você agora tem uma cópia segura dos seus dados em outra parte do mundo, pronta para ser restaurada em uma nova instância se o pior acontecer.
HACK PARA CERTIFICAÇÃO: Para a prova: 1. Snapshots são o mecanismo de backup para volumes EBS. 2. Eles são incrementais, o que economiza custos de armazenamento. 3. Eles são armazenados no Amazon S3. 4. Você pode copiar snapshots entre Regiões para Recuperação de Desastres (DR).
O Piloto Automático dos Backups: Guia do Amazon Data Lifecycle Manager (DLM)
Já sabemos que os Snapshots do EBS são a forma de fazer backup dos nossos "HDs virtuais". Mas, no dia a dia, criar e deletar snapshots manualmente é uma tarefa: * Propensa a erros: É fácil esquecer de fazer um backup. * Cara: É ainda mais fácil esquecer de deletar snapshots antigos, que acumulam custos no S3.
A Dor que o DLM Resolve: O gerenciamento manual, reativo e caro de backups.
O Amazon Data Lifecycle Manager (DLM) é a solução. É um serviço que permite que você automatize a criação, a retenção e a exclusão de snapshots do EBS.
Analogia: Pense no DLM como um "Robô Aspirador de Pó Inteligente". Em vez de você ter que lembrar de passar o aspirador e esvaziar o saco de pó, você simplesmente programa o robô, e ele faz tudo sozinho.
1. O Plano de Voo (A Anatomia de uma Política de Ciclo de Vida)
Para "programar o robô", você cria uma Política de Ciclo de Vida (Lifecycle Policy). Esta política é a sua "agenda de limpeza" e responde a três perguntas:
1.
Onde limpar? (Tags de Destino)
- Como funciona? O DLM não faz backup de tudo. Ele procura por volumes EBS que tenham uma tag específica.
- Analogia: Você coloca uma "etiqueta" na porta dos cômodos que você quer que o robô limpe (ex:
Backup: Daily
).
2.
Quando limpar? (Programação)
- Como funciona? Você define a frequência e o horário em que os snapshots serão criados.
- Analogia: "Limpe todos os cômodos com a etiqueta 'Daily' a cada 24 horas, às 3 da manhã."
3.
O que fazer com a sujeira antiga? (Regra de Retenção)
- Como funciona? Você define quantos snapshots quer manter. Quando um novo é criado e o limite é excedido, o mais antigo é automaticamente deletado.
- Analogia: "Mantenha apenas os últimos 5 sacos de pó (snapshots). Quando o sexto for criado, jogue o mais antigo fora."
Insight de Especialista: Além de reter por contagem (
Count
), você também pode reter por idade (Age
), por exemplo, "delete todos os snapshots com mais de 30 dias".
2. A Prática na CLI (Configurando a Automação)
Vamos ver como o seu material de curso traduz essa programação para a AWS CLI.
Passo 1: Dar Permissão ao Robô (create-default-role
)
Primeiro, precisamos criar a IAM Role que dá ao serviço DLM a permissão para criar e deletar snapshots em seu nome.
aws dlm create-default-role
Passo 2: Escrever a Programação (O Arquivo JSON)
Em seguida, criamos um arquivo (ex: policyDetails.json
) com as regras. Este JSON reflete as três perguntas que fizemos.
{
"ResourceTypes": ["VOLUME"],
"TargetTags": [
{ "Key": "name", "Value": "production" }
],
"Schedules": [{
"Name": "DailySnapshots",
"CreateRule": {
"Interval": 24,
"IntervalUnit": "HOURS",
"Times": [ "03:00" ]
},
"RetainRule": {
"Count": 5
},
"CopyTags": false
}]
}
Tradução: "Para todos os volumes com a tag
name: production
, crie um snapshot a cada 24 horas às 03:00, e mantenha apenas os últimos 5."
Passo 3 e 4: Enviar e Verificar a Programação
Finalmente, usamos a CLI para criar a política a partir do nosso arquivo JSON e depois verificamos se ela foi criada corretamente.
# Criar a política
aws dlm create-lifecycle-policy \
--description "Minha politica de backup diario" \
--state ENABLED \
--execution-role-arn arn:aws:iam::[SEU_ID_CONTA]:role/AWSDataLifecycleManagerDefaultRole \
--policy-details file://policyDetails.json
# Verificar a política criada
aws dlm get-lifecycle-policy --policy-id [ID_DA_POLITICA_RETORNADO_ACIMA]
HACK PARA CERTIFICAÇÃO: Para a prova:
- Amazon Data Lifecycle Manager (DLM) é o serviço para AUTOMATIZAR a criação, retenção e exclusão de snapshots do EBS.
- Ele funciona criando uma Política de Ciclo de Vida que seleciona volumes com base em Tags.
- O DLM é uma ferramenta chave para Otimização de Custos (deletando snapshots antigos) e Excelência Operacional (automatizando backups).