06 – SQL no PostgreSQL: O que são Índices (Indexes) e Como Eles Salvam a Performance do seu Banco

⌘K

06 – SQL no PostgreSQL: O que são Índices (Indexes) e Como Eles Salvam a Performance do seu Banco

Last updated 05/26/2026

No nosso último post, vimos como criar agregações robustas e relatórios usando o GROUP BY. Mas pense no seguinte cenário: sua aplicação começou a crescer, o volume de dados explodiu e aquela query que antes rodava em milissegundos agora está demorando segundos (ou minutos) para responder, travando as requisições dos usuários e gerando alertas de CPU alta no seu monitoramento.

Antes de sair pagando mais caro para fazer um upsize na sua instância de banco de dados na Nuvem, existe uma ferramenta cirúrgica que você precisa dominar: os Índices (Indexes).

Neste post, vamos entender de forma muito simples o que é um índice, como ele funciona nos bastidores do PostgreSQL e como utilizá-lo para acelerar suas consultas de forma drástica.

O que é um Índice? (A analogia do Livro)

Imagine que você tem em mãos um livro técnico sobre Kubernetes com 1.000 páginas. Se eu te pedir para encontrar a página exata que explica sobre “PodDisruptionBudget”, o que você faz?

Abordagem 1: Você lê o livro da página 1 até a 1.000, linha por linha, até achar o termo. No mundo dos bancos de dados, isso se chama Sequential Scan (ou Table Scan). É absurdamente lento e custoso.
Abordagem 2: Você vai direto até as últimas páginas do livro, olha o Índice Remissivo (alfabético), acha a palavra “PodDisruptionBudget” e vê que ela está na página 742. Você vai direto lá.

Um índice no banco de dados funciona exatamente como esse índice remissivo. Ele é uma estrutura de dados separada da tabela principal que guarda os valores de uma determinada coluna ordenados de forma eficiente, apontando para a linha exata onde aquele registro está no disco.

Como funciona o Índice Padrão (B-Tree)

O tipo de índice mais comum e padrão no PostgreSQL é o B-Tree (Balanced Tree, ou Árvore Balanceada).

Em vez de ler a tabela sequencialmente, o banco faz uma busca binária navegando pelos nós dessa árvore. Se você está buscando pelo ID 45, o banco olha para o topo da árvore, vê se 45 é maior ou menor que o valor central e descarta metade das opções imediatamente. Em poucos passos, ele encontra o endereço físico do dado.

Exemplos Práticos no PostgreSQL

Quando você cria uma tabela e define uma coluna como PRIMARY KEY ou UNIQUE, o PostgreSQL cria um índice para essa coluna automaticamente. Mas e para as outras colunas que usamos muito nos filtros?

1. Criando um Índice Simples

Imagine uma tabela com milhões de registros de logs onde você filtra constantemente pelo campo nivel_log ('INFO', 'ERROR', 'DEBUG').

CREATE INDEX idx_logs_nivel ON logs_aplicacao(nivel_log);

A partir de agora, quando você rodar um SELECT * FROM logs_aplicacao WHERE nivel_log = 'ERROR';, o Postgres usará o idx_logs_nivel para buscar apenas os erros, ignorando o resto das linhas.

2. Criando um Índice Composto

Muitas vezes, suas queries filtram por mais de uma coluna ao mesmo tempo. Em cenários DevOps, é muito comum filtrarmos métricas por id_cliente E data_evento.

CREATE INDEX idx_metricas_cliente_data 
ON metricas_infraestrutura(id_cliente, data_evento);

Dica de ouro: A ordem das colunas no índice composto importa. Coloque primeiro a coluna que tem maior poder de filtragem (maior seletividade).

A Importância dos Índices na Cultura DevOps e Dados

Redução drástica de I/O de disco: O gargalo da maioria dos bancos de dados relacionais é a leitura e escrita em disco. Índices bem projetados fazem o banco ler frações minúsculas do disco para entregar o mesmo resultado.
Economia financeira (Cloud Spend): Queries eficientes consomem menos processamento (CPU). Em ambientes escaláveis na AWS ou GCP, queries sem índice geram picos de CPU que forçam o auto-scaling a criar instâncias maiores ou mais réplicas, inflando a conta no final do mês.
Estabilidade em produção: Um único SELECT pesado rodando em uma tabela gigante sem índice pode causar table locking (bloqueio de tabelas), gerando uma fila de conexões presas e derrubando toda a aplicação produtiva.

O Preço do Almoço Grátis: Nem tudo são flores

Se os índices mudam o jogo da performance, por que não indexamos todas as colunas de todas as tabelas?

Porque índices têm um custo.

Espaço em disco: Como o índice é uma estrutura à parte, ele ocupa espaço. Em tabelas muito grandes, os índices podem chegar a ocupar mais gigabytes do que os próprios dados brutos.
Lentidão no INSERT, UPDATE e DELETE: Toda vez que você insere ou atualiza uma linha na tabela principal, o PostgreSQL precisa parar e atualizar também todos os índices associados àquela tabela para manter a árvore balanceada. Se você tiver índices demais, seus INSERTs vão ficar lentos.

Conclusão

Criar índices é a forma mais barata e eficiente de otimizar um banco de dados relacional. A regra geral é simples: indexe as colunas que aparecem frequentemente nas suas cláusulas WHERE e nas junções de tabelas, mas sem exageros para não penalizar a escrita.

No próximo post da nossa série de SQL, vamos entrar em outro conceito fundamental para quem lida com arquiteturas de dados complexas: os JOINs. Vamos aprender a conectar tabelas diferentes de forma performática.

Você tem alguma query rodando lento por aí? Já tentou rodar um EXPLAIN nela para ver se o Postgres está usando os índices corretamente? Conte sua experiência nos comentários!

Was this article helpful to you?

Print

Iniciando no PostgreSQL

01 – O que é SQL? Entenda o motor dos bancos de dados relacionais (com PostgreSQL)

02 – SQL no PostgreSQL: Dominando o Comando CREATE TABLE e Boas Práticas

03 – SQL no PostgreSQL: Inserindo Dados com o Comando INSERT e Estratégias Avançadas

04 – SQL no PostgreSQL: Entendendo o Comando SELECT e a Ordem de Execução

05 – SQL no PostgreSQL: Agrupando Dados com GROUP BY, HAVING e Funções de Agregação

06 – SQL no PostgreSQL: O que são Índices (Indexes) e Como Eles Salvam a Performance do seu Banco

07 – SQL no PostgreSQL: Desvendando os JOINs e Como Conectar Tabelas sem Derrubar a Performance

08 – SQL no PostgreSQL: Como Usar o EXPLAIN para Diagnosticar Queries Lentas

09 – SQL no PostgreSQL: Simplificando Queries Complexas com Views (Visualizações)

10 – SQL no PostgreSQL: Como usar o ALTER TABLE em Produção sem Causar Downtime

11 – SQL no PostgreSQL: Segurança e Governança de Dados com GRANT, REVOKE e Roles (DCL)

12 – SQL no PostgreSQL: Automatizando Processos com Triggers (Gatilhos)

13 – SQL no PostgreSQL: O que significam DDL, DML, DCL e DTL? O Guia Definitivo de Siglas

14 – SQL no PostgreSQL: Como Usar o Comando DELETE em Produção com Segurança Máxima

15 – SQL no PostgreSQL: O que são VACUUM e ANALYZE e Por Que Eles Mantêm Seu Banco Vivo