Plataforma open-source de dashboards que conecta múltiplos data sources como Prometheus, Loki, Elasticsearch e PostgreSQL em visualizações correlacionadas.

O que são variáveis de template no Grafana?

Dropdowns populados dinamicamente a partir de queries que permitem filtrar dashboards por namespace, serviço ou ambiente sem duplicar painéis.

Qual a diferença entre Grafana Loki e Elasticsearch?

Loki indexa apenas labels dos logs, sendo mais barato para armazenar grandes volumes. Elasticsearch indexa o conteúdo completo, sendo mais rápido para buscas de texto livre.

Como correlacionar logs e traces no Grafana?

Incluindo o Trace ID nos logs do Loki e configurando derived fields que geram links automáticos para o trace correspondente no Grafana Tempo.

Grafana Cloud é gratuito?

Sim, o tier gratuito inclui 10.000 séries Prometheus, 50 GB de logs Loki e 50 GB de traces Tempo por mês, suficiente para projetos de médio porte.

Grafana: dashboards profissionais para monitoramento e observabilidade

Visualização de métricas do Prometheus, logs do Loki, traces do Tempo e como construir dashboards que revelam o estado real do sistema.

O que é Grafana e por que se tornou padrão

TL;DR - Visualização de métricas do Prometheus, logs do Loki, traces do Tempo e como construir dashboards que revelam o estado real do sistema.

Grafana é uma plataforma open-source de visualização e análise de dados que permite criar dashboards interativos conectando múltiplas fontes de dados - Prometheus, Loki, Elasticsearch, InfluxDB, PostgreSQL, MySQL, entre dezenas de outros. Lançado em 2014 como fork do Kibana com foco em métricas de séries temporais, o Grafana se tornou o padrão de facto para dashboards de observabilidade em ambientes cloud-native, especialmente por sua integração nativa com Prometheus. A força do Grafana está na flexibilidade: um único dashboard pode combinar métricas de CPU do Prometheus, logs de erro do Loki e traces de latência do Tempo em painéis correlacionados, oferecendo uma visão unificada do estado do sistema. Com mais de 20 milhões de usuários ativos e marketplace de dashboards pré-construídos, a barreira de entrada é baixa.

Data sources - conectando Prometheus, Loki, Tempo e outros

Data sources no Grafana são conectores configurados para cada backend de dados, definindo URL, autenticação e parâmetros de conexão. Cada dashboard e panel referência um ou mais data sources, e um único Grafana pode conectar dezenas de data sources simultaneamente. O data source do Prometheus usa PromQL nativo, enquanto o Loki usa LogQL e o Tempo usa TraceQL para navegação por traces. Data sources podem ser configurados via interface web ou como código em arquivos YAML para ambientes GitOps, garantindo que a configuração do ambiente seja reproduzível. O Grafana também suporta data sources de bancos relacionais como PostgreSQL e MySQL, permitindo visualizar dados de negócio ao lado de métricas de infraestrutura no mesmo dashboard.

Panels - gráficos, tabelas, stat panels

Panels são os blocos de construção de dashboards no Grafana, cada um configurado com uma ou mais queries e um tipo de visualização. Time séries panels exibem métricas ao longo do tempo com linhas, barras ou área preenchida - ideais para visualizar taxas e tendências. Stat panels mostram um único valor numérico em destaque com thresholds de cor para indicar status - verde para normal, amarelo para aviso, vermelho para crítico. Table panels organizam dados tabulares com sorting, filtragem e links, úteis para listar os endpoints mais lentos ou os pods com maior consumo de memória. Gauge panels mostram valores em relação a um intervalo máximo, adequados para uso percentual de CPU e memória. Heatmap panels visualizam distribuições ao longo do tempo, revelando padrões de latência que histogramas agregados ocultariam.

Variáveis de template - dashboards dinâmicos

Variáveis de template transformam dashboards estáticos em ferramentas de análise dinâmicas, permitindo filtrar e alternar entre dimensões sem duplicar painéis. Uma variável de query como label_values(kube_pod_info, namespace) cria um dropdown populado automaticamente com todos os namespaces existentes no Prometheus. Outra variável pode depender da primeira, como listar apenas pods do namespace selecionado, criando filtros encadeados. Variáveis são referenciadas nas queries dos panels com a sintaxe $variável ou ${variável:regex}, e o Grafana substitui o valor selecionado na hora da execução. Dashboards com variáveis bem projetadas servem todos os ambientes - produção, staging, desenvolvimento - e todos os serviços sem precisar de cópias separadas por contexto.

Continuando ↓

Alertas no Grafana

O Grafana Alerting unifica o gerenciamento de alertas provenientes de múltiplos data sources - Prometheus, Loki, Elasticsearch - em uma interface única com regras, notificações e silences centralizados. Ao contrário do Alertmanager do Prometheus que só trabalha com alerting rules do Prometheus, o Grafana Alerting pode criar alertas baseados em queries de qualquer data source configurado. Alertas no Grafana suportam múltiplos canais de notificação via contact points: Slack, email, PagerDuty, OpsGenie, Telegram e webhooks customizados. Notification policies definem hierarquias de roteamento baseadas em labels, similar ao Alertmanager. O estado de cada alerta é persistido e exibido no dashboard com anotações visuais no ponto exato do gráfico onde o alerta disparou.

Grafana Loki - logs centralizados

Grafana Loki é um sistema de agregação de logs horizontalmente escalável, inspirado no Prometheus mas para logs. Diferente do Elasticsearch que indexa o conteúdo completo de cada log, o Loki indexa apenas os labels - como service, namespace e pod - e armazena o conteúdo dos logs comprimido sem indexação. Isso reduz drasticamente o custo de storage e processamento, com o trade-off de que buscas de texto completo são mais lentas que no Elasticsearch. O Promtail, ou alternativamente OpenTelemetry Collector e Fluentd, coleta logs de arquivos e containers e os envia ao Loki com labels extraídos. No Grafana, o painel Explore do Loki permite buscar logs com LogQL, filtrar por labels e visualizar volume de logs ao longo do tempo correlacionado com métricas do Prometheus.

Grafana Tempo - traces distribuídos

Grafana Tempo é um backend de tracing distribuído de alta escala que armazena traces em object storage (S3, GCS, Azure Blob) sem indexação adicional, tornando-o extremamente econômico. Ao contrário do Jaeger que indexa spans por serviço, operação e tags para buscas, o Tempo requer um Trace ID para recuperar um trace - buscas são feitas via métricas do Prometheus ou logs do Loki que contêm o Trace ID. A integração entre Loki, Prometheus e Tempo no Grafana é chamada de "exemplars e derived fields": um log de erro no Loki com um campo TraceID gera automaticamente um link para o trace completo no Tempo, e uma métrica no Prometheus com um exemplar aponta para o trace que representou aquela observação. Essa correlação transforma o Grafana em uma plataforma de observabilidade completa sem necessidade de ferramentas externas.

Dashboards como código - Grafana e GitOps

Dashboards no Grafana são representados internamente como JSON, o que permite versioná-los em Git, automatizar sua criação e garantir consistência entre ambientes. O Grafana suporta provisioning de dashboards e data sources via arquivos YAML montados como ConfigMaps no Kubernetes, eliminando configuração manual após cada deploy. Ferramentas como Grafonnet (Jsonnet) e Grafana Foundation SDK permitem criar dashboards programaticamente com reutilização de componentes, loops e condicionais que seriam impossíveis no editor visual. O Grafana Cloud oferece integração com GitHub Actions para publicar dashboards automaticamente em PRs. Para times que adotam GitOps, versionar dashboards junto com alerting rules e infrastructure as code é uma prática que garante auditabilidade e rollback de configurações de observabilidade.

Continuando ↓

Grafana Cloud vs self-hosted

Grafana Cloud é a oferta SaaS do Grafana Labs que inclui Grafana, Prometheus gerenciado, Loki, Tempo e Alerting em um plano único com tier gratuito generoso - 10.000 séries de Prometheus, 50 GB de logs e 50 GB de traces por mês. A vantagem do Cloud é zero operação de infraestrutura de observabilidade: sem gerenciar upgrades do Prometheus, storage de Loki ou disponibilidade do Grafana. Self-hosted oferece controle total de dados - essencial para compliance e dados sensíveis que não podem sair da infraestrutura - e custos potencialmente menores em grande escala. O kube-prometheus-stack com Thanos e Loki self-hosted é a configuração mais comum em empresas com restrições de dados. Para startups e times que preferem foco em produto, Grafana Cloud elimina a complexidade operacional do stack de observabilidade.

Conclusão

Grafana unificou a visualização de observabilidade ao suportar múltiplos data sources em dashboards correlacionados, tornando mais fácil conectar métricas do Prometheus, logs do Loki e traces do Tempo em uma única plataforma. A combinação de variáveis de template, alerting integrado e dashboards como código torna o Grafana adequado tanto para exploração ad-hoc quanto para monitoramento operacional em produção. Grafana Cloud reduz a barreira de adoção para times que não querem operar infraestrutura de observabilidade. Para sistemas em produção, investir em dashboards bem projetados com os quatro sinais dourados, alertas baseados em SLO e correlação entre sinais é uma das melhores formas de reduzir o tempo de detecção e resolução de incidentes. Continue em: Fundamentos obrigatórios antes de produção.

Vídeos - Grafana e Observabilidade