Observabilidad

Observabilidad

  • Grafana: dashboards y alertas.
  • Prometheus: scraping de exporters.
  • Netdata: visión de nodo (CPU, RAM, IO).

Buenas prácticas

  • Todo servicio expone /health (200 JSON).
  • Etiquetas estándar en métricas: service, slug, env.
  • Alertas mínimas: 5xx > 1% 5min; down de systemd; latency p95 > umbral.

status.json

Documento JSON consumido por el infra-monitor para pintar el estado. Debe incluir cada servicio con systemd y HTTP (local/público) cuando aplique.