Observabilidad
Observabilidad
- Grafana: dashboards y alertas.
- Prometheus: scraping de exporters.
- Netdata: visión de nodo (CPU, RAM, IO).
Buenas prácticas
- Todo servicio expone
/health(200 JSON). - Etiquetas estándar en métricas:
service,slug,env. - Alertas mínimas: 5xx > 1% 5min; down de systemd; latency p95 > umbral.
status.json
Documento JSON consumido por el infra-monitor para pintar el estado. Debe incluir cada servicio con systemd y HTTP (local/público) cuando aplique.