Health-Monitoring — was jedes Signal bedeutet

3 Min LesezeitAktualisiert am 2026-05-18

Health-Monitoring — was jedes Signal bedeutet

Hubbee monitort jede verbundene Site kontinuierlich. Diese Seite erklärt jedes Status-Badge, das du siehst, und was jede Transition auslöst.

Das zwei-dimensionale Status-Modell

Jede Site hat zwei unabhängige Status-Signale:

  1. Connection-Status — ist die Site erreichbar? (online / offline / unknown)
  2. Health-Status — funktioniert die Site korrekt? (ok / warning / critical)

Eine Site kann online aber critical sein (erreichbar, aber PHP wirft Errors). Oder offline (wir haben Kontakt verloren). Das Dashboard kombiniert beides zu einem sichtbaren Badge, aber intern sind sie separat getrackt.

Connection-Status — wie er berechnet wird

Das WP-Plugin sendet alle 5 Minuten einen Heartbeat (konfigurierbar in Sites → Settings → Heartbeat-Intervall). Jeder Heartbeat aktualisiert last_heartbeat_at.

Hubbee betrachtet eine Site als offline, wenn:

now - last_heartbeat_at  >  heartbeat_intervall × 3

Beim Default-5-Minuten-Intervall flippt eine Site nach 15 Minuten Stille auf offline. Bei 1-Minuten-Intervall nach 3 Minuten.

Diese 3×-Schwelle verhindert Flappen bei einem einzelnen verpassten Beat. Für strengeres Monitoring das Intervall senken (bis auf 1 Minute auf Pro/Agency).

Health-Status — wie er berechnet wird

Jeder Heartbeat bringt ein Payload vom WP-Plugin mit:

  • WordPress-Version
  • PHP-Version
  • Plugin-Version
  • Memory-Usage (PHP, current / limit)
  • Disk-Usage (Uploads-Dir + WP-Root)
  • Letzter PHP-Fehler aus wp-content/debug.log
  • Aktives Theme + Slug
  • Anstehende Plugin-/Theme-/Core-Updates

Plugin bewertet das gegen Schwellen und meldet Status:

Trigger Status
PHP-Version end-of-life (kein Security-Support) critical
PHP-Version >= aktuelles stable ok
Memory-Usage > 90% warning
Disk-Usage > 95% critical
Fataler Fehler in debug.log innerhalb letzter Stunde critical
Warning/Notice innerhalb letzter Stunde warning
Anstehendes Core-Update warning
Anstehende Plugin-/Theme-Updates warning
Alles grün ok

Der Status ist der schlimmste aller Trigger. Ein Critical-Trigger macht die ganze Site critical.

Das Dashboard-Badge

Jede Site-Karte zeigt ein kombiniertes Badge:

  • Grüner Punkt + “Online” — Verbindung online, Health OK
  • Gelber Punkt + “Warning” — Verbindung online, Health-Warning
  • Roter Punkt + “Critical” — Verbindung online, Health-Critical
  • Grauer Punkt + “Offline” — Verbindung offline (Health nicht ermittelbar wenn nicht erreichbar)
  • Hell-grau + “Unknown” — Verbindungs-Status noch nicht ermittelt (neue Site)

Hover über das Badge für Last-Heartbeat-Timestamp + Grund.

Wie schnell sind Status-Änderungen sichtbar?

  • Connection → Offline: dauert heartbeat_intervall × 3 (Default 15 min) nach letztem erfolgreichen Beat
  • Connection → Online: bis zu 60 Sekunden nach Recovery (Dashboard-Polling)
  • Health-Änderungen: sofort beim nächsten Heartbeat (binnen 5 min)

Für schnellere Recovery-Erkennung (kritische Produktiv-Sites) das Heartbeat-Intervall senken. Trade-off: mehr WP-Cron-Zyklen und etwas mehr Bandbreite.

Der Site-Health-Tab

In jeder Site → Tab Health. Zeigt den vollen Detail jedes Signals:

  • Letzte 24 Stunden Heartbeats als Timeline
  • Memory- + Disk-Usage-Graphen (7 Tage)
  • Anstehende Updates mit Schweregrad
  • Recent PHP-Fehler mit Stack-Traces (Pro+)

Alerting

Pro-Site konfigurierbar:

  • E-Mail bei Status-Wechsel zu Warning oder Critical
  • E-Mail wenn Site > 30 min Offline
  • Slack-Webhook (Pro+) für beide Transitionen

Settings → Notifications → Site-Alerts setzt Defaults; einzelne Sites können überschreiben.

Uptime-SLO-Tracking

Dashboard trackt Uptime-Prozentsatz über die letzten 30 Tage:

uptime_pct = (gesamt_sekunden - offline_sekunden) / gesamt_sekunden × 100

Eine Site, die in 30 Tagen 1 Stunde offline war: 99,86%. Werte unter 99% triggern ein gelbes Banner; unter 95% wird rot.

Das ist die gleiche Metrik, die dein Kunde auf der geteilten Status-Page sieht (Agency-Plan).

Wann beunruhigen vs nicht

Muster Aktion
Einzelnes Flappen (online → offline → online binnen einer Stunde) Ignorieren. Wahrscheinlich kurzer Network-Hickup.
Wiederholtes Flappen (>3 Transitions/Tag) WP-Cron, Server-Last oder Host-Network-Reliability prüfen.
Persistent offline Plugin offline durchgehen.
Plötzlich Critical Health-Tab → recent errors. Meist ein Plugin-/Theme-Update schief.
Schleichend Warning über Tage Memory-/Disk-Creep — untersuchen, bevor Critical.

Was das NICHT ersetzt

Hubbees Health-Monitoring ist für Plugin-Verbindung + WP-interne Signale. Es ersetzt nicht dediziertes Uptime-Monitoring (Pingdom, UptimeRobot, Better Stack), das von außen checkt. Für mission-critical Sites beide laufen lassen — sie fangen verschiedene Failure-Modes ab.

War der Artikel hilfreich?

Du kommst nicht weiter?

Öffne einen Support-Thread und wir melden uns. Die meisten Antworten erfolgen werktags innerhalb weniger Stunden.

Support kontaktieren