Health-Monitoring — was jedes Signal bedeutet
Health-Monitoring — was jedes Signal bedeutet
Hubbee monitort jede verbundene Site kontinuierlich. Diese Seite erklärt jedes Status-Badge, das du siehst, und was jede Transition auslöst.
Das zwei-dimensionale Status-Modell
Jede Site hat zwei unabhängige Status-Signale:
- Connection-Status — ist die Site erreichbar? (
online/offline/unknown) - Health-Status — funktioniert die Site korrekt? (
ok/warning/critical)
Eine Site kann online aber critical sein (erreichbar, aber PHP wirft Errors). Oder offline (wir haben Kontakt verloren). Das Dashboard kombiniert beides zu einem sichtbaren Badge, aber intern sind sie separat getrackt.
Connection-Status — wie er berechnet wird
Das WP-Plugin sendet alle 5 Minuten einen Heartbeat (konfigurierbar in Sites → Settings → Heartbeat-Intervall). Jeder Heartbeat aktualisiert last_heartbeat_at.
Hubbee betrachtet eine Site als offline, wenn:
now - last_heartbeat_at > heartbeat_intervall × 3
Beim Default-5-Minuten-Intervall flippt eine Site nach 15 Minuten Stille auf offline. Bei 1-Minuten-Intervall nach 3 Minuten.
Diese 3×-Schwelle verhindert Flappen bei einem einzelnen verpassten Beat. Für strengeres Monitoring das Intervall senken (bis auf 1 Minute auf Pro/Agency).
Health-Status — wie er berechnet wird
Jeder Heartbeat bringt ein Payload vom WP-Plugin mit:
- WordPress-Version
- PHP-Version
- Plugin-Version
- Memory-Usage (PHP, current / limit)
- Disk-Usage (Uploads-Dir + WP-Root)
- Letzter PHP-Fehler aus
wp-content/debug.log - Aktives Theme + Slug
- Anstehende Plugin-/Theme-/Core-Updates
Plugin bewertet das gegen Schwellen und meldet Status:
| Trigger | Status |
|---|---|
| PHP-Version end-of-life (kein Security-Support) | critical |
| PHP-Version >= aktuelles stable | ok |
| Memory-Usage > 90% | warning |
| Disk-Usage > 95% | critical |
Fataler Fehler in debug.log innerhalb letzter Stunde |
critical |
| Warning/Notice innerhalb letzter Stunde | warning |
| Anstehendes Core-Update | warning |
| Anstehende Plugin-/Theme-Updates | warning |
| Alles grün | ok |
Der Status ist der schlimmste aller Trigger. Ein Critical-Trigger macht die ganze Site critical.
Das Dashboard-Badge
Jede Site-Karte zeigt ein kombiniertes Badge:
- Grüner Punkt + “Online” — Verbindung online, Health OK
- Gelber Punkt + “Warning” — Verbindung online, Health-Warning
- Roter Punkt + “Critical” — Verbindung online, Health-Critical
- Grauer Punkt + “Offline” — Verbindung offline (Health nicht ermittelbar wenn nicht erreichbar)
- Hell-grau + “Unknown” — Verbindungs-Status noch nicht ermittelt (neue Site)
Hover über das Badge für Last-Heartbeat-Timestamp + Grund.
Wie schnell sind Status-Änderungen sichtbar?
- Connection → Offline: dauert
heartbeat_intervall × 3(Default 15 min) nach letztem erfolgreichen Beat - Connection → Online: bis zu 60 Sekunden nach Recovery (Dashboard-Polling)
- Health-Änderungen: sofort beim nächsten Heartbeat (binnen 5 min)
Für schnellere Recovery-Erkennung (kritische Produktiv-Sites) das Heartbeat-Intervall senken. Trade-off: mehr WP-Cron-Zyklen und etwas mehr Bandbreite.
Der Site-Health-Tab
In jeder Site → Tab Health. Zeigt den vollen Detail jedes Signals:
- Letzte 24 Stunden Heartbeats als Timeline
- Memory- + Disk-Usage-Graphen (7 Tage)
- Anstehende Updates mit Schweregrad
- Recent PHP-Fehler mit Stack-Traces (Pro+)
Alerting
Pro-Site konfigurierbar:
- E-Mail bei Status-Wechsel zu Warning oder Critical
- E-Mail wenn Site > 30 min Offline
- Slack-Webhook (Pro+) für beide Transitionen
Settings → Notifications → Site-Alerts setzt Defaults; einzelne Sites können überschreiben.
Uptime-SLO-Tracking
Dashboard trackt Uptime-Prozentsatz über die letzten 30 Tage:
uptime_pct = (gesamt_sekunden - offline_sekunden) / gesamt_sekunden × 100
Eine Site, die in 30 Tagen 1 Stunde offline war: 99,86%. Werte unter 99% triggern ein gelbes Banner; unter 95% wird rot.
Das ist die gleiche Metrik, die dein Kunde auf der geteilten Status-Page sieht (Agency-Plan).
Wann beunruhigen vs nicht
| Muster | Aktion |
|---|---|
| Einzelnes Flappen (online → offline → online binnen einer Stunde) | Ignorieren. Wahrscheinlich kurzer Network-Hickup. |
| Wiederholtes Flappen (>3 Transitions/Tag) | WP-Cron, Server-Last oder Host-Network-Reliability prüfen. |
| Persistent offline | Plugin offline durchgehen. |
| Plötzlich Critical | Health-Tab → recent errors. Meist ein Plugin-/Theme-Update schief. |
| Schleichend Warning über Tage | Memory-/Disk-Creep — untersuchen, bevor Critical. |
Was das NICHT ersetzt
Hubbees Health-Monitoring ist für Plugin-Verbindung + WP-interne Signale. Es ersetzt nicht dediziertes Uptime-Monitoring (Pingdom, UptimeRobot, Better Stack), das von außen checkt. Für mission-critical Sites beide laufen lassen — sie fangen verschiedene Failure-Modes ab.
War der Artikel hilfreich?
Du kommst nicht weiter?
Öffne einen Support-Thread und wir melden uns. Die meisten Antworten erfolgen werktags innerhalb weniger Stunden.
