MeinImmoPortal - Verlängerte Ladezeiten und Häufungen von Timeouts durch Probleme mit den Datenbankserver – Details zu Vorfällen

Alles in Ordnung

Verlängerte Ladezeiten und Häufungen von Timeouts durch Probleme mit den Datenbankserver

Gelöst
Reduzierte Leistung
Aufgetreten vor 25 TagenDauerte 1 Tag

Betroffen

Plattform

Vollständiger Ausfall aus 6:00 AM zu 1:39 PM, Funktionsfähig aus 1:39 PM zu 8:04 AM

Webseiten

Vollständiger Ausfall aus 6:00 AM zu 1:39 PM, Funktionsfähig aus 1:39 PM zu 8:04 AM

Objekt Import

Vollständiger Ausfall aus 6:00 AM zu 1:39 PM, Funktionsfähig aus 1:39 PM zu 8:04 AM

onOffice API

Vollständiger Ausfall aus 6:00 AM zu 1:39 PM, Funktionsfähig aus 1:39 PM zu 8:04 AM

Propstack Webhooks

Vollständiger Ausfall aus 6:00 AM zu 1:39 PM, Funktionsfähig aus 1:39 PM zu 8:04 AM

OpenImmo Import

Vollständiger Ausfall aus 6:00 AM zu 1:39 PM, Funktionsfähig aus 1:39 PM zu 8:04 AM

Aktualisierung
  • Postmortem
    Postmortem

    Als Teil unser Hochverfügbarkeit haben wir Prüfungen implementiert, die prüfen, ob ein Datenbankserver verfügbar ist, bevor eine Anfrage an diesen geschickt wird. Mit der neuen Version der Datenbankserver-Software hat sich jedoch das Verhalten bei solchen Prüfungen verändert. Der Server behandelt solche Prüfungen nun als "fehlerhafte Verbindung" und sperrt nach einer gewissen Anzahl die Verbindung des Clients. Dies war bislang nicht der Fall.

    Da unserer Prüfungen dieses Verhalten auslösten, wurden die Verbindungen der Webserver zu den Datenbankservern in unregelmäßigen Abständen "gesperrt" und mussten händisch wieder entsperrt werden.

    Das problematische Verhalten haben wir damit gelöst, dass wir erst einmal die Prüfungen auf unserer Seite deaktiviert haben. Im Anschluss werden wir die Einstellungen der Datenbankserver so anpassen, dass wir die Prüfungen gefahrenlos ausführen können, ohne ein Sperre zu riskieren.

    Darüber hinaus haben wir unser Monitoring dahingehen optimiert, dass wir die Alarmschwellen bei Häufungen von Fehlern von Datenbankverbindungen reduziert haben, um schneller reagieren zu können.

  • Gelöst
    Gelöst

    Unser Monitoring kann keine weiteren Auffälligkeiten seit Umsetzung der Lösung feststellen. Wir schließen den Vorfall daher.

    Sie können Ihren Webseiten uneingeschränkt nutzen.

    Wir danken für Ihr Verständnis.

  • Unter Beobachtung
    Unter Beobachtung

    Wir konnten die Fehler inzwischen identifizieren und haben Gegenmaßnahmen implementiert.

    Die letzten Probleme sind gegen 11 Uhr aufgetreten. Seitdem sehen wir keine weiteren Auffälligkeiten oder Ausfälle.

    Ein weiterer größerer Eingriff der mit einem Ausfall verbunden wäre, ist von unserer Seite aktuell erst einmal nicht geplant. Wir werden die System weiter beobachten und nötige Folgearbeiten über ein reguläres Wartungsfenster einplanen und kommunizieren. Dieses Fenster wird auf jeden Fall nötig sein, da auf einem unserer Datenbankserver nach aktuellem Kenntnisstand ein Software- oder Hardware Fehler vorliegt, an dessen Analyse wir noch arbeiten.

    Sie können Ihre Webseiten uneingeschränkt nutzen und auch geplante Aktivitäten für den Rest der Woche ohne Besonderheiten einplanen und durchführen.

    Vielen Dank für Ihr Verständnis.

  • Identifiziert
    Identifiziert

    Leider scheint es noch immer Folgeprobleme des Datenbankupdates der letzten Woche zu geben.

    Wir sehen aktuell immer wieder Fehlermeldungen und massiv erhöhte Ladezeiten durch Probleme mit Datenbankverbindungen.

    Aktuell analysieren wir die Lage und planen die nächsten Schritte, um das Problem nachhaltig zu lösen.

    Aktuell bedeutet dies für Sie keine Einschränkungen in Ihren Arbeitsabläufen. Treten Fehler auf, versuchen Sie die Operation bitte einfach kurze Zeit später erneut.

    Sollten Sie größere Mailings oder Selektionen geplant haben, würden wir Ihnen dazu raten, diese - soweit möglich - auf Morgen zu verschieben.

    Es kann jedoch sein dass wir heute im Laufe des Tages noch eine Notfallwartung am Datenbankcluster vornehmen müssen, um einen stabilen Betrieb wieder zu gewährleisten. Diese Maßnahme wäre dann mit einer zeitlich eingeschränkten Nichterreichbarkeit Ihrer Webseite im Backend und für eingeloggte Nutzer verbunden. Auch werden Übertragungen Ihrer Objekte (Neu, Aktualisierung, Löschen) in diesem Zeitraum nicht funktionieren.

    Wir informieren Sie diesbezüglich noch einmal separat mit weiteren Informationen.

    Wir danken Ihnen schon jetzt für Ihr Verständnis.