Taktiken zum Qualitätsmerkmal Zuverlässigkeit.
Fehlertoleranz
Fehlerbehandlung
Mechanismen zur Erkennung, Protokollierung und Behandlung von Fehlern umsetzen
Taktiken zum Qualitätsmerkmal Zuverlässigkeit.
Fehlertoleranz
Mechanismen zur Erkennung, Protokollierung und Behandlung von Fehlern umsetzen
Verfügbarkeit
Kritische Komponenten oder Systeme mehrfach vorhalten
Fehlertoleranz
Ausnahmen verwenden, um Fehlerzustände zu signalisieren und zu behandeln
Reife
Fördert auch: Verfügbarkeit
Schritte und Anforderungen systematisch abarbeiten
Verfügbarkeit
Fördert auch: Wiederherstellbarkeit, Analysierbarkeit
Detaillierte Anweisungen für das Abarbeiten von Aufgaben und Vorfällen verfassen
Fehlertoleranz, Wiederherstellbarkeit
Auftritte von Fehlern und Ausnahmen erfassen und speichern
Verfügbarkeit
Fördert auch: Analysierbarkeit
Systemzustände, Leistung und Fehler kontinuierlich überwachen
Verfügbarkeit
Fördert auch: Kapazität, Bedienbarkeit
System kontinuierlich in Bezug auf Ressourcennutzung und Leistung überwachen
Reife
Fördert auch: Wiederverwendbarkeit, Ersetzbarkeit
Bewährte und ausgereifte Technologien einsetzen
Fehlertoleranz, Wiederherstellbarkeit
Fördert auch: Verfügbarkeit
Funktionsfähigkeit eines Systems auch unter widrigen Umständen oder bei Fehlern beibehalten
Wiederherstellbarkeit
Verfahren zur Wiederherstellung des Betriebs nach Katastrophen oder schwerwiegenden Störungen erstellen
Wiederherstellbarkeit
Mitarbeitende bereitstellen, die auf Störungen und Probleme schnell reagieren
Verfügbarkeit
Fördert auch: Kapazität
Arbeitslast auf mehrere Ressourcen verteilen
Fehlertoleranz, Wiederherstellbarkeit
Gezielte Störungen in einem System einführen, um dessen Resilienz zu testen
Verfügbarkeit
Fördert auch: Zeitverhalten, Kapazität
Verwendung von Ressourcen automatisch an die aktuelle Last anpassen
Verfügbarkeit
Fördert auch: Zeitverhalten, Kapazität
Ressourcen basierend auf Wachstumsprognosen vorhersagen und planen
Verfügbarkeit
Fördert auch: Zeitverhalten, Kapazität
Erwartungen an die Verfügbarkeit und Leistung der Software definieren
Verfügbarkeit, Reife
Messbare Ziele für die Zuverlässigkeit und Leistung eines Systems bestimmen
Verfügbarkeit
Fördert auch: Zeitverhalten
Wichtige Kennzahlen der Zuverlässigkeit und Leistung der Software erfassen
Verfügbarkeit, Fehlertoleranz
Kopien der Daten auf mehreren Systemen erstellen und synchronisieren
Verfügbarkeit, Fehlertoleranz
Automatisch auf redundante Komponenten im Fehlerfall umschalten
Verfügbarkeit
Fördert auch: Analysierbarkeit
System umsetzen, das in der Lage ist, seinen eigenen Zustand zu überwachen und Probleme zu erkennen
Fehlertoleranz, Verfügbarkeit
Mechanismen zur Isolierung von defekten Komponenten entwickeln
Fehlertoleranz
Fördert auch: Analysierbarkeit, Anpassbarkeit
Die Übereinstimmung von Entwicklungs-, Test- und Produktionsumgebungen sicherstellen
Verfügbarkeit
Regelmäßige Inspektionen und Wartungsarbeiten zur Aufrechterhaltung der Zuverlässigkeit durchführen
Verfügbarkeit
Fördert auch: Prüfbarkeit
Prinzipien für den stabilen Betrieb von Systemen anwenden
Verfügbarkeit, Fehlertoleranz
System bei Ausfällen oder Überlastung weiterhin eingeschränkt funktionieren lassen
Fehlertoleranz, Verfügbarkeit
Mechanismus zum Schutz vor Fehlern und Überlastung in verteilten Systemen einbauen
Fehlertoleranz, Verfügbarkeit
Fördert auch: Kapazität, Modularität
System zur Fehlerbegrenzung in isolierte Bereiche aufteilen
Fehlertoleranz
Fördert auch: Analysierbarkeit
Komponenten ihren eigenen Zustand und ihre Funktionalität selbst überprüfen lassen
Verfügbarkeit
Aktiv Anfragen an eine Komponente senden, um deren Erreichbarkeit zu überprüfen
Verfügbarkeit
Komponenten regelmäßige Lebenszeichen an eine Überwachungsinstanz senden lassen
Fehlertoleranz
Fördert auch: Integrität
Mehrere Operationen zu einer atomaren, konsistenten Einheit zusammenfassen
Fehlertoleranz
Fehlgeschlagene Operationen bei vorübergehenden Fehlern wiederholen
Verfügbarkeit, Fehlertoleranz
Überwachungskomponente zur Erkennung und Behandlung von Systemfehlern oder Ausfällen implementieren
Fehlertoleranz, Reife
Reihe von grundlegenden Tests durchführen, um die Kernfunktionalität eines Systems zu überprüfen
Verfügbarkeit
Anfragen trotz Ausfällen oder Fehlern ununterbrochen weiterleiten
Wiederherstellbarkeit
Fördert auch: Analysierbarkeit, Integrität
Zeitstempeln zu Daten oder Ereignissen zur zeitlichen Nachverfolgung hinzufügen
Verfügbarkeit
Fördert auch: Analysierbarkeit
Kontinuierlich den Zustand und die Leistung von Komponenten oder Diensten überwachen
Verfügbarkeit, Fehlertoleranz
Server oder Systeme als funktionsfähige Gruppe redundant vorhalten
Verfügbarkeit
Fördert auch: Kapazität
Daten auf mehreren Medien oder Systemen speichern
Wiederherstellbarkeit, Verfügbarkeit
Änderungen rückgängig machen und zu einem vorherigen stabilen Zustand zurückkehren
Wiederherstellbarkeit, Fehlertoleranz
Parallelbetrieb zweier Produktionsumgebungen zur Minimierung von Ausfallzeiten nutzen
Wiederherstellbarkeit, Fehlertoleranz
Fördert auch: Änderbarkeit, Anpassbarkeit
Rollouts durch Aktivieren und Deaktivieren von Funktionen flexibilisieren
Fehlertoleranz
Fördert auch: Änderbarkeit
Server oder Instanzen schrittweise aktualisieren
Verfügbarkeit
Fördert auch: Fehlertoleranz, Reife
Auswirkungsradius neuer Features begrenzen, indem sie verborgen für eine Teilmenge von Nutzern ausgerollt werden
Verfügbarkeit, Fehlertoleranz
Änderungen schrittweise für eine begrenzte Benutzergruppe einführen
Fehlertoleranz
Fördert auch: Korrektheit
Datenstrukturen verwenden, die auch bei Fehlern oder Inkonsistenzen funktionsfähig bleiben
Fehlertoleranz
Fördert auch: Modularität
Die Auswirkungen von Fehlern auf einen kleinen Teil des Systems begrenzen
Fehlertoleranz
Fördert auch: Reife
Codes zur Erkennung und Korrektur von Fehlern in Daten verwenden
Fehlertoleranz
Fördert auch: Analysierbarkeit
Fehler und Probleme systematisch erfassen, analysieren und beheben
Fehlertoleranz
Fördert auch: Integrität
Kontrollwerte berechnen, um Datenfehler oder -änderungen zu erkennen
Fehlertoleranz, Reife
Mehrere unterschiedliche Prüfsummenalgorithmen verwenden
Reife, Verfügbarkeit
Datenintegrität während der Speicherung oder Übertragung regelmäßig überprüfen
Reife, Fehlertoleranz
Eingaben, Daten oder Zustände auf Validität überprüfen
Wiederherstellbarkeit
Regelmäßig den Systemzustand sichern
Fehlertoleranz
Fördert auch: Integrität
Kontinuierlich die Integrität von Systemkomponenten, Konfigurationen und Daten überprüfen
Reife
Fördert auch: Zeitverhalten, Kapazität
Leistung und Stabilität eines Systems unter hoher Belastung testen
Wiederherstellbarkeit
Daten und Systemzustände regelmäßig sichern
Verfügbarkeit
Fördert auch: Änderbarkeit
Strukturierten Prozess zur Behandlung von Störungen und Ausfällen durchführen
Fehlertoleranz
Fördert auch: Analysierbarkeit
Ursachen von Ausfällen systematisch analysieren
Verfügbarkeit
Architekturen nutzen, die auf maximale Verfügbarkeit und Ausfallsicherheit ausgelegt sind
Fehlertoleranz
Fördert auch: Analysierbarkeit
Systematische Analyse von Fehlerprotokollen durchführen
Reife
Fördert auch: Integrität, Korrektheit
Mechanismen einsetzen, um die Genauigkeit, Konsistenz und Zuverlässigkeit von Daten sicherzustellen
Verfügbarkeit
Fördert auch: Integrität, Fehlertoleranz
Zuverlässigkeitsvorfälle durch Sicherheitslücken verhindern
Reife
Fördert auch: Integrität, Änderbarkeit
Planmäßige Wartungsarbeiten durchführen und Updates installieren
Reife
Fördert auch: Änderbarkeit, Integrität
Automatisierte Prozesse zur Integration, zum Testen und zur Bereitstellung von Software einsetzen
Fehlertoleranz
Fördert auch: Verfügbarkeit
Infrastrukturkomponenten nicht verändern, sondern durch neue Versionen ersetzen
Reife
Fördert auch: Prüfbarkeit
Funktionalität automatisiert auf verschiedenen Ebenen überprüfen
Reife, Verfügbarkeit
Akzeptable Unzuverlässigkeit als Balance zwischen Feature-Tempo und Zuverlässigkeit quantifizieren
Reife
Fördert auch: Analysierbarkeit
Nach Vorfällen systematisch lernen und systemische Verbesserungen statt Schuldzuweisung anstreben
Verfügbarkeit, Reife
Standardisierte Health-Check-APIs für Load-Balancer- und Orchestrator-Monitoring bereitstellen
Fehlertoleranz, Verfügbarkeit
Zeitlimits für alle externen Aufrufe gegen unbegrenztes Blockieren durchsetzen
Verfügbarkeit, Fehlertoleranz
Eingehende Anforderungsraten gegen Überlastung und für stabile Verfügbarkeit begrenzen
Verfügbarkeit, Fehlertoleranz
Anfragen niedriger Priorität bei Überlastung zugunsten kritischer Operationen verwerfen
Fehlertoleranz, Wiederherstellbarkeit
Operationen sicher wiederholbar ohne unbeabsichtigte Seiteneffekte entwerfen
Fehlertoleranz, Wiederherstellbarkeit
Verteilte Transaktionen durch Sequenzen lokaler Transaktionen mit kompensierenden Aktionen steuern
Fehlertoleranz, Wiederherstellbarkeit
Fehlgeschlagene Nachrichten in eine dedizierte Warteschlange leiten statt sie zu verlieren
Wiederherstellbarkeit, Fehlertoleranz
Änderungen in ein dauerhaftes Append-Only-Log schreiben, bevor sie angewendet werden