Definitionen durchsuchen :
Definition

Data Center Resilience (RZ-Resilienz)

Resilienz ist die Fähigkeit eines Servers, Netzwerks, Speichersystems oder eines gesamten Rechenzentrums, sich während eines Störfalls schnell zu erholen und den Betrieb fortzusetzen, selbst wenn es zu einem Geräteausfall, Stromausfall oder einer anderen Störung gekommen ist. 

Die Resilienz eines Rechenzentrums ist ein geplanter Teil der implementierten Architektur und wird normalerweise mit anderen Überlegungen zur Notfallplanung und -wiederherstellung im Rechenzentrum, wie zum Beispiel Datenschutz, in Verbindung gebracht. Das Adjektiv resilient bedeutet „die Fähigkeit zu haben, zum Ursprungszustand zurückzukehren“.

Die Data Center Resiliency (auch Ausfallsicherheit oder Belastbarkeit von Rechenzentren) wird oft durch den Einsatz redundanter Komponenten, Subsysteme, Systeme oder Einrichtungen erreicht. Wenn ein Element ausfällt oder eine Unterbrechung erfährt, übernimmt das redundante Element nahtlos die Aufgabe und unterstützt weiterhin die Rechendienste für die Benutzerbasis. Im Idealfall wissen die Benutzer eines belastbaren (resilient) Systems nie, dass es überhaupt zu einer Unterbrechung gekommen ist.

Wenn zum Beispiel die Stromversorgung eines gewöhnlichen Servers ausfällt, fällt der Server aus - und alle Workloads auf diesem Server sind nicht mehr verfügbar, bis der Server repariert und neu gestartet wird (oder die Workloads können auf einem anderen geeigneten Server neu gestartet werden). Wenn der Server über ein redundantes Netzteil verfügt, hält das Backup-Netzteil den Server am Laufen, bis ein Techniker das ausgefallene Netzteil ersetzen kann. Techniken, wie Server-Clustering, unterstützen redundante Workload auf mehreren physischen Servern. Wenn ein Server im Cluster ausfällt, übernimmt ein anderer Knoten mit seinen redundanten Workloads.

Dasselbe Konzept gilt bis hin zu ganzen Rechenzentrumseinrichtungen. Beispielsweise kann eine Organisation ihr Rechenzentrum mit zwei getrennten Versorgungsleitungen von verschiedenen Versorgungsanbietern versorgen, so dass ein Backup-Anbieter verfügbar ist, wenn der erste Versorgungsanbieter ausfällt. Ein weiteres Beispiel: Organisationen, die Hot Sites unterstützen, können die Kollokation von Rechenzentren unterstützen - die Verlagerung eines gesamten Betriebs von einer Einrichtung zur anderen als Reaktion auf jede Art von lokaler Unterbrechung oder regionaler Katastrophe.

Organisationen mit geschäftskritischen Arbeitslasten werden auf mehreren Ebenen innerhalb des Rechenzentrums resilientere Techniken einsetzen, da die Kosten für den Verzicht auf die Aufrechterhaltung kritischer Datenverarbeitungsdienste bei einem längeren Dienstausfall in der Regel höher sind. Beispielsweise können kritische Unternehmensdienste, wie Software für die Transaktionsverarbeitung oder Datenbanksysteme, mit umfassender Rechenzentrumsresilienz konzipiert werden, einschließlich Clustering, Snapshots und Off-Site-Redundanz. Umgekehrt können nicht essentielle Arbeitslasten, die ein gewisses Maß an Unterbrechungen tolerieren können, nur wenig Ausfallsicherheit erhalten oder einfach offline bleiben, bis sie wiederhergestellt werden können.

Diese Definition wurde zuletzt im Mai 2020 aktualisiert

ComputerWeekly.de

Close