Intern
Rechenzentrum

Die Zeichen stehen wieder auf grün

26.08.2011

Das Rechenzentrum sah sich am Donnerstag, den 25.08.2011 mit dem wohl größten Störfall seiner Geschichte konfrontiert - mittlerweile laufen alle wichtigen Systeme wieder.

Speichersystem EVA, einer der Controller mit einem Teil der Festplatten.
Speichersystem EVA, einer der Controller mit einem Teil der Festplatten.

Der Störfall begann mit dem Absturz eines unserer zentralen Speichersysteme. Die Gründe für den Absturz werden zurzeit noch vom Hersteller analysiert. 

Nach dem Absturz blieb das System beim Neustart in einer Endlosschleife hängen. Nun waren die daran angeschlossenen Server von Ihren Plattenlaufwerken abgeschnitten. Daher waren viele unserer Dienste nicht mehr verfügbar. Betroffen waren unter anderem: IMAP-Mailserver, Webserver (TYPO3), Novell-Netzlaufwerke, WueCampus sowie diverse virtuelle Server (ESX-Umgebung).

Mitteilungen über den aktuellen Stand haben wir fortlaufend über unseren Twitter-Kanal bekanntgegeben: http://twitter.com/uniwue_rz

Chronologischer Rückblick auf die Ereignisse 

  • 9.10 h: Das Speichersystem fällt aus.
  • 10.00 h: Nachdem die Bootversuche alle scheitern, wird der Vorfall an HP eskaliert.
  • 11.00 h: Nach einer ersten Problemanalyse wird von HP ein Techniker auf den Weg geschickt.
  • 15.00 h: Der Techniker trifft ein und beginnt mit der Problemsuche.
  • 19.00 h: Ein Austauschcontroller trifft ein und wird eingebaut.
  • 21.00 h: Ein eingeschränkter Zugriff auf das Speichersystem ist wieder möglich.
  • 24.00h: Alle virtuellen Festplatten sind wieder im Zugriff, es kann mit den Serverarbeiten begonnen werden.
  • 00.30h: Die Homepage, die Novell-Filecluster, das IMAP/Webmail-System sowie WueCampus sind wieder verfügbar.

Als Folge waren am Freitag noch kurzfristige Unterbrechungen am Authentifizierungs-Server und Novell-Filecluster zu verzeichnen. Weitere Nacharbeiten an verschiedenen Servern untergeordneter Priorität stehen jetzt noch an.

Technischer Hintergrund SAN

Das betroffene SAN (SAN: Storage Area Network) ist eine EVA (Enterprise Virtual Array) von HP. Sie ist ein in sich mehrfach redundant ausgelegtes Speichersystem, das auf insg.168 Festplatten brutto mehr als 100 TB Datenkapazität als virtuelle Raid-Verbünde anspricht.

Von Martin Schuhmann

Zurück