Differences between revisions 1032 and 1039 (spanning 7 versions)
Revision 1032 as of 2010-04-14 12:55:30
Size: 1552
Comment:
Revision 1039 as of 2010-04-23 09:03:22
Size: 2107
Comment:
Deletions are marked like this. Additions are marked like this.
Line 11: Line 11:
== Behobene Ausfälle ==
Die Ausfälle der verschiedenen Dienste am 20.04. waren auf ein Netzwerkproblem zurückzuführen.<<BR>>
Der zentrale FB3-Router lief aus unbekanntem Grund auf 99% Last. Nach dessen Reboot waren alle Dienste wieder verfügbar.<<BR>>
Line 12: Line 15:
== Behobene Ausfälle == Nachtrag: <<BR>>
Die Ursache konnte reproduzierbar auf eine defekte PC-Netzwerkkarte zurückgeführt werden.<<BR>>
Kleine Ursache, große Wirkung!<<BR>>
JoergBrandt, 21.04.2010 17:30
Line 17: Line 23:
Das Aktivieren der neuen Software auf den Cisco-Switches am gestrigen Abend verlief problemlos.<<BR>>
JoergBrandt, 22.04.2010
Line 25: Line 34:
Am Samstag 17.4.10 wird in der Zeit von 7:00 - 16:00 Uhr die Kälteversorgung für
das Cartesium unterbrochen. Um die Wärmelast im Hauptserverraum zu reduzieren
müssen einige Server ab Freitag abend abgeschaltet werden. Es wird versucht, die
wesentlichen Dienste aufrecht zu erhalten.<<BR>>
MattiasWerner, 14.4.10
 
Am Samstag 24.4.10 wird in der Zeit von 7:00 - 16:00 Uhr erneut die Kälteversorgung für das Cartesium unterbrochen. Um die Wärmelast im Hauptserverraum zu reduzieren müssen einige Server ab Freitag abend abgeschaltet werden. Es wird versucht, die wesentlichen Dienste aufrecht zu erhalten.<<BR>>
MattiasWerner, 23.4.10

Was ist die FB3-Statusseite
Hinweise zur Benutzung für die Techniker

Ticketing-System der FB3-Technik

Aktuelle Ausfälle

Behobene Ausfälle

Die Ausfälle der verschiedenen Dienste am 20.04. waren auf ein Netzwerkproblem zurückzuführen.
Der zentrale FB3-Router lief aus unbekanntem Grund auf 99% Last. Nach dessen Reboot waren alle Dienste wieder verfügbar.

Nachtrag:
Die Ursache konnte reproduzierbar auf eine defekte PC-Netzwerkkarte zurückgeführt werden.
Kleine Ursache, große Wirkung!
JoergBrandt, 21.04.2010 17:30

Geplante Arbeiten

Abgeschlossene Arbeiten

Das Aktivieren der neuen Software auf den Cisco-Switches am gestrigen Abend verlief problemlos.
JoergBrandt, 22.04.2010

Wo dies möglich ist, wurde auf den zentralen Servern des FB3 der Zugang für normale Nutzer weitgehend eingeschränkt, um die dort laufenden Dienste zu schützen.
Davon ausgenommen ist die Solaris-Zone "login".
Bis auf weiteres stehen auch die leistungsfähigen Server "amun" und "aton" noch zur Verfügung.
Welche Rechner allgemein zugänglich sind, ist über das login-Flag ("Normal users can login") der Hostdatenbank dokumentiert.
JoergBrandt, 12.03.2010

Geplante Arbeiten in den Arbeitsgruppen

Am Samstag 24.4.10 wird in der Zeit von 7:00 - 16:00 Uhr erneut die Kälteversorgung für das Cartesium unterbrochen. Um die Wärmelast im Hauptserverraum zu reduzieren müssen einige Server ab Freitag abend abgeschaltet werden. Es wird versucht, die wesentlichen Dienste aufrecht zu erhalten.
MattiasWerner, 23.4.10

Status der Systeme

Statusübersicht über die wichtigsten Dienste
Status der LDAP-Server

Externe Störungen

Status FB3 (last edited 2025-05-20 15:18:28 by CemilYuecel)