Differences between revisions 1035 and 1733 (spanning 698 versions)
Revision 1035 as of 2010-04-20 17:35:57
Size: 1941
Comment:
Revision 1733 as of 2026-07-03 10:36:46
Size: 1607
Comment:
Deletions are marked like this. Additions are marked like this.
Line 1: Line 1:
## page was renamed from Status_FB3
## page was renamed from FrontPagehttp://status/Status%20FB3?action=edit&editor=text
#pragma section-numbers off
Line 6: Line 3:
~-[[http://service.informatik.uni-bremen.de/rt/?autouser=gast|Ticketing-System der FB3-Technik]]-~ ~-[[mailto:service@informatik.uni-bremen.de|Ticketing-System der FB3-Technik]]-~
Line 11: Line 8:
Vor einigen Minuten gab es einen kurzen Ausfall des Servers {{{erwin}}}, was dazu gefuehrt hat, dass die meisten Home-Verzeichnisse und einige andere Dienste nicht erreichbar waren. Das Problem hat sich scheinbar von selbst heboben, waehrend wir noch auf der Suche nach einer Loesung waren. Nach den Ursachen wird gerade gefahndet.<<BR>><<BR>>
Ausserdem gibt es Problem mit dem Mailserver, an denen gerade gearbeitet wird.<<BR>>
ChristianManal, 17:35
Line 18: Line 11:
Durch ein Netzwerkproblem ist der zentrale FB3-Proxmox-Cluster heute um kurz vor 10 Uhr in einen Split-Brain-Zustand gekommen, der zu einem Neustart aller Clusterknoten geführt hat.<<BR>>
Dadurch sind alle auf dem Cluster gehosteten virtuellen Maschinen ausgefallen und neugestartet worden.<<BR>>
Wir haben die Cluster-Konfiguration nun robuster gemacht, sodass dieses Problem in dieser Form zukünftig nicht mehr auftreten sollte.<<BR>>
ChrstianManal, 2026-07-03, 10:36

Wegen Problemen beim Installieren von Updates auf {{{hackmd.informatik.uni-bremen.de}}} kam es leider zu einem vollständigen Datenverlust bei der Hegdedoc-Instanz auf dem Server.<<BR>>
Darum musste Hedgedoc auf den Stand der letzten Datensicherung aus der Nacht vom 30.06. auf den 01.07. zurückgesetzt werden.<<BR>>
ChristianManal, 2026-07-01, 10:26

Line 20: Line 23:
Am Mittwoch den 21.04. werden ab 18:00 Uhr nach und nach die Cisco-Komponenten im MZH rebootet, um die zuvor eingespielten Software-Updates zu aktivieren.<<BR>>
Dadurch wird es zeitweilig zu Netzausfaellen kommen.<<BR>>
ChristianManal, 15.04.2010
Am Montag den 13.07.2026 wird der [[https://mattermost.informatik.uni-bremen.de/|FB3-Mattermost-Server]] eingestellt. Siehe [[https://t.informatik.uni-bremen.de/wiki/Dienste/Mattermost|hier]] für weitere Informationen.<<BR>>
ChristianManal, 2026-03-02
Line 26: Line 28:
Wo dies möglich ist, wurde auf den zentralen Servern des FB3 der Zugang für normale Nutzer weitgehend eingeschränkt, um die dort laufenden Dienste zu schützen.<<BR>>
Davon ausgenommen ist die Solaris-Zone "login".<<BR>>
Bis auf weiteres stehen auch die leistungsfähigen Server "amun" und "aton" noch zur Verfügung.<<BR>>
Welche Rechner allgemein zugänglich sind, ist über das login-Flag ("Normal users can login") der Hostdatenbank dokumentiert.<<BR>>
JoergBrandt, 12.03.2010
Line 34: Line 31:
 
Line 37: Line 35:
[[http://status.informatik.uni-bremen.de/mon|Statusübersicht]] über die wichtigsten Dienste<<BR>> [[https://www.fb3.uni-bremen.de/hobbit|Status]] der LDAP-Server [[http://nagios.informatik.uni-bremen.de/overview/|Statusübersicht]] über die wichtigsten Dienste

Was ist die FB3-Statusseite
Hinweise zur Benutzung für die Techniker

Ticketing-System der FB3-Technik

Aktuelle Ausfälle

Behobene Ausfälle

Durch ein Netzwerkproblem ist der zentrale FB3-Proxmox-Cluster heute um kurz vor 10 Uhr in einen Split-Brain-Zustand gekommen, der zu einem Neustart aller Clusterknoten geführt hat.
Dadurch sind alle auf dem Cluster gehosteten virtuellen Maschinen ausgefallen und neugestartet worden.
Wir haben die Cluster-Konfiguration nun robuster gemacht, sodass dieses Problem in dieser Form zukünftig nicht mehr auftreten sollte.
ChrstianManal, 2026-07-03, 10:36

Wegen Problemen beim Installieren von Updates auf hackmd.informatik.uni-bremen.de kam es leider zu einem vollständigen Datenverlust bei der Hegdedoc-Instanz auf dem Server.
Darum musste Hedgedoc auf den Stand der letzten Datensicherung aus der Nacht vom 30.06. auf den 01.07. zurückgesetzt werden.
ChristianManal, 2026-07-01, 10:26

Geplante Arbeiten

Am Montag den 13.07.2026 wird der FB3-Mattermost-Server eingestellt. Siehe hier für weitere Informationen.
ChristianManal, 2026-03-02

Abgeschlossene Arbeiten

Geplante Arbeiten in den Arbeitsgruppen

Status der Systeme

Statusübersicht über die wichtigsten Dienste

Externe Störungen

Status FB3 (last edited 2026-07-03 10:36:46 by ChristianManal)