Massnahmen zur Verbesserung des Mail-Dienstes am FB3
Liebe Nutzerinnen und Nutzer,
aus aktuellem Anlass hier ein kurzer Bericht zu unseren Plänen, die zunehmenden Probleme im Zusammenhang mit dem zentralen Mail-Dienst kurz- bis mittelfristig zu lösen und die Qualität des Dienstes zu verbessern.
Am 4.9.2006 gab es ein erstes Treffen mit der FB-Leitung, dem Rechnerbeauftragten und den für die Administration der zentralen Dienste verantwortlichen Technikern, um zunächst die Situation zu analysieren und erste Schritte zu einer Verbesserung des Dienstes zu vereinbaren.
Zum besseren Verständnis hier eine Übersicht über die Hauptursachen für die aktuellen und zurückliegende Probleme mit dem Mail-Dienst:
- Die Komplexität des Dienstes ist in den vergangenen Jahren enorm gestiegen, unter anderem durch die massive Zunahme an Traffic bedingt durch Spam, sowie durch die Vielzahl von Subdiensten, Komponenten und Softwaresystemen, aus denen der Mail-Dienst mittlerweile besteht (Spam-Management, Virenschutz, Hosting von Mail-Domains, mehrere Verfahren zum Administrieren von Mail-Verteilern, Webmail, Mail-Quota, Verteilung der Funktionalität auf mehrere physische Server, etc.).
- Seit einigen Wochen gerät das RAID-System (redundanter Festplatten-Verbund), das vom Mail-Server verwendet wird, in eine Überlast-Situation.
- Es gibt eine Reihe von Problemen mit den aktuellen Versionen des Betriebssystems Solaris 10, das auf dem Mail-Server eingesetzt wird; so stürzen beispielsweise bestimmte Systemdienste mehrmals täglich ab, und das NFS-Subsystem (Netz-Dateisystem) verhält sich in bestimmten Situationen erratisch.
- Es gibt Verbesserungsmöglichkeiten bei den Prozeduren zur Datensicherung; dies schließt insbesondere das regelmäßigere Testen der erstellten Backups ein (der Datenverlust am 1.9.2006 hätte so wahrscheinlich verhindert werden können).
Auf dem gestrigen Treffen wurden zunächst die folgenden Schritte beschlossen:
- Aus noch bereitzustellenden Finanzmitteln wird kurzfristig ein weiteres RAID-System für den Mail-Server beschafft. Das Vorhandensein eines zweiten RAIDs erleichtert die erforderliche Rekonfiguration des existierenden RAIDs sowie zukünftige Betriebssystem-Neuinstallationen und ähnliche Aktionen ohne nennenswerte Beeinträchtigung des laufenden Betriebs.
- Backups werden in Zukunft regelmäßiger getestet, d.h. das Wiederherstellen von verlorenen Daten wird periodisch durchexerziert, um die Tauglichkeit der Backups zu verifizieren.
- Zur Erhöhung der Redundanz werden die Mail-Daten zusätzlich zur normalen Datensicherung (auf Band) einmal pro Tag auf eine Festplatte gesichert. Auf diese Weise können Vorfälle wie der vom 1.9.2006 verhindert werden.
- Schließlich soll die Struktur der Mail-Dienste an einigen vergleichbaren Institutionen (z.B. anderen Universitäten) begutachtet werden, um gegebenenfalls Ideen zu gewinnen, wie die Komplexität unseres Dienstes möglicherweise reduziert werden kann.
Bei Fragen hierzu: Mail an zentral-t@informatik.uni-bremen.de; bei Fragen zu den IT-Diensten allgemein an service@informatik.uni-bremen.de.
Dokumentation des Mail-Dienstes: http://www.informatik.uni-bremen.de/t/info/mail.html http://www.informatik.uni-bremen.de/t/info/dienstelandkarte/dienste/mail.html
Grüße, --OL