Montag, 9. April 2012
Aktueller Ausfall
Update Freitag, 13. April 2012:
Seit 13:00 Uhr haben wir wieder einen vollständigen Mailspool.
Ihr könnt alle DIenste jetzt wieder wie gewohnt nutze.
Solltet Ihr irgendwelche Probleme entdecken, so schreibt bitte eine Mail an admin@bawue.net oder kontaktiert uns im IRC.
Eine genauere Erklärung des Ausfalls erfolgt in den nächsten Tagen.
Update: Der Mailserver wird ab jetzt (Donnerstag, 12:00 Uhr) unerreichbar sein, während wir das Backup einspielen.
Anschliessend sollten wieder alle Mails ohne Verlust verfügbar sein.
UPDATE: Wie es aussieht, haben wir eine aktuelle Kopie der Daten auf dem Filer gefunden. Wir prüfen dies im Moment.
UPDATE:
Wir haben mittlerweile den Mailserver wieder aktiviert, jedoch auf einer anderen IP.
Unter mail-temp.bawue.net/193.7.176.99 ist IMAP, IMAPS, POP3 und POP3S verfügbar. Wie der Name sagt, ist dies rein temporär.
Alternativ geht auch der Webmail Zugang unter <https://webmail.bawue.net> oder <https://my.bawue.net/squirrelmail2/>.
Eine Zusammenfassung der aktuellen Probleme:
Die aktuellen Ausfälle beim bawue.net sind eine Spätfolge der am Osterwochenende stattgefundenen Arbeiten an der Stromversorgung: Wir haben wir gerade mit einem merkwürdigen Problem der Datenspeicher zu kämpfen: Manche, aber nicht alle unsere Server haben nach der Wiederherstellung der Stromversorgung plötzlich den Datenstand von Anfang Februar.
Die Webserver selber sind davon betroffen, nicht aber die Userdaten/Webseiten und Datenbanken. D.h. Konfigurationsänderungen am Webserver sind verloren, Webseiten selber nicht.
Die Webseiten sollten alle seit Sonntag abend wieder verfügbar sein.
Leider ist auch der Mailserver betroffen. Das System ist aktuell, aber der Mailspool, also die Mails sind auf dem Stand 4. Februar 2012.
Wir sind im Moment dabei, alle Daten von den zentralen Datenspeichern wegzumigrieren, damit wir diese genauer untersuchen können ohne weitere Ausfälle zu provozieren.
Unser Problem ist nun, dass die wir die Mailserver in Betrieb nehmen können aber dann Mails zwischen dem 4. Februar und dem 9. April "fehlen".
Lokal bei Euch sind diese Mails noch verfügbar, werden beim ersten Kontakt mit dem Mailserver jedoch gelöscht.
Insofern würde ich Euch empfehlen, eine Sicherheitskopie des Datenbestandes Eures lokalen Mailclients anzulegen.
Da wir aber dies nicht an alle unsere Benutzer kommunizieren konnten, zögern wir noch, die Mailserver wieder komplett in Betrieb zu nehmen.
Wir haben allerdings Übergangslösung im Angebot:
Auf einer anderen IP Adresse/einem anderen Hostnamen könnt Ihr auf Eure Mails zugreifen, unter der Prämisse, dass ihr wisst, dass dies evtl. lokal gespeicherte Mails löschen kann.
Wenn Ihr das möchtet, so sagt bitte kurz Bescheid und wir werden das dann entsprechend für Euch einrichten.
Erreichbar sind die Admins im IRC Netz auf dem Channel #bawue. Webchat. Ersatzweise geht auch eine eMail an admin@bawue.net.
UPDATE: Wir bewegen gerade die "frischen" Daten andere Maschinen, damit wir gefahrlos uns die Filer genauer anschauen können.
Sobald dies geschehen ist, sind die Webserver wieder verfügbar.
Als Hinweis an die User: Bitte erstellt eine Kopie des Mail-Folders Eures eMail Clients. So können die Mails, die Ihr noch lokal habt nicht verlorengehen sobald Ihr unseren Mailserver mit den alten Daten kontaktiert. Bei Fragen helfen wir Euch gerne über den Webchat.
Im Zusammenhang mit den angekündigten Arbeiten an der Stromversorgung am Osterwochenende ist leider ein Problem mit den zentralen Datenspeichern aufgetreten.
Im Laufe der Arbeiten wurden am Sonntag Abend die zwei zentralen Datenspeicher neu gestartet.
Abschliessend fiel auf, dass einzelne Systeme plötzlich auf dem Stand von ende Januar oder anfang Februar sind.
Wir sind gerade dabei herauszufinden, was hier los ist und dann zu versuchen den Fehler zu beheben.
Aktueller Stand ist:
- Sämtliche Datenbanken sind aktuell
- Sämtliche Daten von Benutzern (Homedirs, Webseiten) sind aktuell
- IMAP/Mail Spool ist Stand 4. Februar 2012
- Systempartition vom Mailserver ist aktuell.
- Systempartitionen von Webservern und Shellservern sind Stand Februar.
Aktuell ist der Mailserver abgeschaltet, damit Ihr Eure lokal noch vorhandenen Mails nicht beim nächsten Sync verliert.
Webseiten funktionieren mit Ausnahme derer, deren Konfiguration zwischen Februar und April 2012 geändert wurde.
Erreichbar sind die Admins im IRC Netz auf dem Channel #bawue. Webchat.
Donnerstag, 6. Januar 2011
Bilder vom Umbau (Teil 1)
Andreas hatte eine Digitalkamera dabei und wir haben diverse Zustände während unserer Umbauaktion letzte Nacht dokumentiert.
Wir haben leider verpasst, ganz am Anfang ein Bild zu machen. Bei folgendem ersten Bild, das das Rack von vorne zeigt, fehlen schon 2 Geräte eine gute halbe Bildschirmhöhe über dem Bildschirm. Auf dem Bild sehen wir von oben nach unten irgendwelche Rittal Rack Management Geräte, 2 Dell Server auf denen die meisten unserer virtuellen Maschinen laufen, eine Lücke in der davor unser erster Router BB1 und unser serieller Consolenserver war, Sysiphus2 (Storage und virtuelle Maschinen), BB2 (unser zweiter momentan aktiver Router), ein Bildschirm mit Tastatur, dahinter in irgendeiner Reihenfolge News (Newsserver), Gonzo (Andreas Server) und Horscht (Storage und virtuelle Maschinen). Unter dem Bildschirm sind unsere beiden neuen Storageserver, auf denen alle Nutzerdaten und fast alle virtuellen Maschinen liegen, die Tape Library für Backups und 2 Mal USV mit Akkus.
Auf der Rückseite ist alles verkabelt, wobei die meisten Kabel viel zu lang sind und damit ein ganz kleines bisschen nach Chaos aussehen. In der Mitte rechts sieht man 2 24-Port 100MBit Switche durchschauen, die wir schon viele viele Jahre nicht mehr nutzen aber auf Grund der vielen Kabel nicht ausbauen konnten.
Hier sieht man ganz links eine Kiste, die am Ende der Nacht mit übrigen Kabeln gefüllt sein wird. Im ersten Rack links sind King und Sysiphus1, beides Server die seit einiger Zeit nicht mehr in Betrieb sind. Im zweiten Rack ist der Switch, der die Aussenanbindung für uns macht (oben, mit den schönen bunten Kabeln) und darunter ein Switch den wir als Ersatzgerät neu angeschafft haben und noch ins Rack einbauen müssen (nach dem Umbau).
Hier sind diverse Geräte verschwunden: Gonzo liegt im Rack vom vorigen Bild und läuft friedlich vor sich hin, News macht dasselbe. Alle virtuellen Maschinen wurden von Horscht auf andere Server migriert und Horscht liegt ausgeschaltet in irgendeiner Ecke. Unsere iSCSI server laufen nicht mehr gespiegelt, das zweite Gerät wurde heruntergefahren und auch irgendwo abgestellt. Das Kabelchaos hinten ist auch schon deutlich übersichtlicher geworden.
Hier ist das Rack fast schon leer, jedenfalls so leer wir wir es am Ende der Nacht zurücklassen werden. Der einzige laufende Rechner ist noch BB1, der die Aussenanbindung macht.
Hier sieht man von vorne nach hinten: Sysiphus2, den wir für einige virtuelle Maschinen brauchen, die lokalen Plattenspeicher nutzen, dann 3 Dell Server, auf denen alle anderen VMs laufen und ganz hinten der Storage Server. Ich finde ja, das Rack war ein Fehlkauf, so ist alles viel übersichtlicher.
Das fast leere Rack von hinten, mit fast keinen Kabeln mehr.
Dienstag, 4. Januar 2011
Downtime aller Dienste am 5.1./6.1. [Update^2]
Es steht seit einiger Zeit ein größerer Umbau des Serverschrankes an, den wir voraussichtlich morgen Abend gegen 21:00 Uhr in Angriff nehmen. Wir werden dabei alle Server aus dem Rack ausbauen, die wichtigsten neben dem Rack hinstellen und wieder in Betrieb nehmen, dann das Rack umbauen und danach wieder alle Server einbauen. Beim Ausbau und danach wieder beim Einbau sind kurze Downtimes leider unumgänglich. Wir werden unser bestes geben um sie so kurz wie möglich zu halten.
Während des Umbaus sollten die meisten Dienste zur Verfügung stehen (wir gehen davon aus, alle von Nutzern erreichbaren Dienste anbieten zu können).
Nach diesem "Neujahrsputz" wird das Rack dann neu geordnet erstrahlen, alle Server werden korrekt eingebaut und festgeschraubt sein und wir hoffen, damit für ein paar weitere Jahre Bawue.Net ohne größere Umbauten gerüstet zu sein.
Solltet ihr auf irgendwelche Probleme stoßen, dürft ihr uns gerne im IRC Netzwert IRCnet im Channel #bawue oder per Email an admin@bawue.net um Rat fragen, wir werden alle Anfragen so schnell wir können beantworten.
[Update 1:] Bisher schaut alles recht gut aus. Wir haben die meiste Hardware aus dem Rack ausgebaut und neben das Rack auf den Boden gelegt. Die Server und alle (wichtigen) VMs laufen. Jetzt geht es erstmal ins Bett, bevor morgen dann das gemacht wird, für das wir uns heute die Nacht um die Ohren geschlagen haben: Die Rackschienen richtig einstellen und alles wirder richtig einbauen.
[Update 2:] Da es ja langweilig wäre, sich an Pläne zu halten und da im Laufe des heutigen Tages Hardwareprobleme aufgetreten sind und wir erst morgen an Ersatzteile kommen, werden wir morgen mit dem Rack weitermachen. Dadurch wird es voraussichtlich am 7.1. und evtl. am 8.1. zu weiteren kurzen Ausfällen kommen.
Samstag, 11. Dezember 2010
Downtime des IMAP Servers [Update]
Bei Wartungsarbeiten mussten wir heute leider den IMAP/POP3 Server neu booten. Der notwendige Dateisystemcheck dauert leider noch an, daher ist der IMAP/POP3 Server im Moment nicht erreichbar.
Wir bitten die Downtime zu entschuldigen und melden uns hier, sobald wir mehr wissen.
Beid den Wartungsarbeiten handelte es sich um ein Speicherupdate bei unseren beiden neuen Dell Servern. Die hatten bisher 6 GB RAM und haben nur 16 GB. Da die Server von der Hardware her identisch sind hoffen wir in Zukunft bei Wartunsarbeiten virtuelle Maschinen nicht mehr abschalten und neu booten zu müssen sondern einfach im Betrieb auf den anderen Server umziehen zu können.
[Update:] Scheint, als wurde meine Bitte nicht erhört, hier kurz reinzuschreiben, dass sich die Sache erledigt hat. Also, das o.g. Problem besteht seit geraumer Zeit nicht mehr.
Samstag, 6. Februar 2010
Wartungsankuendigung am 5.2. und 6.2.
Begin forwarded message:
Date: Fri, 5 Feb 2010 21:22:46 +0100 (CET)
From: Andreas Thienemann
Subject: [Bawue.Net] Wartungsankuendigung bawue.net
Hallo,
da wir in den vergangenen zwei Wochen leider ein paar Ausfälle im
Zusammenhang mit unserem Storage-Server hatten, werden wir im Laufe des
Wochenendes und des Freitag abends ein Ersatzgerät einbauen auf dass
solche Probleme hoffentlich ein Ende haben.
Leider bedeutet dies, dass wir dafür sowohl ie Mailserver, die
Webserver und auch die Shellserver kurzzeitig abschalten müssen um die
Daten auf das neue Storage Gerät zu kopieren. Deshalb ist
vorraussichtlich von Freitag abend 23:00 bis Samstag Abend 23:00 Uhr
mit Störungenzu rechnen. Wir versuchen zwar, diese Störungen zu
miniieren, könnendies aber leider auch nur begrenzt erreichen.
Nach Abschluss dieser Arbeiten werden wir Euch entsprechend informieren.
Solltet Ihr irgendwelche Fehler entdecken oder weitergehende Fragen
haben, so schickt bitte eine Mail an
im IRCnet Chatnetzwerk auf dem Channel #bawue.
cheers,
andreas
Dienstag, 2. Februar 2010
Ausfall des Storage Servers am Montag Nachmittag
Wir hatten gestern nachmittag einen Ausfall im Storage-System. Mail ist seit irgendwann vor 18:00 Uhr wieder verfügbar, die anderen Dienste seit ca. 22:00 Uhr.
Ein zweiter Storage Server steht seit ungefähr einer Woche im Rack, wir konnten ihn auf Grund fehlender Hardware leider noch nicht in Betrieb nehmen. In den nächsten Wochen wird es dann redundanten Storage geben, was Probleme wie heute hoffentlich in die Vergangenheit verbannt.
Samstag, 23. Januar 2010
Ausfall des Mailsystems [Erledigt]
Am Samstag abend wurde bei der Migration von einigen Virtuellen Maschinen auf ein neues iSCSI Storage System der IMAP Server neu gestartet.
Unter normalen Umständen wäre der Mailserver nach ca. 2 Minuten wieder erreichbar gewesen. Allerdings wurde nicht daran gedacht, dass nach einer Laufzeit von mehreren Monaten beim Neustart automatisch das Filesystem auf Fehler überprüft wird.
Diese Fehlerprüfung (fsck) läuft aufgrund der hohen Anzahl an Dateien leider noch immer. Bis diese abgeschlossen ist, ist der IMAP Server nicht erreichbar.
UPDATE2: Die IMAP und POP3 sind seit dem 24. Januar 2010 21:50 wieder wie gewohnt erreichbar. Der Filesystemcheck hat bis Sonntag Mittag angedauert. Die restliche Zeit haben wir damit verbracht sicherzustellen dass keine Mails verloren gegangen sind.
Entgegen des ursprünglichen Updates haben wir den Spool nicht neu erzeugt. D.h. sämtliche IDs der Mails sind gleichgeblieben.
Im moment werden die am Samstag und Sonntag zwischengespeicherten Mails zugestellt. Dies kann noch ein klein wenig dauern, Mails vom Wochenende sind aber nicht verlorengegangen.
UPDATE: Da die Überprüfung des Dateisystems _immer_ noch andauert (GRRRR!) werden wir wohl einen leeren Spool initialisieren damit auf Mails wieder zugegriffen werden kann.
Nach Ablauf des fsck werden wir dann die beiden Spools wieder konsolidieren indem wir die Mails einzeln von einem Spool in den anderen kopieren und anschliessend die entsprechenden Datenbanken neu erzeugen.
Solltet Ihr Eure eMails nicht nur auf dem IMAP Server sondern auch offline auf Euren Rechnern zu Hause haben, so solltet Ihr eine Kopie Eurer lokalen Daten vorsichtshalber anlegen. Manche eMail Clients löschen gerne einfach mal den gesamten Cache wenn sich die Datenbank auf dem IMAP Server ändert. Mit der Sicherheitskopie habt Ihr für diesen Fall wenigstens eine Kopie.
Sonntag, 3. Mai 2009
Ausfall der VM Helena [Erledigt]
Helena ist im Moment leider ausgefallen. Alle bisherigen Versuche, den Fehler zu finden oder die Maschine neu zu starten sind fehl geschlagen. Wir arbeiten weiterhin an dem Problem und hoffen, möglichst bald eine Lösung gefunden zu haben.
Betroffen sind folgende Dienste:
- Ssh Login auf helena.bawue.de (shell.bawue.net funktioniert und bietet dasselbe)
- Der MySQL 3 Server (nicht betroffen: mysql5.bawue.net)
- Webseiten, die auf dem Server gehostet sind (leider sehr viele) (nicht betroffen: Webseiten, die auf den neuen Webserver umgezogen sind, der Zugriff auf das public_html Verzeichnis)
Nicht betroffen sind alle anderen Dienste wie Mail, News, ...
Als Bugfix kann ich für Spezialfälle im Moment folgendes anbieten:
- Sollte deine Domain auf Helena gehostet sein und solltest du keine Datenbank von mysql.bawue.de, helena.bawue.de oder localhost nutzen, kann ich die Domain auf unseren neuen Webserver umziehen. Dazu bitte eine Email mit einer Liste aller umzuziehenden Domainnamen an admin@bawue.net schreiben.
- Sollte die Domain auf Helena laufen und eine lokale Datenbank nutzen, kann ich den Umzug auch starten, was dann allerdings funktioniert und was wie stirbt, weiss ich nicht.
- Sollte die Domain auf irgendeine Art und weise speziell konfiguriert worden sein, muss ich von Fall zu Fall schauen, was ich tun kann.
Danke für das Verständnis, Philipp (im Namen aller Admins)
[UPDATE:]
Helena läuft wieder. Das Problem wurde durch einen REboot von King gelöst. Der REboot verursachte jedoch andere Probleme, was die Sache etwas verzögert hat.
Sollte jemand dennoch auf den neuen Webserver umziehen wollen oder seine Datenbank nach mysql5 migrieren wollen, kann er sich gerne Tipps bei admin@bawue.net geben lassen. Die Kombination neuer Webserver/neuer Datenbankserver bietet nach Berichten anderer Nutzer bemerkbare Geschwindigkeitsvorteile.
Sonntag, 1. März 2009
bawue.net Certification Authority
Zur Verschlüsselten Übertragung von Daten im Internet wird im allgemeinen eine Technik namens Secure Sockets Layer (SSL) verwendet.
Diese Technik basiert auf dem Austausch von Schlüsseln zwischen Client und Server und anschliessender Verschlüsselung aller übertragenen Daten. Neben der Verschlüsselung soll die SSL Technik auch die Vertrauenswürdigkeit des Servers sicherstellen: Die Webseite https://my.bawue.net soll auch wirklich das My-Bawue Interface sein.
Die per HTTPS erreichbaren Webseiten des bawue.nets sowie die SSL unterstützenden Server (SMTP, IMAP, NNTP, UUCP etc.) sind durch die bawue.net Certificate Authority signiert.
Die Installation der bawue.net Root CA im Browser bzw. im Mail-Client führt dazu, dass die verschlüsselten Verbindungen ohne Warnungen aufgebaut werden können. Hierzu bitte den Schlüssel der "bawue.net e.V. Root Certification Authority" installieren. Nach dem Klick auf den vorigen Link wird der Schlüssel heruntergeladen und ein Fenster erscheint. Nach Bestätigen dieses, ist der Schlüssel installiert und der Besuch von z.B. https://my.bawue.net sollte keine weiteren Warnungen erzeugen.
Die Seriennummer des Schlüssels ist f7:aa:65:c7:3b:dd:85:8e und der SHA1 Fingerabdruck lautet 66:91:95:12:8B:90:8D:4C:A9:B0:FE:7A:11:37:77:27:E4:C5:5C:5C.
Donnerstag, 15. Januar 2009
Mitgliederversammlung 2008
Die Mitgliederversammlung für das Geschäftsjahr 2008 des bawue.net e.V. naht.
Sonntag, 15. Februar 2009 um 15:00 Uhr
im Obergeschoss des Ristorante Pizzeria Musica è
in der Neckarstraße 160, 70190 Stuttgart (0711-2858829).
Das Lokal befindet sich direkt an der Ecke Neckarstraße/Hackstraße und kann über die U-Bahn Linien U1, U2, U4, U9, U11 und U14 an der Haltestelle Stöckach erreicht werden. Ein Stadtplan mit Routenplaner befindet sich auf http://www.bawue.de/main/mitgliederversammlung.php.
Tagesordnung:
- Feststellung der Beschlussfähigkeit
- Wahl des Protokollführers
- Bericht des Vorstandes
- Bericht des Kassiers
- Bericht der Kassenprüfer
- Entlastung des Vorstandes
- Bericht über Vorhaben und Zukunftsperspektiven
- Wahl des Vorstandes
- Anträge
- Sonstiges
Anträge zur Tagesordnung können bis Samstag, den 14. Februar 2009 schriftlich (auch per E-Mail) beim Vorstand eingereicht werden.
Wichtig: Falls Du nicht persönlich erscheinen kannst, bitten wir Dich, einem bei der Mitgliederversammlung anwesenden Mitglied Deines Vertrauens eine formlose Vollmacht auszustellen um unsere Beschlussfähigkeit sicherzustellen. (Paragraph 9 der Vereinssatzung.)
Suche
Links
- bawue.net
- bawue.net Admins







