von Sven » Do 3. Dez 2015, 22:16
Hallo zusammen,
heute habe ich endlich mal die Zeit in Ruhe und ausführlich zu antworten. Daher erstmal SORRY für den langen Text.
Vorab: grundsätzlich ist es mir egal auf welcher Plattform der Server läuft. Die "Infrastructure Readiness" ist Thema von Carsten
Zunächst ein WrapUp der letzten Jahre:Historisch gesehen hatte der ABBUC ja (glaube bei 1&1) mal Webhosting gemietet, was lange vor meiner Zeit war. Allerdings gab es wohl Gründe die für eine eigene Infrastruktur sprachen.
Im Forum ist ja einige Male darüber zu lesen, dass die Erreichbarkeit, Bandbreite oder Geschwindigkeit von ABBUC.de nicht optimal war. Vor einigen Jahren war der Server noch in Frankfurt auf Kosten von Carsten gehostet. Und das war auch noch volume based und kostete (privates) Geld.
Danach ist der Server mit Carsten von Frankfurt weg gezogen, wieder gab es einige Kommentare bezüglich der Performance. Am 31.01.2013 wurde dann der Server ausgetauscht und die Performance ist deutlich gestiegen.
Am 19.11.2014 ist der Server dann nach Düren umgezogen, bekam mehrere IPv4 und IPv6-Adressen, sowie eine echte Traffic-Flatrate. Danach war eigentlich ein Optimum an Performance vorhanden.
Mit dem letzten Ausfall ist der Server nun aktuell in Hofheim (auf dem Schreibtisch), wie man auf dem Twitter-Post vom ABBUC sehen kann.
Die Installation von abbuc.de:Der Server selbst ist aktuell mit 2 Platten ausgestattet, die per brtfs-Dateisystem ein quasi Raid-1 bilden (Mirror des Filesystems). ABBUC.de selbst läuft in einem virtuellen Container auf dem Server. Neben diesen läuft ein weiterer Container, der uns eine Kopie von abbuc.de zur Verfügung stellt um Updates vorab testen zu können. Die beiden Platten sind Enterprise-Storage-Platten von WD, also nichts Schlechtes.
Die 2. Platte hatte ab August Probleme und sollte wie auf der JHV mitgeteilt ausgetauscht werden, was leider nicht mehr rechtzeitig geklappt hat. Durch Wartungsarbeiten (Trafo-Wartung) war der Server nach einem Reboot remote nicht mehr erreichbar. Auch der IPMI-Zugang (ähnlich dem ILOM bei HP/Oracle) war nicht möglich. Durch den Onsite-Support wurde auch umgehend ein Power-Reset durchgeführt, jedoch ohne Erfolg.
Ein dort angebrachter KVM (Remote-Konsole) lies ebenfalls keinen Zugriff zu (kein Boot, kein Log, nix), so dass ich kurzerhand beschlossen habe das der Server abgebaut und nach Hofheim zur weiteren Analyse gebracht werden sollte.
Nach 2 Tagen des Troubleshootings hatten wir den Server soweit, dass er wieder lief (und auch noch läuft). Allerdings hat auch die 1. Platte Probleme, so dass ich in Absprache mit Oliver beschlossen hatte den Server erst einmal unten zu lassen um möglichen Datenverlust zu vermeiden.
Durch persönliche Doofheit hatte ich dann auch noch falsche Platten bestellt, was sich erst beim geplanten Austausch vor Ort herausgestellt hatte. Um euch nicht länger hängen zu lassen hatte ich dann am Abend den (Web-)Server wieder hochgefahren.
Die neuen Platten liegen nun hier und warten darauf eingebaut zu werden, was hoffentlich am Wochenende passieren wird. Leider sind wir nicht über tiefe Kenntnisse bezüglich des Filesystems gesegnet, weswegen einerseits das Troubleshooting lange gedauert hat, andererseits sich auch das Handling von Backup und Restore sich für uns etwas schwieriger gestaltet. Ein Raid-Controller wäre da schon deutlich einfach gewesen...
Meine Sicht der Dinge:Ich habe den Text bewusst etwas detailierter verfasst um aufzuzeigen, das die lange Downtime nichts mit schlechtem Support des Hosters zu tun hat. Einzig das Ressourcenproblem schlägt aktuell zu. Weder Carsten noch ich haben derzeit die zeitlichen Möglichkeiten uns voll um die Website zu kümmern.
Somit ist es eigentlich egal ob der Server durch Hackerangriffe, HW-Fehler, Fehlrouting oder was auch immer nicht läuft - letztendlich kommt es nicht auf die Art des Hostings an, sondern auf die Ressourcen an die den Server administrieren.
Ich hatte vor einigen Jahren selbst root-Server angemietet und war mit der Performance überhaupt nicht zufrieden. Hinzu kommt, je billiger der Anbieter, desto schlechter meist der Service.
Bei root-Servern teilt man sich nunmal die HW mit anderen, was sich eigentlich immer negativ auf die Performance der Website auswirkt. Hinzu kommt noch die Anbindung, die ebenfalls geshared wird.
Im Forum sind einige Beiträge von euch zu finden die sich mit dem Thema schlechte Performance auseinander setzen. Daher wäre es aus dieser Sicht eher ein Rückschritt von einer eigenen Plattform wegzugehen.
Bezüglich der Sicherheit ist es natürlich auch weiterhin ein Thema, egal wo und wie gehostet wird.
Einige Hoster bieten zyklische Backups der VMs an, bei anderen ist man selbst dafür verantwortlich. Alles eine Frage des Preises.
Wir haben auf dem Server natürlich schon quasi personenbezogene Daten (Emailadressen, private Adressen aus dem Shop...) die nach meiner Einschätzung schützenswert sind.
Weiterhin haben wir auf dem Server auch die privaten Webspaces der Mitglieder gehostet.
Es ist voll OK darüber zu diskutieren und Alternativen aufzuzeigen. Auch mag jeder eine eigene Meinung darüber haben ob ein eigener Server sinnvoll ist oder nicht. Aus der Sicht des Clubs würde ich sagen haben wir derzeit die für uns flexibelste, schnellste, billigste und beste Lösung. Aber auch das mag seine Schattenseiten haben wie wir jetzt erfahren mussten.
Und direkt an Jürgen: Klar haben wir viel Fach-KnowHow im Club, Möglichkeiten auch bei Ausfällen dem Problem zu begegnen. Und ja, der lange Ausfall ist nicht unbedingt förderlich für den Club. Aber am Ende sind wir nur ein Club der nicht die gleichen Anforderungen hat wie ein Unternehmen - und nicht die gleichen finanziellen Mittel.
Und wie immer gilt: ABBUC - der Userclub zum Mitmachen.
Wer sich also der Verantwortung stellen möchte Web- und Serveradmin zu sein ist herzlich eingeladen.
Liebe Grüße
Sven
PS: Noch etwas (für mich) positives: Ich konnte temporär mein Überstundenkonto durch den Ausfall etwas reduzieren