Jahresrückblick 2025: Plattformbetrieb zwischen Innovation und Fortschritt
Seit Anfang 2025 hat sich viel getan. Es war ein Jahr, in dem wir nicht nur gewachsen sind, sondern auch ein Jahr, in dem viel Bewegung in unserer Plattform-Architektur herrschte. Wenn wir auf die nackten Zahlen schauen, können wir mittlerweile mit Stolz verkünden: Wir verwalten mittlerweile 157 physische Server und 1.457 virtuelle Maschinen, die zusammen über 2 Petabyte Traffic bewegt haben. Mit 23 TiB RAM, 3.048 CPU-Cores und 2,2 Petabyte Storage haben wir mittlerweile beachtliche Kapazitäten in der Plattform erreicht.
Doch Zahlen erzählen nur die halbe Geschichte. Hinter diesen Werten steckt eine Philosophie der kontinuierlichen Verbesserung – nicht nur für uns als Betreiber, sondern vor allem für euch als Nutzende. Wir blicken zurück auf ein Jahr voller technischer Weichenstellungen, ehrlicher Herausforderungen und spannender Neuerungen.
46 Plattform-Releases: Fortschritt im Wochentakt
Wer unsere Changelogs verfolgt, hat es bemerkt: 46 Releases in 12 Monaten – das bedeutet fast wöchentlich neue Features, Bugfixes oder Security-Updates. Warum dieser hohe Takt? Weil wir überzeugt sind, dass kleine, regelmäßige Schritte besser sind als große, riskante Sprünge („Big Bang Releases“).
Diese Strategie erlaubt uns, technische Schulden gar nicht erst aufkommen zu lassen. Wir schließen Sicherheitslücken oft binnen Stunden und bringen neue Software-Versionen zeitnah in die Plattform. Für unsere Kund*innen bedeutet das: Kein langes Warten auf das nächste „Service Pack“, sondern eine Plattform, die organisch mit den Anforderungen wächst und dabei sicher bleibt.
Flexibilität für eure Anwendungen: Cloud-init und Ubuntu
Manchmal führt der Weg nach vorn über die Integration bewährter Standards. Mit der Einführung von Cloud-init-basierten Ubuntu-VMs im Frühjahr 2025 haben wir eine Lücke in unserem Dienstleistungsportfolio geschlossen. Unser Team hat beobachtet, dass manche Anwendungen und Migrationen einfach schlichtweg eine spezifische Umgebung benötigen.
Cloud-init ist hier der Schlüssel: Es ermöglicht die automatisierte Initialisierung von Cloud-Instanzen direkt beim ersten Start. Das Ergebnis ist eine deutlich schnellere Bereitstellung und eine nahtlose Integration in bestehende Workflows auf unserer Plattform. Wir haben uns für diesen Schritt entschieden, um euch die Freiheit zu geben, eure Anwendungen so zu betreiben, wie ihr es braucht – ohne Kompromisse bei der Plattformwahl eingehen zu müssen.
Souveräne KI: Mehr als nur Hype
Künstliche Intelligenz war auch 2025 das dominierende Thema in der Tech-Welt. Doch statt auf jeden Zug aufzuspringen, haben wir uns gefragt: Wie können wir KI anbieten, die unseren Werten von Datenschutz und Souveränität entspricht? Die Antwort lieferten wir im September mit unserer OpenAI-kompatiblen API für den AMD GPU-Cluster.
Das ist kein Marketing-Gimmick, sondern eine bewusste Entscheidung für digitale Unabhängigkeit. Unsere Nutzer sollen KI-Modelle einsetzen können, ohne sensible Daten an externe Hyperscaler zu senden. Durch den Einsatz leistungsstarker AMD-Hardware liefern wir die nötige Rechenpower, während die API-Kompatibilität sicherstellt, dass ihr bestehende Tools und Workflows ohne Umlernen weiterverwenden könnt.
Netzwerk: Das Rückgrat unserer Plattform
Eine starke Plattform braucht ein starkes Fundament. Deshalb haben wir 2025 auch hinter den Kulissen massiv investiert und umgebaut.
Switching auf NOKIA
Ein Highlight war die Umstellung unserer Switching-Infrastruktur auf NOKIA. Warum NOKIA? Weil wir eine Lösung brauchten, die nicht nur heute, sondern auch morgen skaliert. Gleichzeitig legen wir großen Wert auf langfristige europäische Partnerschaften – für unsere digitale Souveränität und die unserer Nutzerinnen und Nutzer. Ein solcher Wechsel ist komplex: Er bedeutete monatelange Tests und eine enge Abstimmung mit dem Hersteller, bevor der schrittweise Rollout begann. Das Ergebnis ist eine Infrastruktur, die robuster und wartungsfreundlicher ist.
Routing: Von FRR zu BIRD
Auch beim Routing gab es Veränderungen. Wir haben uns entschieden, von FRRouting (FRR) auf BIRD zu wechseln. Das war eine logische Entscheidung, um langfristig mehr Flexibilität im Routing und einen besseren Community-Support zu erhalten. Die Zusammenarbeit mit der BIRD-Community und Partnern wie CZ.NIC hat uns hier wertvolle Impulse gegeben.
Und ja – es lief nicht immer alles wie geplant.
Ehrlichkeit und Transparenz gehört für uns ebenfalls zum Plattformbetrieb dazu: 2025 lief nicht alles so reibungslos wie wir es ursprünglich geplant haben. Bei der Vielzahl an Veränderungen gab es auch Situationen die zu Instabilität geführt haben oder sehr komplexe Betriebszustände entstehen ließen.
So hatten wir zum Beispiel über einen längeren Zeitraum mit Phänomenen in der DNS-Namensauflösung zu kämpfen. Das Fehlerbild war tückisch: Es trat nicht dauerhaft auf, sondern führte in spezifischen Situationen zu verzögerten oder fehlgeschlagenen Verbindungen.
Wie kam es dazu? Es handelte sich um eine komplexe Wechselwirkung aus Sicherheits- und Performance-Einstellungen verschiedener Dienste, die sich gegenseitig ungünstig beeinflussten. Wir haben das Problem inzwischen nachhaltig identifiziert und behoben. Mehr noch: Wir haben daraus gelernt, solche „stillen“ Fehler in Tooling-Kombinationen gezielter zu überwachen und künftig schneller zu erkennen.
Nutzerfreundlichkeit im Fokus
Technik ist am Ende nur Mittel zum Zweck, weshalb wir gezielt Features eingeführt haben, die euren Alltag erleichtern. Da Projektanforderungen selten statisch sind, reagieren wir darauf mit einem flexiblen Pricing-Modell aus Committed und temporären Service-Upgrades – eine Lösung, mit der wir eine gesunde Balance zwischen Flexibilität und Preisattraktivität gefunden haben. Dasselbe Mindset verfolgen wir bei der Leistung: Wir „schenken“ euch zusätzliche Disk-IOPS für kurze Lastspitzen (Burst-Performance), denn es ergibt technisch wenig Sinn, kurzzeitige Prozesse wie einen Reboot künstlich zu limitieren. Auch hier haben wir einen Sweetspot zwischen individueller Performance und allgemeiner Lastverteilung definiert, der voll zu euren Gunsten ausfällt.
Ausblick 2026: Was kommt als Nächstes?
2025 war ein starkes Jahr, aber wir ruhen uns nicht aus. Für 2026 stehen die Zeichen weiter auf Integration und Verfeinerung. Wir werden unsere KI-API weiter ausbauen, um noch mehr Use Cases abbilden zu können, und im Netzwerkbereich den Austausch mit der BIRD-Community noch intensiver zu gestalten. Technologie lebt vom Austausch. Das wurde uns beim NixOS Salt Sprint wieder besonders deutlich. Der direkte Draht zur Community inspiriert uns und hilft uns, unsere Prozesse zu hinterfragen. Auch der Day-1-Support für NixOS 25.11 zeigt unser Commitment: Wir konsumieren Open Source nicht nur, wir arbeiten aktiv mit dem Upstream zusammen, um das Ökosystem für alle besser zu machen.
Doch wir blicken nicht nur auf den Code, sondern auch auf die Hardware-Märkte – und hier mischt sich Vorfreude mit Wachsamkeit. Wir beobachten derzeit die Beschaffungsstrategien großer Hyperscaler und deren Einfluss auf ausgewählte Märkte, insbesondere bei Speicherkomponenten für Server und GPUs. Aktuelle Markteinschätzungen deuten darauf hin, dass sich diese Entwicklungen mittelfristig auf Preisstrukturen auswirken könnten. Vor diesem Hintergrund verfolgen wir die Marktbewegungen aufmerksam, um mögliche Auswirkungen frühzeitig zu erkennen. Aber unsere Mission bleibt unverändert: Wir managen die Technik und die Plattform im Hintergrund, damit ihr euch voll und ganz auf eure Projekte in 2026 konzentrieren könnt.