Skip to main content Skip to page footer

KI FLAT: 
Ihre Daten.
Ihre Kontrolle.

Die KI-Flatrate für 13,30 € pro Tag – DSGVO-konform, souverän gehostet in Deutschland. Auf Wunsch stehen Ihnen unsere KI-Expert:innen zur Seite.

Täglich kündbar   |   ISO-27001 zertifiziert   |   Hosting in Deutschland

Volle Souveränität – Ihre Daten, Ihr Kontrolle

Die KI läuft auf unserer Infrastruktur in Deutschland – ohne Datenweitergabe an Dritte. Sie behalten die volle Kontrolle über Zugriffe, Speicherung von Daten, Modelle und Prozesse.

Schneller Start – Integration in Stunden, nicht Wochen

Dank API-Kompatibilität mit OpenAI binden Sie Ihr System ohne Umbauten an. Auf Wunsch begleiten Sie unsere KI-Expert:innen persönlich.

Flexibel, transparent und fair – nur 13,30 € pro Tag

Tagesgenaue Abrechnung, keine Mindestlaufzeit, kein Vendor-Lock-in und wirklich 100% Open Source! Wachsen Sie im eigenen Tempo – eine Bindung ohne Risiko.

Technischer Aufbau – Sicherheit & Performance, die überzeugt

  • 100 % Hosting in Deutschland
    ISO-27001 zertifizierte Rechenzentren, DSGVO-konform, keine Datenabflüsse ins Ausland.
  • Open-Source Technologie-Stack
    Transparente Modelle und Systeme (ROCm, Open WebUI, OpenSearch) — nachvollziehbar, erweiterbar, zukunftssicher.
  • API-Kompatibilität mit OpenAI
    Drop-in Replacement: Nutzen Sie Ihre bestehenden Integrationen durch Tausch des API-Endpunkts sofort weiter.
  • Performante Hardware
    AMD W7900 GPUs (48 GB VRAM) im GPU-Cluster (192 GB VRAM) – ideal für LLM-Inference, Fine-Tuning und komplexe Workloads.
  • Stateless Architektur
    Keine Datenpersistenz außerhalb der GPU – maximale Datensouveränität.
  • Optional: Dedizierte Single-Tenant GPU-Infrastruktur
    Ihre LLMs bzw. AI&ML-Stack läuft exklusiv auf isolierter Hardware — keine Vermischung mit anderen Kunden.

Transparente Vertragsdetails – KI Flat auf einen Blick:

KategorieInhalt / Details
Preis & Abrechnung
  • 13,30 € pro Tag
  • KI-Nutzung als Flatrate (Fair Use Policy)
  • tagesgenaue Abrechnung
  • Berechnung startet am Tag des ersten, angelegten API Keys
  • stoppt automatisch mit Löschen des letzten API Keys am Folgetag
  • Mindestvertragslaufzeit 1 Tag
  • Vertragsverlängerung 1 Tag
API & Modelle
  • Unbegrenzte API Access Keys
  • Zugriff auf verschiedene LLMs (siehe Tabelle unten)
  • aktueller Zugriff ohne Beschränkung (Fair Use Policy)
Hosting & Datenschutz
  • ISO-27001-zertifizierte Rechenzentren in Deutschland
  • Daten werden nur im GPU-Speicher verarbeitet (stateless)
  • DSGVO- und BDSG-konform
  • AVV optional möglich
Support & SLA
  • Service und Support innerhalb der Geschäftszeiten (werktags 9–16 Uhr)
  • Incident-Handling priorisiert
  • Wartungsfenster werden kommuniziert
Nutzung & Haftung
  • Best Effort-Verfügbarkeit
  • Fair Use Policy – bei übermäßiger Nutzung behalten wir uns das Recht vor Maßnahmen zu ergreifen
Optionale Erweiterungen
  • Dedizierte GPUs mit individuellen SLAs und individuellen Vertragsvereinbarungen
  • Integration von Open WebUI / OpenSearch
  • Beratungsleistungen & Workshops
13,30

KI flat

Die einfache KI Flatrate mit einfacher Implementierung

Zugriff per API
Sofort Zugriff auf die KI per API Access
tagesgenaue Abrechnung
Ein Preis pro Tag, täglich kündbar. Einfacher geht es nicht.
Open-Source LLM's
Transparente Dokumentation der Modelleigenschaften

Nutzbare LLMs im Überblick:

ModellOriginLizenzEinsatzgebiet (Stärken)QuantisierungKontextlänge
gpt-oss:20bOpenAIApache 2.0Leistungsstarker Allrounder für Textgenerierung und Chatbots; sehr gutes Verhältnis von Rechenleistung zu Qualität.MXFP4128k Tokens
gpt-oss:120bOpenAIApache 2.0Premium-Modell für komplexe Aufgaben, lange Dokumente und präzise Antworten; ideal für Unternehmens-Use-Cases.MXFP4128k Tokens
mistral-small3.2:latestMistral AIApache 2.0Schnelles, effizientes Multimodal-Modell mit Vision-Unterstützung; ideal für Assistenzsysteme & Automatisierung.Q4_K_M 128k Tokens
Nomic-embed-text:v1.5NomicApache 2.0Text-Embedding-Modell mit sehr hoher Dichte und Performance; gut für semantische Suche & Retrieval.F16 2k Tokens
bge-m3:567mBeijing Academy of Artificial IntelligenceMITKompaktes & performantes Embedding-Modell; ideal für schnelle Vektorsuche, Knowledge Retrieval und RAG.F16 8k Tokens
embeddinggemma:300mGoogleGemma Terms of UseLeichtgewichtiges Embedding-Modell; sehr ressourcenschonend, gut für Anwendungen mit geringem Footprint.BF162k Tokens

Unsere Lösungen – flexibel, leistungsstark, maßgeschneidert

Egal ob Sie schnell starten, maximale Performance benötigen oder eine individuell abgestimmte KI-Strategie entwickeln möchten – wir bieten drei Wege, KI effizient und souverän in Ihrem Unternehmen oder Ihrer Verwaltung einzusetzen.

Lösung 1:

KI Flat (Flatrate)

Buchen Sie KI Flat einfach als Flatrate und profitieren Sie von sofortigem API-Zugang zu leistungsstarken LLMs. Shared GPU-Infrastruktur, stateless Verarbeitung – Ihre Daten werden nicht gespeichert oder gecacht.

Lösung 2:

Dedizierte KI-Lösung

Für maximale Leistung: Ihre eigene dedizierte GPU-Infrastruktur. 100 % Rechenleistung für Ihre Modelle, vollständig isoliert und für anspruchsvolle Workloads optimiert.

Lösung 3:

Consulting & Workshop

Unsere Expert:innen erarbeiten gemeinsam mit Ihnen die optimale KI-Lösung für Ihre individuellen Anforderungen. Von Strategie über Workflow-Design bis hin zur Implementierung – praxisnah und lösungsorientiert!

Björn Langer Vertriebsleiter Flying Circus Internet Operations

Björn Langer

Lassen Sie uns über Ihr Projekt sprechen

Als erster technischer Ansprechpartner setze ich mich dafür ein, Ihre individuellen Anforderungen zu verstehen und passgenaue Ansätze für den erfolgreichen Betrieb Ihrer Anwendung zu entwickeln. Unser Austausch ermöglicht zudem eine erste Preisindikation für Ihr individuelles Projekt zu ermitteln. Ich freue mich, mit Ihnen ins Gespräch zu kommen!

Technische Basis: Performance mit AMD-Power

Die Grundlage von KI Flat bildet ein GPU-Cluster mit AMD W7900 Grafikkarten. Jede GPU verfügt über 48 GB VRAM und hohen FP32/64-Durchsatz. Damit werden selbst komplexe Workloads mühelos verarbeitet – ob klassische Machine-Learning-Frameworks wie PyTorch und TensorFlow oder anspruchsvolle LLM-Inference in Echtzeit.

Die Architektur ist bewusst stateless konzipiert: Eingaben werden ausschließlich im GPU-Speicher verarbeitet, niemals persistiert oder in externe Caches ausgelagert. Ihre Daten bleiben jederzeit unter Ihrer Kontrolle und sind gegen ungewollte Speicherung geschützt.

Mit ROCm, dem offenen Software-Stack von AMD, setzt Flying Circus konsequent auf offene Standards und transparente Technologie. Das Ergebnis ist eine zukunftsfähige Plattform, die sich optimal an neue Entwicklungen im KI-Bereich anpassen lässt.

Alle Vorteile auf einen Blick:

Die DSGVO-konforme KI für Unternehmen und den öffentlichen Sektor –

sicher, flexibel und sorgenfrei

Implementieren Sie leistungsstarke Open-Source-KI-Modelle in Ihre Anwendung, ohne Datenschutzrisiken einzugehen. Der Flying Circus bietet eine vollständig verwaltete Private KI-Umgebung, gehostet in ISO 27001-zertifizierten Rechenzentren in Deutschland – 100 % DSGVO-konform und für den sicheren Unternehmenseinsatz optimiert.

Ihr Vorteil: Eine DSGVO-konforme KI-Lösung
ohne Kompromisse

Wenn Sie eine zuverlässige KI-Lösung benötigen, die nahtlos in Ihren Betrieb integriert werden kann, machen wir es für Sie einfach. Wir übernehmen vollständig das Management der Software und Infrastruktur für Sie, damit Sie sich auf Ihr Kerngeschäft konzentrieren können. Um maximale Sicherheit zu gewährleisten, bieten wir Ihnen dedizierte KI-Serverinfrastruktur an. Unser Single-Tenant-Ansatz stellt sicher, dass Ihre Systeme strikt getrennt bleiben und Ihre Daten jederzeit unter Ihrer Kontrolle sind – ohne Vermischung mit anderen Kunden. Unsere maßgeschneiderten Service-Level Agreements (SLAs) garantieren Ihnen eine optimale Anwendungsverfügbarkeit und Anpassung an Ihre spezifischen Anforderungen. Sie konzentrieren sich auf Ihr Kerngeschäft – wir kümmern uns um die smarte KI-Lösung, die Sie dabei unterstützt.

Von der Idee zur einsatzbereiten KI –
Ihre maßgeschneiderte Lösung

Der Einsatz von KI muss durchdacht sein – und genau hier unterstützen wir Sie. Unabhängig davon, ob es sich um Retrieval-Augmented Generation (RAG), Machine Learning, Fine-Tuning oder Multi-Agenten-Systeme handelt – wir unterstützen Sie bei der Entwicklung Ihrer eigenen KI-Anwendung und passen die Methode individuell an Ihre Bedürfnisse im Projekt an. In der Planungsphase analysieren wir gemeinsam Ihre Anforderungen, wählen das optimale Modell und stimmen die KI-Hardware exakt auf Ihre Bedürfnisse ab. Während der Realisierungsphase setzen wir die Lösung für Sie um, ermöglichen erste Tests und Sie nutzen bestehende Sprachmodelle präzise für Ihren Anwendungsfall – mit engen Feedbackzyklen für maximale Effizienz. Sobald alles optimal läuft, übernehmen wir in der Betriebsphase das Hosting und den sicheren Betrieb Ihrer KI. Der Zugriff erfolgt komfortabel über eine intuitive grafische Weboberfläche oder eine OpenAI-kompatible API – reibungslos und perfekt in Ihre Systeme integriert. Eben einfach eine KI-Lösung mit maximaler Sicherheit und Datenschutz vom Flying Circus.


Der Flying Circus bietet viele Vorteile für Ihr KI-Projekt

Einfache API-Integration

  • Drop-In Replacement für OpenAI API – bedeutet: minimaler Entwicklungsaufwand für Sie!
  • Schnelle und einfache Einbindung in bestehende Anwendungen
  • Keine eigene Hardware erforderlich – Wir übernehmen das komplette Hosting & Management

Sicherheit und Datenschutz

  • Ihre Daten bleiben Ihre Daten – Keine Speicherung von Prompts oder KI-Antworten in Dritt-Systemen!
  • Dediziertes Hosting – Für maximale Leistung & Isolation
  • Erweiterte Sicherheitsarchitektur – z. B. VPN-Integration möglich

Gefördert durch das Land Sachsen-Anhalt – für digitale Souveränität

Mit der Strategie „Sachsen-Anhalt Digital 2030“ verfolgt das Land das Ziel, eine starke digitale Wirtschaft und eine moderne, zukunftsfähige Verwaltung aufzubauen. Künstliche Intelligenz spielt dabei eine zentrale Rolle – sie eröffnet enorme Potenziale, bringt aber auch Herausforderungen mit sich: den Schutz personenbezogener Daten, die Nachvollziehbarkeit von Entscheidungsprozessen und die Kontrolle darüber, wo und wie Daten verarbeitet werden.

Unser Ziel ist es, die digitale Selbstbestimmung in Sachsen-Anhalt nachhaltig zu stärken: Wir wollen Organisationen befähigen, Daten und Technologien so einzusetzen, dass sie den Vorgaben der europäischen Gesetzgebung entsprechen – nachvollziehbar, auditierbar und compliant. Gleichzeitig fördern wir die Entwicklung innovativer Anwendungen, die auf offenen Standards basieren und langfristig den digitalen Standort Sachsen-Anhalt stärken.

Eine datenschutzkonforme Lösung –

die sichere KI in der Verwaltung

Künstliche Intelligenz (KI) kann die öffentliche Verwaltung revolutionieren, indem sie Routineaufgaben automatisiert, Entscheidungen erleichtert und den Bürgerservice verbessert. Mit unserem datenschutzkonformen KI-Ansatz können Verwaltungsprozesse optimiert werden, ohne dass sensible Daten gefährdet sind.

Unsere KI-Lösungen bieten hier zum Beispiel die Möglichkeit, Anträge zu prüfen und priorisieren, Dokumente automatisch zu klassifizieren und Fristen zu überwachen. Durch virtuelle Assistenten ("Amt-Agenten") können Bürgerinnen und Bürger sowie Mitarbeiterinnen und Mitarbeiter bei verschiedenen Anliegen unterstützt werden, während Chatbots als natürliche Sprachschnittstelle dienen. Unser Ansatz ist es, Verwaltungen effizienter und transparenter zu gestalten, indem datenschutzkonforme KI-Lösungen zur Verbesserung der Dienstleistungen für Bürgerinnen und Bürger beitragen. Wir sind überzeugt davon, dass unsere dedizierte KI-Lösung aktiv die digitale Transformation öffentlicher Verwaltungen unterstützen kann.

Maßgeschneiderte KI-Lösungen vom Flying Circus

Die Broschüre „Maßgeschneiderte KI-Lösungen vom Flying Circus“ gibt einen kompakten Überblick über unsere Arbeit und unserer Lösung KI Flat. Sie zeigt, wie Unternehmen und öffentliche Einrichtungen KI sicher, effizient und im Einklang mit europäischen Datenschutzstandards einsetzen können.

Im PDF für Sie enthalten:

  • Markt‑Insights: BSI‑ und Bitkom‑Analyse – Europas Position gegenüber USA & China
  • Technik‑Highlights: AMD‑W7900‑Cluster, ROCm‑Stack & stateless‑Processing für kompromisslosen Datenschutz
  • Unser Angebot: KI Flat ab 13,30 €/Tag – sofortiger API‑Zugriff, Drop‑In‑Replacement für OpenAI, Open WebUI & OpenSearch als Erweiterungen
  • Beratung & Umsetzung: Von der ersten Strategie‑Work‑Session bis zum Go‑Live – begleitet von Experten

Jetzt PDF herunterladen



Interesse an einer KI-Lösung mit maximaler Sicherheit und Datenschutz?

Sie wollen KI einsetzen, aber Datenschutz oder Integration sind Herausforderungen? Lassen Sie uns gemeinsam Ihre aktuellen IT-Herausforderungen angehen und überlegen, wie wir diese mithilfe von unserem KI-Ansatz lösen können. Kontaktieren Sie uns jetzt für eine persönliche Beratung.

Ich bin damit einverstanden, dass meine personenbezogenen Daten für die Bearbeitung meines Kontaktanliegens verarbeitet werden. 
Die Datenschutzerklärung finden Sie unter diesem Link.