Insight
20.10.2025

Ein RAG ohne Amerika – wie Schweizer Unternehmen wieder Kontrolle über ihre KI gewinnen

Retrieval-Augmented Generation (RAG) ist die Grundlage vieler moderner Chatbots und Wissenssysteme.

Sie ermöglicht, dass grosse Sprachmodelle nicht einfach frei halluzinieren, sondern Antworten auf Basis echter, interner Informationen liefern. Doch fast alle populären RAG-Lösungen – von OpenAI über Azure bis Anthropic – haben eines gemeinsam: Sie laufen auf amerikanischer Infrastruktur. Und genau hier beginnt das Problem.

Das Versprechen von RAG – und die Abhängigkeit dahinter

RAG gilt als einer der grössten Fortschritte in der KI-Entwicklung. Statt generische Modelle mit riesigen Datenmengen zu trainieren, können Unternehmen nun eigene Dokumente, Policies und Wissensquellen integrieren. Das Resultat: präzise Antworten, kontextbezogen, auf die Organisation zugeschnitten.
Doch was in der Theorie nach Kontrolle klingt, bedeutet in der Praxis oft das Gegenteil.

Viele RAG-Systeme greifen auf externe APIs zurück – etwa auf Azure OpenAI oder Amazon Bedrock. Damit fliessen nicht nur Anfragen, sondern oft auch Metadaten, Embeddings und Teilinhalte in Systeme, die dem US Cloud Act unterliegen. Das heisst: Auf Anfrage können amerikanische Behörden Zugriff auf diese Daten verlangen – auch dann, wenn sie in der Schweiz oder in Europa gespeichert sind.

Für Unternehmen mit sensiblen Informationen – etwa im Finanzwesen, Gesundheitssektor oder in der Verwaltung – ist das ein klarer Verstoss gegen den Grundsatz der Datenhoheit.

Warum Schweizer Unternehmen eigene RAG-Architekturen brauchen

In einer Zeit, in der Regulatoren wie die FINMA, das neue DSG oder der kommende EU AI Act mehr Transparenz und Nachvollziehbarkeit fordern, sind proprietäre, ausländische KI-Dienste ein Risiko.
Denn wer nicht weiss, wo seine Daten verarbeitet werden, welche Modelle Zugriff haben und welche Logs geschrieben werden, kann keine Compliance garantieren.

Ein souveränes RAG-System hingegen läuft komplett innerhalb kontrollierter Grenzen – sei es in einer Schweizer Cloud oder On-Premise im eigenen Rechenzentrum.
Das bedeutet:

  • Keine Datenübertragung ins Ausland
  • Keine Abhängigkeit von US-Anbietern
  • Volle Kontrolle über Modelle, Infrastruktur und Sicherheitslayer

Damit entsteht nicht nur technische, sondern auch strategische Unabhängigkeit.

Technische Basis für Souveränität: Lokale Modelle & Schweizer Infrastruktur

Ein souveränes RAG-System wie der Neuronetix KnowledgeBot kombiniert drei Kernkomponenten:

  1. Retriever: Durchsucht lokale Datenquellen, etwa SharePoint, DMS oder File Server, auf Basis semantischer Vektor-Datenbanken (z. B. Qdrant).
  2. Embeddings: Texte werden in numerische Vektoren umgewandelt – direkt auf Schweizer Servern, ohne externe API-Aufrufe.
  3. LLM: Antworten werden von lokal laufenden Modellen wie Llama 3, Mistral oder OpenHermes generiert – vollständig offline oder in geschützter Schweizer Cloud-Umgebung.

Dazwischen liegt ein Sicherheitslayer, der Rollen- und Zugriffsrechte berücksichtigt und jede Anfrage auditierbar macht.
So entsteht eine Architektur, die nicht nur modern, sondern auch rechtlich tragfähig ist – von der FINMA bis zum Bundesamt für Informatik.

RAG-Souveränität ist kein Luxus – sondern eine Notwendigkeit

Unternehmen, die heute auf amerikanische Modelle setzen, verschieben ihre Risiken in die Zukunft.
Wenn ein Audit ansteht oder neue regulatorische Anforderungen greifen, wird plötzlich sichtbar, dass Datenströme über Grenzen hinweggehen, Logfiles nicht kontrollierbar sind oder sich Modelle nicht mehr austauschen lassen.

Ein souveränes RAG-System vermeidet genau diese Sackgasse. Es bietet:

  • Nachvollziehbarkeit: Jede Antwort ist mit Quelle verknüpft.
  • Transparenz: Kein verstecktes Logging, keine Blackbox.
  • Kontrolle: Modelle, Daten und Infrastruktur bleiben in Schweizer Hand.

Die Schweiz hat alle Voraussetzungen, hier eine Vorreiterrolle einzunehmen – mit eigener Cloud-Infrastruktur, offenen Modellen und Partnern, die auf Unabhängigkeit statt auf Lizenzverträge setzen.

Was das konkret bedeutet

Statt ChatGPT oder Azure OpenAI zu verwenden, läuft dein RAG künftig direkt in der Schweiz:

  • Die Vektor-Datenbank wird auf einem Schweizer Server betrieben.
  • Das LLM läuft lokal in einem Container – performant, aber vollständig isoliert.
  • Daten bleiben im Haus, auch während der Verarbeitung.
  • Der Zugriff erfolgt ausschliesslich über authentifizierte Kanäle mit rollenbasierter Freigabe.

Das Ergebnis: dieselbe Effizienz, aber ohne rechtliche Grauzonen – echte digitale Souveränität statt API-Abhängigkeit.

Fazit: Es geht nicht nur um Technik, sondern um Selbstbestimmung

Ein RAG-System ohne Verbindung in die USA ist kein Rückschritt, sondern der nächste logische Schritt in der digitalen Evolution.
Es bedeutet, Verantwortung zu übernehmen – für die eigenen Daten, für die eigene Sicherheit und für die Zukunftsfähigkeit des Unternehmens.

Die Schweiz hat die Chance, hier ein eigenes Ökosystem aufzubauen – mit souveränen Clouds, offenen Modellen und Technologiepartnern, die Transparenz über Bequemlichkeit stellen.
Neuronetix unterstützt Unternehmen genau dabei: RAG-Systeme zu bauen, die intelligent sind – und souverän.

z
z
z
z
i
i
z
z
Bereit, durchzustarten?
Starte jetzt mit konkreten Ideen, echten Potenzialen und dem richtigen Partner an deiner Seite.