AIDSGVOEngineering

DSGVO bei AI — was das in der Praxis wirklich bedeutet

Die fünf Fragen, die wir jedes Mal beantworten, bevor wir auch nur einen API-Key beantragen.

20. Mai 2026·9 min Lesezeit

„DSGVO macht AI in Europa unmöglich" — das hören wir wöchentlich, und es ist meistens falsch. Was wahr ist: DSGVO macht schlampige AI unmöglich. Das ist gut. Hier sind die fünf Fragen, die wir jedes Mal beantworten, bevor wir auch nur einen API-Key beantragen.

1. Welche Daten gehen überhaupt durch das Modell?

Vor allem anderen: klassifiziere deine Daten. Es macht einen riesigen Unterschied, ob die LLM ein Patient-Symptom („mein Rücken schmerzt seit gestern") oder ein anonymisiertes Aggregat („14% der Anfragen sind Rezept-Nachbestellung") sieht.

Pro Use-Case gehen wir die Felder einzeln durch und labeln sie:

Personenbezogen identifizierend — Name, Mail, IP, Geräte-ID. Kommt nur in die LLM, wenn es absolut nötig ist.
Personenbezogen sensitiv — Gesundheit, Glauben, Sexualität, politische Meinung. Art 9 DSGVO. Geht in 95% der Use-Cases nicht in eine externe LLM.
Pseudonymisiert — Token statt Email, ID statt Name. Wenn das Mapping bei dir bleibt, ist es kein voller Personenbezug mehr.
Anonym — keine Rückführung möglich, auch nicht über Umwege. Frei verwendbar.

Faustregel: Nichts mehr durch die LLM schicken, als der Use-Case zwingend braucht. 80% der Projekte kriegen es mit pseudonymisierten Daten hin.

2. Wo läuft das Modell physisch?

OpenAI rohe US-API: Daten gehen nach USA, Standardvertragsklauseln greifen, aber die Optik im DACH-Mittelstand ist schwierig. Auch Microsoft-Azure-OpenAI war lang in dieser Grauzone.

Seit Vercel AI Gateway mit Zero Data Retention live ist (August 2025), routen wir LLM-Calls für DACH-Kund:innen ausschließlich über die EU-Region. Konkret:

Hosting in Frankfurt (Vercel Fluid Compute, ISO 27001).
Routing über Vercel AI Gateway → konfigurierbar pro Provider, ZDR aktiviert.
Keine Modell-Trainings-Nutzung deiner Daten — vertraglich zugesichert beim Gateway-Setup.
Logs bei uns in Vercel, nicht beim Modell-Provider.

3. Wer ist der Verantwortliche, wer der Auftragsverarbeiter?

Im DSGVO-Vokabular: Controller (du, der Auftraggeber) → Processor (NeXsoft, der das System betreibt) → Sub-Processor (Vercel, OpenAI, etc).

Das heißt zwei AV-Verträge sind nötig:

Zwischen dir und uns (NeXsoft als Processor) — wir liefern den Standard-AVV bei Projekt-Kick-off.
Zwischen uns und allen Sub-Processoren (Vercel, OpenAI via Gateway). Die Verträge haben wir ein Mal aufgesetzt und sie gelten für alle unsere Kunden — du musst sie nicht neu verhandeln.

Die Liste der Sub-Processoren steht im AVV. Wenn wir einen neuen reinholen, informieren wir dich vorab und du kannst widersprechen.

4. Wie lange werden Daten gespeichert?

Das ist die Frage, bei der Projekte am häufigsten gegen die Wand fahren — weil sie nie geklärt wird.

LLM-Prompts & Responses: bei Zero Data Retention nicht beim Provider gespeichert. In unseren Logs maximal 30 Tage, danach Aggregat oder Löschung.
Trainings-Daten für eigene Fine-Tunes: nur wenn der Use-Case es zwingend braucht. Pseudonymisiert. Mit Lösch-Pipeline pro User auf Anfrage.
Embeddings (Vektor-DB für RAG): Texte selbst nicht, nur Vektoren. Trotzdem im AVV erwähnen.
Backups: 30 Tage rollend, dann gelöscht. Vorher kein Recovery mehr möglich — das musst du wissen.

5. Was passiert, wenn das Modell falsch entscheidet?

Wenn ein Mensch von einer automatisierten Entscheidung „erheblich beeinträchtigt" wird, hat er nach Art 22 DSGVO ein Recht auf menschliche Überprüfung. Bei AI-Triage in einer Praxis bedeutet das konkret:

Jede „Eskalations"-Entscheidung der AI ist gleichzeitig sichtbar auf einem MFA-Tablet. Niemand verlässt sich darauf, dass die AI eine Notfall-Empfehlung wirklich zu Konsequenzen führt.
Patient:innen können widersprechen. „Ich will einen Termin, auch wenn die AI sagt: chronisch, kein Akut-Slot nötig" — durchgewinkt, Menschen entscheiden.
Audit-Trail: jede AI-Entscheidung mit Input, Output, Timestamp, Modell-Version. Damit du in zwei Jahren auf eine Anfrage „warum hat die AI das damals so entschieden?" antworten kannst.

Was du jetzt tun kannst

Wenn du AI in einem deutschen Geschäft einsetzt — egal wie früh — geh diese fünf Fragen mit deinem Datenschutz-Beauftragten durch:

Welche Daten brauchen wir wirklich? (Minimalprinzip)
Wo wird gerechnet? (EU oder mit SCC + ZDR)
Wer ist Verantwortlicher, wer Auftragsverarbeiter? (AVVs)
Wie lange werden Daten gespeichert? (Auftragsverarbeitung + Logs)
Was passiert bei falschen Outputs? (Art 22 / menschliche Eskalation)

Wenn du auf alle fünf eine schriftliche Antwort hast, bist du näher an „DSGVO-konformer AI" als 95% des Markts. Und ja — du kannst dann auch starten.

DSGVO ist bei AI nicht der Endgegner. Schlampige Architektur ist der Endgegner. DSGVO zwingt dich nur, sauber zu sein.

Neue Insights direkt im Postfach

Ehrliche Notes aus Engineering, AI und echten Cases. Etwa 1× im Monat, jederzeit abbestellbar.

Hilft das deinem Vorhaben weiter?

Lass uns 30 Min sprechen — konkret zu deinem Case.

Auch lesenswert

Wie wir aus einem Chat-Widget einen Conversion-Funnel gemacht haben

Ein Floating-Chat-Widget allein konvertiert nicht. Das mussten wir lernen — und sechs Pattern nachbauen, damit aus klick-scroll-schließ ein messbarer Funnel von Open bis Erstgespräch wurde.

Vercel AI Gateway statt Provider-SDKs

Drei Provider-SDKs in einem Repo bedeuten drei API-Keys, drei Rate-Limit-Logiken, drei Token-Zähl-Eigenheiten. Wir haben sie alle gegen einen Gateway-Endpoint getauscht. Hier ist, wie und warum.

Alle Insights

Jonas Schmitz

Gründer · NeXsoft

Koblenz·Antwortet meist in < 4h

Direkt mit Jonas sprechen

Kein Funnel, kein Sales-Rep. Du redest mit mir.

Ich höre dir 30 Minuten zu, stelle ein paar gezielte Fragen und sage dir am Ende ehrlich, ob — und wie — wir dir helfen können. Wenn nicht, bekommst du mindestens zwei Empfehlungen, wer's könnte.

30 Min, kein Sales-Pitch
Konkrete Einschätzung deines Cases
Fixpreis-Indikation am Ende des Calls

Lieber per Mail schreiben →