Veranstaltungen

Kein System war jemals fair

Technische Strichzeichnung im Blanco-Stil von fünf Teilnehmenden des Trustworthy AI Circle, die lächeln und das Friedenszeichen zeigen, gezeichnet mit dünnen schwarzen Linien auf weißem Grund mit Akzenten in zartem Korallenrot.

Für das Originalfoto den Mauszeiger darüberbewegen

Maschinell aus dem Englischen übersetzt. Maßgeblich ist das englische Original.Zum englischen Original

Was wir aus vier Breakout-Sessions, einer Demo eines Fairness-Tools und mehr als fünfzig Jahren gemeinsamer Erfahrung über Fairness in der KI gelernt haben. Vom Trustworthy AI Circle: „Alles ist fair in der KI, oder?“

Die eine Antwort, auf die wir uns einigen konnten

Wir eröffneten den Trustworthy AI Circle mit der gebündelten Berufserfahrung von über fünfzig Jahren im Raum und kamen zu genau einer klaren Schlussfolgerung: Kein System war jemals fair. Keine einzelne Definition von Fairness ist über Kontexte, Rollen und Individuen hinweg gültig.

Das klingt wie eine Sackgasse. Es war das Gegenteil. Es war der einzig ehrliche Ausgangspunkt. Alles wirklich Nützliche, das folgte, hing davon ab, dieses Eingeständnis zuerst aus dem Weg zu räumen, sodass es in der Session nicht darum ging, einen Konsens herzustellen. Es ging darum, ein Wort von überflüssigem Ballast zu befreien, das jeder benutzt und das kaum jemand auf die gleiche Weise definiert.

Daniel Glinz eröffnet den Trustworthy AI Circle vor einer projizierten Folie mit dem Titel „The silent architecture of fairness“ und einem sitzenden Publikum. — The silent architecture of fairness: Demo der Closed Beta von validant.ai.

Das Experiment: vier Räume, ein Tool

Um das Abstrakte konkret zu machen, teilten wir die Teilnehmenden in vier Gruppen auf und wiesen jeder eine organisatorische Rolle zu: Board, Operations, Business und Compliance. Dann gaben wir allen vier Gruppen dasselbe Szenario – ein Unternehmen, das ein KI-basiertes Recruiting-Tool einführt – und stellten eine täuschend einfache Frage: Was würde „fair“ aus Ihrer jeweiligen Position heraus bedeuten?

Dann zogen wir uns zurück und überließen den Teilnehmenden als Experten das Feld.

Eine Gruppe von Teilnehmenden des Trustworthy AI Circle, versammelt um ein Flipchart mit der Überschrift „Board“, erarbeitet, was Fairness aus ihrer zugewiesenen Rolle bedeutet. — Einer der vier Arbeitsräume: Die Definition von „fair“ aus einer einzigen Perspektive am Tisch.

Erkenntnis 1: Fairness ist irreduzibel plural

Jede Gruppe erarbeitete eine andere Definition von Fairness. Jede Definition war in sich schlüssig. Keine einzige Gruppe behauptete, ihre Definition sei ohne Preis zu haben.

Das ist das Ergebnis, auf das ich immer wieder zurückkomme. „Fair“ ist keine Eigenschaft des Tools, die man einmal messen und zertifizieren kann. Es ist ein ausgehandeltes Ergebnis zwischen Stakeholdern mit unterschiedlichen primären Verpflichtungen. Das Board ist dem langfristigen Wert und der Reputation verpflichtet. Die Compliance ist dem Gesetz verpflichtet. Der Bereich Business ist der Leistung und Erklärbarkeit verpflichtet. Der Bereich Operations ist dem Prozess und der Auditierbarkeit verpflichtet. Jede Rolle hatte von ihrem Standpunkt aus recht, und die Definitionen ließen sich nicht auf eine einzige Kennzahl reduzieren.

Wäre Fairness eine Eigenschaft des Systems, würden vier Expertengruppen, die dasselbe System betrachten, zu einem übereinstimmenden Ergebnis kommen. Das taten sie nicht. Sie kamen zu unterschiedlichen, klar voneinander abgrenzbaren und vertretbaren Ergebnissen, was darauf hindeutet, dass diese Eigenschaft in den Beziehungen rund um das Tool liegt und nicht im Tool selbst.

Ein Moderator präsentiert an einem Flipchart mit der Überschrift „Ihre Rolle: Operations. Definieren Sie, was für Sie fair ist“ vor einem Kreis stehender Teilnehmender. — „Definieren Sie, was für Sie fair ist.“ Jede Rolle kam zu einer schlüssigen Antwort, und keine zwei Antworten stimmten überein.

Erkenntnis 2: Sogar der Begriff „Transparenz“ zersplittert

Jede Gruppe forderte Transparenz. Das schien eine Gemeinsamkeit zu sein, bis wir die Ergebnisse verglichen und sich herausstellte, dass das Wort vier verschiedene Dinge bedeutete.

Der Bereich Business meinte die Erklärbarkeit der Empfehlungen. Das Board meinte die kulturelle Verantwortlichkeit für die getroffenen Entscheidungen. Die Rechtsabteilung meinte eine kontrollierte, vertretbare Offenlegung. Der Bereich Operations meinte einen auditierbaren, reproduzierbaren Prozess. Ein Wort, vier unvereinbare Anforderungen. Wenn ein Anbieter „Transparenz“ verspricht und ein Käufer eine dieser vier Bedeutungen darunter versteht, während der Anbieter eine andere liefert, wird die Lücke erst sichtbar, wenn das System bereits in Betrieb ist und jemand nach der Verantwortlichkeit fragt.

Erkenntnis 3: KI ist ein Spiegel, keine Quelle

In meinem Teil der Session habe ich erörtert, was das für das Recruiting bedeutet, denn beim Recruiting hört die Abstraktion auf, akademisch zu sein. Die Lektion daraus ist unbequem und sollte klar ausgesprochen werden: KI erfindet keine Ungleichheit. Sie hält uns einen Spiegel vor.

Ein Recruiting-Modell lernt aus historischen Einstellungsdaten, und historische Einstellungsdaten kodieren historische Präferenzen. Selbst wenn man geschützte Merkmale entfernt, schleusen Proxys dasselbe Signal wieder ein. Das Prestige einer Universität korreliert mit dem sozioökonomischen Hintergrund. Die Sprache im Lebenslauf transportiert dies ebenfalls, wobei Begriffe wie „geleitet“ und „ausgeführt“ positiver bewertet werden als „kollaboriert“ und „unterstützt“. Das meistzitierte öffentliche Beispiel – ein frühes Recruiting-Tool eines großen Tech-Unternehmens, das gelernt hatte, Lebensläufe mit dem Wort „women’s“ herabzustufen – schuf keinen neuen Bias. Es reproduzierte einen, der bereits in den Trainingsdaten vorhanden war, und wandte ihn dann in großem Maßstab mit der ruhigen Gewissheit von etwas an, das objektiv aussieht.

Ein Redner spricht vor einem sitzenden Teilnehmerkreis an einem Fenster und erörtert, wie Bias im KI-gestützten Recruiting zutage tritt. — Wo die Abstraktion aufhört, akademisch zu sein: Bias im Recruiting, lesbar gemacht.

Das ist das zweischneidige Schwert. KI perpetuiert bestehenden Bias mit schockierender Effizienz und zementiert ihn in täglichen Entscheidungen. Gleichzeitig macht sie diesen Bias aber auch lesbar. Sie überführt ein Muster, das diffus und leugbar war, in ein Diagramm, auf das man zeigen kann, was die Frage aufwirft, die wir bisher vermeiden konnten: Ist das in Ordnung?

“Bias sichtbar statt nur behauptet zu machen, ist der springende Punkt. Sie können keinen Trade-off aushandeln, den Sie sich weigern anzusehen.”

Erkenntnis 4: Wir begannen mit Metriken und endeten bei der Ethik

Wir kamen mit der Erwartung einer Konversation über Metriken und Tools – Demographic Parity, Equal Opportunity, Equalised Odds, Calibration. Wir gingen mit der Erkenntnis, dass die Metrik der letzte Schritt ist, nicht der erste.

Eine Fairness-Metrik für sich allein ist nur „etwas zum Anschauen“. Erst der situative Kontext macht sie zu einer Entscheidungsgrundlage. Dieselbe Disparitätskennzahl kann in einem Umfeld statistisches Rauschen und in einem anderen ein schwerwiegender Schaden sein, und nur der Kontext verrät, was zutrifft. Lässt man den Kontext weg, hat man nur eine Zahl. Behält man ihn bei, hat man Verantwortlichkeit. Bevor man also etwas so Komplexes wie Fairness sinnvoll operationalisieren kann, braucht man eine Diskussion, die von der Ethik geleitet wird und in der spezifischen Situation verankert ist. Die Mathematik kommt danach, nicht davor.

Erkenntnis 5: Es gibt immer einen Verlierer

Keine Gruppe kam um den Trade-off herum. Jede Fairness-Definition bevorzugt jemanden und benachteiligt jemand anderen. Chancengleichheit (Equal Opportunity) schützt davor, qualifizierte Kandidaten zu übersehen, garantiert aber keine gleiche Repräsentation. Demografische Parität (Demographic Parity) bewirkt das Gegenteil. Sie können nicht alle gleichzeitig erfüllen, und die Forschungsliteratur stellt klar, dass einige dieser Definitionen mathematisch unvereinbar sind.

Die eigentliche Entscheidung lautet also nicht: „Ist dieses System fair?“. Sondern: „Wen sind wir bereit, verlieren zu lassen, und können wir diese Wahl verteidigen?“. Das ist eine Werteentscheidung im technischen Gewand, und wer so tut, als sei es anders, lässt seine Organisation mit einer sauberen Compliance-Akte sehenden Auges ins Verderben laufen.

Teilnehmende sitzen im Kreis in einer offenen Diskussion; hinter ihnen eine projizierte Folie mit dem Titel „Alles ist fair in der KI, oder?“. — Der Trade-off, dem keine Gruppe entkam: Jede Definition von „fair“ schafft einen Verlierer.

Was das für Organisationen bedeutet

Aus dem Tag ergaben sich einige praktische Konsequenzen.

01Jede Organisation muss ihre eigenen Werte definieren und diese explizit machen. Fairness kann nicht an eine Standardeinstellung in einem Tool ausgelagert werden.
02Die Interessen der Stakeholder müssen offengelegt, diskutiert und explizit gewichtet werden, anstatt sie demjenigen zu überlassen, der zufällig die Beschaffungsentscheidung innehat.
03Der Shareholder-Value kann nicht länger allein ausschlaggebend sein. Er muss gegen den langfristigen Kundenwert abgewogen werden, mit einem gerechten Zugang, der belegt, transparent und gegenüber dem Vorstand rechenschaftspflichtig ist.
04Nichts davon ist eine einmalige Übung. Die richtige Antwort verändert sich, so wie sich Gesellschaft, Technologie und menschliche Werte verändern. Daher muss die Gewichtung immer wieder überprüft und darf nicht nur einmal festgelegt und zu den Akten gelegt werden.

Die Rolle von Validant.ai

Das ist die Lücke, für deren Schließung ich Validant.ai entwickelt habe. Die Plattform existiert nicht, um einem System den Stempel „fair“ aufzudrücken, denn dieser Stempel wäre unehrlich. Sie existiert, um die Abwägungen explizit, belegbar und prüfbar zu machen: eine unabhängige Analyse, wen ein System begünstigt, wen es benachteiligt und ob diese Entscheidung bewusst und vertretbar getroffen wurde.

Stellen Sie es sich wie eine Bewertungsfunktion für KI-Fairness vor. Kein Urteil, das die Diskussion beendet, sondern eine Evidenzgrundlage, die die Diskussion rechenschaftspflichtig macht, die die Metrik mit dem Kontext verbindet und die einem Vorstand etwas an die Hand gibt, wofür er tatsächlich einstehen kann. Fairness mag mathematisch nie vollständig erreichbar sein. Bewusst zu wählen, wen wir bereit sind zu benachteiligen, diese Wahl zu dokumentieren und sie anzupassen, wenn sich die Welt verändert – das ist erreichbar, und das ist die Aufgabe.

Der Wettlauf um Klarheit

Die Fairness-Forschung läuft seit Jahrzehnten. Die Definitionen vervielfachen sich ständig und die Ziellinie verschiebt sich immer weiter. Es wäre einfach, das als Scheitern zu interpretieren. Das ist es aber nicht. Das einzig wirkliche Scheitern wäre, den Wettlauf um Klarheit aufzugeben oder, schlimmer noch, zu erklären, man sei bereits am Ziel.

Eine gute Podiumsdiskussion ist keine inszenierte Einigkeit. Sie besteht aus unterschiedlichen Perspektiven, echter Reibung und den Fragen, die wirklich gestellt werden müssen. Diese Reibung ist kein Problem, das geglättet werden muss. Sie ist menschlich, sie ist notwendig, und sie ist der Punkt, an dem der Wandel tatsächlich stattfindet.

Der volle Raum des Trustworthy AI Circle: ein aufmerksames Publikum vor einem Redner und einer projizierten Folie zur Architektur von Fairness. — Der Trustworthy AI Circle während der Sitzung.

Fünf Teilnehmende des Trustworthy AI Circle lächeln und zeigen nach der Sitzung das Friedenszeichen. — Die Menschen hinter der Reibung: der Trustworthy AI Circle nach der Sitzung.

Daniel Glinz arbeitet an den Themen KI-Fairness, digitales Vertrauen und regulatorische Bereitschaft und ist der Gründer von Validant.ai. Wenn Ihre Organisation sich mit denselben Fragen beschäftigt, arbeitet er direkt mit Unternehmen zusammen, um deren KI-Biases transparent zu machen und die Abwägungen zu durchdenken, die jede Fairness-Entscheidung erzwingt. Nehmen Sie Kontakt auf, um das Gespräch fortzusetzen, eine Demo zu sehen oder zu erfahren, wie Sie Bias in Ihren eigenen Systemen sichtbar machen können.

Beschäftigen Sie sich damit, was Fairness für Ihre eigenen Systeme bedeutet? Nehmen Sie Kontakt auf für eine Demo oder um zu erfahren, wie Sie Ihre KI-Biases transparent machen und die damit verbundenen Abwägungen meistern können.

Diesen Beitrag teilen

Technische Strichzeichnung im Blanco-Stil einer einzelnen Lupe in der Mitte, von der identische Linien zu einer Reihe kleiner Bürogebäude und einer uniformen Menschenmenge ausstrahlen, mit einer einzelnen, sanft korallenrot gefärbten und abseits stehenden Figur, in dünnen schwarzen Linien auf weißem Grund.

StudienZum Lesen öffnen

27. Mai 2026

Die falsche Frage, im großen Stil gestellt

Eine wegweisende Studie mit 4 Millionen Bewerbungen zeigt, wie KI-Tools für die Personalbeschaffung ihre Voreingenommenheit verbergen, warum eine einzige Ablehnung zu einer allgegenwärtigen Ablehnung werden kann und weshalb eine unabhängige Bewertung auf Positionsebene keine Option mehr ist.

Lesen

Technische Strichzeichnung im Blanco-Stil der gedeckten hölzernen Kapellbrücke und des achteckigen Wasserturms in Luzern über der Reuss, mit dem Pilatus im Hintergrund und einem sanften Korallenton am Himmel.

VeranstaltungenZum Lesen öffnen

30. Mai 2026

Zwei Sichten auf eine Entscheidung: Vertrauenswürdige und erklärbare KI in der Praxis an der HSLU

Notizen von einem Fachkurs in Luzern über vertrauenswürdige und erklärbare KI und was dieser über den Ansatz von Validant.ai bestätigt.

Lesen

Zwei nahezu identische Reinigungsschwämme in einem Verkaufsregal: der männlich kodierte „Scrub Daddy“ ist teurer als der weiblich kodierte „Scrub Mommy“, der als günstigere Variante derselben Marke verkauft wird, mit der Bildunterschrift: „Vertrauen in ein KI-System beginnt in dem Moment, in dem seine Bias-Effekte nicht mehr verborgen sind.“

ForschungZum Lesen öffnen

21. Mai 2026

Bias ist das Fundament

Warum jeder Fairness-Anspruch mit einer Bias-Diagnose beginnt und warum deren Überspringen alles Nachgelagerte zunichtemacht.

Lesen

Zurück zu allen Beiträgen