Was wir aus vier Breakout-Sessions, einer Demo eines Fairness-Tools und mehr als fünfzig Jahren gemeinsamer Erfahrung über Fairness in der KI gelernt haben. Vom Trustworthy AI Circle: „Alles ist fair in der KI, oder?“
Die eine Antwort, auf die wir uns einigen konnten
Wir eröffneten den Trustworthy AI Circle mit der gebündelten Berufserfahrung von über fünfzig Jahren im Raum und kamen zu genau einer klaren Schlussfolgerung: Kein System war jemals fair. Keine einzelne Definition von Fairness ist über Kontexte, Rollen und Individuen hinweg gültig.
Das klingt wie eine Sackgasse. Es war das Gegenteil. Es war der einzig ehrliche Ausgangspunkt. Alles wirklich Nützliche, das folgte, hing davon ab, dieses Eingeständnis zuerst aus dem Weg zu räumen, sodass es in der Session nicht darum ging, einen Konsens herzustellen. Es ging darum, ein Wort von überflüssigem Ballast zu befreien, das jeder benutzt und das kaum jemand auf die gleiche Weise definiert.
Das Experiment: vier Räume, ein Tool
Um das Abstrakte konkret zu machen, teilten wir die Teilnehmenden in vier Gruppen auf und wiesen jeder eine organisatorische Rolle zu: Board, Operations, Business und Compliance. Dann gaben wir allen vier Gruppen dasselbe Szenario – ein Unternehmen, das ein KI-basiertes Recruiting-Tool einführt – und stellten eine täuschend einfache Frage: Was würde „fair“ aus Ihrer jeweiligen Position heraus bedeuten?
Dann zogen wir uns zurück und überließen den Teilnehmenden als Experten das Feld.
Erkenntnis 1: Fairness ist irreduzibel plural
Jede Gruppe erarbeitete eine andere Definition von Fairness. Jede Definition war in sich schlüssig. Keine einzige Gruppe behauptete, ihre Definition sei ohne Preis zu haben.
Das ist das Ergebnis, auf das ich immer wieder zurückkomme. „Fair“ ist keine Eigenschaft des Tools, die man einmal messen und zertifizieren kann. Es ist ein ausgehandeltes Ergebnis zwischen Stakeholdern mit unterschiedlichen primären Verpflichtungen. Das Board ist dem langfristigen Wert und der Reputation verpflichtet. Die Compliance ist dem Gesetz verpflichtet. Der Bereich Business ist der Leistung und Erklärbarkeit verpflichtet. Der Bereich Operations ist dem Prozess und der Auditierbarkeit verpflichtet. Jede Rolle hatte von ihrem Standpunkt aus recht, und die Definitionen ließen sich nicht auf eine einzige Kennzahl reduzieren.
Wäre Fairness eine Eigenschaft des Systems, würden vier Expertengruppen, die dasselbe System betrachten, zu einem übereinstimmenden Ergebnis kommen. Das taten sie nicht. Sie kamen zu unterschiedlichen, klar voneinander abgrenzbaren und vertretbaren Ergebnissen, was darauf hindeutet, dass diese Eigenschaft in den Beziehungen rund um das Tool liegt und nicht im Tool selbst.
Erkenntnis 2: Sogar der Begriff „Transparenz“ zersplittert
Jede Gruppe forderte Transparenz. Das schien eine Gemeinsamkeit zu sein, bis wir die Ergebnisse verglichen und sich herausstellte, dass das Wort vier verschiedene Dinge bedeutete.
Der Bereich Business meinte die Erklärbarkeit der Empfehlungen. Das Board meinte die kulturelle Verantwortlichkeit für die getroffenen Entscheidungen. Die Rechtsabteilung meinte eine kontrollierte, vertretbare Offenlegung. Der Bereich Operations meinte einen auditierbaren, reproduzierbaren Prozess. Ein Wort, vier unvereinbare Anforderungen. Wenn ein Anbieter „Transparenz“ verspricht und ein Käufer eine dieser vier Bedeutungen darunter versteht, während der Anbieter eine andere liefert, wird die Lücke erst sichtbar, wenn das System bereits in Betrieb ist und jemand nach der Verantwortlichkeit fragt.
Erkenntnis 3: KI ist ein Spiegel, keine Quelle
In meinem Teil der Session habe ich erörtert, was das für das Recruiting bedeutet, denn beim Recruiting hört die Abstraktion auf, akademisch zu sein. Die Lektion daraus ist unbequem und sollte klar ausgesprochen werden: KI erfindet keine Ungleichheit. Sie hält uns einen Spiegel vor.
Ein Recruiting-Modell lernt aus historischen Einstellungsdaten, und historische Einstellungsdaten kodieren historische Präferenzen. Selbst wenn man geschützte Merkmale entfernt, schleusen Proxys dasselbe Signal wieder ein. Das Prestige einer Universität korreliert mit dem sozioökonomischen Hintergrund. Die Sprache im Lebenslauf transportiert dies ebenfalls, wobei Begriffe wie „geleitet“ und „ausgeführt“ positiver bewertet werden als „kollaboriert“ und „unterstützt“. Das meistzitierte öffentliche Beispiel – ein frühes Recruiting-Tool eines großen Tech-Unternehmens, das gelernt hatte, Lebensläufe mit dem Wort „women’s“ herabzustufen – schuf keinen neuen Bias. Es reproduzierte einen, der bereits in den Trainingsdaten vorhanden war, und wandte ihn dann in großem Maßstab mit der ruhigen Gewissheit von etwas an, das objektiv aussieht.
Das ist das zweischneidige Schwert. KI perpetuiert bestehenden Bias mit schockierender Effizienz und zementiert ihn in täglichen Entscheidungen. Gleichzeitig macht sie diesen Bias aber auch lesbar. Sie überführt ein Muster, das diffus und leugbar war, in ein Diagramm, auf das man zeigen kann, was die Frage aufwirft, die wir bisher vermeiden konnten: Ist das in Ordnung?
“Bias sichtbar statt nur behauptet zu machen, ist der springende Punkt. Sie können keinen Trade-off aushandeln, den Sie sich weigern anzusehen.”
Erkenntnis 4: Wir begannen mit Metriken und endeten bei der Ethik
Wir kamen mit der Erwartung einer Konversation über Metriken und Tools – Demographic Parity, Equal Opportunity, Equalised Odds, Calibration. Wir gingen mit der Erkenntnis, dass die Metrik der letzte Schritt ist, nicht der erste.
Eine Fairness-Metrik für sich allein ist nur „etwas zum Anschauen“. Erst der situative Kontext macht sie zu einer Entscheidungsgrundlage. Dieselbe Disparitätskennzahl kann in einem Umfeld statistisches Rauschen und in einem anderen ein schwerwiegender Schaden sein, und nur der Kontext verrät, was zutrifft. Lässt man den Kontext weg, hat man nur eine Zahl. Behält man ihn bei, hat man Verantwortlichkeit. Bevor man also etwas so Komplexes wie Fairness sinnvoll operationalisieren kann, braucht man eine Diskussion, die von der Ethik geleitet wird und in der spezifischen Situation verankert ist. Die Mathematik kommt danach, nicht davor.
Erkenntnis 5: Es gibt immer einen Verlierer
Keine Gruppe kam um den Trade-off herum. Jede Fairness-Definition bevorzugt jemanden und benachteiligt jemand anderen. Chancengleichheit (Equal Opportunity) schützt davor, qualifizierte Kandidaten zu übersehen, garantiert aber keine gleiche Repräsentation. Demografische Parität (Demographic Parity) bewirkt das Gegenteil. Sie können nicht alle gleichzeitig erfüllen, und die Forschungsliteratur stellt klar, dass einige dieser Definitionen mathematisch unvereinbar sind.
Die eigentliche Entscheidung lautet also nicht: „Ist dieses System fair?“. Sondern: „Wen sind wir bereit, verlieren zu lassen, und können wir diese Wahl verteidigen?“. Das ist eine Werteentscheidung im technischen Gewand, und wer so tut, als sei es anders, lässt seine Organisation mit einer sauberen Compliance-Akte sehenden Auges ins Verderben laufen.
Was das für Organisationen bedeutet
Aus dem Tag ergaben sich einige praktische Konsequenzen.
- 01Jede Organisation muss ihre eigenen Werte definieren und diese explizit machen. Fairness kann nicht an eine Standardeinstellung in einem Tool ausgelagert werden.
- 02Die Interessen der Stakeholder müssen offengelegt, diskutiert und explizit gewichtet werden, anstatt sie demjenigen zu überlassen, der zufällig die Beschaffungsentscheidung innehat.
- 03Der Shareholder-Value kann nicht länger allein ausschlaggebend sein. Er muss gegen den langfristigen Kundenwert abgewogen werden, mit einem gerechten Zugang, der belegt, transparent und gegenüber dem Vorstand rechenschaftspflichtig ist.
- 04Nichts davon ist eine einmalige Übung. Die richtige Antwort verändert sich, so wie sich Gesellschaft, Technologie und menschliche Werte verändern. Daher muss die Gewichtung immer wieder überprüft und darf nicht nur einmal festgelegt und zu den Akten gelegt werden.
Die Rolle von Validant.ai
Das ist die Lücke, für deren Schließung ich Validant.ai entwickelt habe. Die Plattform existiert nicht, um einem System den Stempel „fair“ aufzudrücken, denn dieser Stempel wäre unehrlich. Sie existiert, um die Abwägungen explizit, belegbar und prüfbar zu machen: eine unabhängige Analyse, wen ein System begünstigt, wen es benachteiligt und ob diese Entscheidung bewusst und vertretbar getroffen wurde.
Stellen Sie es sich wie eine Bewertungsfunktion für KI-Fairness vor. Kein Urteil, das die Diskussion beendet, sondern eine Evidenzgrundlage, die die Diskussion rechenschaftspflichtig macht, die die Metrik mit dem Kontext verbindet und die einem Vorstand etwas an die Hand gibt, wofür er tatsächlich einstehen kann. Fairness mag mathematisch nie vollständig erreichbar sein. Bewusst zu wählen, wen wir bereit sind zu benachteiligen, diese Wahl zu dokumentieren und sie anzupassen, wenn sich die Welt verändert – das ist erreichbar, und das ist die Aufgabe.
Der Wettlauf um Klarheit
Die Fairness-Forschung läuft seit Jahrzehnten. Die Definitionen vervielfachen sich ständig und die Ziellinie verschiebt sich immer weiter. Es wäre einfach, das als Scheitern zu interpretieren. Das ist es aber nicht. Das einzig wirkliche Scheitern wäre, den Wettlauf um Klarheit aufzugeben oder, schlimmer noch, zu erklären, man sei bereits am Ziel.
Eine gute Podiumsdiskussion ist keine inszenierte Einigkeit. Sie besteht aus unterschiedlichen Perspektiven, echter Reibung und den Fragen, die wirklich gestellt werden müssen. Diese Reibung ist kein Problem, das geglättet werden muss. Sie ist menschlich, sie ist notwendig, und sie ist der Punkt, an dem der Wandel tatsächlich stattfindet.
Daniel Glinz arbeitet an den Themen KI-Fairness, digitales Vertrauen und regulatorische Bereitschaft und ist der Gründer von Validant.ai. Wenn Ihre Organisation sich mit denselben Fragen beschäftigt, arbeitet er direkt mit Unternehmen zusammen, um deren KI-Biases transparent zu machen und die Abwägungen zu durchdenken, die jede Fairness-Entscheidung erzwingt. Nehmen Sie Kontakt auf, um das Gespräch fortzusetzen, eine Demo zu sehen oder zu erfahren, wie Sie Bias in Ihren eigenen Systemen sichtbar machen können.
Beschäftigen Sie sich damit, was Fairness für Ihre eigenen Systeme bedeutet? Nehmen Sie Kontakt auf für eine Demo oder um zu erfahren, wie Sie Ihre KI-Biases transparent machen und die damit verbundenen Abwägungen meistern können.
StudienZum Lesen öffnenDie falsche Frage, im großen Stil gestellt
Eine wegweisende Studie mit 4 Millionen Bewerbungen zeigt, wie KI-Tools für die Personalbeschaffung ihre Voreingenommenheit verbergen, warum eine einzige Ablehnung zu einer allgegenwärtigen Ablehnung werden kann und weshalb eine unabhängige Bewertung auf Positionsebene keine Option mehr ist.
Lesen


