Automatisierte Identitätsprüfung: Im BAMF urteilen zunehmend Computer über Geflüchtete

von Anna Biselli

Seit einigen Jahren setzt das Bundesamt für Migration und Flüchtlinge zunehmend auf IT-Systeme, um die Identität von Geflüchteten zu bestimmen und zu verifizieren. Doch die Systeme machen Probleme: Sie sind fehleranfällig und greifen teilweise tief in die Privatsphäre der Schutzsuchenden ein. Die Asylverfahren werden weiter entmenschlicht, Schicksale werden zunehmend Maschinen überlassen.

In der ersten Hälfte des Jahres 2016 wurden beim Bundesamt für Migration und Flüchtlinge fast 400.000 Asylanträge gestellt. Die Behörde kam mit der Bearbeitung der Anträge nicht mehr hinterher, unerledigte Asylverfahren stapelten sich. Mehrere Tausend neue Mitarbeiter*innen sollten helfen, die Anträge schneller abzuarbeiten. Stattdessen brachten sie neue Probleme: Laut einer internen Auswertung des BAMF aus dem Jahr 2017 hatten nur rund 20 Prozent die vorgesehene Grundausbildung durchlaufen. Es kursierten interne Zielvorgaben, die kaum zu schaffen sind: 3,5 Entscheidungen oder drei Anhörungen pro Tag sollten die Angestellten jeweils bewältigen.[1] Nicht viel Zeit, um sich mit den Schutzsuchenden auseinanderzusetzen, von denen alle ihre eigene Flucht- und Verfolgungsgeschichte mitbrachten.

Die Vorgaben brachten keine Besserung: Im ersten Halbjahr 2016 stieg die Bearbeitungszeit für Anträge wieder an. Das BAMF hoffte, die Behörde mit Hilfe von Unternehmensberatungen auf Effizienz trimmen zu können. Eine der Maßnahmen: mehr Digitalisierung, mehr computergesteuerte Assistenz zu Entscheidungen – „innovative Technologien“.[2] Pünktlich vor der Bundestagswahl, im Juli 2017, führte das BAMF der Presse vier große IT-Systeme vor, die bei der Verifikation und Feststellung der Identität Geflüchteter helfen sollten.[3]

Bei der Bildbiometrie werden die Gesichter der eingereisten Personen aufgenommen und mit bereits in den Datenbanken vorhandenen Bil­dern verglichen. Dieser Registrierungsschritt erfolgt schon beim ersten Kontakt mit deutschen Behörden, kann also unter anderem auch durch Bundes- und Länderpolizeien oder Ausländerbehörden erfolgen. Als Ergänzung zu bereits vorher etablierten Fingerabdrücken sollen die biometrischen Lichtbilder Mehrfachregistrierungen erschweren. Die Bilder werden im Elektronischen Aufenthaltstitel gespeichert und sind ebenso im Ausländerzentralregister hinterlegt, auf das eine Vielzahl von Behörden Zugriff hat – von Gesundheitsämtern über Geheimdienste bis hin zu Jobcentern.

Automatische Transliteration soll bei der Herkunftsbestimmung helfen

Der biometrische Bildabgleich betrifft alle Antragsteller*innen. Andere Verfahren beziehen sich auf bestimmte Gruppen, etwa „TraLiTa“, der Transliterationsassistent. Er kommt bei arabischsprachigen Antragsteller*innen zum Einsatz und soll zwei Aufgaben erfüllen: Zuerst sollen Namen in arabischen Schriftzeichen einheitlich in lateinische Buchstaben übertragen werden. So will das BAMF Doppeldeutigkeiten vermeiden. Zuvor hing die Schreibweise oftmals von den Gewohnheiten der Dolmetscher*innen ab, die die Namen eingaben, denn für die Übertragung existieren mehrere verschiedene Normen. Doch dem BAMF geht es nicht nur um eine konsistente Schreibweise, die Asylbehörde erhofft sich von dem System zusätzlich Hinweise auf die Herkunft der Person.

Anhand der Häufigkeit des Namens im angegebenen Herkunftsland ermittelt das System Tendenzen: „Der Name kommt im angegebenen Land Syrien selten vor. In den Ländern Ägypten und Marokko kommt er hingegen häufiger vor“, könnte ein Ergebnis lauten. Laut einer Dienstanweisung des BAMF zur Identitätsfeststellung stellen diese Angaben „lediglich ein Indiz dar und haben keine Beweiskraft“.[4] Das System erreiche bei Syrer*innen und Iraker*innen Erfolgsquoten von 85 bis 90 Prozent, erklärte das Bundesinnenministerium im Dezember 2018 in der Antwort auf eine Kleine Anfrage der Linksfraktion. Bei Menschen aus Maghreb-Staaten lag es nur noch in 35 Prozent richtig.[5] Die Auswertung liefert also häufiger falsche als richtige Ergebnisse. Das Innenministerium vermutet, das könne an der „historisch entstandenen Vermischung mit der französischen und italienischen Sprache“ liegen, also auch einer höheren Namensvielfalt als in anderen Ländern.

Der Datensatz hinter TraLitA stütze sich auf „eine Milliarde Namen aus aller Welt“, so das Innenministerium.[6] Für die entscheidenden Regionen, aus denen arabischsprachige Geflüchtete kommen, seien 20.000 Namen pro Land enthalten. Laut dem Digitalen Familienwörterbuch gibt es in Deutschland allein fast 25.000 Nachnamen, Vornamen sind in dieser Zahl noch nicht enthalten. Haben Personen also einen ungewöhnlichen Vor- oder Nachnamen oder kommen sie aus einem Land mit hoher Namensvielfalt, entstehen ihnen Nachteile und die Wahrscheinlichkeit steigt, dass die Auswertung Zweifel hervorruft.

In einem Viertel aller Fälle, in denen die Software eingesetzt wurde, habe sie die Angaben der Asylsuchenden gestützt. Bei 34 Prozent habe es Widersprüche gegeben, beim Rest seien die Ergebnisse nicht verifizierbar oder ohne Ergebnis geblieben, so das Innenministerium. Dieses System mit zweifelhaftem Nutzen lässt sich das BAMF viel Geld kosten: Fast eine Viertel Million Euro für den Test einer Software-Variante, die letztlich nicht im Realbetrieb eingesetzt wurde. Weitere 10.000 für Tests mit dem Produkt der Firma SVA, auf das die Auswahl fiel. Geplant sind bis zum Jahr 2019 Gesamtausgaben für den Produktivbetrieb, Lizenzen, Wartung und Support von etwa 3,1 Millionen Euro.[7]

Fehlerhafte Dialektanalysen bringen Geflüchtete in Gefahr

Etwas niedriger, mit 2,1 Millionen Euro, fällt die Planung für automatisierte sprachbiometrische Analysen aus. Dabei geben Antragsteller*in­nen rund zwei Minuten lange Sprachproben ab, bei denen sie den Inhalt von vorgelegten Bildern beschreiben sollen. Eine Software analysiert das Gesprochene und liefert eine Aufzählung der als am wahrscheinlichsten erkannten Sprachen und Dialekte. Diese Software der Firma Nuance soll laut BAMF bisher nur bei arabischsprachigen Antragsteller*innen eingesetzt werden, verfügt jedoch über Modelle zu mehr als 25 Sprachen.[8]

Obwohl eine Dienstanweisung den Mitarbeiter*innen der Asylverfahrenssekretariate vorgibt, die Dialektanalysen nur bei arabischsprachigen Antragsteller*innen durchzuführen, gibt es Abweichungen von dieser Regel: So finden sich vereinzelt Fälle von Menschen beispielsweise aus Venezuela oder Bangladesch, die der Dialektanalyse unterzogen werden. In diesen Ländern kommt Arabisch nicht als Landessprache vor. Nach Recherchen von Motherboard gibt es ebenso Fälle, in denen Antragsteller*innen eine sprachbiometrische Analyse durchlaufen mussten, deren Muttersprache überhaupt nicht im Repertoire der Software vorkam.[9] Sie hätte also niemals die Angaben der Asylsuchenden bestätigen können. Interpretieren die Entscheider*innen aus den falschen Analyse­ergebnissen Ablehnungsgründe, da sie eine Lüge über die Herkunft der Geflüchteten suggerieren, können die Asylanträge als „offensichtlich unbegründet“ abgelehnt werden.

Dass es zu solchen Fehlanwendungen kommt, legt nahe, dass die Mitarbeiter*innen teilweise unzureichend für den Einsatz der Technik ausgebildet sind. Interne Schulungsunterlagen des BAMF unterstützen diesen Eindruck. Eine über hundert Seiten lange Präsentation enthält zwar ausführliche Anleitungen, welche Knöpfe der Software wann zu drücken sind, die Deutung der Ergebnisse ist jedoch nur knapp angeschnitten.[10] Nirgendwo, auch nicht in zugehörigen Dienstanweisungen, gibt es klare Leitlinien zur Interpretation – etwa, ab wie viel Prozent Wahrscheinlichkeit ein Ergebnis überhaupt als aussagekräftig angesehen werden kann. Die Qualitätsmaße für die Sprachaufnahme wie der Signal-Rausch-Abstand sind als „nicht relevant“ gekennzeichnet, dabei sind sie entscheidend dafür, ob eine Aufnahme verwertbar ist.

Zu den Bedienungsfehlern kommt die Ungenauigkeit der Software. Das BAMF gab zu Beginn eine Fehlerquote von 20, mittlerweile von 15 Prozent an.[11] Diese Fehlerquote ist jedoch nicht über alle Dialekte und Sprachen gleich­verteilt, sie hängt unter anderem von der Menge und Qualität der Sprachproben ab, mit denen ein System trainiert wurde. Levantinisches Arabisch, das unter anderem in Syrien verbreitet ist, ist sehr stark in der Trainingsdatenmenge repräsentiert. Hier liege die Fehlerquote bei zehn Prozent. Für andere Dialekte macht das Innenministerium keine Angaben.[12] Es offenbaren sich auch hier Nachteile für Geflüchtete, die nicht aus einer der gut abgedeckten Regionen stammen, da die Analysen für sie häufiger fehlerhaft sind und unberechtigte Zweifel hervorrufen.

Das BAMF wiegelt ab und relativiert das Problem damit, dass die Ergebnisse aller Computeranalysen immer nur ein Punkt unter vielen bei einer Asylentscheidung seien. Entscheider*innen urteilten immer in der „Gesamtschau“ aller Anhaltspunkte. Doch es existieren Fälle, bei denen das offensichtlich nicht der Fall ist und Entscheider*innen sich auf die automatisiert erstellten Ergebnisse verlassen haben. Asylsuchende wurden abgelehnt, auch wenn mehrere andere Hinweise ihre Herkunftslandangaben stützten.

Wie oft die Dialektanalyse-Software zum Einsatz kommt, geht nicht eindeutig aus den Angaben des BAMF und des Innenministeriums hervor. Im Dezember 2018 sprach das Ministerium von insgesamt 6.284 Einsätzen von der bundesweiten Einführung im September 2017 bis Mitte November 2018. Das widerspricht älteren Zahlen, wonach die Software bis zum April 2018 bereits 9.883 Mal genutzt worden sei. Das Ministerium schickt voran, seine Zahlen könnten „unterzeichnet“ sein und seien „nur bedingt mit früheren Auskünften“ vergleichbar.[13]

Im gleichen Monat lehnte sich der BAMF-Vize und frühere IT-Leiter Markus Richter mit eigenen Angaben gegenüber der Funke Mediengrup­pe noch weiter aus dem Fenster und sprach von 19.000 Einsätzen der Dialekterkennung.[14] Offenbar wenden die Behörden unterschiedliche Zähl­weisen an. Es liegt nahe, dass Richter die Anzahl der technischen Analysevorgänge angibt und das Innenministerium die Angaben aus Statistiken aufgrund der Asylakten zieht – also aus den Fällen, in denen die Analyseergebnisse tatsächlich berücksichtigt wurden.

Handyauswertungen sind nur in Einzelfällen verwertbar

Eine ähnliche Diskrepanz zwischen der öffentlichen Darstellung des BAMF und den Zahlen des Innenministeriums taucht bei der Handy­aus­wer­tung auf – dem vierten großen IT-Vorhaben des BAMF. Laut der Antwort des Ministeriums auf eine Anfrage der Linken sind von Januar bis Ende Oktober 2018 ganze 9.710 Handys ausgelesen worden. Beim Bundesamt dagegen ist die Rede von 27.000 ausgelesenen Geräten in der Zeit von September 2017 bis Dezember 2018.[15] Selbst bezogen auf den etwas breiteren Zeitraum lässt sich diese Diskrepanz nicht erklären. Auch hier stellen die 27.000 technische Auslesevorgänge dar, ungeachtet dessen wie oft ein Auslesen scheiterte oder wie häufig die Ergebnisse letztlich nicht in den Akten landeten.

Betrachtet man die Zahl, wie häufig eine Handyauswertung letztlich von einer Volljurist*in für die Asylentscheidung freigegeben wurde und sie eine Entscheider*in zu Gesicht bekam, sinkt die Angabe weiter: 2.845 Fälle. „Verwertbare Ergebnisse“ hätten dann in 35 Prozent der Fälle vorgelegen, Hinweise auf Widersprüche zu den Angaben der Antragsteller*innen seien in zwei Prozent der Fälle zum Vorschein gekommen. Umgerechnet heißt das: etwa 60 Mal von Januar bis Oktober 2018. Die Kosten für die Auslesetechnik und die darauf aufbauende Analysesoftware sind hoch. Allein die Tests von drei verschiedenen Lösungen kosteten über eine halbe Million Euro. Bis zum Jahr 2019 geht das Innenministerium von Ausgaben in Höhe von 11,2 Millionen Euro aus.[16]

Rechtlich wurde die Handyauswertung bei eingereisten Personen ohne Passdokumente durch das „Gesetz zur besseren Durchsetzung der Ausreisepflicht“ vom Juli 2017 ermöglicht. Offiziell heißt es, die Antragsteller*innen sollen ihre Geräte auf freiwilliger Basis entsperren. Was aber passiert, wenn sie das nicht tun wollen, geht aus einer Dienstanweisung hervor. Im Falle einer Verweigerung kann ein Asylantrag „als zurückgenommen“ angesehen werden, was den Asylantrag beenden würde.[17]

Das Auslesen und Analysieren eines Smartphones ist ein tiefer Eingriff in die Privatsphäre jedes Einzelnen. Die Geräte enthalten persönliche Nachrichten, auch Fotos und geben Aufschluss über die Kommunikationsgewohnheiten. Die Auswertung des BAMF enthält bisher primär statistische Angaben in solcher Form: Welche Ländervorwahlen riefen die Antragstellenden wie oft an und welche Länderdomains hatten die Websites, die sie besuchten? Darüber hinaus enthält die Analyse aber auch Geodaten darüber, wo sich ein Geflüchteter aufhielt. Zudem bekommen Entscheider*innen bei genehmigter Auswertung Nutzernamen aus Apps oder verwendete Mailadressen zu sehen. Sie geben Auskunft darüber, ob eine Person beispielsweise Dating-Apps nutzt oder unter mehreren Pseudonymen kommuniziert.

Technisch könnte das System viel mehr als Statistiken zu erstellen und diese Möglichkeit weckt Begehrlichkeiten. Nach eigenen Angaben prüft das Innenministerium, ob die Auswertung der Handydaten erweitert werden kann.[18] Worum es dabei geht, deutete bereits die ehemalige BAMF-Chefin Jutta Cordt in einem Interview mit dem SWR an, bei dem sie Zugriff auf die Fotos der Geflüchteten forderte.[19]

Zusammengefasst lässt sich sagen, dass die IT-Assistenzsysteme des BAMF auf der einen Seite teuer und von fragwürdigem Nutzen sind. Auf der anderen Seite greifen sie teils tief in die Privatsphäre von Schutzsuchenden ein und entmenschlichen sie. Sie überlassen die Entscheidung, ob sie ihre Herkunft und Fluchtgeschichte wahrheitsgemäß schildern, teilweise Computerprogrammen, deren Algorithmen und Datengrundlagen intransparent und nicht überprüfbar sind. Doch die Behörde hält weiter an den Systemen fest und profiliert sich immer weiter als IT-Spitzenreiter und Vorbild für andere EU-Staaten. In ihrer „Digitalisierungsagenda 2020“[20] kommt zum Vorschein, dass die vorhandenen Systeme noch nicht das Ende der Technisierung von Asylverfahren sein sollen: Künstliche Intelligenz als Hilfe bei der Entscheidungsfindung oder der Einsatz einer Blockchain als Teil der Asyldatenspeicherung und -verwaltung sind nur zwei Projekte von vielen.

[1]   Sueddeutsche.de v. 22.7.2017
[2]   Spiegel Nr. 32 v. 6.8.2016
[3]   Biselli, A.: Digitalisierte Migrationskontrolle, in: Bürgerrechte & Polizei/CILIP 114 (November 2017), S. 71-77, motherboard.vice.com v. 22.8.2018
[4]   https://fragdenstaat.de/files/foi/110992/dienstanweisung_identitaetsfeststellung.pdf
[5]   BT-Drs. 19/6647 v. 19.12.2018
[6]   ebd.
[7]   ebd.
[8]   Netzpolitik.org v.12.12.2017
[9]   Motherboard.vice.com v. 20.8.2018
[10] https://fragdenstaat.de/anfrage/schulungsunterlagen-dienstanweisungen-informationen-zu-umgang-mit-sprachbiometrischen-tests
[11] Netzpolitik.org v. 12.12.2017, Motherboard v. 20.8.2018
[12] BT-Drs. 19/6647 v. 19.12.2018
[13] ebd.
[14] Berliner Morgenpost v. 18.12.2018
[15] BT-Drs. 19/6647 v. 19.12.2018, Motherboard v. 21.12.2018
[16] BT-Drs. 19/6647 v. 19.12.2018
[17] https://fragdenstaat.de/files/foi/110992/dienstanweisung_identitaetsfeststellung.pdf
[18] BT-Drs. 19/6647 v. 19.12.2018
[19] SWR: Interview der Woche v. 10.11.2017
[20] www.bamf.de/SharedDocs/Anlagen/DE/Publikationen/Broschueren/broschuere-digitalisierungsagenda-2020.html

Beitragsbild: Der frühere Bundesinnenminister Thomas de Maizière (CDU) lässt sich zeigen, wie Handydaten ausgelesen werden (BAMF).

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.