Einsatz von IT-Assistenzsystemen und Künstlicher Intelligenz im Bundesamt für Migration und Flüchtlinge
der Abgeordneten Clara Bünger, Nicole Gohlke, Gökay Akbulut, Anke Domscheit-Berg, Dr. André Hahn, Susanne Hennig-Wellsow, Ina Latendorf, Cornelia Möhring, Petra Pau, Sören Pellmann, Martina Renner, Dr. Petra Sitte, Kathrin Vogler und der Fraktion DIE LINKE.
Vorbemerkung
Seit 2017 setzt das Bundesamt für Migration und Flüchtlinge (BAMF) vermehrt IT-Assistenzsysteme im Rahmen des Asylverfahrens ein, die die Mitarbeiterinnen und Mitarbeiter des BAMF insbesondere bei der Feststellung der Identität und Herkunft von Asylsuchenden unterstützen sollen. Für das BAMF erweist sich der Einsatz dieser Systeme vor allem in den Fällen als relevant, in denen die Asylsuchenden bei der Antragstellung keine Identitätsdokumente vorlegen können. Sie umfassen u. a. eine Sprach- bzw. Dialekterkennungssoftware, eine Namenstransliteration- und Namensanalysesoftware, eine Software, die die Datenträger von Asylsuchenden automatisiert auswertet sowie eine Software, die den automatisierten Abgleich von aufgenommenen Lichtbildern ermöglicht. Die Sprach- bzw. Dialekterkennungssoftware soll anhand einer zweiminütigen Sprachaufnahme Rückschlüsse auf den Herkunftsstaat oder die Herkunftsregion der Asylsuchenden ermöglichen. Die Namenstransliteration- und Namensanalysesoftware soll einerseits arabische Namen einheitlich in die lateinische Schreibweise übersetzen und andererseits ausgehend von der Schreibweise des Namens Hinweise auf mögliche Herkunftsstaaten des Asylsuchenden liefern. Mittels der automatisierten Datenträgerauswertung sollen Hinweise über die Identität und Staatsangehörigkeit von Asylsuchenden erlangt werden. Der Lichtbildabgleich soll parallel zum Abgleich von Fingerabdrücken der Identitätssicherung und damit verbunden der Verhinderung von Mehrfachanträgen sowie Mehrfachidentitäten dienen (vgl. Bundestagsdrucksache 19/6647).
Der Einsatz der genannten IT-Assistenzsysteme wird in den Medien (u. a. www.freiheitsrechte.org/ueber-die-gff/presse/pressemitteilungen-der-gesellschaft-fur-freiheitsrechte/pm-handydatenauswertung; www.zeit.de/digital/internet/2017-03/bamf-asylbewerber-sprach-analyse-software-computerlinguistik; netzpolitik.org/2018/die-it-tools-des-bamf-fehler-vorprogrammiert/; taz.de/Digitale-Assistenten-beim-BAMF/!5470641/) und insbesondere auch in der juristischen Fachliteratur (u. a. Lehnert, in: Huber/Mantel (Hrsg.), AufenthG/AsylG, § 15a AsylG, Randnummer 4 und § 16 AsylG, Randnummer 3; Pelzer, in: Decker/Bader/Kothe (Hrsg.), BeckOK Migrations- und Integrationsrecht, § 15a AsylG, Randnummer 8 und § 16 AsylG, Randnummer 10 f.; Bruckermann, Auswertung von Datenträgern bei Migranten – Verfassungsrechtliche Bedenken bei § 48a AufenthG und § 15a AsylG im Spannungsfeld von Informationeller Selbstbestimmung und staatlichem Kontrollanspruch, SRa 2018, 133) zunehmend kritisiert. Es werden insbesondere Bedenken an der fehlerfreien Anwendung sowie an der Geeignetheit und Angemessenheit einiger dieser Systeme geäußert. Ferner hat das Bundesverwaltungsgericht in seinem Urteil vom 16. Februar 2023 (Az. 1 C 19.21) die Durchführung der Datenträgerauswertung im Asylverfahren in dem zugrunde liegenden Sachverhalt für rechtswidrig erklärt. Das genannte Urteil hat nach Auffassung der Fragestellenden auch jenseits des konkreten Sachverhaltes Ausstrahlkraft auf die Auswertung von mobilen Datenträgern von Asylsuchenden im Rahmen des Asylverfahrens.
In Antworten auf frühere parlamentarische Anfragen kündigte die Bundesregierung eine wissenschaftliche Begleitung bzw. Evaluation einzelner IT-Assistenzsysteme an, die allerdings nach Kenntnis der Fragestellenden bislang nicht umgesetzt wurde (u. a. Antwort zu Frage 11c auf Bundestagsdrucksache 19/190,; Antwort zu Frage 14 auf Bundestagsdrucksache 20/3238).
Neben den genannten determinierten IT-Assistenzsystemen setzt das BAMF nun auch Künstliche Intelligenz (KI) ein. Diese soll Entscheiderinnen und Entscheider dabei unterstützen, in Anhörungsprotokollen „sicherheitsrelevante Sachverhalte“ zu erkennen (vgl. Bundestagsdrucksache 20/6401, Anlage 1a). Das Ziel der automatisierten Analyse der Anhörungsprotokolle sei es, „den gesetzlichen Meldeverpflichtungen des BAMF an Sicherheitsbehörden leichter und schneller nachkommen zu können“ (netzpolitik.org/2019/asylbehoerde-sucht-mit-kuenstlicher-intelligenz-nach-auffaelligen-gefluechteten/).
Mit dem Einsatz von KI betritt das BAMF Neuland. Die Gefahren und Risiken, die mit dem Einsatz derartiger Systeme einhergehen, sind nach Auffassung der Fragestellenden vielfältig und reichen von ethischen und gesellschaftlichen Bedenken bis hin zu potenziellen Fehlinterpretationen bzw. zur unbeabsichtigten Voreingenommenheit in den algorithmischen Entscheidungen. Die Kleine Anfrage zielt auch darauf ab, in Erfahrung zu bringen, ob und inwieweit geeignete Maßnahmen sowohl in der Entwicklungsphase als auch bei der (flächendeckenden) Anwendung der KI in der Praxis vorgesehen sind, um potenziellen Gefahren und Risiken entgegenzuwirken.
Wir fragen die Bundesregierung:
Fragen29
Mit welchen nationalen und europäischen Datenbanken werden die aufgenommenen Lichtbilder von Asylsuchenden im Asylverfahren automatisiert abgeglichen?
In welchen Datenbanken werden die aufgenommenen Lichtbilder gespeichert?
Ist die Löschung der gespeicherten Lichtbilder in den einzelnen Datenbanken zu irgendeinem Zeitpunkt vorgesehen?
In wie vielen Fällen wurde der automatisierte Lichtbildabgleich im Jahr 2022 und im ersten Halbjahr 2023 im Rahmen des Asylverfahrens durchgeführt?
a) In wie vielen dieser Fälle hat der Lichtbildabgleich dazu geführt oder maßgeblich dazu beigetragen, Mehrfachanträge bzw. Mehrfachidentitäten zu verhindern (bitte in absoluten und relativen Zahlen darstellen)?
b) In wie vielen dieser Fälle war der Lichtbildabgleich zusätzlich zu dem Abgleich von Fingerabdrücken für das Erreichen des verfolgten Zieles, namentlich Identitätssicherung und Verhinderung von Mehrfachanträgen bzw. Mehrfachidentitäten, notwendig (bitte in absoluten und relativen Zahlen darstellen)?
c) In wie vielen dieser Fälle führte der Lichtbildabgleich zu fehlerhaften bzw. zu unzutreffenden Ergebnissen (bitte in absoluten und relativen Zahlen darstellen)?
d) In wie vielen dieser Fälle konnten mittels des Lichtbildabgleiches überhaupt keine Ergebnisse erzielt werden (bitte in absoluten und relativen Zahlen darstellen), und aus welchen Gründen konnten in den entsprechenden Fällen keine Ergebnisse erzielt werden?
Erfolgt der automatisierte Lichtbildabgleich auch bei Minderjährigen, und wenn ja, unter welchen Voraussetzungen?
Zu welchem Zeitpunkt innerhalb des Asylverfahrens kommt die Spracherkennungs- bzw. Dialekterkennungssoftware bei Asylsuchenden zum Einsatz?
In wie vielen Fällen wurde die Spracherkennungs- bzw. Dialekterkennungssoftware im Jahr 2022 und im ersten Halbjahr 2023 im Rahmen des Asylverfahrens eingesetzt?
a) In wie vielen dieser Fälle konnten die Herkunftsangaben der betroffenen Asylsuchenden mittels der Spracherkennungs- bzw. Dialekterkennungssoftware bestätigt bzw. widerlegt werden (bitte in absoluten und relativen Zahlen darstellen und – sofern möglich – bitte zusätzlich separate Angaben zu den einzelnen Sprachen machen)?
b) In wie vielen dieser Fälle lieferte die Spracherkennungs- bzw. Dialekterkennungssoftware fehlerhafte bzw. unzutreffende Ergebnisse (bitte in absoluten und relativen Zahlen darstellen)?
c) In wie vielen dieser Fälle konnten mittels der Spracherkennungs- bzw. Dialekterkennungssoftware überhaupt keine Ergebnisse erzielt werden (bitte in absoluten und relativen Zahlen darstellen), und aus welchen Gründen konnten in den entsprechenden Fällen keine Ergebnisse erzielt werden?
d) In wie vielen dieser Fälle wurde ein separates Sprachgutachten veranlasst und durchgeführt?
Ist der Einsatz der Spracherkennungs- bzw. Dialekterkennungssoftware weiterhin auf bestimmte Sprachmodelle beschränkt?
Inwieweit werden die betroffenen Asylsuchenden darüber informiert, welche konkreten Auswirkungen die in dem automatisiert erstellten Ergebnisbericht enthaltenen Informationen bzw. Hinweise bei der Bestimmung des Herkunftsstaates und ggf. bei der Entscheidung über den Asylantrag im Einzelfall haben?
Auf welche Rechtsgrundlage bzw. Rechtsgrundlagen werden die im Asylverfahren durchgeführten Namenstransliteration sowie Namensanalyse gestützt?
In welchen Fällen kommt die Namensanalysesoftware im Asylverfahren zur Anwendung?
Ist die einzige Voraussetzung für die Anwendung der Namensanalysesoftware, dass die Asylsuchenden keine Identitätsdokumente vorlegen (können)?
Wurden oder werden die Entwicklung und Anwendung der Namensanalysesoftware wissenschaftlich begleitet, und wenn ja, wie?
Beruhen die im Ergebnisbericht angegebenen Prognosen über potenzielle Herkunftsstaaten auf wissenschaftlichen Erkenntnissen, und wenn ja, auf welchen?
Wie kommen die im automatisiert erstellten Ergebnisbericht angegebenen Prognosen zustande (bitte die technische Funktionsweise der Namensanalyse detailliert darlegen)?
In wie vielen Fällen wurde die Namensanalysesoftware im Jahr 2022 und im ersten Halbjahr 2023 im Rahmen des Asylverfahrens eingesetzt?
a) In wie vielen dieser Fälle konnten die Herkunftsangaben der betroffenen Asylsuchenden mittels der Namensanalysesoftware bestätigt bzw. widerlegt werden (bitte in absoluten und relativen Zahlen darstellen)?
b) In wie vielen dieser Fälle lieferte die Namensanalysesoftware fehlerhafte bzw. unzutreffende Ergebnisse (bitte in absoluten und relativen Zahlen darstellen)?
c) In wie vielen dieser Fälle konnten mittels der Namensanalysesoftware überhaupt keine Ergebnisse erzielt werden (bitte in absoluten und relativen Zahlen darstellen), und aus welchen Gründen konnten in den entsprechenden Fällen keine Ergebnisse erzielt werden?
Inwieweit werden die betroffenen Asylsuchenden darüber informiert, welche konkreten Auswirkungen die in dem automatisiert erstellten Ergebnisbericht enthaltenen Informationen bzw. Hinweise bei der Bestimmung des Herkunftsstaates und ggf. bei der Entscheidung über den Asylantrag im Einzelfall haben?
Welche ergänzenden Angaben zur Umsetzung des Urteils des Bundesverwaltungsgerichts vom 16. Februar 2023 (Az. 1 C 19.21) zur Auswertung von mobilen Datenträgern von Asylsuchenden im Rahmen des Asylverfahrens kann die Bundesregierung machen (vgl. Antwort zu Frage 14d auf Bundestagsdrucksache 20/8222)?
a) Wurde das „zur Sicherstellung der Verhältnismäßigkeit der Maßnahme einzuhaltende Verfahren“ mittlerweile abgestimmt, und wenn ja, wie sieht dieses Verfahren im Einzelnen aus, und wenn nein, wann ist mit dem Abschluss der Abstimmung zu rechnen?
b) Ist die Annahme der Fragestellenden zutreffend, dass die Entscheidung über das Auslesen von Datenträgern nach wie vor erfolgt, bevor eine Anhörung der betroffenen Asylsuchenden stattgefunden hat, und wenn ja, wie wird dies begründet, vor dem Hintergrund, dass nach Auffassung der Fragestellenden im Rahmen der Anhörung durch entsprechende gezielte Fragen die Angaben der Betroffenen zu ihrer Herkunft und Identität überprüft werden könnten, was ein Auslesen ihrer Datenträger ggf. überflüssig machen könnte?
c) Wie genau bzw. anhand welcher Kriterien wägen Volljuristinnen und Volljuristen ab, ob Asylsuchende ihre Geräte auslesen lassen müssen (vgl. ebd.)?
Welche konkreten Daten werden im Kontext der Datenträgerauswertung ausgelesen und gespeichert?
a) Werden jenseits der Metadaten auch die Inhalte der Daten, wie beispielsweise Textnachrichten, Bilder, Videos oder E-Mails, ausgelesen sowie (vorübergehend) gespeichert?
b) Werden jenseits des automatisiert erstellten Ergebnisberichts weitere Daten in dem entsprechenden Datentresor gespeichert?
c) Welche Informationen beinhaltet der automatisiert erstellte Ergebnisbericht?
d) Hat das BAMF – jenseits des automatisiert erstellten Ergebnisberichts – zu irgendeinem Zeitpunkt Zugriff auf die ausgelesenen (Roh-)Daten?
Zu welchem Zeitpunkt und in welchen Fällen ist die Löschung des automatisiert erstellten Ergebnisberichts aus der MARiS-Akte vorgesehen?
Zu welchem Anteil verfügten im Jahr 2022 sowie im ersten Halbjahr 2023 Asylsuchende, deren Identität bzw. Herkunft nach Auffassung des BAMF nicht hinreichend sicher durch Identitätsdokumente geklärt werden konnte, über mobile Datenträger, und zu welchem Anteil wurden diese in dem genannten Zeitraum ausgelesen?
a) In wie vielen Fällen wurde in den genannten Zeiträumen ein Ergebnisbericht automatisiert erstellt?
In wie vielen dieser Fälle wurden die automatisiert erstellten Ergebnisberichte durch die jeweiligen Entscheider angefordert (bitte in absoluten und relativen Zahlen darstellen)?
In wie vielen Fällen wurde diesem Antrag nach entsprechender Prüfung durch einen Volljuristen entsprochen bzw. erfolgte eine Ablehnung (bitte so differenziert wie möglich und in absoluten und relativen Zahlen darstellen)?
b) In wie vielen der Fälle, in denen der Ergebnisbericht der Datenträgerauslesung für das Asylverfahren verwertet wurde, hat dieser dazu geführt oder maßgeblich dazu beigetragen, Angaben der betroffenen Asylsuchenden zu ihrer Identität bzw. Herkunft zu bestätigen bzw. zu widerlegen (bitte in absoluten und relativen Zahlen darstellen)?
c) In wie vielen Fällen lieferte die Datenträgerauswertung in den genannten Zeiträumen fehlerhafte bzw. unzutreffende Ergebnisse (bitte in absoluten und relativen Zahlen darstellen)?
d) In wie vielen Fällen konnten mittels der Datenträgerauswertung in den genannten Zeiträumen überhaupt keine Ergebnisse erzielt werden (bitte in absoluten und relativen Zahlen darstellen), und aus welchen Gründen konnten in den entsprechenden Fällen keine Ergebnisse erzielt werden?
e) In wie vielen Fällen wurden in den genannten Zeiträumen die Zugangsdaten von Datenträgern bei dem zuständigen Telekommunikationsdienstleister angefragt (bitte in absoluten und relativen Zahlen darstellen), und in wie vielen dieser Fälle wurden die entsprechenden Zugangsdaten übermittelt (bitte in absoluten und relativen Zahlen darstellen)?
f) Inwieweit sind Maßnahmen vorgesehen, um die Effektivität und Wirksamkeit der Datenträgerauswertung zu steigern?
Werden auch Datenträger von Minderjährigen im Asylverfahren ausgewertet, und wenn ja, in wie vielen Fällen wurden mobile Datenträger von Minderjährigen im Jahr 2022 sowie im ersten Halbjahr 2023 ausgewertet?
Inwieweit werden die betroffenen Asylsuchenden im Vorfeld über den Verfahrensablauf und über den Sinn und Zweck der Maßnahme belehrt und aufgeklärt?
Auf welche Rechtsgrundlage wird die „Gefährderanalyse“ bzw. „Profilanalyse“ zur Untersuchung von Anhörungsprotokollen gestützt?
Inwieweit sind in diesem Zusammenhang gesetzliche Änderungen und Anpassungen vorgesehen?
Findet die „Gefährderanalyse“ bzw. „Profilanalyse“ bereits flächendeckend Anwendung oder befindet sie sich noch in der Pilotphase?
a) Sofern sie in der Praxis noch nicht flächendeckend Anwendung finden sollte, zu welchem Zeitpunkt ist der flächendeckende Einsatz geplant?
b) Wie findet die „Gefährderanalyse“ bzw. „Profilanalyse“ in der Praxis Anwendung bzw. wie soll sie in der Praxis Anwendung finden (bitte den Verfahrensablauf ausführlich darstellen underläutern)?
c) In welchen Fällen wird die KI eingesetzt bzw. in welchen Fällen soll sie eingesetzt werden?
Wird die „Gefährderanalyse“ bzw. „Profilanalyse“ zur Untersuchung von Anhörungsprotokollen mittels einer speziellen KI wissenschaftlich begleitet, und wenn ja, durch wen?
Welche Funktionsweise weist die im Zusammenhang mit der „Gefährderanalyse“ bzw. „Profilanalyse“ eingesetzte KI auf (bitte die technische Funktionsweise ausführlich darstellen und erläutern), und basiert sie auf dem sogenannten Deep-Learning-Verfahren?
Wie viele Anhörungsprotokolle wurden zu Trainingszwecken in die KI eingeführt?
Nach welchen Kriterien wurden die Trainingsdaten ausgewählt?
Wie wurde die Anonymisierung der Trainingsdaten sichergestellt?
Fließen zukünftige Anhörungsprotokolle ebenfalls als Trainingsdaten in die KI ein?
Wie erkennt die Software in den Anhörungsprotokollen „sicherheitsrelevante Sachverhalte“ (vgl. Bundestagsdrucksache 20/6401), und welche konkreten Informationen in den Anhörungsprotokollen werden hiervon erfasst (bitte „sicherheitsrelevanter Sachverhalte“ beispielhaft aufzählen)?
In wie vielen Fällen wurde ein „sicherheitsrelevanter Sachverhalt“ an die Sicherheitsbehörden weitergeleitet?
Welche Erkenntnis- bzw. Fehlerquote weist die KI bislang auf, und wie wird die Effektivität der KI mit Blick auf das verfolgte Ziel bislang eingeschätzt?
Werden die Asylantragstellerinnen und Asylantragsteller über die Anwendung sowie über die konkrete (technische) Funktionsweise der KI informiert und belehrt, und wenn ja, wie?
Soll die KI fortlaufend überwacht und evaluiert werden, und wenn ja, wie?
a) Welche Intervalle sind dafür vorgesehen?
b) Werden hierzu bereits konkrete Maßnahmen umgesetzt, und wenn ja, wie?
Sind Maßnahmen angedacht, um eine potenzielle unbeabsichtigte Voreingenommenheit in den algorithmischen Entscheidungen zu vermeiden, und wenn ja, welche?
c) Wer ist für die Überwachung der KI zuständig?
d) Ist die Einführung eines Risiko- und Qualitätsmanagementsystems vorgesehen?
e) Werden Anpassungen und Änderungen an der KI dokumentiert, und wenn ja, wie?
f) Für wann ist die Flächeneinführung geplant?
g) Wie geht das BAMF mit den Herausforderungen des sogenannten Confirmation bias sowie Automation bias um?