Maschinelle Sprachverarbeitung und forensische Phonetik bei Polizei und Geheimdiensten
der Abgeordneten Andrej Hunko, Jan Korte, Wolfgang Gehrcke, Herbert Behrens, Sevim Dağdelen, Annette Groth, Ulla Jelpke, Harald Koch, Niema Movassat, Thomas Nord, Dr. Petra Sitte und der Fraktion DIE LINKE.
Vorbemerkung
In verschiedenen Bereichen kommt bei Polizeien und Geheimdiensten die maschinelle Sprachverarbeitung zum Einsatz. Hierzu gehören das Erkennen roher Inhalte, die automatische Sprachenerkennung bzw. die Vorselektion nach Sprachen, die Fähigkeit zur Verarbeitung (kontinuierlich) gesprochener Sprache sowie die Umwandlung gesprochener in geschriebene Sprache. Derart können die Sprachdaten weiter durch Verfahren zu Texterkennung, Textfilterung, Textmining oder der maschinellen Übersetzung verarbeitet werden. Behörden des Bundes nutzen aber auch Anwendungen zur forensischen Phonetik. Das Bundeskriminalamt (BKA) setzt beispielsweise die Stimmenanalyse ein, um Audioaufzeichnungen zu analysieren. Eine Software versucht ein Stimmenprofil einzelner Personen über vorgefundene Merkmale auszulesen. Die Merkmalskonfigurationen können in einer Stimmenvergleichsanalyse mit anderen Aufzeichnungen abgeglichen werden. Über das „lautsprachliche Verhalten“ sollen Aussagen über Alter und Geschlecht des Sprechers getroffen werden. Das BKA nutzt die Anwendungen, um bei einem Betroffenen „seine regionale Herkunft, seine Sprachkompetenz bzw. seine soziale Zugehörigkeit, eine eventuell vorhandene Stimmverstellung sowie Einflüsse von z. B. Stress, Alkohol oder akuten Stimmerkrankungen“ zu bestimmen (http://tinyurl.com).
Analysiert werden Stimme, Sprache und Sprechweise. Die Software ist in der Lage, unerwünschte Nebengeräusche auszufiltern. Mit der sogenannten „maschinellen Sprechererkennung“ soll die Zuverlässigkeit eines Stimmenvergleichs erhöht werden. Im BKA kommt hierfür ein „Sprecherkennungssystem“ (SPES) zum Einsatz, das einen „Ähnlichkeitswert“ berechnet. Mit der „phonetischen Textanalyse“ werden Audioaufzeichnungen verschriftlicht, überprüft und ebenfalls analysiert und bewertet. Auch Hintergrundgeräusche werden derart bestimmt.
Auch Geheimdienste nutzen Technologien, um Sprachdaten zu analysieren und auszuwerten. Vor 13 Jahren wurde offenkundig, wie der Bundesnachrichtendienst (BND) Unternehmen mit entsprechendem Wissen aufzukaufen versuchte. Laut dem Nachrichtenmagazin „FAKT“ habe der deutsche Geheimdienst im Wettbewerb mit amerikanischen Partnern gestanden, um die Vorherrschaft in dem Bereich zu erlangen (ARD, 3. September 2013). Unter den vom BND aufgekauften Firmen soll eine Firma des heutigen Professors A. W. vom Karlsruher Institut für Technologie (KIT) gewesen sein. Bis 2002 habe A. W. an Projekten gearbeitet, die in das US-Programm „Total Information Awareness“ integriert worden seien. Das Nachrichtenmagazin „FAKT“ verfügt nach eigenen Aussagen über „Unterlagen”, die belegten, dass in einem der Projekte der Militärgeheimdienst NSA als Kunde genannt würde. Die Europäische Kommission hatte in den Jahren zuvor mit AVENTINUS und SENSUS Projekte gefördert, um ebenfalls entsprechende Technologien für das damalige Polizeiamt bzw. die spätere Polizeiagentur EUROPOL zu entwickeln. Der Projektkoordinator für SENSUS war mit S. B. (Tarnname) ein BND-Angehöriger, der für das „Amt für Auslandsfragen“ (AfA), ein Tarninstitut des BND, arbeitete („Die Bayern-Belgien-Connection“; www.heise.de). Die Zugehörigkeit des AfA zum BND ist der Europäischen Kommission laut Medienberichten von Anfang an bekannt gewesen. Der BND sei sogar von sich aus an die Kommission herangetreten, um SENSUS auf den Weg zu bringen. Die Bundesregierung erklärte hierzu, der BND sei in SENSUS als „gewöhnlicher Dritter“ beteiligt gewesen (Bundestagsdrucksache 14/6667). S. B. wurde später unter seinem richtigen Namen C. K. wegen Fälschung eines Vertrages zuungunsten der Firma P. im SENSUS-Projekt verurteilt.
Die Marktführerschaft wurde in jenen Jahren der belgischen Firma L. & H. zugeschrieben, die damals mehrere Tausend Mitarbeiter/-innen beschäftigte. Das Nachrichtenmagazin „FAKT“ berichtet, auch L. & H. habe im Jahr 2000 eine Firma von A. W. „mit dessen Know-How“ gekauft. Dieses sei dann für den deutschen Bundesnachrichtendienst weiterentwickelt worden. Auch das Polizeiamt EUROPOL hatte mit dem BND hinsichtlich der Spracherkennung zusammengearbeitet. Im Rahmen einer Marktbeobachtung von Übersetzungssoftware nahmen vier EUROPOL-Mitarbeiter/-innen an einer Veranstaltung teil, die vom BND durchgeführt wurde. Die Bundesregierung vertritt die Auffassung, dabei sei das Trennungsgebot von Polizei und Diensten unberührt geblieben.
Mittlerweile werden Spracherkennungssysteme auch in polizeiliche und geheimdienstliche Analysesoftware integriert. Die Firma r. S. S. bewirbt sein System „INT-CENT“ damit, dass als Addon auch die Spracherkennung hinzugekauft werden könne. Laut Eigenwerbung bringt die Anwendung als Feature die „Automatische Übersetzung” mit (http://tinyurl.com). Zu den Kunden von r. S. S. gehören Behörden des Bundesministeriums des Innern und des Bundeskanzleramts.
Auch zur Analyse der „strategischen Fernmeldeaufklärung“ des BND dürften computergestützte Spracherkennungssysteme zum Einsatz kommen.
Mitschnitte werden vor ihrer Weitergabe an ausländische Dienste „G10-bereinigt“, also beteiligte deutsche Partner oder auch Gesprächsbeiträge entfernt. Dies dürfte kaum händisch vorgenommen werden. Zu vermuten ist, dass auch der in Echtzeit überwachte Verkehr durchforstet wird, um einzelne Sprecher/-innen identifizieren zu können und Gespräche aufzuzeichnen und auszuwerten. Eine Software muss hierfür nicht nur die Fähigkeit zur Stimmanalyse mitbringen, sondern auch die gesprochenen Sprachen erkennen.
Wir fragen die Bundesregierung:
Fragen52
Welche Behörden des Bundesministeriums des Innern, des Bundesministeriums der Verteidigung und des Bundeskanzleramts nutzen Systeme zur maschinellen Sprachverarbeitung oder forensischen Phonetik, und worum handelt es sich dabei?
Welche weitere Hard- und Software kommt zum Erkennen roher Inhalte, zur automatischen Sprachenerkennung bzw. die Vorselektion nach Sprachen, zur Verarbeitung (kontinuierlich) gesprochener Sprache sowie zur Umwandlung gesprochener in geschriebene Sprache zur Anwendung?
Welche weitere Hard- und Software kommt für Verfahren zur Texterkennung und Textfilterung, zum Textmining oder der maschinellen Übersetzung zum Einsatz?
Welche der genutzten Hard- oder Software ist dabei in der Lage, Sprachen zu erkennen oder Features zur automatisierten Übersetzung zu integrieren?
In welchen Abteilungen der Behörden kommen die Anwendungen zum Einsatz?
Wofür wird diese dort genutzt?
Wer hat die oben erfragte Hard- und Software hergestellt bzw. programmiert und an die Behörden verkauft?
Welche Kosten entstanden hierfür in den letzten zehn Jahren?
In welchen Fällen wurde entsprechende Software von welchen ausländischen Behörden überlassen oder verkauft?
Inwiefern und mit welchen Funktionalitäten wurden die Anwendungen von den Behörden weiterentwickelt oder sogar selbst programmiert?
Hinsichtlich welcher Anwendungen ist den Behörden der zugrundeliegende Quellcode bekannt?
Über welche Funktionalitäten oder Zusatzmodule verfügen die Anwendungen?
Auf welche Datenbanken, Sprachverkehre, Ermittlungsergebnisse oder sonstigen Datensätze greifen die Anwendungen bei den Behörden jeweils zu?
Inwiefern ist es möglich, in polizeilichen oder geheimdienstlichen Datenbanken nach einzelnen Stimmen oder Audioaufzeichnungen zu suchen, und in welchem Umfang wird dies praktiziert (bitte, soweit möglich, Zahlen seit 2007 angeben)?
Auf welche Art und Weise kann eine von den Behörden genutzte Software zur Stimmenanalyse, Stimmenvergleichsanalyse oder Sprechererkennung Aussagen über Alter und Geschlecht, „regionale Herkunft“, „Sprachkompetenz“, „soziale Zugehörigkeit“, Stimmverstellung, Stimmerkrankungen treffen, und als wie wahrscheinlich wird diese bewertet?
Welche Behörden des Bundesinnenministeriums, des Bundesverteidigungsministeriums und des Bundeskanzleramts nutzen gegenwärtig welche Software der Firma r. S. S., und inwiefern sind dort die Spracherkennung oder Module zur „Automatischen Übersetzung“ integriert?
Inwiefern wird auch die „strategische Fernmeldeaufklärung“ des BND mit maschineller Sprachverarbeitung oder forensischer Phonetik vorgenommen?
Mit welchen Anwendungen und welchen Funktionalitäten können vom BND Sprachverkehre in Echtzeit ausgeforscht werden, und in welchem Umfang wird dies praktiziert?
In welchen Fällen wird dies praktiziert (bitte hierfür nicht nur auf die rechtliche Grundlage des BND verweisen, sondern darstellen, ob dies für besondere Einsätze vorgesehen ist)?
Inwiefern können dadurch einzelne Sprecher/-innen identifiziert werden?
Inwiefern und mit welchen Funktionalitäten werden abgehörte Sprachverkehre mittels maschineller Sprachverarbeitung oder forensischer Phonetik „G10-bereinigt“?
Inwiefern trifft es zu, dass der BND 1996 und 1997 die „Erfassung von Sprachverkehren [...] aus technischen Gründen für die nächste Zeit auf Ausnahmefälle beschränkt[e]“, und welche Gründe waren hierfür maßgeblich (http://tinyurl.com)?
Inwiefern trifft es zu, dass der BND mit dem „Amt für Auslandsfragen“ ein Tarninstitut gründete, um in den Besitz entsprechender Technologie zur maschinellen Sprachverarbeitung oder sonstiger Auswertung audiobasierter Datensätze zu gelangen?
Sofern die Bundesregierung die Auffassung vertritt, das „Amt für Auslandsfragen“ sei kein Tarninstitut des BND, inwiefern arbeitete der Geheimdienst dennoch mit dem „Amt für Auslandsfragen“ zusammen?
Welche Technologien zur maschinellen Sprachverarbeitung waren für den BND in den letzten 15 Jahren von besonderem Interesse?
Inwiefern trifft es zu, dass der BND oder andere Geheimdienste des Bundes oder von ihm beauftragte oder gegründete Firmen oder Einrichtungen hierzu in den letzten 15 Jahren andere Unternehmen mit entsprechendem Wissen aufkaufte?
Um welche zahlenmäßige Größenordnung gekaufter Unternehmen handelt es sich dabei?
Welche Kosten entstanden hierfür im Einzelnen?
Inwiefern und auf welche Weise bzw. mit welchen Partner/-innen war der BND bzw. das „Amt für Auslandsfragen“ mit der Sprachtechnologie „METAL“ befasst?
Welche Kosten entstanden hierfür, und welche Firmen oder andere Einrichtungen erhielten entsprechende Gelder?
Inwiefern trifft es zu, dass deutsche Geheimdienste Firmen oder Kenntnisse des heutigen Professors A. W. vom Karlsruher Institut für Technologie (KIT) aufgekauft hat, und um welche handelte es sich dabei?
Inwiefern trifft es zu, dass der Projektkoordinator des EU- Forschungsprojektes SENSUS mit S. B. (Tarnname) ein BND-Angehöriger gewesen ist, bzw. welche anderslautenden Erkenntnisse kann die Bundesregierung hierzu beisteuern?
Inwiefern trifft es nach Kenntnis der Bundesregierung zu, dass die Zugehörigkeit des „Amts für Auslandsfragen“ oder des S. B. zum BND der Europäischen Kommission von Anfang an bekannt gewesen sei?
Inwiefern trifft es nach Kenntnis der Bundesregierung zu, dass der BND sogar von sich aus an die Kommission herangetreten sei, um SENSUS auf den Weg zu bringen, bzw. welche anderslautenden Erkenntnisse kann die Bundesregierung hierzu beisteuern?
Welche Konsequenzen zog die Bundesregierung bzw. ihre zuständigen Behörden aus der Verurteilung von S. B. wegen Fälschung eines Vertrages im SENSUS-Projekt?
In welchen anderen Forschungsvorhaben der Bundesregierung, der EU oder anderer internationaler Verbünde hat der BND in den letzten 15 Jahren als „gewöhnlicher Dritter“ teilgenommen?
In welchen anderen Forschungsvorhaben der Bundesregierung, der EU oder anderer internationaler Verbünde hat das Bundesamt für Verfassungsschutz in den letzten 15 Jahren als „gewöhnlicher Dritter“ teilgenommen?
Über welche Abteilungen bzw. andere, vom Bundesamt für Verfassungsschutz oder dem BND beauftragten oder gegründeten Firmen oder Einrichtungen, wurde dies abgewickelt?
Sofern die Bundesregierung hierzu Angaben verweigert oder teilweise zurückhält, welche Angaben kann sie zum Umfang derartiger heimlicher Teilnahme an der zivilen Sicherheitsforschung machen?
Sofern die Bundesregierung auch hierzu Angaben verweigert oder teilweise zurückhält, inwiefern wird dies heute noch praktiziert?
Welche Kontakte pflegen die deutschen Geheimdienste Militärischer Abschirmdienst, BND und das Bundesamt für Verfassungsschutz (BfV) hinsichtlich Technologien zur maschinellen Sprachverarbeitung oder forensischen Phonetik mit ausländischen Partnerdiensten aus den USA, Großbritannien, Israel und Australien?
Inwiefern werden mit den Partnern entsprechende Kapazitäten gemeinsam genutzt oder beforscht?
Inwiefern verfügt auch das im Besitz des BND und BfV befindliche Überwachungswerkzeug X-Keyscore oder sonstige, im Zusammenhang mit der bekanntgewordenen Spionageaffäre rund um den US-Geheimdienst NSA an deutsche Dienste überlassene Hard- und Software über Funktionalitäten Sprecherkennung, Stimmanalyse, nachträglichen Bearbeitung von Audioaufzeichnungen, Spracherkennung oder automatisierten Übersetzung?
Inwiefern werden automatisiert ausgewertete oder bearbeitete, abgehörte audiobasierte Telekommunikationsverkehre an ausländische Dienste weitergegeben, und inwiefern werden diese zuvor durch menschliche Bediener/-innen kontrolliert?
Worum handelt es sich bei dem „Runden Tisch zur Sicherstellung der Telekommunikationsüberwachung in der Zukunft“ des Bundesinnenministeriums, auf wessen Veranlassung wurde dieser eingerichtet, und wer ist dort (auch anlassbezogen) beteiligt oder eingeladen?
Welche Forschungen zur maschinellen Sprachverarbeitung oder forensischen Phonetik oder automatisierten Übersetzung finanziert bzw. finanzierte die Bundesregierung in den letzten 15 Jahren?
Wer war mit welchen Aufgaben an den jeweiligen Projekten beteiligt?
Welche finanziellen Mittel stellte die Bundesregierung über welche Bundesministerien hierfür bereit (bitte auch für die Geheimdienste angeben)?
Welche Forschungen zur maschinellen Sprachverarbeitung oder forensischen Phonetik oder automatisierten Übersetzung finanziert bzw. finanzierte die Europäische Kommission nach Kenntnis der Bundesregierung in den letzten 15 Jahren, und in welchen der Vorhaben waren deutsche Behörden oder andere deutsche Partner/-innen beteiligt?
Inwiefern verfügt auch die Polizeiagentur EUROPOL nach Kenntnis der Bundesregierung über Werkzeuge zur maschinellen Sprachverarbeitung oder forensischen Phonetik oder automatisierten Übersetzung?
Inwiefern arbeiten welche deutschen Behörden hierfür in welchen Vorhaben mit EUROPOL zusammen?
In welchen Fällen haben welche Behörden des Bundesinnenministeriums, des Bundesverteidigungsministeriums und des Bundeskanzleramts in den letzten 15 Jahren welche ausländischen Behörden in der maschinellen Sprachverarbeitung oder forensischen Phonetik oder automatisierten Übersetzung geschult oder ausgebildet, und um welche ausländischen Behörden handelte es sich dabei (bitte auch angeben, wenn es sich um einen „Austausch“ handelte)?