Nützliche Erfindung: Studentin entwickelt KI, die Gebärdensprache übersetzt

Bots, die wie echte Menschen in Chats kommunizieren, Computer, die Go spielen, und eine KI, die Texte erstellt – es gibt inzwischen eine KI für fast alles. Doch nicht alle, so wie beispielsweise die Voice AI, erfüllen auch wirklich einen sinnvollen Zweck. Nun ist es einer indischen Studentin gelungen, eine KI zu entwickeln, die Gebärdensprache übersetzen kann.

Young positive couple sit on sofa at home communicating using sign language, friends talking indoor showing fingers gestures, having fun, leading pleasant conversation, people with disability concept
70 Millionen Menschen weltweit nutzen die Gebärdensprache (Symbolbild: Getty Images)

Laut ARD Alpha benutzen etwa 250.000 Menschen in Deutschland die Gebärdensprache (DGS), oft sogar als Muttersprache. Dazu gehören taube oder gehörlose, schwerhörige Menschen und Menschen mit Hörbehinderung. Weltweit sind es sogar rund 70 Millionen. Es gibt rund 200 verschiedene Gebärdensprachen und alle müssen – wie jede andere Fremdsprache auch – erlernt werden.

Priyanjali Gupta, eine Maschinenbau-Studentin, hat nun eine künstliche Intelligenz entwickelt, die bestimmte Zeichen der Gebärdensprache ins Englische übersetzt – und das in Echtzeit! In einem Video, das erst auf Linkedin viral ging und später auch in anderen sozialen Netzwerken verbreitet wurde, demonstriert die Inderin, wie es aussieht, wenn sie ein Zeichen für beispielsweise "Ich liebe dich" oder "Nein" macht und die KI das gleichzeitig in Worte verfasst.

Dazu inspiriert wurde sie von ihrer Mutter, die sie dazu drängte, ihr Studium für etwas Sinnvolles zu nutzen. "Sie hat mich damit aufgezogen“, sagte Gupta zu Interesting Engineering. "Aber es hat mich dazu gebracht, darüber nachzudenken, was ich mit meinem Wissen und meinen Fähigkeiten tun könnte.“

Trainiert hat die Studentin ihre KI mit einem Datensatz an Einzelbildern, die sie selbst mithilfe einer Webcam erstellte. "Der Datensatz wird manuell erstellt, indem die Bildsammlungs-Python-Datei ausgeführt wird, die Bilder von der Webcam für alle der unten genannten Zeichen in der amerikanischen Gebärdensprache (ASL) sammelt: Hallo, ich liebe dich, danke, bitte, ja und nein“, teilte Gupta in ihrem Github-Beitrag mit.

Zu gefährlich: KI-Bildgenerator Midjourney schränkt Dienste wegen Missbrauchs ein

Die Studentin vom Vellore Institute of Technology (VIT) in Tamil Nadu, Indien, erstellte das Modell mithilfe der Tensorflow-Objekterkennung, welches auf Transfer Learning aus einem vorab trainierten Modell basiert, das ursprünglich von Nicholas Renotte erstellt wurde, einem Datenwissenschaftler und KI-Experten. Renotte entwickelte einen maschinellen Lernalgorithmus, der Gebärdensprache in Echtzeit erkennt, decodiert und transkribiert.

VIDEO: KI hat Menschheit zerstört, sagt achselzuckend "Sorry"