„Wir geben Maschinen die Fähigkeit, uns wirklich zu verstehen“: audEERING entwickelt die weltweit erste Deep-Learning-Methode zur Analyse von Stimmen

Dagmar Schuller, CEO von audEERING, mit Roboter audEER (Credit: Arlet Ulfers)

Von Julia Mengeler.

An die Existenz mehr oder weniger intelligenter Maschinen und selbstlernender Algorithmen haben sich wohl die meisten gewöhnt. Begegnen sie uns doch längst an diversen Stellen im Alltag. Was aber, wenn nun Roboter oder smarte Assistenten in der Lage sind, uns zuzuhören, uns zu verstehen und unsere Gefühle zu analysieren? Klingt nach Science-Fiction, ist aber Realität. In einem kleinen Örtchen im Dunstkreis von München entwickeln die KI-Experten von audEERING eine Künstliche Intelligenz zur Analyse menschlicher Stimmen.

„Smarte Assistenzsysteme und Roboter haben immer noch damit zu kämpfen, treffsicher zu verstehen, was wir wirklich meinen“, sagt Dagmar Schuller, CEO und Co-Gründerin von audEERING. Ohnehin führten sie nur Stumpf unsere Befehle aus – im Idealfall. Häufig scheitert ja beispielsweise Siri schon an den einfachsten Sprachbefehlen. Im Feld der intelligenten Audioanalyse gibt es also noch Pionierarbeit zu leisten. Und das geschieht nicht etwa im Silicon Valley bei den Tech-Giganten, sondern eben im oberbayrischen Gilching.

„Dass Maschinen mit Hilfe von KI sozial kompetent, gar empathisch sein können, klingt wie Zukunftsmusik, ist aber technisch bereits möglich“

Dort ließ sich 2012 das KI-Start-up audEERING nieder. Das Unternehmen hat eine Technologie entwickelt, die mittels maschineller Intelligenz und Deep Learning mehr als 6.000 verschiedene Merkmale aus Audiosignalen ermitteln kann. Mit dem Verfahren können sie aus der menschlichen Stimme Informationen zu Charaktereigenschaften, gesundheitlichem Zustand und emotionaler Verfassung einer Person gewinnen. Die intelligente Sprachanalyse erkennt zudem, ob der Sprecher zufrieden, verärgert oder traurig ist. Über 50 unterschiedliche Emotionsausprägungen werden dabei erfasst. „Dass Maschinen mit Hilfe von KI sozial kompetent, gar empathisch sein können, klingt wie Zukunftsmusik, ist aber technisch bereits möglich“, sagt Schuller. Wer einmal sehen möchte, wie gut das funktioniert, der sollte sich audEER angucken. audEER ist ein einfacher Lego Mindstorm Roboter, dem man die Audio Analyse Software einpflanzte und der so zum empathischen Zuhörer wurde.

audEERING verdient sein Geld damit, Emotionen für Maschinen verständlich zu machen. Kunden aus Automobilindustrie, Gesundheitswesen, Marktforschung und IoT nutzen die Technologie zur Emotionserkennung, um wiederum ihre Kunden besser zu verstehen und Produkte zu optimieren. Ein zweites Standbein hat audEERING in der Forschung. Denn dort begann alles: Das Unternehmen entwuchs dem universitären Umfeld der Technischen Universität München (TUM). Bereits 2009 setzten hier die Doktoranden Florian Eyben und Martin Wöllmer am Lehrstuhl für Mensch-Maschine-Kommunikation die Deep-Learning-Methode zur Analyse von Audiodaten zum ersten Mal ein – in dieser Form eine Weltpremiere. „Viele Unternehmen, die sich heute mit intelligenter Sprachanalyse beschäftigen, nutzen unsere Forschungsarbeit als Basis“, sagt Schuller. Sorge ob potenzieller Konkurrenz mache man sich aber wenig, denn „im Gegensatz zu anderen Anbietern, benötigt unsere Analyse-KI lediglich einen kurzen Audio-Ausschnitt von nur wenigen Sekunden“. Dank jahrelanger Forschungsarbeit und eines ganzheitlichen Ansatzes sei man zudem viel breiter aufgestellt als die Wettbewerber. Und tatsächlich ist der vielseitige Einsatz der intelligenten Audioanalyse bemerkenswert.

„Die KI kann besser erkennen, ob jemand betrunken ist, als ein Mensch“

Zum einen nutzen Unternehmen die audEERING-Technologie zu kommerziellen Zwecken. „In der Marktforschung“, sagt Schuller, „macht es einen riesigen Unterschied, ob die Probanden ein Kreuz auf einem Fragebogen machen oder darüber hinaus einen Einblick in ihre Gefühle gewähren, die das Produkt bei ihnen auslöst“. Grundsätzlich aber wolle das Unternehmen mit seiner Sprachanalyse-KI den Menschen bestmöglich unterstützen und das Leben leichter machen – beim Autofahren beispielweise. Fahrzeuge der Zukunft könnten mit der KI die Gefühlslage des Fahrers erfassen und daraufhin automatisch Musik oder Beleuchtung einstellen. Außerdem denkbar: eine Fahrtauglichkeitsprüfung durch die KI, denn diese „kann besser erkennen, ob jemand betrunken ist, als ein Mensch“, erklärt Schuller. In diesem konkreten Anwendungsfall, also wenn die Künstliche Intelligenz den menschlichen Fähigkeiten tatsächlich überlegen ist, erreiche die Technologie das sogenannte Super-Human-Level. Es ginge dann natürlich nicht darum, den Menschen zu maßregeln, sondern einzig darum, die Insassen zu schützen.

Zum anderen hilft die audEERING Sprachanalyse-Technologie im Gesundheitswesen bei der Diagnose neurokognitiver Erkrankungen. Symptome wie Sprachverlust, Stimmungsschwankungen und Stress können digital analysiert und somit Leiden wie Alzheimer, Parkinson, Burn-out und Depressionen bereits im Frühstadium erkannt werden. Für die Entwicklung weiterer Anwendungen und Gadgets, wie einer intelligenten Brille zur Früherkennung von Parkinson, kooperiert audEERING mit internationalen Start-ups und erhält Fördermittel der EU.

„Bei uns zählt der Pioniergeist“

Überhaupt ist das Unternehmen Teil eines einzigartigen High-Tech-Netzwerkes. Denn am Standort Gilching entstand vor zehn Jahren der Asto-Park. Mit über 70 nationalen und internationalen Unternehmen aus der Techbranche ist die beschauliche Gemeinde im Landkreis Starnberg zum Innovationsstandort geworden. Und: In unmittelbarer Nähe liegt das Zentrum für Luft- und Raumfahrt, in dessen Nachbarschaft sich immer wieder neue, spannende Tech- und Robotik-Start-ups ansiedeln. Das fördere den Austausch und die Kooperationen. Für die KI-Pioniere von audEERING das ideale Ökosystem für die weitere Geschäftsentwicklung.

Und obwohl die attraktive Metropole München nicht weit entfernt ist, habe man bei audEERING keine Probleme, Entwickler und KI-Experten zu rekrutieren – mittlerweile zählt das Team rund 40 Köpfe. Die Position als Innovationsführer sei natürlich hilfreich, um Tech-Talents anzulocken, aber noch lange nicht ausreichend. „Bei uns zählt der Pioniergeist“, meint Schuller. Deswegen besinne man sich auf den universitären Ursprung der Company und biete einen interdisziplinären Ansatz. „Wir geben unseren KI-Experten die Chance, immer neue Anwendungsgebiete intelligenter Audio Analyse zu entwickeln. Bei uns haben sie die Chance, an kommerziellen Produkten zu arbeiten, verlieren aber trotzdem den Bezug zur Forschung nicht.“ Der Forschungshintergrund spielt bei audEERING eine große Rolle. Dieser sei der wichtigste Treiber, wenn es darum gehe, über die Grenzen des akademischen State of the Art hinaus zu denken, erklärt Schuller.

Übrigens ist der kleine, empathische Lego-Roboter audEER noch nicht serienreif. Er sei ein Unikat und diene bislang lediglich der Visualisierung der Technologie auf Messen und im hauseigenen Showroom im „Silicon Valley Bayerns“, Gilching.

Dieser Text ist Teil der neuen Serie #TechMadeInGermany.
Bislang erschienen sind dabei unter anderem Stücke über HolorideLiliumApiOmat, Raisin und Showheroes.

(Beitragsbild: Arlet Ulfers)

Clutch-Redaktion