Sprachdialogsysteme mit »Informed Machine Learning«

Sprachtechnologien für Anwendungen in Wirtschaft und Industrie

Sprachassistenten werden in immer mehr Lebensbereichen eingesetzt und ermöglichen eine intuitive Interaktion mit der Technik. Wissenschaftlerinnen und Wissenschaftler des Forschungszentrums Maschinelles Lernen entwickeln auf Basis des »Informed Machine Learning« Technologien für sprachgesteuerte Dialogsysteme mit Fokus auf domänenspezifischem Wissen für den Einsatz in der Wirtschaft und Industrie.

Durch die Kombination modernster Komponenten für Spracherkennung, Question Answering via Wissensgraphen und Sprachsynthese adressieren diese Technologien die Herausforderungen und Bedürfnisse von Unternehmen und B2B-Anwendungen. Darüber hinaus gewährleisten diese Systeme technologische Souveränität: Daten können in sicheren Datenräumen gespeichert und verarbeitet werden.  

Demonstrator: Smarter Sprachassistent als virtueller Stadtführer

Sprachassistenten sind in allen Branchen einsetzbar, um die Interaktion zwischen Mensch und Maschine intuitiv zu gestalten. Doch was für Menschen intuitiv und einfach ist, zum Beispiel Kontextwissen abzurufen, das fällt Maschinen schwer. Methoden des »Informed Machine Learning« können diese Lücke schließen. Anhand eines virtuellen Stadtführers für Sehenswürdigkeiten in Berlin zeigen wir, wie unser System gelernt hat, auf unterschiedliche Herausforderungen zu reagieren.

 

Frage zur Umgebung

Das System ist in der Lage, Anfragen mit räumlichem Bezug zu beantworten, etwa nach Restaurants oder Hotels in der Nähe. Die Beantwortung basiert auf Kartendaten, z. B. von OpenStreetMap.

 

Koreferenz

Für Menschen ist es intuitiv, für Maschinen eine Herausforderung: den Bezug zu einer vorhergehenden Frage zu erkennen.

 

Entitätenerkennung

Das System erkennt Entitäten in einer Frage (z. B. Brandenburger Tor) und nutzt diese für die weitere Abfrage von Informationen (z. B. Architekt, Besucherzahlen).

 

Direkte Frage

Das System ruft Informationen aus einem Wissensgraphen ab und berücksichtigt dabei den Kontext, auf den sich die Fragen beziehen (z. B. Koordinaten, Blickrichtung).

 

Kommandos

Einfache Sprachbefehle wie Stopp, Weiter o. ä. lösen Aktionen aus. Außerdem reagiert das System auf Ereignisse (Trigger), z. B. beim Annähern an ein Gebäude oder den Ablauf eines Timers.

 

Wissensgebiet erkennen

Das System erkennt, welches Wissensgebiet eine Frage adressiert – etwa Navigation, Wetter oder Buchungen – und sorgt dafür, dass die Frage von entsprechenden Untermodulen verarbeitet wird.

 

Small Talk

Das Dialogsystem hat typische Dialogelemente wie Begrüßungen, Verabschiedungen und Höflichkeitsfloskeln gelernt und kann darauf reagieren.