Natürliche Interaktion zwischen Mensch und Roboter
Die Forschenden des Projekts ASARob haben den bereits bestehenden mobilen Assistenzroboter Care-O-bot mit Komponenten zur Erfassung seines Umfelds und von Personen ausgestattet. Der Roboter soll natürlich mit dem Menschen in einen Dialog treten können. Dabei hilft unter anderem dessen Fähigkeit zu erkennen, womit der Mensch sich beschäftigt um anschließend seine Aufmerksamkeit zu gewinnen. Das Ziel ist eine intuitive Interaktion zwischen Mensch und Roboter.
Damit ein Roboter gut mit Menschen interagieren kann, muss er ihre Aufmerksamkeit auf sich ziehen und ihre Handlung verstehen. Der Assistenzroboter Care-o-Bot sollte deshalb in die Lage versetzt werden, Personen und ihr Umfeld auf unterschiedliche Weisen zu erfassen und das gesammelte Wissen zu verarbeiten. Der Roboter muss erkennen, wann sich Personen an ihn wenden und wann sie während einer Roboter-Mensch-Interaktion die Aufmerksamkeit auf andere Gegenstände oder Personen – und somit weg vom Roboter – richten.
Die Innovation lag darin, den Care-O-Bot in die Lage zu versetzen, seinen eigenen Handlungskontext sowie den von der Person, mit der er interagiert, nachzuvollziehen. Ein System, das alle physischen Aktionen und Sprachausgaben des Roboters steuert, passt diese jeweils an den vorliegenden Kontext an. Eine solch vielseitige und umfangreiche Erfassung der menschlichen Aufmerksamkeit ist bislang weitgehend einzigartig und legt einen entscheidenden Grundpfeiler für die zukünftige Mensch-Maschine-Interaktion.
Der Mensch kommuniziert unbewusst auf sehr viele verschiedene Arten. Beispielsweise durch Gestik und Mimik. Die Vision einer natürlichen Interaktion zwischen Mensch und Maschine setzt voraus, dass die Maschine in der Lage ist zu erkennen, welcher Intention eine Person nachgeht und ob sie sich auf den Dialog konzentriert. Wenn die Maschine nachvollziehen kann, dass ein Mensch sich ihr zuwendet und sie explizit anspricht, werden Trigger-Wörter wie „Ok Google“ oder „Alexa“ obsolet. Zukünftig können solche Systeme proaktiv reagieren und natürliche Gespräche initiieren oder weiterführen, während sie zudem den Kontext des Dialogs nachvollziehen können.