News
Worte bewähren sich als Lehrmittel für KI
Auf der Suche nach einem neuen Weg, Robotern etwas beizubringen, haben Forscher herausgefunden, dass Beschreibungen in menschlicher Sprache das Lernen eines simulierten Roboterarms beschleunigen können, der eine Vielzahl von Lehrmitteln hebt und benutzt.
Die besten Lehrmittel für Roboter könnten einfach darin bestehen, deutlich mit ihnen zu sprechen, so eine neue Forschungsarbeit der Princeton University. Die Ergebnisse ergänzen die bisherigen Belege dafür, dass sich autonome Roboter durch die Bereitstellung umfassenderer Informationen während des KI-Trainings besser an neue Situationen anpassen können, was ihre Sicherheit und Effizienz erhöht.
Die Aufnahme von Beschreibungen der Form und Funktion eines Werkzeugs in den Trainingsprozess eines Roboters verbesserte die Fähigkeit der Maschine, mit neu entdeckten Werkzeugen umzugehen. Die neue Methode, Accelerated Learning of Tool Manipulation with LAnguage (ATLA), wurde von einem Team aus Maschinenbauingenieuren und Informatikern auf einer Konferenz über Roboterlernen vorgestellt.
Roboterarme haben ein großes Potenzial, bei sich wiederholenden oder anspruchsvollen Aufgaben zu helfen, aber es ist schwierig, Robotern beizubringen, Werkzeuge effektiv zu handhaben. Die Werkzeuge haben eine große Formenvielfalt, und die Geschicklichkeit und das Sehvermögen eines Roboters sind nicht mit denen eines Menschen vergleichbar.
"Zusätzliche Informationen in Form von Sprache können einem Roboter helfen, den Umgang mit den Werkzeugen schneller zu erlernen", so Anirudha Majumdar, Assistenzprofessor für Maschinenbau und Luft- und Raumfahrttechnik in Princeton und Leiter des Intelligent Robot Motion Lab.
Kredit: Princeton Engineering
Das Team erhielt Werkzeugbeschreibungen, indem es GPT-3 abfragte, ein großes Sprachmodell, das von OpenAI im Jahr 2020 veröffentlicht wurde und eine Form der KI namens Deep Learning verwendet, um Text als Antwort auf eine Aufforderung zu erzeugen. Nachdem sie mit verschiedenen Aufforderungen experimentiert hatten, entschieden sie sich für die Aufforderung "Beschreiben Sie das [Merkmal] von [Werkzeug] in einer detaillierten und wissenschaftlichen Antwort", wobei das Merkmal die Form oder der Zweck des Werkzeugs war.
"Da diese Sprachmodelle im Internet trainiert wurden, kann man dies in gewissem Sinne als eine andere Art der Informationsbeschaffung betrachten", die effizienter und umfassender ist als Crowdsourcing oder das Durchsuchen bestimmter Websites nach Werkzeugbeschreibungen, so Koautor Karthik Narasimhan, Assistenzprofessor für Computerwissenschaften.
Für ihre simulierten Lernexperimente mit Robotern wählte das Team einen Trainingssatz von 27 Werkzeugen aus, die von einer Axt bis zu einem Abzieher reichen. Sie gaben dem Roboterarm vier verschiedene Aufgaben, darunter das Schieben des Werkzeugs, das Heben des Werkzeugs, das Fegen eines Zylinders auf einem Tisch oder das Einschlagen eines Stifts in ein Loch.
Die Forscher entwickelten eine Reihe von Richtlinien mit Hilfe von Trainingsansätzen des maschinellen Lernens mit und ohne Sprachinformationen und verglichen dann die Leistung der Richtlinien mit einem separaten Testsatz von neun Werkzeugen mit paarweisen Beschreibungen.
Dieser Ansatz wird als Meta-Lernen bezeichnet, da der Roboter seine Lernfähigkeit mit jeder aufeinanderfolgenden Aufgabe verbessert. Er lernt nicht nur, jedes einzelne Werkzeug zu benutzen, sondern "versucht auch zu lernen, die Beschreibungen dieser hundert verschiedenen Werkzeuge zu verstehen, so dass er beim Erkennen des 101. "Wir tun zwei Dinge: Wir bringen dem Roboter bei, wie man die Werkzeuge benutzt, aber wir bringen ihm auch Englisch bei."
Die Forscher verwendeten Lehrmittel, um den Erfolg des Roboters beim Schieben, Heben, Fegen und Hämmern mit den neun Testwerkzeugen zu messen, und verglichen die Ergebnisse, die mit den Strategien erzielt wurden, die Sprache im maschinellen Lernprozess verwendeten, mit denen, die keine Sprachinformationen verwendeten. In den meisten Fällen boten die Sprachinformationen deutliche Vorteile für die Fähigkeit des Roboters, neue Werkzeuge zu benutzen.
Eine Aufgabe, bei der sich bemerkenswerte Unterschiede zwischen den Lernstrategien zeigten, war die Verwendung eines Brecheisens, um einen Zylinder oder eine Flasche auf einem Tisch zu fegen, so Allen Z. Ren, Doktorand in Majumdars Gruppe und Hauptautor der Forschungsarbeit.
"Mit dem Sprachtraining lernt es, am langen Ende des Brecheisens zu greifen und die gekrümmte Oberfläche zu nutzen, um die Bewegung der Flasche besser einzuschränken. Ohne die Sprache griff es das Brecheisen nahe an der gekrümmten Oberfläche und war schwieriger zu kontrollieren", so Ren.
Die Forschung wurde zum Teil vom Toyota Research Institute (TRI) unterstützt und ist Teil eines größeren, vom TRI finanzierten Projekts in Majumdars Forschungsgruppe, das darauf abzielt, die Fähigkeit von Robotern zu verbessern, in neuartigen Situationen zu funktionieren, die sich von ihren Trainingsumgebungen unterscheiden, und zwar mit Hilfe von Lehrmitteln.