Nowy framework umożliwia zwierzęce, zwinne ruchy czworonożnych robotów.

14 Lipiec 2024 2316
Share Tweet

13 lipca 2024 r. funkcja

Ten artykuł został zrewidowany zgodnie z procesem redakcyjnym i politykami Science X. Redaktorzy zwrócili uwagę na następujące cechy, dbając jednocześnie o wiarygodność treści:

  • zgodność z faktami
  • publikacja poddana recenzji przez ekspertów
  • zaufane źródło
  • przeczytany i sprawdzony

przez Ingrid Fadelli, Tech Xplore

Czworonożne zwierzęta posiadają wrodzoną zdolność do zwinnych i adaptacyjnych ruchów, które pozwalają im poruszać się na różnorodnych terenach. W ostatnich dziesięcioleciach robotycy na całym świecie próbowali efektywnie odtworzyć te ruchy w robotach czworonogich.

Modele obliczeniowe szkolone za pomocą uczenia ze wzmocnieniem okazały się szczególnie obiecującymi, jeśli chodzi o umożliwienie zwinnej lokomocji w robotach czworonogich. Jednakże te modele zwykle są trenowane w środowiskach symulacyjnych, a ich wydajność czasami spada, gdy są stosowane do rzeczywistych robotów w środowiskach rzeczywistych.

Alternatywne podejścia do osiągnięcia zwinnej lokomocji wśród czworonożnych wykorzystują nagrania poruszających się zwierząt zebrane przez czujniki ruchu i kamery jako demonstracje, które są używane do szkolenia kontrolerów (czyli algorytmów do wykonywania ruchów robotów). To podejście, zatytułowane 'uczenie przez naśladowanie', pozwoliło na odtworzenie ruchów przypominających zwierzęce w niektórych robotach czworonogich.

Badacze z Tencent Robotics X w Chinach niedawno wprowadzili nowe hierarchiczne ramy, które mogą ułatwić wykonywanie zwinnych ruchów przypominających zwierzęce przez roboty czworonogie. Ta struktura, wprowadzona w pracy opublikowanej w czasopiśmie Nature Machine Intelligence, została początkowo zastosowana w robocie czworonogim o nazwie MAX, dając bardzo obiecujące wyniki.

'Dokonano licznych prób osiągnięcia zwinnej lokomocji w robotach czworonogich za pomocą klasycznych kontrolerów lub podejść uczenia ze wzmocnieniem,' lei Han, Qingxu Zhu i ich koledzy napisali w swojej pracy. 'Te metody zwykle polegają na modelach fizycznych lub ręcznie tworzonych nagrodach, aby dokładnie opisać dany system, a nie na ogólnym rozumieniu, jak robią to zwierzęta. Proponujemy hierarchiczną strukturę w celu konstruowania prymitywnego, środowiskowego i strategicznego poziom wiedzy, który jest całkowicie trenowalny, wielokrotnego użytku oraz uzupełniany dla robotów na nogach.'

Nowa struktura zaproponowana przez badaczy obejmuje trzy etapy uczenia się za pomocą wzmocnienia, z których każdy skupia się na ekstrakcji wiedzy na różnych poziomach zadań lokomocji i percepcji robota. Kontroler zespołu w każdym z tych etapów nauki nazwano prymitywnym kontrolerem ruchu (PMC), środowiskowym-prymitywnym kontrolerem ruchu (EPMC) i strategiczno-środowiskowym-prymitywnym kontrolerem ruchu (SEPMC) odpowiednio.

'Moduł prymitywny podsumowuje wiedzę z danych dotyczących ruchów zwierząt, gdzie, inspirując się dużymi pre-trenowanymi modelami w rozumieniu języka i obrazu, wprowadziliśmy głębokie modele generatywne, aby produkować sygnały kontroli ruchu stymulujące roboty poruszające się na nogach, aby zachowywały się jak prawdziwe zwierzęta,' napisali badacze. 'Następnie kształtujemy różne zdolności przemierzania na wyższym poziomie, aby zgodzić się z otoczeniem poprzez ponowne użycie modułu prymitywnego. Ostatecznie trenowany jest moduł strategiczny, skupiający się na złożonych zadaniach dochodowych poprzez ponowne wykorzystanie wiedzy z poprzednich poziomów.'

Badacze ocenili swoją zaproponowaną strukturę w serii eksperymentów, w których zastosowali ją wobec robota czworonogiego o nazwie MAX. Konkretnie, dwa roboty MAX uczestniczyły w grze przypominającej zabawę w chowanego, a struktura została użyta do kontroli ich ruchów.

'Zastosowaliśmy wytrenowane kontrolery hierarchiczne do robota MAX, czworonogiego robota opracowanego wewnętrznie, aby naśladować zwierzęta, przemieszczać się przez złożone przeszkody i bawić się w zaprojektowaną, wymagającą grę w chowanego, gdzie w robotach pojawia się zręczność i strategia przypominające te z życia,' napisali badacze.

W początkowych testach badacze stwierdzili, że ich model pozwolił robotowi MAX skutecznie przemieszczać się w różnych środowiskach, wykonując zwinne ruchy przypominające te zwierzęce. W przyszłości model mógłby zostać dostosowany i zastosowany do innych robotów czworonogich, potencjalnie ułatwiając ich użycie w środowiskach rzeczywistych.

Więcej informacji: Lei Han et al, Lifelike agility and play in quadrupedal robots using reinforcement learning and generative pre-trained models, Nature Machine Intelligence (2024). DOI: 10.1038/s42256-024-00861-3

© 2024 Science X Network


POWIĄZANE ARTYKUŁY