Nieuw framework maakt dierlijke Agile bewegingen mogelijk in vierbenige robots.
13 juli 2024 kenmerk
Dit artikel is beoordeeld volgens het redactionele proces en de beleidslijnen van Science X. Redacteuren hebben de volgende eigenschappen benadrukt terwijl ze de geloofwaardigheid van de inhoud waarborgden:
- feiten gecheckt
- peer-reviewed publicatie
- vertrouwde bron
- gecorrigeerd
door Ingrid Fadelli, Tech Xplore
Vierbenige dieren zijn van nature in staat tot behendige en aanpasbare bewegingen, waardoor ze zich kunnen voortbewegen op een breed scala van terreinen. In de afgelopen decennia hebben robotici wereldwijd geprobeerd om deze bewegingen effectief na te bootsen in viervoetige robots.
Met behulp van computationele modellen getraind via versterkend leren zijn bijzonder veelbelovende resultaten behaald voor het mogelijk maken van behendige voortbeweging in viervoetige robots. Echter, deze modellen worden meestal getraind in gesimuleerde omgevingen en hun prestaties nemen soms af wanneer ze worden toegepast op echte robots in echte wereldomgevingen.
Alternatieve benaderingen om behendige viervoetige voortbeweging te realiseren maken gebruik van beelden van bewegende dieren verzameld door bewegingssensoren en camera's als demonstraties, die worden gebruikt om controllers (d.w.z. algoritmen voor het uitvoeren van de bewegingen van robots) te trainen. Deze benadering, genaamd 'imitatieleren', bleek in staat te zijn om de reproductie van dierlijke bewegingen in sommige viervoetige robots mogelijk te maken.
Onderzoekers bij Tencent Robotics X in China introduceerden onlangs een nieuw hiërarchisch framework dat de uitvoering van dierlijke behendige bewegingen in viervoetige robots zou kunnen vergemakkelijken. Dit framework, geïntroduceerd in een paper gepubliceerd in Nature Machine Intelligence, werd aanvankelijk toegepast op een viervoetige robot genaamd MAX, wat zeer veelbelovende resultaten opleverde.
'Er zijn veel inspanningen geleverd om behendige voortbeweging in viervoetige robots te bereiken met behulp van klassieke controllers of versterkend leren benaderingen,' schreven Lei Han, Qingxu Zhu en hun collega's in hun paper. 'Deze methoden vertrouwen meestal op fysieke modellen of handgemaakte beloningen om het specifieke systeem nauwkeurig te beschrijven, in plaats van op een gegeneraliseerd begrip zoals dieren dat doen. Wij stellen een hiërarchisch framework voor om op primitief-, omgevings- en strategisch niveau kennis te construeren die allemaal vooraf trainbaar, herbruikbaar en verrijkbaar zijn voor viervoetige robots.'
Het nieuwe framework dat door de onderzoekers is voorgesteld, strekt zich uit over drie stadia van versterkend leren, waarbij elk zich richt op de extractie van kennis op een ander niveau van voortbewegingstaken en robotperceptie. De controller van het team op elk van deze leerniveaus wordt respectievelijk aangeduid als primitieve motorcontroller (PMC), omgevings-primitieve motorcontroller (EPMC) en strategisch-omgevings-primitieve motorcontroller (SEPMC).
'De primitieve module vat kennis samen uit dierlijke bewegingsgegevens, waarbij we, geïnspireerd door grootschalige vooraf getrainde modellen in taal- en beeldbegrip, diepe generatieve modellen introduceren om motorbesturingsignalen te produceren die viervoetige robots aanzetten om zich te gedragen als echte dieren,' schreven de onderzoekers. 'Vervolgens vormen we verschillende doorkruisingscapaciteiten op een hoger niveau om aan te sluiten bij de omgeving door het hergebruiken van de primitieve module. Tot slot wordt een strategische module getraind, gericht op complexe downstreamtaken door het hergebruiken van de kennis uit eerdere niveaus.'
De onderzoekers evalueerden hun voorgestelde framework in een reeks experimenten, waarbij ze het toepasten op een viervoetige robot genaamd MAX. Specifiek werden twee MAX-robots ingezet om deel te nemen aan een soortgelijk spel en het framework werd gebruikt om hun bewegingen te regelen.
'We passen de getrainde hiërarchische controllers toe op de MAX-robot, een in-house ontwikkelde viervoetige robot, om dieren na te bootsen, complexe obstakels te doorkruisen en te spelen in een ontworpen, uitdagend multi-agent achtervolgings-etagère-spel, waarin het levensechte behendigheid en strategieën in de robots ontstaan,' schreef het team.
In hun initiële tests ontdekten de onderzoekers dat hun model de MAX-robot in staat stelde om succesvol verschillende omgevingen te doorkruisen, behendige bewegingen uitvoerend die lijken op die van dieren. In de toekomst kan het model worden aangepast en toegepast op andere viervoetige robots, waarbij potentieel hun inzetbaarheid in real-world omgevingen wordt vergemakkelijkt.
Meer informatie: Lei Han et al, Lifelike agility and play in quadrupedal robots using reinforcement learning and generative pre-trained models, Nature Machine Intelligence (2024). DOI: 10.1038/s42256-024-00861-3
© 2024 Science X Network