Un nuevo marco de trabajo permite movimientos ágiles similares a los de los animales en robots de cuatro patas

14 Julio 2024 1594
Share Tweet

13 de julio de 2024

Este artículo ha sido revisado de acuerdo con el proceso editorial y políticas de Science X. Los editores han destacado los siguientes atributos mientras aseguran la credibilidad del contenido:

  • verificación de hechos
  • publicación revisada por pares
  • fuentes confiables
  • corregido

por Ingrid Fadelli, Tech Xplore

Los animales de cuatro patas son capaces innatamente de movimientos ágiles y adaptables, lo que les permite desplazarse en una amplia gama de terrenos. Durante las últimas décadas, los robóticos de todo el mundo han estado tratando de reproducir efectivamente estos movimientos en robots cuadrúpedos (es decir, de cuatro patas).

Se ha descubierto que los modelos computacionales entrenados mediante aprendizaje por refuerzo logran resultados especialmente prometedores para permitir locomoción ágil en robots cuadrúpedos. Sin embargo, estos modelos generalmente se entrenan en entornos simulados y a veces su rendimiento disminuye cuando se aplican a robots reales en entornos del mundo real.

Enfoques alternativos para lograr locomoción ágil en cuadrúpedos utilizan metraje de animales en movimiento recopilado por sensores de movimiento y cámaras como demostraciones, que se utilizan para entrenar controladores (es decir, algoritmos para ejecutar los movimientos de los robots). Este enfoque, llamado 'aprendizaje por imitación', ha demostrado permitir la reproducción de movimientos similares a los animales en algunos robots cuadrúpedos.

Los investigadores de Tencent Robotics X en China presentaron recientemente un nuevo marco jerárquico que podría facilitar la ejecución de movimientos ágiles similares a los de los animales en robots de cuatro patas. Este marco, presentado en un documento publicado en Nature Machine Intelligence, se aplicó inicialmente a un robot cuadrúpedo llamado MAX, produciendo resultados muy prometedores.

'Se han realizado numerosos esfuerzos para lograr locomoción ágil en robots cuadrúpedos a través de controladores clásicos o enfoques de aprendizaje por refuerzo', escribieron Lei Han, Qingxu Zhu y sus colegas en su artículo. 'Estos métodos suelen depender de modelos físicos o recompensas diseñadas a mano para describir con precisión el sistema específico, en lugar de una comprensión general como hacen los animales. Proponemos un marco jerárquico para construir conocimiento de nivel primitivo, ambiental y estratégico que sea pre-entrenable, reutilizable y enriquecedor para robots con patas'.

El nuevo marco propuesto por los investigadores abarca tres etapas de aprendizaje por refuerzo, cada una de las cuales se centra en la extracción de conocimiento a un nivel diferente de tareas de locomoción y percepción de robots. El controlador del equipo en cada una de estas etapas de aprendizaje se llama controlador motor primitivo (PMC), controlador motor primitivo-ambiental (EPMC) y controlador motor primitivo-ambiental-estratégico (SEPMC), respectivamente.

'El módulo primitivo resume el conocimiento de los datos de movimiento animal, donde, inspirados en modelos pre-entrenados grandes en el entendimiento de lenguaje e imagen, introducimos modelos generativos profundos para producir señales de control motor estimulantes para que los robots con patas actúen como animales reales', escribieron los investigadores. 'Luego formamos varias capacidades de travesía a un nivel superior para alinearnos con el entorno reutilizando el módulo primitivo. Finalmente, se entrena un módulo estratégico, enfocándose en tareas complejas aguas abajo reutilizando el conocimiento de niveles anteriores'.

Los investigadores evaluaron su marco propuesto en una serie de experimentos, donde lo aplicaron a un robot cuadrúpedo llamado MAX. Específicamente, dos robots MAX participaron en un juego similar a una persecución y se utilizó el marco para controlar sus movimientos.

'Aplicamos los controladores jerárquicos entrenados al robot MAX, un robot cuadrúpedo desarrollado internamente, para imitar a los animales, atravesar obstáculos complejos y jugar en un juego de persecución multiagente desafiante y diseñado, donde emergen agilidad y estrategia realistas en los robots', escribió el equipo.

En sus pruebas iniciales, los investigadores descubrieron que su modelo permitió al robot MAX atravesar con éxito diferentes entornos, realizando movimientos ágiles que se asemejan a los de los animales. En el futuro, el modelo podría adaptarse y aplicarse a otros robots de cuatro patas, facilitando potencialmente su despliegue en entornos del mundo real.

Más información: Lei Han et al, Lifelike agility and play in quadrupedal robots using reinforcement learning and generative pre-trained models, Nature Machine Intelligence (2024). DOI: 10.1038/s42256-024-00861-3

© 2024 Science X Network


ARTÍCULOS RELACIONADOSL