InicioSociedadEste algoritmo hace que los robots funcionen mejor

Este algoritmo hace que los robots funcionen mejor

-

Los ingenieros de la Universidad Northwestern han desarrollado un nuevo algoritmo de inteligencia artificial (IA) para robótica inteligente. Al ayudar a los robots a aprender habilidades complejas de manera rápida y confiable, el nuevo método podría mejorar significativamente la practicidad (y la seguridad) de los robots para diversas aplicaciones, incluidos automóviles autónomos, drones de reparto, asistentes domésticos y automatización.

Llamado aprendizaje por refuerzo de máxima difusión (MaxDiff RL), el éxito del algoritmo radica en su capacidad de alentar a los robots a explorar sus entornos de la manera más aleatoria posible para obtener un conjunto diverso de experiencias. Esta «aleatoriedad diseñada» mejora la calidad de los datos que los robots recopilan sobre su propio entorno. Y, al utilizar datos de mayor calidad, los robots simulados demostraron un aprendizaje más rápido y eficiente, mejorando su confiabilidad y rendimiento generales.

Cuando se probaron con otras plataformas de IA, los robots simulados que utilizaban el nuevo algoritmo de Northwestern superaron consistentemente a los modelos de última generación. De hecho, el nuevo algoritmo funciona tan bien que los robots aprendieron nuevas tareas y luego las realizaron con éxito en un solo intento, haciéndolo bien a la primera. Esto contrasta marcadamente con los modelos de IA actuales, que permiten un aprendizaje más lento mediante prueba y error.

El La investigación fue publicada hoy. en la revista Nature Machine Intelligence.

«Otros marcos de IA pueden ser algo poco confiables», dijo Northwestern. Tomás Berrueta, quien dirigió el estudio. “A veces logran concretar una tarea, pero otras veces fracasan por completo. Con nuestro marco, siempre que el robot sea capaz de resolver la tarea, cada vez que encienda su robot puede esperar que haga exactamente lo que se le pidió que hiciera. Esto hace que sea más fácil interpretar los éxitos y fracasos de los robots, lo cual es crucial en un mundo cada vez más dependiente de la IA”.

Berrueta es un Compañero presidencial en Northwestern y un Ph.D. candidato en ingeniería mecánica en la Escuela de Ingeniería McCormick. Experto en robótica Todd Murphey, profesor de ingeniería mecánica en McCormick y asesor de Berrueta, es el autor principal del artículo. Berrueta y Murphey fueron coautores del artículo con Allison Pinosky, también Ph.D. candidato en el laboratorio de Murphey.

La desconexión incorpórea

Para entrenar algoritmos de aprendizaje automático, los investigadores y desarrolladores utilizan grandes cantidades de big data, que los humanos filtran y seleccionan cuidadosamente. La IA aprende de estos datos de entrenamiento, mediante prueba y error, hasta alcanzar resultados óptimos. Si bien este proceso funciona bien para sistemas incorpóreos, como ChatGPT y Google Gemini (anteriormente Bard), no funciona para sistemas de inteligencia artificial incorporados como los robots. Los robots, en cambio, recopilan datos por sí mismos, sin el lujo de tener curadores humanos.

«Los algoritmos tradicionales no son compatibles con la robótica de dos maneras distintas», dijo Murphey. “En primer lugar, los sistemas incorpóreos pueden aprovechar un mundo donde las leyes físicas no se aplican. En segundo lugar, los fracasos individuales no tienen consecuencias. Para las aplicaciones informáticas, lo único que importa es que tenga éxito la mayor parte del tiempo. En robótica, un fallo podría ser catastrófico”.

Para resolver esta desconexión, Berrueta, Murphey y Pinosky se propusieron desarrollar un algoritmo novedoso que garantice que los robots recopilen datos de alta calidad sobre la marcha. En esencia, MaxDiff RL ordena a los robots que se muevan de forma más aleatoria para recopilar datos completos y diversos sobre sus entornos. Al aprender a través de experiencias aleatorias seleccionadas por ellos mismos, los robots adquieren las habilidades necesarias para realizar tareas útiles.

Hacerlo bien la primera vez

Para probar el nuevo algoritmo, los investigadores lo compararon con modelos actuales de última generación. Utilizando simulaciones por computadora, los investigadores pidieron a robots simulados que realizaran una serie de tareas estándar. En general, los robots que utilizan MaxDiff RL aprendieron más rápido que los otros modelos. También realizaron tareas correctamente de manera mucho más consistente y confiable que otros.

Quizás aún más impresionante: los robots que utilizan el método MaxDiff RL a menudo logran realizar correctamente una tarea en un solo intento. Y eso fue incluso cuando empezaron sin conocimiento.

«Nuestros robots eran más rápidos y ágiles, capaces de generalizar eficazmente lo que aprendieron y aplicarlo a nuevas situaciones», dijo Berrueta. «Para aplicaciones del mundo real donde los robots no pueden permitirse un tiempo interminable de prueba y error, esto es un gran beneficio».

Dado que MaxDiff RL es un algoritmo general, se puede utilizar para una variedad de aplicaciones. Los investigadores esperan que aborde cuestiones fundamentales que frenan el campo y, en última instancia, allane el camino para una toma de decisiones confiable en robótica inteligente.

«Esto no tiene por qué usarse sólo para vehículos robóticos que se mueven», dijo Pinosky. “También podría usarse para robots estacionarios, como un brazo robótico en una cocina que aprende a cargar el lavavajillas. A medida que las tareas y los entornos físicos se vuelven más complicados, el papel de la encarnación se vuelve aún más crucial a considerar durante el proceso de aprendizaje. Este es un paso importante hacia sistemas reales que realizan tareas más complicadas e interesantes”.

Fuente: norteuniversidad orthwestern

!function(f,b,e,v,n,t,s){if(f.fbq)return;n=f.fbq=function(){n.callMethod?
n.callMethod.apply(n,arguments):n.queue.push(arguments)};if(!f._fbq)f._fbq=n;
n.push=n;n.loaded=!0;n.version=’2.0′;n.queue=[];t=b.createElement(e);t.async=!0;
t.src=v;s=b.getElementsByTagName(e)[0];s.parentNode.insertBefore(t,s)}(window,
document,’script’,’https://connect.facebook.net/en_US/fbevents.js’);
fbq(‘init’, ‘1254095111342376’);
fbq(‘track’, ‘PageView’);

Publicado anteriormente en The European Times.

Deja un comentario

- Publicidad -spot_img

Selección