DeepMind Lanza Gemini Robotics 1.5: La Revolución en IA que Reflexiona Antes de Actuar para Aplicaciones Físicas

Google DeepMind ha dado un significativo paso adelante en el ámbito de la robótica con la presentación de sus nuevos modelos, Gemini Robotics 1.5 y Gemini Robotics-ER 1.5. Diseñados para trabajar de forma complementaria, estos modelos permiten que los robots perciban, planifiquen, razonen, utilicen herramientas y actúen en tareas físicas complejas de múltiples etapas. Este desarrollo se considera un hito hacia la inteligencia artificial general (AGI) aplicada al mundo real, destacando en áreas de transparencia, seguridad y generalización entre diferentes tipos de robots.

Gemini Robotics-ER 1.5 se presenta como un modelo de razonamiento encarnado, que funciona como un «cerebro de alto nivel» para planificar en lenguaje natural, tomar decisiones lógicas y utilizar herramientas de búsqueda para obtener datos externos. Mientras tanto, Gemini Robotics 1.5 se centra en traducir estas instrucciones en comandos motores, añadiendo un enfoque de «pensar antes de actuar» que genera una secuencia interna de razonamiento, mejorando la claridad del proceso y ayudando a explicar el porqué de cada decisión.

Este enfoque permite aumentar la capacidad de generalización en tareas más largas y diversos entornos, superando el tradicional patrón de «una instrucción, un movimiento». Por ejemplo, un robot puede separar la ropa por colores o clasificar residuos según las normativas locales, realizando consultas en línea si es necesario para descomponer y ejecutar cada paso con precisión.

Un avance clave es la capacidad de transferir habilidades entre diferentes robots sin necesidad de ajustes específicos, una innovación que acelera el aprendizaje y reduce costos al reutilizar políticas entre plataformas.

Actualmente, Gemini Robotics-ER 1.5 está disponible para desarrolladores a través de la API de Gemini en Google AI Studio. Sin embargo, el modelo Gemini Robotics 1.5 está restringido a socios seleccionados debido a estrictas validaciones de seguridad.

En el ámbito de la seguridad, DeepMind ha implementado controles en capas y actualizado su benchmark ASIMOV para garantizar que los robots puedan operar con una comprensión profunda de las restricciones físicas y semánticas. Esto busca prevenir riesgos y asegurar la adherencia a las normas de seguridad.

Mientras la industria sueña con robots generalistas en tareas cotidianas, la realidad es que aún hay desafíos significativos por resolver, como la destreza fina y la robustez en entornos no controlados. No obstante, los avances logrados colocan a estos modelos como herramientas prometedoras en áreas como la logística, salud y manufactura flexible.

En resumen, la iniciativa de DeepMind representa no solo una mejora en la precisión y el razonamiento en entornos complejos, sino también en la capacidad de explicar sus procesos, un aspecto vital en la certificación y auditoría de comportamientos robóticos.

Cayetano Andaluz
Cayetano Andaluz
Periodista y redactor de noticias de actualidad sobre Andalucía y sus provincias. También información en general.

Compartir artículo:

Más popular

Más artículos como este
Relacionados

Duro Felguera Sufre Caída del 30% Tras Decisión Judicial Sobre Prórroga

La justicia asturiana ha rechazado la cuarta prórroga solicitada...

Incremento en Ventas de Tesla Ante el Fin de Subsidios para Vehículos Eléctricos en EE. UU.

Tesla ha revertido su caída en ventas, alcanzando 497,000...

Atentado contra sinagoga en Manchester deja dos muertos y tres heridos graves durante Yom Kipur

La Policía ha abatido al responsable de un atentado...

La renta en Andalucía es 74.000 euros inferior a la del ciudadano más adinerado de la región.

La diversidad económica en España varía notablemente entre comunidades...