DeepMind Lanza Gemini Robotics 1.5: La Revolución en IA que Reflexiona Antes de Actuar para Aplicaciones Físicas

Google DeepMind ha dado un significativo paso adelante en el ámbito de la robótica con la presentación de sus nuevos modelos, Gemini Robotics 1.5 y Gemini Robotics-ER 1.5. Diseñados para trabajar de forma complementaria, estos modelos permiten que los robots perciban, planifiquen, razonen, utilicen herramientas y actúen en tareas físicas complejas de múltiples etapas. Este desarrollo se considera un hito hacia la inteligencia artificial general (AGI) aplicada al mundo real, destacando en áreas de transparencia, seguridad y generalización entre diferentes tipos de robots.

Gemini Robotics-ER 1.5 se presenta como un modelo de razonamiento encarnado, que funciona como un «cerebro de alto nivel» para planificar en lenguaje natural, tomar decisiones lógicas y utilizar herramientas de búsqueda para obtener datos externos. Mientras tanto, Gemini Robotics 1.5 se centra en traducir estas instrucciones en comandos motores, añadiendo un enfoque de «pensar antes de actuar» que genera una secuencia interna de razonamiento, mejorando la claridad del proceso y ayudando a explicar el porqué de cada decisión.

Este enfoque permite aumentar la capacidad de generalización en tareas más largas y diversos entornos, superando el tradicional patrón de «una instrucción, un movimiento». Por ejemplo, un robot puede separar la ropa por colores o clasificar residuos según las normativas locales, realizando consultas en línea si es necesario para descomponer y ejecutar cada paso con precisión.

Un avance clave es la capacidad de transferir habilidades entre diferentes robots sin necesidad de ajustes específicos, una innovación que acelera el aprendizaje y reduce costos al reutilizar políticas entre plataformas.

Actualmente, Gemini Robotics-ER 1.5 está disponible para desarrolladores a través de la API de Gemini en Google AI Studio. Sin embargo, el modelo Gemini Robotics 1.5 está restringido a socios seleccionados debido a estrictas validaciones de seguridad.

En el ámbito de la seguridad, DeepMind ha implementado controles en capas y actualizado su benchmark ASIMOV para garantizar que los robots puedan operar con una comprensión profunda de las restricciones físicas y semánticas. Esto busca prevenir riesgos y asegurar la adherencia a las normas de seguridad.

Mientras la industria sueña con robots generalistas en tareas cotidianas, la realidad es que aún hay desafíos significativos por resolver, como la destreza fina y la robustez en entornos no controlados. No obstante, los avances logrados colocan a estos modelos como herramientas prometedoras en áreas como la logística, salud y manufactura flexible.

En resumen, la iniciativa de DeepMind representa no solo una mejora en la precisión y el razonamiento en entornos complejos, sino también en la capacidad de explicar sus procesos, un aspecto vital en la certificación y auditoría de comportamientos robóticos.

Cayetano Andaluz
Cayetano Andaluz
Periodista y redactor de noticias de actualidad sobre Andalucía y sus provincias. También información en general.

Compartir artículo:

Más popular

Más artículos como este
Relacionados

Madalena Cascais Tomé Asume el Liderazgo de Servicios Financieros en Worldline

Worldline, una destacada empresa global de servicios de pagos,...

Guía de Inversión Inteligente en España: Descubriendo Oportunidades Sostenibles y Rentables

En el contexto económico actual de España, la inversión...

Reunión entre Diputación y Ayuntamiento de Conil sobre la Mejora de la Carretera de Puerto Pesquero

El diputado de Cooperación, Javier Bello, y el diputado...

La Diputación de Córdoba Invierte 170.000 Euros en la Mejora Integral de la CP-95 ‘Ronda de Carcabuey’

La Diputación de Córdoba, a través de la Delegación...