Anuncia Google dos modelos de IA para nueva generación de robots humanoides

Google DeepMind ha revelado dos innovadores modelos de inteligencia artificial (IA) que, según la compañía, marcan el comienzo de una nueva era en robótica avanzada: Gemini Robotics y Gemini Robotics-ER.
Ambos modelos, desarrollados a partir de la IA Gemini 2.0, amplían significativamente las capacidades de los robots, permitiéndoles realizar tareas más variadas y complejas en entornos del mundo real.
El primero de ellos, Gemini Robotics, es un sofisticado sistema de visión-lenguaje-acción (VLA) que introduce el control físico como una nueva dimensión, permitiendo a los robots ejecutar tareas con precisión milimétrica. Gracias a esta innovación, los robots pueden realizar acciones detalladas como doblar una figura de origami o colocar cuidadosamente un bocadillo dentro de una bolsa con cierre hermético, explica la empresa en su blog oficial.
Para lograr una verdadera utilidad en entornos humanos, la IA aplicada a la robótica debe cumplir con tres principios clave:
Versatilidad: la capacidad de adaptarse a múltiples escenarios y requerimientos.
Interacción intuitiva: una comprensión ágil de instrucciones y respuestas rápidas a cambios en el entorno.
Destreza física: la habilidad de ejecutar tareas que normalmente requieren el uso preciso de las manos y los dedos, como manipular objetos frágiles.
Google DeepMind asegura que, si bien sus desarrollos anteriores ya habían avanzado en estas áreas, Gemini Robotics representa un salto cualitativo en las tres dimensiones, acercando a la industria a la creación de robots verdaderamente versátiles