En junio de 2025, Google DeepMind lanzó el modelo Gemini Robotics On‑Device, una innovación en el campo de la visión ‒ lenguaje ‒ acción (VLA). Diseñado para ejecutarse localmente, elimina la necesidad de conexión a internet, ofreciendo una autonomía y velocidad de respuesta que transforman la interacción entre robots y entornos físicos.
🔍 ¿Qué puede hacer este modelo?
- Interpretar comandos en lenguaje natural y ejecutar tareas complejas, como desabrochar cremalleras o doblar ropa.
- Adaptarse a diferentes plataformas (bi‑arm ALOHA, Franka FR3, humanoide Apollo) con tan solo 50–100 demostraciones prácticas.
- Funcionamiento local con baja latencia, ideal para entornos sin conectividad.
🔧 ¿Por qué es un avance decisivo?
- Autonomía real: elimina la dependencia de la nube, crucial para aplicaciones en campo o sensibles.
- Velocidad: la inferencia ocurre en el mismo dispositivo, reduciendo drásticamente el tiempo de respuesta.
- SDK accesible: DeepMind ofrece un kit de desarrollo con compatibilidad para simulación en MuJoCo y potenciación con demostraciones reales.
📈 Evaluación de rendimiento
Gemini On‑Device supera a otros modelos similares en pruebas de generalización. Aunque la versión híbrida (con nube) aún marca el máximo rendimiento (~80 %), esta versión local alcanza ~60 %, lo que la hace ideal para aplicaciones prácticas.
🔮 Implicaciones para makers y la comunidad del hardware abierto
- Ideal para incorporar visión avanzada en proyectos educativos: drones, robots de servicio, vigilancia. - Una gran oportunidad para integrar cámaras 3D, microcontroladores y sensores con IA embebida. - En H2ElectronicsCR podemos facilitarte el acceso a estos componentes y brindar asesoría para desarrollar prototipos con IA local.
🚀 ¿Cómo empezar?
- Mirá la demo oficial y lee la documentación de Gemini Robotics On‑Device.
- Aplicá al programa de “trusted testers” si estás desarrollando proyectos avanzados.
- Instalá el SDK y diseñá tu primer experimento: ¿un robot que entienda “traeme esa taza”? ☕
🗣️ ¿Qué nos gustaría saber de vos?
¿En qué proyecto te gustaría aplicar visión y control inteligente? ¿Querés que hagamos un taller o guía paso a paso? Dejá tu idea en los comentarios y exploremos juntos el futuro de la robótica en Costa Rica.
No hay comentarios en este artículo.