ALQUITARES-1.5. Aunque no ha hecho tanto ruido, en abril de 2025 se lanzó UI-TARS-1.5, un agente multimodal de código abierto capaz de realizar todo tipo de tareas dentro de entornos de escritorio. UI-TARS-1.5 es un agente multimodal diseñado para interactuar con el mundo digital a través de interfaces gráficas, usando la propia pantalla, ratón y teclado.
Venía a manos de Bytedance, empresa tras gigantes como TikTok y uno de los principales jugadores en el desarrollo de la inteligencia artificial en China.
la diferencia. 1.5 es un agente de IA diseñado para usar un ordenador como lo haría una persona. Ve la pantalla, identifica elementos visuales y actúa mediante ratón y teclado.
A diferencia de Moltbot, no ejecuta código ni comandos directamente en el sistema, sino que interactúa con la PC desde fuera, a nivel de interfaz. Es más seguro por diseño, porque no puede romper el sistema ejecutando código arbitrario. Además, razón antes de cada acción, lo que reduce los errores acumulados en tareas largas.
- UI-TARS no controla tu ordenador. Lo usa.
- Moltbot no usa tu computadora. Lo controla.
Qué puedes hacer. UI-TARS interactúa «hablando» con tu ordenador. Es capaz de ejecutar tareas en nuestra interfaz analizando lo que hay en ella.
- Sirve como asistente de programación.
- Puede comportarse como un humano para probar aplicaciones.
- Funciona como tutor para realizar tareas complejas.
- Puede gestionar tareas de escritorio y gestión del PC.
¿Por qué es importante?. La nueva guerra por la IA no se centrará exclusivamente en modelos como Gemini, ChatGPT o Claude: el siguiente paso es lograr una IA local capaz de actuar como un humano, pero con ciertas garantías de seguridad.
Moltbot, UI-TARS, Kimmi K2.5 (también china)… Aunque la IA agéntica suene lejana, la guerra por lograr que forme parte de nuestro día a día lleva años gestándose.
Imagen | Xataka
En Xataka | Estudiar con IA sin pensar no enseña nada: estos consejos pueden servirte para sacar partido y aprender de verdad



