Close Menu
LISTIN DIARIO – RD EN VIVO Noticia de ultimo minutoLISTIN DIARIO – RD EN VIVO Noticia de ultimo minuto

    Subscribe to Updates

    Get the latest creative news from FooBar about art, design and business.

    What's Hot

    Someten una consulta reforma sobre emisiones contaminantes

    2 de mayo de 2026

    Los One vs. Sr. Jiménez en Planeta Alofoke

    2 de mayo de 2026

    Gasolina y gasoil premium suben RD$9 y los tipo regular aumentan RD$7 – El Nuevo Diario (República Dominicana)

    2 de mayo de 2026
    Facebook X (Twitter) Instagram
    • Sobre Nosotros
    • Contáctanos
    Facebook X (Twitter) Instagram Pinterest Vimeo
    LISTIN DIARIO – RD EN VIVO Noticia de ultimo minutoLISTIN DIARIO – RD EN VIVO Noticia de ultimo minuto
    • Home
    • Deportes
    • Economía
    • Entretenimiento
    • Internacionales
    • Nacionales
    • Política
    • Salud
    • Tecnología
    LISTIN DIARIO – RD EN VIVO Noticia de ultimo minutoLISTIN DIARIO – RD EN VIVO Noticia de ultimo minuto
    Home»Tecnología»el “GPS” que ayuda a los agentes de IA a elegir el mejor camino entre respuestas de un LLM
    Tecnología

    el “GPS” que ayuda a los agentes de IA a elegir el mejor camino entre respuestas de un LLM

    LISTIN DIARIO NOTICIA DE HOYBy LISTIN DIARIO NOTICIA DE HOY7 de febrero de 2026No hay comentarios8 Mins Read
    Share Facebook Twitter Pinterest LinkedIn Tumblr Reddit Telegram Email
    Ilustración surrealista que representa a un agente de inteligencia artificial escribiendo código con un flujo creativo onírico
    Share
    Facebook Twitter LinkedIn Pinterest Email

    Los agentes de IA se han convertido en ese compañero de oficina que no se cansa: puede revisar documentos, traducir código, preparar informes o encadenar pasos para completar una tarea de principio a fin. Muchos de estos agentes se apoyan en modelos de lenguaje grandes (LLM) porque son rápidos, flexibles y se adaptan a instrucciones variadas. El problema aparece cuando el agente llega a una parte delicada del trabajo y el LLM “patina”: una salida incorrecta, un detalle inventado, un cambio que rompe una prueba.

    Si el agente estaba traduciendo una base de código archivo por archivo, un error pequeño puede comportarse como una ficha de dominó: compila mal, se rompen pruebas, se ataca el flujo. Lo que uno querría, de forma bastante humana, es que el sistema reconociera el tropiezo, volviera a un punto anterior y lo intentara de nuevo con lo aprendido. En la práctica, programar ese “volver atrás” suele ser un castigo: obliga a agregar lógica de control, registros, condiciones, reintentos y rutas alternativas, a veces con un volumen de cambios comparable al del propio agente.

    EnCompass: separar el guion de la búsqueda

    Investigadores de MIT CSAIL y la empresa Asari AI propone una solución con nombre de brújula: Abarcar. La idea central es elegante: permitir que el programador escriba el flujo de trabajo del agente como siempre (el “guion”), y que la búsqueda de soluciones —reintentos, exploración de alternativas, retrocesos— se gestiona como una capa aparte.

    En términos cotidianos, es como cocinar siguiendo una receta sin tener que reescribirla cada vez que algo sale mal; EnCompass sería el ayudante que, si la salsa se corta, vuelve al paso donde se incorporó el aceite, prueba otra técnica y conserva la versión que funciona. Según explica el autor principal zhening liestudiante de doctorado en EECS e investigador en CSAIL, el framework permite “separar la estrategia de búsqueda del flujo subyacente” para que los programadores experimenten con distintos enfoques y encuentren el que mejor rendimiento da.

    Backtracking y “clones”: probar varios caminos sin romper tu programa

    Dos conceptos sostienen la mecánica de EnCompass. El primero es el retroceder: cuando el LLM comete un error, el sistema puede retroceder a un punto anterior y lanzar un nuevo intento, incorporando señales de que la ruta previa no funcionó. El segundo es la clonación del estado de ejecución: EnCompass puede crear “copias” del runtime para probar alternativas en paralelo.

    La metáfora aquí es potente: imagina que envías a varias versiones de ti mismo a resolver el mismo problema con enfoques distintos. Una prueba una solución conservadora, otra arriesga con un cambio más agresivo, otra revisa la documentación. Luego comparas resultados y te quedadas con el mejor. Esa es la promesa práctica de EnCompass: explorar el espacio de salidas posibles de los LLM sin obligarte a convertir tu agente en un laberinto de if/else, reintentos manuales y estados difíciles de depurar.

    Puntos de ramificación: del relato lineal al “elige tu propia aventura”

    Para que el sistema sepa dónde tiene sentido bifurcar y dónde conviene retroceder, EnCompass introduce anotaciones llamadas puntos de bifurcación. El programador marca operaciones cuyo resultado puede variar —típicamente llamadas al LLM— y señala qué información conviene registrar para evaluar si un paso salió bien.

    Aquí encaja la comparación con un libro de “elige tu propia aventura”. Un agente tradicional sigue una trama única: paso 1, paso 2, paso 3. Con puntos de bifurcaciónel mismo programa se convierte en un árbol de historias posibles: si el LLM devuelve A, el agente sigue un camino; si devuelve B, toma otro. La diferencia es que EnCompass no se limita a aceptar el primer desenlace: usa una estrategia de búsqueda para recorrer ese árbol y encontrar el final más sólido.

    Estrategias de búsqueda enchufables: del haz de búsqueda en Monte Carlo Tree Search

    El detalle interesante es que EnCompass no impone una única forma de “buscar”. Ofrece estrategias comunes listas para usar y deja la puerta abierta a crear estrategias personalizadas. Entre las mencionadas por el equipo figuran búsqueda de haz y Búsqueda de árboles de Montecarlo (MCTS).

    En cristiano: búsqueda de haz funciona como si llevaras varias opciones “finalistas” a la vez; en cada paso, conservas un número limitado de las mejores rutas y descartas el resto. Es útil cuando quieres diversidad controlada sin disparar el coste. MCTSpor su parte, mezcla exploración y explotación: prueba caminos nuevos, refuerza los prometedores y va construyendo un árbol de decisiones con probabilidades, parecido a cómo un jugador evalúa jugadas en un tablero cuando no puede calcularlo todo. EnCompass hace que cambiar de enfoque sea una decisión de configuración y no una reescritura del agente.

    Resultados: menos líneas de código y más margen para confirmar

    El equipo probó EnCompass con agentes programados en Pitón que invocan LLMs y reporta un ahorro notable de implementación. La cifra que más llama la atención es la reducción de esfuerzo para añadir búsqueda: hasta un 80% menos de trabajo de codificación en varios agentes, según sus mediciones.

    El ejemplo más concreto se centra en un agente que traduce un repositorio de Java y Python. Implementar a mano la lógica de búsqueda implicaba un volumen de cambios considerable; con EnCompass, la instrumentación se concentra en añadir puntos de bifurcación y registrador de señales de calidad. El resultado cuantificado por los investigadores: 348 líneas menoslo que equivale a un recorte de alrededor del 82% frente a la versión manual.

    Luego está la parte que a muchos equipos les importa incluso más que el ahorro de líneas: el rendimiento. Al probar distintas estrategias, identificaron como opción ganadora una variante de búsqueda por haz de dos nivelescon mejoras de precisión del 15% al ​​40% en cinco repositorios, usando un presupuesto de búsqueda que multiplicaba por 16 las llamadas al LLM respecto a ejecutar el agente sin búsqueda. Traducido a una imagen cotidiana: si antes preguntabas una vez y aceptabas la primera respuesta, ahora preguntas varias veces, comparas y te quedadas con la mejor, con un costo controlado y una mecánica más sistemática.

    Dónde encaja (y dónde no): agentes guiados por programa frente a agentes “a la deriva”

    EnCompass apunta a un tipo de agente muy común en entornos profesionales: aquel en el que existe un flujo programático claro, y el LLM se utiliza en puntos concretos como motor de traducción, síntesis o generación. Ahí el framework brilla porque “engancha” la búsqueda al programa: el agente tiene estructura, y la búsqueda explora alternativas dentro de esa estructura.

    El propio Li matiza un límite importante: esta versión es menos aplicable a agentes controlados por completo por un LLM, donde no hay un flujo predefinido y el modelo decide qué hacer en cada paso sobre la marcha. Si el LLM es el director, el guionista y el actor improvisando en tiempo real, hay menos “puntos estables” del programa donde insertar retroceder y clonación de ejecución. En este escenario, las técnicas de búsqueda suelen aplicarse directamente a la inferencia del modelo, no a la ejecución de un flujo de trabajo.

    Qué significa para el día a día de programar con IA

    Detrás de EnCompass hay una lectura práctica de algo que muchos equipos ya han vivido: los LLM son útiles, pero su confiabilidad no se consigue pidiéndoles “por favor que no se equivoquen”. Se consigue diseñando sistemas que asumen el error como parte del proceso y lo gestionan con mecanismos parecidos a los que usamos los humanos: repetir, comparar, retroceder, probar otra vía.

    El coautor Armando Solar Lezamaprofesor de EECS e investigador principal en CSAIL, lo enmarca como una necesidad creciente: a medida que los LLM se vuelven piezas habituales del software, se vuelve crítico construir sistemas que aprovechen sus fortalezas y rodeen sus limitaciones. Desde fuera del proyecto, Yiming Yangprofesora en Carnegie Mellon, destaca el valor de la abstracción: separar lógica del agente y estrategia de búsqueda ofrece una vía más “principiada” para mejorar tareas como generación, traducción y análisis de código.

    Próximos pasos: tareas más grandes y colaboración humano-agente

    El trabajo se presentó en NeurIPS en diciembre, y el equipo plantea extender EnCompass hacia marcos de búsqueda más generales y probarlo en tareas más complejas, con foco en usos reales en empresas. También quieren evaluar cómo ayuda cuando el agente colabora con personas, por ejemplo al idear diseños de hardware o al traducir bibliotecas de código mucho más extensas. En el artículo del MIT se menciona la ambición de apuntar a retos de gran escala, desde gestionar enormes bases de código hasta ayudar a planificar experimentos científicos o diseñar componentes de hardware.

    Si esa línea madura, EnCompass podría terminar siendo para los agentes de IA lo que los buenos sistemas de control de versiones fueron para el desarrollo: no “evitan” los errores, pero convierte el proceso de corregirlos y elige el mejor camino en algo repetible, medible y menos doloroso.

    Comparte esto:

    • Haz clic para compartir en Facebook (Se abre en una ventana nueva) Facebook
    • Haz clic para compartir en X (Se abre en una ventana nueva) X

    Me gusta esto:

    Me gusta Cargando...

    Relacionado

    agentes ayuda camino elegir entre GPS LLM los mejor respuestas
    Share. Facebook Twitter Pinterest LinkedIn Tumblr Email
    Previous ArticleDesafío Siglo XXI, resumen capítulo 131: estos son los 8 semifinalistas ¿Quiénes salieron?
    Next Article Consejo de transición de Haití finaliza su mandato entre dudas
    LISTIN DIARIO NOTICIA DE HOY
    • Website

    Related Posts

    Nacionales

    Los One vs. Sr. Jiménez en Planeta Alofoke

    2 de mayo de 2026
    Política

    Gasolina y gasoil premium suben RD$9 y los tipo regular aumentan RD$7 – El Nuevo Diario (República Dominicana)

    2 de mayo de 2026
    Política

    Así son los carteles electorales de los principales partidos en las elecciones en Andalucía.

    1 de mayo de 2026
    Add A Comment

    Deja un comentarioCancelar respuesta

    Our Picks

    Someten una consulta reforma sobre emisiones contaminantes

    2 de mayo de 2026

    Los One vs. Sr. Jiménez en Planeta Alofoke

    2 de mayo de 2026

    Gasolina y gasoil premium suben RD$9 y los tipo regular aumentan RD$7 – El Nuevo Diario (República Dominicana)

    2 de mayo de 2026

    Inversión y conducta – El Nuevo Diario (República Dominicana)

    2 de mayo de 2026
    Stay In Touch
    • Facebook
    • Twitter
    • Pinterest
    • Instagram
    • YouTube
    • Vimeo

    Subscribe to Updates

    Get the latest creative news from SmartMag about art & design.

    Top Posts

    La identidad de las víctimas de feminicidio en Bosa: una madre y sus hijas de 17 y 20 años.

    24 de marzo de 202669 Views

    Mujer encontrada sin vida en Sabana Iglesia tras recibir llamada

    29 de marzo de 202643 Views

    Facultades y obligaciones de los órganos auxiliares en el Nuevo Código Procesal Penal – El Nuevo Diario (República Dominicana)

    19 de diciembre de 202524 Views
    About Us

    Listindiario es tu fuente confiable de noticias en la República Dominicana. Nos dedicamos a ofrecer información actual, precisa y relevante en categorías como Política, Economía, Deportes, Tecnología, Salud, Internacionales y Entretenimiento. Nuestro equipo de periodistas y colaboradores trabaja constantemente para mantenerte informado y conectado con los acontecimientos más importantes del país y del mundo.

    Our Picks

    Someten una consulta reforma sobre emisiones contaminantes

    2 de mayo de 2026

    Los One vs. Sr. Jiménez en Planeta Alofoke

    2 de mayo de 2026

    Gasolina y gasoil premium suben RD$9 y los tipo regular aumentan RD$7 – El Nuevo Diario (República Dominicana)

    2 de mayo de 2026

    Subscribe to Updates

    Get the latest creative news from FooBar about art, design and business.

    LISTIN DIARIO – RD EN VIVO Noticia de ultimo minuto
    Facebook X (Twitter) Instagram Pinterest
    • Sobre Nosotros
    • Contáctanos
    • Términos y Condiciones
    • Aviso Legal
    • Política de Privacidad

    © 2025 listindiario.es All rights reserved. Designed by DD.

    Type above and press Enter to search. Press Esc to cancel.

    %d