Volver al blog

Artículo técnico

Cómo Elastra resuelve contexto adaptativo para agentes de IA sin convertir cada tarea en descubrimiento amplio del repositorio

Un artículo técnico sobre cómo Elastra clasifica el tipo de tarea, limita la exploración y orquesta el contexto para que los agentes de IA se mantengan precisos en tareas estrechas sin perder profundidad en trabajo arquitectónico amplio.

2026-05-1514 minIngeniería de contexto para agentes de IA

La mayoría de las stacks de agentes aún asumen que más contexto recuperado es automáticamente mejor. Elastra sigue otro camino: clasifica primero la tarea y luego ajusta contexto, exploración y uso de modelos alrededor de ese task shape. El resultado es menor coste en trabajo localizado del repositorio, profundidad preservada en análisis arquitectónico y una orquestación multi-modelo mucho mejor.

Público objetivo
Equipos de plataforma, staff engineers, equipos de AI tooling, líderes de ingeniería y builders avanzados que quieren agentes de coding útiles, predecibles y eficientes en coste en repositorios reales.
Objetivo
Explicar cómo Elastra convierte la resolución de contexto sensible al prompt en comportamiento bounded del agente, por qué eso importa para la eficiencia de tokens y la latencia, y cómo el adaptive scoping mejora tanto la ejecución estrecha como el análisis arquitectónico amplio.

Puntos clave

  • Elastra trata el contexto como un problema de alcance de ejecución, y no solo como un problema de retrieval.
  • El task shape importa porque las tareas estrechas en el repositorio y las tareas arquitectónicas amplias necesitan políticas de contexto diferentes.
  • El adaptive scoping también mejora la asignación de coste multi-modelo al permitir que modelos baratos hagan discovery bounded y modelos más fuertes se enfoquen en síntesis.

Por qué el retrieval cambia el comportamiento del agente

En sistemas agentic, el retrieval no es pasivo. La cantidad y la forma de la evidencia enviada al modelo cambian lo que el agente cree que debe hacer a continuación.

Si el payload parece amplio, el agente suele comportarse de forma amplia. Empieza a validar patrones hermanos, confirmar supuestos arquitectónicos y abrir caminos de exploración que pueden ser innecesarios para la tarea en cuestión.

  • Las tareas estrechas no deberían convertirse en descubrimiento amplio del repositorio.
  • Las tareas amplias aún deben preservar profundidad arquitectónica.
  • El problema de control no es solo la calidad del retrieval. Es la ramificación conductual después del retrieval.

Scoping orientado a la tarea en lugar de una política única de retrieval

Elastra primero pregunta qué tipo de tarea es esta y luego ajusta amplitud de contexto, profundidad de exploración y presupuesto de ejecución alrededor de esa respuesta.

Por eso el mismo repositorio puede soportar tanto correcciones localizadas de bugs como análisis arquitectónico amplio sin forzar ambos casos al mismo modo operativo costoso.

  • `localized_pr_analysis`
  • `targeted_bugfix`
  • `implementation_multifile`
  • `architectural_analysis`
  • `open_discovery`

Perfiles de ejecución: presupuesto, modo de exploración y ancho de alcance

Una vez conocido el task shape, Elastra adjunta un perfil de ejecución que orienta hasta dónde debe llegar el agente.

Las tareas estrechas favorecen exploración bounded, presupuestos pequeños, pocos hops cross-service y una fuerte preferencia por archivos cambiados y evidencia directa. Las tareas amplias preservan presupuestos mayores y una mayor capacidad de tracing.

Por qué adaptive context resolution mejora la orquestación multi-modelo

El adaptive scoping no solo reduce el desperdicio de retrieval. Ayuda a la stack a decidir dónde gastar razonamiento caro y dónde usar descubrimiento más barato.

Un ejemplo práctico es un workflow centrado en Claude en el que Kimi se usa para discovery bounded y Sonnet se usa para implementación o síntesis de mayor valor. Cuando la etapa de discovery está bien delimitada, el modelo premium gasta su presupuesto en la parte de la tarea que realmente se beneficia de ello.

  • Los modelos más baratos manejan discovery bounded y enrutamiento inicial.
  • Los modelos más fuertes se enfocan en implementación, síntesis y explicación final fundamentada.
  • El coste total baja porque el modelo premium recibe evidencia más estrecha y más limpia.

De context shaping a execution shaping

La versión de largo plazo más fuerte de esta arquitectura no es solo context-aware. Es execution-aware.

Eso significa que la misma policy que moldea el retrieval también puede moldear branching, delegación, verificación y los límites prácticos de exploración después de que llega el contexto.

Por qué esto importa para los equipos de ingeniería

Gran parte de la infraestructura de ingeniería con IA todavía trata el contexto como un adjunto estático al prompt. Elastra trata el contexto como un contrato operativo gobernado.

Esa distinción es lo que permite que las tareas estrechas sigan siendo estrechas, las tareas amplias sigan siendo profundas y el uso de modelos siga siendo económicamente racional al mismo tiempo.

Adaptive context resolution no es un truco de retrieval. Es el mecanismo operativo que convierte el contexto del repositorio en comportamiento bounded, sensible a la tarea y económicamente racional para agentes.