Introducción
En sistemas multiagente, la orquestación de llamados a LLMs es crucial para coordinar la comunicación entre agentes y garantizar respuestas coherentes y eficientes.
Patrones de Orquestación
1. Orquestador Central (Hub and Spoke)
Un agente central coordina todos los llamados y distribuye tareas a agentes especializados.
graph TD
O[Orquestador] --> A1[Agente Análisis]
O --> A2[Agente Síntesis]
O --> A3[Agente Validación]
A1 --> O
A2 --> O
A3 --> O
Ventajas:
- Control centralizado del flujo
- Fácil de debuggear
- Punto único de logging
Desventajas:
- Cuello de botella potencial
- Single point of failure
2. Pipeline Secuencial
Los agentes procesan la información en secuencia, cada uno añadiendo valor.
graph LR
Input[Input] --> A1[Extracción]
A1 --> A2[Análisis]
A2 --> A3[Síntesis]
A3 --> Output[Output]
Casos de uso:
- Procesamiento de documentos
- Pipelines de ETL con IA
- Refinamiento iterativo de respuestas
3. Routing Dinámico
Un router decide qué agente debe manejar cada request basándose en el contenido.
graph TD
R[Router] -->|técnico| T[Agente Técnico]
R -->|legal| L[Agente Legal]
R -->|general| G[Agente General]
Estrategias de Manejo de Errores
Retry con Backoff Exponencial
Fallback a Modelo Alternativo
Si el modelo principal falla, usar uno de respaldo con capacidades similares.
Consideraciones de Latencia
| Estrategia | Latencia | Costo | Complejidad |
|---|---|---|---|
| Secuencial | Alta | Bajo | Baja |
| Paralelo | Baja | Alto | Media |
| Híbrido | Media | Medio | Alta |