Docs

Proxy

Visión general del proxy

El proxy de RenLayer es un proxy inverso en línea que intercepta el tráfico de los agentes, aplica políticas, previene fugas de datos y escribe un rastro de auditoría completo.

El proxy de RenLayer es la capa de aplicación. Es un proxy inverso Rust + Axum situado en la ruta de la petición entre un agente y el proveedor de modelo o API de herramienta upstream. Cada petición y respuesta lo atraviesa, por lo que cada acción es observable y gobernable.

Qué hace el proxy

  • Autentica al agente con una clave de API asignada al tenant.
  • Clasifica la llamada (chat completion, embedding, invocación de herramienta, petición MCP, HTTP arbitrario).
  • Evalúa políticas en orden de prioridad y decide si permitir, marcar o denegar la llamada.
  • Ejecuta detectores DLP sobre prompts y respuestas para detectar PII, secretos, código fuente y datos sensibles definidos a medida.
  • Reenvía el tráfico permitido al upstream configurado y devuelve la respuesta en streaming.
  • Escribe una traza con el cuerpo de la petición, la respuesta, el estado, la latencia, el conteo de tokens y los hallazgos DLP.

Por qué en línea (no asíncrono)

Un proxy de logging que duplica el tráfico hacia un pipeline de análisis puede contarte qué pasó. Un proxy en línea puede contarte qué pasó y evitar que pasen cosas malas. RenLayer es en línea porque:

  • Una política DENY debe impedir realmente la llamada, no solo marcarla después de que el modelo haya respondido.
  • Un bloqueo DLP debe redactar o rechazar antes de que los datos sensibles salgan de tu red.
  • Los límites de tasa deben aplicarse en el momento de la petición para ser exigibles.

El compromiso es la latencia. El proxy añade típicamente entre 5 y 15 ms a una petición cuando las políticas son sencillas y los detectores DLP son basados en patrones; los detectores personalizados pesados pueden incrementar esa cifra. Para llamadas LLM (que ya tardan segundos), esta sobrecarga es despreciable.

Lo que el proxy no hace

  • No entrena ni afina modelos.
  • No almacena pesos de modelos ni mantiene su propio LLM.
  • No reescribe prompts más allá de redactar patrones DLP coincidentes cuando se le configura para hacerlo.

El proxy es un pass-through con políticas y observabilidad. El comportamiento de tu agente no cambia cuando ninguna regla coincide.

Cómo lo ejecutan los operadores

El proxy es un único binario (o contenedor). Depende de:

  • PostgreSQL: compartido con la API de plataforma; usado para datos de tenant, agente, política y traza.
  • Red de salida: para alcanzar los proveedores upstream que llaman tus agentes.

Tres patrones de despliegue son habituales: sidecar, gateway y standalone. Consulta despliegue del proxy.

A dónde ir después

Última actualización: