👋 Hola. Soy un asistente empresarial genérico corriendo detrás de Cloudflare AI Gateway con Guardrails activados.
¿Qué hace Guardrails? Llama Guard 3 (integrado en AI Gateway) evalúa cada prompt antes de que llegue al modelo y cada respuesta antes de devolverla. Bloquea 14 categorías de contenido peligroso: PII, prompt injection, jailbreaks, violencia, autolesión, contenido sexual, hate speech, consejo especializado no autorizado y más.
Usa el catálogo de prompts a la derecha para probar casos legítimos (deben pasar) y casos de ataque (deben ser bloqueados con HTTP 403 y badge naranja). También puedes escribir tus propios prompts abajo.
Cada bloqueo se registra en el gateway
¿Qué hace Guardrails? Llama Guard 3 (integrado en AI Gateway) evalúa cada prompt antes de que llegue al modelo y cada respuesta antes de devolverla. Bloquea 14 categorías de contenido peligroso: PII, prompt injection, jailbreaks, violencia, autolesión, contenido sexual, hate speech, consejo especializado no autorizado y más.
Usa el catálogo de prompts a la derecha para probar casos legítimos (deben pasar) y casos de ataque (deben ser bloqueados con HTTP 403 y badge naranja). También puedes escribir tus propios prompts abajo.
Cada bloqueo se registra en el gateway
demo-oxxo-gw con un eventID que puedes inspeccionar en el dashboard.