🛡 Cloudflare AI Security Demo

AI Gateway + Guardrails · Workers AI (Llama 3.3 70B)
gateway: demo-oxxo-gw
modelo: @cf/meta/llama-3.3-70b-instruct-fp8-fast
👋 Hola. Soy un asistente empresarial genérico corriendo detrás de Cloudflare AI Gateway con Guardrails activados.

¿Qué hace Guardrails? Llama Guard 3 (integrado en AI Gateway) evalúa cada prompt antes de que llegue al modelo y cada respuesta antes de devolverla. Bloquea 14 categorías de contenido peligroso: PII, prompt injection, jailbreaks, violencia, autolesión, contenido sexual, hate speech, consejo especializado no autorizado y más.

Usa el catálogo de prompts a la derecha para probar casos legítimos (deben pasar) y casos de ataque (deben ser bloqueados con HTTP 403 y badge naranja). También puedes escribir tus propios prompts abajo.

Cada bloqueo se registra en el gateway demo-oxxo-gw con un eventID que puedes inspeccionar en el dashboard.