Centro de confianza

Triggerfish aplica la seguridad en código determinístico por debajo de la capa del LLM — no en prompts que el modelo podría ignorar. Cada decisión de política la toma código que no puede ser influenciado por prompt injection, ingeniería social o mal comportamiento del modelo. Consulte la página completa de Diseño con seguridad primero para la explicación técnica detallada.

Controles de seguridad

Estos controles están activos en la versión actual. Cada uno se aplica en código, se prueba en CI y es auditable en el repositorio de código abierto.

Control	Estado	Descripción
Aplicación de políticas sub-LLM	ACTIVE	Ocho hooks determinísticos interceptan cada acción antes y después del procesamiento del LLM. El modelo no puede eludir, modificar ni influir en las decisiones de seguridad.
Sistema de clasificación de datos	ACTIVE	Jerarquía de cuatro niveles (PUBLIC, INTERNAL, CONFIDENTIAL, RESTRICTED) con aplicación obligatoria de no write-down.
Seguimiento de taint de sesión	ACTIVE	Cada sesión rastrea la clasificación más alta de datos accedidos. El taint solo escala, nunca disminuye.
Registro de auditoría inmutable	ACTIVE	Todas las decisiones de políticas se registran con contexto completo. El registro de auditoría no puede ser deshabilitado por ningún componente del sistema.
Aislamiento de secretos	ACTIVE	Credenciales almacenadas en llavero del SO o vault. Nunca en archivos de configuración, almacenamiento, registros ni contexto del LLM.
Sandboxing de plugins	ACTIVE	Los plugins de terceros se ejecutan en un doble sandbox Deno + WASM (Pyodide). Sin acceso de red no declarado, sin exfiltración de datos.
Escaneo de dependencias	ACTIVE	Escaneo automatizado de vulnerabilidades vía GitHub Dependabot. PRs abiertos automáticamente para CVEs upstream.
Código fuente abierto	ACTIVE	La arquitectura de seguridad completa tiene licencia Apache 2.0 y es auditable públicamente.
Despliegue en infraestructura propia	ACTIVE	Se ejecuta completamente en su infraestructura. Sin dependencia de la nube, sin telemetría, sin procesamiento externo de datos.
Cifrado	ACTIVE	TLS para todos los datos en tránsito. Cifrado a nivel de SO en reposo. Integración con vault empresarial disponible.
Programa de divulgación responsable	ACTIVE	Proceso documentado de reporte de vulnerabilidades con tiempos de respuesta definidos. Ver política de divulgación.
Imagen de contenedor endurecida	PLANNED	Imágenes Docker sobre base Google Distroless con CVEs cercanos a cero. Escaneo automatizado con Trivy en CI.

Defensa en profundidad — 13 capas independientes

Ninguna capa es suficiente por sí sola. Si una capa se ve comprometida, las capas restantes continúan protegiendo el sistema.

Capa	Nombre	Aplicación
01	Autenticación de canales	Identidad verificada por código al establecer la sesión
02	Acceso a datos con permisos	Permisos del sistema fuente, no credenciales del sistema
03	Seguimiento de taint de sesión	Automático, obligatorio, solo escalación
04	Linaje de datos	Cadena completa de procedencia para cada elemento
05	Hooks de aplicación de políticas	Determinísticos, no eludibles, registrados
06	MCP Gateway	Permisos por herramienta, clasificación de servidor
07	Sandbox de plugins	Doble sandbox Deno + WASM (Pyodide)
08	Aislamiento de secretos	Llavero del SO o vault, por debajo de la capa del LLM
09	Sandbox de herramientas del sistema de archivos	Jaula de rutas, clasificación de rutas, E/S limitada por taint
10	Identidad y delegación de agentes	Cadenas de delegación criptográficas
11	Registro de auditoría	No puede deshabilitarse
12	Prevención de SSRF	Lista de denegación de IPs + verificaciones de resolución DNS
13	Control de clasificación de memoria	Escritura a su propio nivel, lectura solo hacia abajo

Lea la documentación completa de arquitectura de Defensa en profundidad.

Por qué importa la aplicación sub-LLM

La mayoría de las plataformas de agentes de IA aplican la seguridad a

través de prompts del sistema — instrucciones al LLM que dicen "no compartas datos sensibles". Los ataques de prompt injection pueden anular estas instrucciones.

Triggerfish toma un enfoque diferente: el LLM tiene cero autoridad sobre las decisiones de seguridad. Toda la aplicación ocurre en código determinístico por debajo de la capa del LLM. No hay ruta desde la salida del LLM a la configuración de seguridad. :::

Hoja de ruta de cumplimiento

Triggerfish está en estado de pre-certificación. Nuestra postura de seguridad es arquitectónica y verificable en el código fuente hoy. Las certificaciones formales están en la hoja de ruta.

Certificación	Estado	Notas
SOC 2 Tipo I	PLANNED	Criterios de servicios de confianza de Seguridad + Confidencialidad
SOC 2 Tipo II	PLANNED	Efectividad sostenida de controles durante período de observación
BAA HIPAA	PLANNED	Acuerdo de asociado de negocios para clientes de salud
ISO 27001	PLANNED	Sistema de gestión de seguridad de la información
Prueba de penetración de terceros	PLANNED	Evaluación de seguridad independiente
Cumplimiento GDPR	PLANNED	Arquitectura autohospedada con retención y eliminación configurables

Una nota sobre la confianza

El núcleo de seguridad es de código abierto bajo Apache 2.0. Puede leer

cada línea de código de aplicación de políticas, ejecutar la suite de tests y verificar las afirmaciones usted mismo. Las certificaciones están en la hoja de ruta. :::

Audite el código fuente

El código fuente completo de Triggerfish está disponible en github.com/greghavens/triggerfish — con licencia Apache 2.0.

Reporte de vulnerabilidades

Si descubre una vulnerabilidad de seguridad, repórtela a través de nuestra Política de divulgación responsable. No abra issues públicos en GitHub para vulnerabilidades de seguridad.

Centro de confianza ​

Controles de seguridad ​

Defensa en profundidad — 13 capas independientes ​

Por qué importa la aplicación sub-LLM ​

Hoja de ruta de cumplimiento ​

Una nota sobre la confianza ​

Audite el código fuente ​

Reporte de vulnerabilidades ​