Sistema de clasificación
El sistema de clasificación de datos es la base del modelo de seguridad de Triggerfish. Cada dato que entra, se mueve a través de, o sale del sistema lleva una etiqueta de clasificación. Estas etiquetas determinan hacia dónde pueden fluir los datos, y más importante aún, hacia dónde no pueden.
Niveles de clasificación
Triggerfish utiliza una única jerarquía ordenada de cuatro niveles para todos los despliegues.
| Nivel | Rango | Descripción | Ejemplos |
|---|---|---|---|
RESTRICTED | 4 (más alto) | Datos más sensibles que requieren máxima protección | Documentos de fusiones y adquisiciones, materiales de junta, PII, cuentas bancarias, historiales médicos |
CONFIDENTIAL | 3 | Información sensible para el negocio o la persona | Datos de CRM, finanzas, registros de RRHH, contratos, registros fiscales |
INTERNAL | 2 | No destinado a compartir externamente | Wikis internas, documentos de equipo, notas personales, contactos |
PUBLIC | 1 (más bajo) | Seguro para cualquier persona | Material de marketing, documentación pública, contenido web general |
La regla de prohibición de escritura descendente
El invariante de seguridad más importante de Triggerfish:
Los datos solo pueden fluir a canales o destinatarios con un nivel de
clasificación igual o superior. Esta es una regla fija: no se puede configurar, anular ni desactivar. El LLM no puede influir en esta decisión. :::
Esto significa:
- Una respuesta que contenga datos
CONFIDENTIALno puede enviarse a un canalPUBLIC - Una sesión con taint
RESTRICTEDno puede enviar a ningún canal por debajo deRESTRICTED - No hay anulación de administrador, ni cláusula de escape empresarial, ni solución alternativa del LLM
Clasificación efectiva
Los canales y los destinatarios tienen niveles de clasificación. Cuando los datos están a punto de salir del sistema, la clasificación efectiva del destino determina lo que se puede enviar:
EFFECTIVE_CLASSIFICATION = min(channel_classification, recipient_classification)La clasificación efectiva es la menor de las dos. Esto significa que un canal de alta clasificación con un destinatario de baja clasificación se trata como de baja clasificación.
| Canal | Destinatario | Efectiva | ¿Puede recibir datos CONFIDENTIAL? |
|---|---|---|---|
INTERNAL | INTERNAL | INTERNAL | No (CONFIDENTIAL > INTERNAL) |
INTERNAL | EXTERNAL | PUBLIC | No |
CONFIDENTIAL | INTERNAL | INTERNAL | No (CONFIDENTIAL > INTERNAL) |
CONFIDENTIAL | EXTERNAL | PUBLIC | No |
RESTRICTED | INTERNAL | INTERNAL | No (CONFIDENTIAL > INTERNAL) |
Reglas de clasificación de canales
Cada tipo de canal tiene reglas específicas para determinar su nivel de clasificación.
Correo electrónico
- Coincidencia de dominio: los mensajes
@empresa.comse clasifican comoINTERNAL - El administrador configura qué dominios son internos
- Los dominios desconocidos o externos se clasifican por defecto como
EXTERNAL - Los destinatarios externos reducen la clasificación efectiva a
PUBLIC
Slack / Teams
- Pertenencia al workspace: los miembros del mismo workspace/tenant son
INTERNAL - Los usuarios externos de Slack Connect se clasifican como
EXTERNAL - Los usuarios invitados se clasifican como
EXTERNAL - La clasificación se deriva de la API de la plataforma, no de la interpretación del LLM
WhatsApp / Telegram / iMessage
- Empresa: los números de teléfono cotejados con la sincronización del directorio de RRHH determinan si son internos o externos
- Personal: todos los destinatarios se clasifican por defecto como
EXTERNAL - Los usuarios pueden marcar contactos de confianza, pero esto no cambia las matemáticas de clasificación; cambia la clasificación del destinatario
WebChat
- Los visitantes de WebChat siempre se clasifican como
PUBLIC(los visitantes nunca se verifican como propietarios) - WebChat está destinado a interacciones de cara al público
CLI
- El canal CLI se ejecuta localmente y se clasifica según el usuario autenticado
- El acceso directo por terminal es normalmente
INTERNALo superior
Fuentes de clasificación de destinatarios
Empresa
- La sincronización de directorio (Okta, Azure AD, Google Workspace) rellena automáticamente las clasificaciones de destinatarios
- Todos los miembros del directorio se clasifican como
INTERNAL - Los invitados y proveedores externos se clasifican como
EXTERNAL - Los administradores pueden anular por contacto o por dominio
Personal
- Predeterminado: todos los destinatarios son
EXTERNAL - Los usuarios reclasifican contactos de confianza mediante indicaciones en el flujo o la aplicación complementaria
- La reclasificación es explícita y se registra
Estados de los canales
Cada canal progresa a través de una máquina de estados antes de poder transportar datos:
| Estado | ¿Puede recibir datos? | ¿Puede enviar datos al contexto del agente? | Descripción |
|---|---|---|---|
UNTRUSTED | No | No | Predeterminado para canales nuevos/desconocidos. Completamente aislado. |
CLASSIFIED | Sí (dentro de la política) | Sí (con clasificación) | Revisado y asignado un nivel de clasificación. |
BLOCKED | No | No | Prohibido explícitamente por el administrador o usuario. |
SEGURIDAD Los canales nuevos siempre se encuentran en el estado
UNTRUSTED. No pueden recibir ningún dato del agente ni enviar datos al contexto del agente. El canal permanece completamente aislado hasta que un administrador (empresa) o el usuario (personal) lo clasifique explícitamente. :::
Cómo interactúa la clasificación con otros sistemas
La clasificación no es una función aislada: impulsa decisiones en toda la plataforma:
| Sistema | Cómo se utiliza la clasificación |
|---|---|
| Taint de sesión | Acceder a datos clasificados eleva la sesión a ese nivel |
| Hooks de políticas | PRE_OUTPUT compara el taint de sesión con la clasificación del destino |
| MCP Gateway | Las respuestas del servidor MCP llevan clasificación que contamina la sesión |
| Linaje de datos | Cada registro de linaje incluye el nivel de clasificación y la razón |
| Notificaciones | El contenido de las notificaciones está sujeto a las mismas reglas |
| Delegación de agentes | El techo de clasificación del agente llamado debe cumplir el taint del llamante |
| Sandbox de plugins | El SDK de plugins auto-clasifica todos los datos emitidos |
