Sesiones y taint

Las sesiones son la unidad fundamental del estado de conversación en Triggerfish. Cada sesión rastrea de forma independiente un nivel de taint — una marca de agua de clasificación que registra la mayor sensibilidad de los datos accedidos durante la sesión. El taint impulsa las decisiones de salida del motor de políticas: si una sesión tiene taint CONFIDENTIAL, ningún dato de esa sesión puede fluir a un canal clasificado por debajo de CONFIDENTIAL.

Modelo de taint de sesión

Cómo funciona el taint

Cuando una sesión accede a datos con un nivel de clasificación, toda la sesión queda contaminada a ese nivel. El taint sigue tres reglas:

Por conversación: Cada sesión tiene su propio nivel de taint independiente
Solo escalación: El taint puede aumentar, nunca disminuir dentro de una sesión
El reinicio completo limpia todo: El taint Y el historial de conversación se limpian juntos

Escalación de taint: PUBLIC → INTERNAL → CONFIDENTIAL → RESTRICTED. El taint solo puede escalar, nunca disminuir.

SEGURIDAD El taint nunca puede reducirse selectivamente. No hay

mecanismo para "descontaminar" una sesión sin limpiar todo el historial de conversación. Esto previene la filtración de contexto — si la sesión recuerda haber visto datos confidenciales, el taint debe reflejarlo. :::

Por qué el taint no puede disminuir

Incluso si los datos clasificados ya no se muestran, la ventana de contexto del LLM todavía los contiene. El modelo puede referenciar, resumir o repetir información clasificada en respuestas futuras. La única forma segura de reducir el taint es eliminar el contexto por completo — que es exactamente lo que hace un reinicio completo.

Tipos de sesiones

Triggerfish gestiona varios tipos de sesiones, cada uno con seguimiento de taint independiente:

Tipo de sesión	Descripción	Taint inicial	Persiste entre reinicios
Principal	Conversación directa principal con el propietario	`PUBLIC`	Sí
Canal	Una por canal conectado (Telegram, Slack, etc.)	`PUBLIC`	Sí
Segundo plano	Creada para tareas autónomas (cron, webhooks)	`PUBLIC`	Duración de la tarea
Agente	Sesiones por agente para enrutamiento multiagente	`PUBLIC`	Sí
Grupo	Sesiones de chat grupal	`PUBLIC`	Sí

Las sesiones en segundo plano siempre inician con taint PUBLIC,

independientemente del nivel de taint de la sesión padre. Esto es por diseño — los trabajos cron y las tareas disparadas por webhooks no deben heredar el taint de cualquier sesión que las haya generado. :::

Ejemplo de escalación de taint

A continuación se muestra un flujo completo que muestra la escalación de taint y el bloqueo resultante de la política:

Mecanismo de reinicio completo

Un reinicio de sesión es la única forma de reducir el taint. Es una operación deliberada y destructiva:

Archivar registros de linaje — Todos los datos de linaje de la sesión se preservan en el almacenamiento de auditoría
Limpiar historial de conversación — Toda la ventana de contexto se borra
Reiniciar taint a PUBLIC — La sesión inicia de nuevo
Requerir confirmación del usuario — El hook SESSION_RESET requiere confirmación explícita antes de ejecutarse

Después de un reinicio, la sesión es indistinguible de una sesión nueva. El agente no tiene memoria de la conversación anterior. Esta es la única forma de garantizar que los datos clasificados no se filtren a través del contexto del LLM.

Comunicación entre sesiones

Cuando un agente envía datos entre sesiones usando sessions_send, se aplican las mismas reglas de no write-down:

Taint de sesión origen	Canal de sesión destino	Decisión
`PUBLIC`	Canal `PUBLIC`	ALLOW
`CONFIDENTIAL`	Canal `CONFIDENTIAL`	ALLOW
`CONFIDENTIAL`	Canal `PUBLIC`	BLOCK
`RESTRICTED`	Canal `CONFIDENTIAL`	BLOCK

Herramientas de sesión disponibles para el agente:

Herramienta	Descripción	Impacto en el taint
`sessions_list`	Listar sesiones activas con filtros	Sin cambio de taint
`sessions_history`	Obtener transcripción de una sesión	El taint hereda de la sesión referenciada
`sessions_send`	Enviar mensaje a otra sesión	Sujeto a verificación de write-down
`sessions_spawn`	Crear sesión de tarea en segundo plano	La nueva sesión inicia en `PUBLIC`
`session_status`	Verificar estado actual y metadatos de sesión	Sin cambio de taint

Linaje de datos

Cada elemento de datos procesado por Triggerfish lleva metadatos de procedencia — un registro completo de dónde vienen los datos, cómo se transformaron y a dónde fueron. El linaje es la pista de auditoría que hace verificables las decisiones de clasificación.

Estructura del registro de linaje

json

{
  "lineage_id": "lin_789xyz",
  "content_hash": "sha256:a1b2c3d4...",
  "origin": {
    "source_type": "integration",
    "source_name": "salesforce",
    "record_id": "opp_00123ABC",
    "record_type": "Opportunity",
    "accessed_at": "2025-01-29T10:23:45Z",
    "accessed_by": "user_456",
    "access_method": "plugin_query"
  },
  "classification": {
    "level": "CONFIDENTIAL",
    "reason": "source_system_default",
    "assigned_at": "2025-01-29T10:23:45Z",
    "can_be_downgraded": false
  },
  "transformations": [
    {
      "type": "extraction",
      "description": "Selected fields: name, amount, stage",
      "timestamp": "2025-01-29T10:23:46Z",
      "agent_id": "agent_123"
    },
    {
      "type": "summarization",
      "description": "LLM summarized 3 records into pipeline overview",
      "timestamp": "2025-01-29T10:23:47Z",
      "input_lineage_ids": ["lin_789xyz", "lin_790xyz", "lin_791xyz"],
      "agent_id": "agent_123"
    }
  ],
  "current_location": {
    "session_id": "sess_456",
    "context_position": "assistant_response_3"
  }
}

Reglas de seguimiento de linaje

Evento	Acción de linaje
Datos leídos desde una integración	Crear registro de linaje con origen
Datos transformados por el LLM	Agregar transformación, vincular linajes de entrada
Datos agregados de múltiples fuentes	Fusionar linaje, clasificación = `max(entradas)`
Datos enviados a un canal	Registrar destino, verificar clasificación
Reinicio de sesión	Archivar registros de linaje, limpiar del contexto

Clasificación de agregación

Cuando se combinan datos de múltiples fuentes (p. ej., un resumen del LLM de registros de diferentes integraciones), el resultado agregado hereda la clasificación máxima de todas las entradas:

Entrada 1: INTERNAL    (wiki interna)
Entrada 2: CONFIDENTIAL (registro de Salesforce)
Entrada 3: PUBLIC      (API del clima)

Clasificación del resultado agregado: CONFIDENTIAL (máximo de las entradas)

Los despliegues empresariales pueden configurar reglas opcionales de

degradación para agregados estadísticos (promedios, conteos, sumas de más de 10 registros) o datos anonimizados certificados. Todas las degradaciones requieren reglas de políticas explícitas, se registran con justificación completa y están sujetas a revisión de auditoría. :::

Capacidades de auditoría

El linaje habilita cuatro categorías de consultas de auditoría:

Rastreo hacia adelante: "¿Qué pasó con los datos del registro X de Salesforce?" — sigue los datos hacia adelante desde el origen a todos los destinos
Rastreo hacia atrás: "¿Qué fuentes contribuyeron a esta salida?" — rastrea una salida de vuelta a todos sus registros fuente
Justificación de clasificación: "¿Por qué esto está marcado como CONFIDENTIAL?" — muestra la cadena de razones de clasificación
Exportación de cumplimiento: Cadena completa de custodia para revisión legal o regulatoria

Persistencia del taint

El taint de sesión se persiste a través del StorageProvider bajo el espacio de nombres taint:. Esto significa que el taint sobrevive a reinicios del daemon — una sesión que era CONFIDENTIAL antes de un reinicio sigue siendo CONFIDENTIAL después.

Los registros de linaje se persisten bajo el espacio de nombres lineage: con retención orientada al cumplimiento (90 días predeterminados).

Sesiones y taint ​

Modelo de taint de sesión ​

Cómo funciona el taint ​

Por qué el taint no puede disminuir ​

Tipos de sesiones ​

Ejemplo de escalación de taint ​

Mecanismo de reinicio completo ​

Comunicación entre sesiones ​

Linaje de datos ​

Estructura del registro de linaje ​

Reglas de seguimiento de linaje ​

Clasificación de agregación ​

Capacidades de auditoría ​

Persistencia del taint ​