Skip to content

Centre de confiance

Triggerfish applique la sécurité dans du code déterministe sous la couche LLM -- pas dans des prompts que le modèle pourrait ignorer. Chaque décision de politique est prise par du code qui ne peut être influencé par l'injection de prompt, l'ingénierie sociale ou le mauvais comportement du modèle. Consultez la page complète Conception axée sécurité pour l'explication technique détaillée.

Contrôles de sécurité

Ces contrôles sont actifs dans la version actuelle. Chacun est appliqué dans le code, testé en CI et auditable dans le dépôt open source.

ContrôleStatutDescription
Application de politique sous le LLM ACTIVEHuit hooks déterministes interceptent chaque action avant et après le traitement LLM. Le modèle ne peut pas contourner, modifier ou influencer les décisions de sécurité.
Système de classification des données ACTIVEHiérarchie à quatre niveaux (PUBLIC, INTERNAL, CONFIDENTIAL, RESTRICTED) avec application obligatoire du no-write-down.
Suivi du taint de session ACTIVEChaque session suit le plus haut niveau de classification des données consultées. Le taint ne fait que s'élever, jamais diminuer.
Journalisation d'audit immuable ACTIVEToutes les décisions de politique sont journalisées avec le contexte complet. La journalisation d'audit ne peut être désactivée par aucun composant du système.
Isolation des secrets ACTIVEIdentifiants stockés dans le trousseau de clés du système d'exploitation ou le vault. Jamais dans les fichiers de configuration, le stockage, les logs ou le contexte LLM.
Sandboxing des plugins ACTIVELes plugins tiers s'exécutent dans un double sandbox Deno + WASM (Pyodide). Aucun accès réseau non déclaré, aucune exfiltration de données.
Analyse des dépendances ACTIVEAnalyse automatique des vulnérabilités via GitHub Dependabot. Les PR sont ouvertes automatiquement pour les CVE en amont.
Code source ouvert ACTIVEL'architecture de sécurité complète est sous licence Apache 2.0 et auditable publiquement.
Déploiement sur site ACTIVES'exécute entièrement sur votre infrastructure. Aucune dépendance cloud, aucune télémétrie, aucun traitement de données externe.
Chiffrement ACTIVETLS pour toutes les données en transit. Chiffrement au niveau du système d'exploitation au repos. Intégration vault entreprise disponible.
Programme de divulgation responsable ACTIVEProcessus documenté de signalement des vulnérabilités avec des délais de réponse définis. Voir la politique de divulgation.
Image conteneur durcie PLANNEDImages Docker sur base Google Distroless avec quasi-zéro CVE. Analyse automatisée Trivy en CI.

Défense en profondeur -- 13 couches indépendantes

Aucune couche n'est suffisante seule. Si une couche est compromise, les couches restantes continuent à protéger le système.

CoucheNomApplication
01Authentification des canauxIdentité vérifiée par code à l'établissement de session
02Accès aux données tenant compte des permissionsPermissions du système source, pas d'identifiants système
03Suivi du taint de sessionAutomatique, obligatoire, escalade uniquement
04Lignage des donnéesChaîne de provenance complète pour chaque élément de données
05Hooks d'application de politiqueDéterministes, non contournables, journalisés
06MCP GatewayPermissions par outil, classification du serveur
07Sandbox de pluginDouble sandbox Deno + WASM (Pyodide)
08Isolation des secretsTrousseau de clés du système d'exploitation ou vault, sous la couche LLM
09Sandbox des outils de système de fichiersPrison de chemin, classification des chemins, E/S limitées au taint
10Identité et délégation d'agentChaînes de délégation cryptographiques
11Journalisation d'auditNe peut être désactivée
12Prévention SSRFListe de blocage IP + vérifications de résolution DNS
13Contrôle de classification de la mémoireÉcriture à son propre niveau, lecture vers le bas uniquement

Consultez la documentation complète de l'architecture Défense en profondeur.

Pourquoi l'application sous le LLM est importante

La plupart des plateformes d'agent IA appliquent la sécurité via des prompts système -- des instructions au LLM disant « ne partagez pas de données sensibles ». Les attaques d'injection de prompt peuvent outrepasser ces instructions.

Triggerfish adopte une approche différente : le LLM a zéro autorité sur les décisions de sécurité. Toute l'application se fait dans du code déterministe sous la couche LLM. Il n'y a aucun chemin de la sortie du LLM vers la configuration de sécurité. :::

Feuille de route de conformité

Triggerfish est en pré-certification. Notre posture de sécurité est architecturale et vérifiable dans le code source dès aujourd'hui. Les certifications formelles sont prévues dans la feuille de route.

CertificationStatutNotes
SOC 2 Type I PLANNEDCritères de services de confiance Sécurité + Confidentialité
SOC 2 Type II PLANNEDEfficacité soutenue des contrôles sur la période d'observation
HIPAA BAA PLANNEDAccord de partenaire commercial pour les clients du secteur de la santé
ISO 27001 PLANNEDSystème de management de la sécurité de l'information
Test d'intrusion par un tiers PLANNEDÉvaluation de sécurité indépendante
Conformité RGPD PLANNEDArchitecture auto-hébergée avec rétention et suppression configurables

Une note sur la confiance

Le cœur de sécurité est open source sous Apache 2.0. Vous pouvez lire chaque ligne de code d'application de politique, exécuter la suite de tests et vérifier les affirmations vous-même. Les certifications sont prévues dans la feuille de route. :::

Auditer le code source

Le code source complet de Triggerfish est disponible sur github.com/greghavens/triggerfish -- sous licence Apache 2.0.

Signaler une vulnérabilité

Si vous découvrez une vulnérabilité de sécurité, veuillez la signaler via notre Politique de divulgation responsable. N'ouvrez pas d'issues publiques sur GitHub pour les vulnérabilités de sécurité.