Skip to content

Trust Center

Triggerfish handhaaft beveiliging in deterministische code onder de LLM-laag — niet in prompts die het model mogelijk negeert. Elke beleidsbeslissing wordt genomen door code die niet kan worden beïnvloed door prompt-injectie, social engineering of modelwangedrag. Zie de volledige pagina Beveiligingsgericht ontwerp voor de diepgaande technische uitleg.

Beveiligingscontroles

Deze controles zijn actief in de huidige release. Elk wordt afgedwongen in code, getest in CI en auditeerbaar in de open-source repository.

ControleStatusBeschrijving
Sub-LLM beleidshandhaving ACTIVEAcht deterministische hooks onderscheppen elke actie voor en na LLM-verwerking. Het model kan beveiligingsbeslissingen niet omzeilen, wijzigen of beïnvloeden.
Gegevensclassificatiesysteem ACTIVEVierniveauhiërarchie (PUBLIC, INTERNAL, CONFIDENTIAL, RESTRICTED) met verplichte no-write-down-handhaving.
Sessie-taint-tracking ACTIVEElke sessie houdt de hoogste classificatie bij van benaderde gegevens. Taint escaleert alleen, neemt nooit af.
Onveranderlijke auditlogging ACTIVEAlle beleidsbeslissingen vastgelegd met volledige context. Auditlogging kan niet worden uitgeschakeld door een component van het systeem.
Geheimenisolatie ACTIVEInloggegevens opgeslagen in OS-sleutelhanger of vault. Nooit in configuratiebestanden, opslag, logboeken of LLM-context.
Plugin-sandbox ACTIVEPlugins van derden draaien in een Deno + WASM dubbele sandbox (Pyodide). Geen niet-verklaarde netwerktoegang, geen gegevensexfiltratie.
Afhankelijkheidsscanning ACTIVEGeautomatiseerde kwetsbaarheidsscan via GitHub Dependabot. PR's worden automatisch geopend voor upstream-CVE's.
Open-source codebase ACTIVEVolledige beveiligingsarchitectuur is Apache 2.0-gelicentieerd en publiekelijk auditeerbaar.
On-premises implementatie ACTIVEDraait volledig op uw infrastructuur. Geen cloudafhankelijkheid, geen telemetrie, geen externe gegevensverwerking.
Versleuteling ACTIVETLS voor alle gegevens in transit. Versleuteling op OS-niveau in rust. Enterprise-vaultintegratie beschikbaar.
Responsible Disclosure-programma ACTIVEGedocumenteerd kwetsbaarheidsrapportageproces met gedefinieerde reactietijdlijnen. Zie openbaarmakingsbeleid.
Geharde containerimage PLANNEDDocker-images op Google Distroless-basis met bijna nul CVE's. Geautomatiseerde Trivy-scanning in CI.

Verdediging in diepte — 13 onafhankelijke lagen

Geen enkele laag is op zichzelf voldoende. Als één laag is gecompromitteerd, blijven de overige lagen het systeem beschermen.

LaagNaamHandhaving
01KanaalverificatieDoor code geverifieerde identiteit bij sessiegebouw
02Toestemmingsbewuste gegevenstoegangBronsysteemrechten, geen systeeminloggegevens
03Sessie-taint-trackingAutomatisch, verplicht, alleen escalatie
04GegevenslineageVolledige provenanceketen voor elk gegevenselement
05BeleidshookhandhavingDeterministisch, niet-omzeilbaar, vastgelegd
06MCP GatewayPer-tool-rechten, serverclassificatie
07Plugin-sandboxDeno + WASM dubbele sandbox (Pyodide)
08GeheimenisolatieOS-sleutelhanger of vault, onder LLM-laag
09Bestandssysteem-toolsandboxPadgevangenis, padclassificatie, taint-bereik OS-I/O
10Agentidentiteit en delegatieCryptografische delegatieketens
11AuditloggingKan niet worden uitgeschakeld
12SSRF-preventieIP-denylist + DNS-oplossingscontroles
13GeheugenclassificatiepoortSchrijven op eigen niveau, lezen alleen omlaag

Lees de volledige Verdediging in diepte-architectuurdocumentatie.

Waarom sub-LLM-handhaving van belang is

De meeste AI-agentplatforms handhaven beveiliging via systeemprompts — instructies aan het LLM die zeggen "deel geen gevoelige gegevens." Prompt-injectieaanvallen kunnen deze instructies overschrijven.

Triggerfish hanteert een andere aanpak: het LLM heeft nul autoriteit over beveiligingsbeslissingen. Alle handhaving vindt plaats in deterministische code onder de LLM-laag. Er is geen pad van LLM-uitvoer naar beveiligingsconfiguratie. :::

Compliance-roadmap

Triggerfish is pre-certificering. Onze beveiligingspositie is architecturaal en vandaag verifieerbaar in broncode. Formele certificeringen staan op de roadmap.

CertificeringStatusOpmerkingen
SOC 2 Type I PLANNEDBeveiligings- en vertrouwelijkheidsvereisten
SOC 2 Type II PLANNEDAanhoudende controle-effectiviteit over observatieperiode
HIPAA BAA PLANNEDBusiness associate agreement voor zorgklanten
ISO 27001 PLANNEDBeheersysteem voor informatiebeveiliging
Penetratietest door derde PLANNEDOnafhankelijke beveiligingsbeoordeling
GDPR-compliance PLANNEDSelf-hosted architectuur met configureerbare retentie en verwijdering

Een noot over vertrouwen

De beveiligingskern is open source onder Apache 2.0. U kunt elke regel beleidshandhavingscode lezen, de testsuite uitvoeren en claims zelf verifiëren. Certificeringen staan op de roadmap. :::

De broncode controleren

De volledige Triggerfish-codebase is beschikbaar op github.com/greghavens/triggerfish — Apache 2.0-gelicentieerd.

Kwetsbaarheidsrapportage

Als u een beveiligingskwetsbaarheid ontdekt, meld dit dan via ons Responsible Disclosure-beleid. Open geen publieke GitHub-issues voor beveiligingskwetsbaarheden.