Förtroendecentrum
Triggerfish tillämpar säkerhet i deterministisk kod under LLM-lagret — inte i promptar som modellen kan ignorera. Varje policybeslut fattas av kod som inte kan påverkas av prompt-injektion, social manipulation eller modellfeluppträdande. Se den fullständiga Säkerhetscentrerat design-sidan för den djupgående tekniska förklaringen.
Säkerhetskontroller
Dessa kontroller är aktiva i den aktuella versionen. Var och en tillämpas i kod, testas i CI och är granskningsbar i det öppna källkodsrepositoriet.
| Kontroll | Status | Beskrivning |
|---|---|---|
| Sub-LLM-policyhantering | ACTIVE | Åtta deterministiska hooks fångar upp varje åtgärd före och efter LLM-bearbetning. Modellen kan inte kringgå, ändra eller påverka säkerhetsbeslut. |
| Dataklassificeringssystem | ACTIVE | Fyranivåhierarki (PUBLIC, INTERNAL, CONFIDENTIAL, RESTRICTED) med obligatorisk nedskrivningshantering. |
| Session-taint-spårning | ACTIVE | Varje session spårar den högsta klassificeringen av data som nåtts. Taint eskalerar bara, minskar aldrig. |
| Oföränderlig revisionsloggning | ACTIVE | Alla policybeslut loggas med fullständigt sammanhang. Revisionsloggning kan inte inaktiveras av någon komponent i systemet. |
| Hemlighetsisolering | ACTIVE | Uppgifter lagrade i OS-nyckelring eller vault. Aldrig i konfigurationsfiler, lagring, loggar eller LLM-kontext. |
| Plugin-sandlåda | ACTIVE | Tredjepartsplugins körs i en Deno + WASM dubbel sandlåda (Pyodide). Ingen odeklarerad nätverksåtkomst, ingen dataexfiltration. |
| Beroendeskanning | ACTIVE | Automatiserad sårbarhetsskanning via GitHub Dependabot. PR:er öppnas automatiskt för uppströms CVE:er. |
| Öppen källkodsbas | ACTIVE | Full säkerhetsarkitektur är Apache 2.0-licensierad och offentligt granskningsbar. |
| On-premises-driftsättning | ACTIVE | Körs helt på din infrastruktur. Inget molnberoende, ingen telemetri, ingen extern databearbetning. |
| Kryptering | ACTIVE | TLS för all data i transit. OS-nivåkryptering i vila. Företagsvault-integration tillgänglig. |
| Program för ansvarsfull avslöjande | ACTIVE | Dokumenterad process för sårbarhetrapportering med definierade svarstidlinjer. Se avslöjandepolicyn. |
| Härdad container-bild | PLANNED | Docker-bilder på Google Distroless-bas med nära noll CVE:er. Automatiserad Trivy-skanning i CI. |
Försvar på djupet — 13 oberoende lager
Inget enskilt lager är tillräckligt ensamt. Om ett lager komprometteras fortsätter de återstående lagren att skydda systemet.
| Lager | Namn | Tillämpning |
|---|---|---|
| 01 | Kanalautentisering | Kodverifierad identitet vid sessionsupprättande |
| 02 | Behörighetsmedveten dataåtkomst | Källsystembehörigheter, inte systemuppgifter |
| 03 | Session-taint-spårning | Automatisk, obligatorisk, bara eskalering |
| 04 | Datalinjegrafi | Fullständig provenanskedja för varje dataelement |
| 05 | Policyhanteringshooks | Deterministiska, icke-kringgångsbara, loggade |
| 06 | MCP Gateway | Per-verktygsbehörigheter, serverklassificering |
| 07 | Plugin-sandlåda | Deno + WASM dubbel sandlåda (Pyodide) |
| 08 | Hemlighetsisolering | OS-nyckelring eller vault, under LLM-lagret |
| 09 | Filsystemsverktygssandlåda | Sökvägsinstängning, sökvägsklassificering, taint-avgränsad I/O |
| 10 | Agentidentitet och delegering | Kryptografiska delegeringskedjor |
| 11 | Revisionsloggning | Kan inte inaktiveras |
| 12 | SSRF-förebyggande | IP-nekalista + DNS-upplösningskontroller |
| 13 | Minneklassificeringsgrindning | Skriv på egen nivå, läs bara nedåt |
Läs den fullständiga Försvar på djupet-arkitekturdokumentationen.
Varför sub-LLM-hantering spelar roll
De flesta AI-agentplattformar tillämpar säkerhet via systempromtar — instruktioner till LLM:en om att "inte dela känslig data." Prompt-injektionsattacker kan åsidosätta dessa instruktioner.
Triggerfish tar ett annat tillvägagångssätt: LLM:en har noll auktoritet över säkerhetsbeslut. All hantering sker i deterministisk kod under LLM-lagret. Det finns ingen väg från LLM-utdata till säkerhetskonfiguration. :::
Efterlevnadsfärdplan
Triggerfish är pre-certifiering. Vår säkerhetsposition är arkitektonisk och verifierbar i källkod idag. Formella certifieringar finns på färdplanen.
| Certifiering | Status | Anteckningar |
|---|---|---|
| SOC 2 Type I | PLANNED | Säkerhet + konfidentialitetsförtroendekriterer |
| SOC 2 Type II | PLANNED | Bibehållen kontrolleffektivitet under observationsperiod |
| HIPAA BAA | PLANNED | Affärspartnersavtal för hälsovårdskunder |
| ISO 27001 | PLANNED | Informationssäkerhetshanteringssystem |
| Penetrationstest av tredje part | PLANNED | Oberoende säkerhetsbedömning |
| GDPR-efterlevnad | PLANNED | Självhostad arkitektur med konfigurerbar kvarhållning och radering |
En not om förtroende
Säkerhetskärnan är öppen källkod under Apache 2.0. Du kan läsa varje rad av policyhanteringskod, köra testsviten och verifiera påståenden själv. Certifieringar finns på färdplanen. :::
Granska källkoden
Den fullständiga Triggerfish-kodbasen finns på github.com/greghavens/triggerfish — Apache 2.0-licensierad.
Sårbarhetrapportering
Om du upptäcker en säkerhetssårbarhet, rapportera den via vår Policy för ansvarsfull avslöjande. Öppna inte offentliga GitHub-ärenden för säkerhetssårbarheter.
