Skip to content

Förtroendecentrum

Triggerfish tillämpar säkerhet i deterministisk kod under LLM-lagret — inte i promptar som modellen kan ignorera. Varje policybeslut fattas av kod som inte kan påverkas av prompt-injektion, social manipulation eller modellfeluppträdande. Se den fullständiga Säkerhetscentrerat design-sidan för den djupgående tekniska förklaringen.

Säkerhetskontroller

Dessa kontroller är aktiva i den aktuella versionen. Var och en tillämpas i kod, testas i CI och är granskningsbar i det öppna källkodsrepositoriet.

KontrollStatusBeskrivning
Sub-LLM-policyhantering ACTIVEÅtta deterministiska hooks fångar upp varje åtgärd före och efter LLM-bearbetning. Modellen kan inte kringgå, ändra eller påverka säkerhetsbeslut.
Dataklassificeringssystem ACTIVEFyranivåhierarki (PUBLIC, INTERNAL, CONFIDENTIAL, RESTRICTED) med obligatorisk nedskrivningshantering.
Session-taint-spårning ACTIVEVarje session spårar den högsta klassificeringen av data som nåtts. Taint eskalerar bara, minskar aldrig.
Oföränderlig revisionsloggning ACTIVEAlla policybeslut loggas med fullständigt sammanhang. Revisionsloggning kan inte inaktiveras av någon komponent i systemet.
Hemlighetsisolering ACTIVEUppgifter lagrade i OS-nyckelring eller vault. Aldrig i konfigurationsfiler, lagring, loggar eller LLM-kontext.
Plugin-sandlåda ACTIVETredjepartsplugins körs i en Deno + WASM dubbel sandlåda (Pyodide). Ingen odeklarerad nätverksåtkomst, ingen dataexfiltration.
Beroendeskanning ACTIVEAutomatiserad sårbarhetsskanning via GitHub Dependabot. PR:er öppnas automatiskt för uppströms CVE:er.
Öppen källkodsbas ACTIVEFull säkerhetsarkitektur är Apache 2.0-licensierad och offentligt granskningsbar.
On-premises-driftsättning ACTIVEKörs helt på din infrastruktur. Inget molnberoende, ingen telemetri, ingen extern databearbetning.
Kryptering ACTIVETLS för all data i transit. OS-nivåkryptering i vila. Företagsvault-integration tillgänglig.
Program för ansvarsfull avslöjande ACTIVEDokumenterad process för sårbarhetrapportering med definierade svarstidlinjer. Se avslöjandepolicyn.
Härdad container-bild PLANNEDDocker-bilder på Google Distroless-bas med nära noll CVE:er. Automatiserad Trivy-skanning i CI.

Försvar på djupet — 13 oberoende lager

Inget enskilt lager är tillräckligt ensamt. Om ett lager komprometteras fortsätter de återstående lagren att skydda systemet.

LagerNamnTillämpning
01KanalautentiseringKodverifierad identitet vid sessionsupprättande
02Behörighetsmedveten dataåtkomstKällsystembehörigheter, inte systemuppgifter
03Session-taint-spårningAutomatisk, obligatorisk, bara eskalering
04DatalinjegrafiFullständig provenanskedja för varje dataelement
05PolicyhanteringshooksDeterministiska, icke-kringgångsbara, loggade
06MCP GatewayPer-verktygsbehörigheter, serverklassificering
07Plugin-sandlådaDeno + WASM dubbel sandlåda (Pyodide)
08HemlighetsisoleringOS-nyckelring eller vault, under LLM-lagret
09FilsystemsverktygssandlådaSökvägsinstängning, sökvägsklassificering, taint-avgränsad I/O
10Agentidentitet och delegeringKryptografiska delegeringskedjor
11RevisionsloggningKan inte inaktiveras
12SSRF-förebyggandeIP-nekalista + DNS-upplösningskontroller
13MinneklassificeringsgrindningSkriv på egen nivå, läs bara nedåt

Läs den fullständiga Försvar på djupet-arkitekturdokumentationen.

Varför sub-LLM-hantering spelar roll

De flesta AI-agentplattformar tillämpar säkerhet via systempromtar — instruktioner till LLM:en om att "inte dela känslig data." Prompt-injektionsattacker kan åsidosätta dessa instruktioner.

Triggerfish tar ett annat tillvägagångssätt: LLM:en har noll auktoritet över säkerhetsbeslut. All hantering sker i deterministisk kod under LLM-lagret. Det finns ingen väg från LLM-utdata till säkerhetskonfiguration. :::

Efterlevnadsfärdplan

Triggerfish är pre-certifiering. Vår säkerhetsposition är arkitektonisk och verifierbar i källkod idag. Formella certifieringar finns på färdplanen.

CertifieringStatusAnteckningar
SOC 2 Type I PLANNEDSäkerhet + konfidentialitetsförtroendekriterer
SOC 2 Type II PLANNEDBibehållen kontrolleffektivitet under observationsperiod
HIPAA BAA PLANNEDAffärspartnersavtal för hälsovårdskunder
ISO 27001 PLANNEDInformationssäkerhetshanteringssystem
Penetrationstest av tredje part PLANNEDOberoende säkerhetsbedömning
GDPR-efterlevnad PLANNEDSjälvhostad arkitektur med konfigurerbar kvarhållning och radering

En not om förtroende

Säkerhetskärnan är öppen källkod under Apache 2.0. Du kan läsa varje rad av policyhanteringskod, köra testsviten och verifiera påståenden själv. Certifieringar finns på färdplanen. :::

Granska källkoden

Den fullständiga Triggerfish-kodbasen finns på github.com/greghavens/triggerfish — Apache 2.0-licensierad.

Sårbarhetrapportering

Om du upptäcker en säkerhetssårbarhet, rapportera den via vår Policy för ansvarsfull avslöjande. Öppna inte offentliga GitHub-ärenden för säkerhetssårbarheter.