Skip to content

Tillitssenter

Triggerfish håndhever sikkerhet i deterministisk kode under LLM-laget — ikke i prompter modellen kan ignorere. Hver policy-beslutning tas av kode som ikke kan påvirkes av prompt-injeksjon, sosial manipulasjon eller modellfeiladferd. Se den fullstendige Sikkerhetsfokusert design-siden for den dype tekniske forklaringen.

Sikkerhetskontroller

Disse kontrollene er aktive i gjeldende utgivelse. Hver av dem håndheves i kode, testes i CI og er reviderbar i det åpne kildekodelageret.

KontrollStatusBeskrivelse
Sub-LLM Policy-håndhevelse ACTIVEÅtte deterministiske hooks intercepterer hver handling før og etter LLM-behandling. Modellen kan ikke omgå, endre eller påvirke sikkerhetsbeslutninger.
Dataklassifiseringssystem ACTIVEFire-nivås hierarki (PUBLIC, INTERNAL, CONFIDENTIAL, RESTRICTED) med obligatorisk no-write-down-håndhevelse.
Session Taint-sporing ACTIVEHver sesjon sporer den høyeste klassifiseringen av aksesserte data. Taint eskalerer bare, synker aldri.
Uforanderlig revisjonslogging ACTIVEAlle policy-beslutninger logges med full kontekst. Revisjonslogging kan ikke deaktiveres av noen komponent i systemet.
Hemmelighetsisolasjon ACTIVELegitimasjon lagres i OS-nøkkelring eller vault. Aldri i konfigurasjonsfiler, lagring, logger eller LLM-kontekst.
Plugin-sandkasse ACTIVETredjeparts plugins kjøres i en Deno + WASM dobbel sandkasse (Pyodide). Ingen udeklarert nettverkstilgang, ingen dataeksfiltrering.
Avhengighetsskanning ACTIVEAutomatisert sårbarhetsskanning via GitHub Dependabot. PR-er åpnes automatisk for oppstrøms CVE-er.
Åpen kildekodebase ACTIVEFull sikkerhetsarkitektur er Apache 2.0-lisensiert og offentlig reviderbar.
Lokal distribusjon ACTIVEKjøres helt på din infrastruktur. Ingen skyavhengighet, ingen telemetri, ingen ekstern databehandling.
Kryptering ACTIVETLS for alle data under overføring. OS-nivå kryptering i ro. Bedrifts vault-integrasjon tilgjengelig.
Program for ansvarlig avsløring ACTIVEDokumentert prosess for sårbarhetrapportering med definerte svartidslinjer. Se avsløringspolicy.
Herdet containerimage PLANNEDDocker-images på Google Distroless-base med nesten null CVE-er. Automatisert Trivy-skanning i CI.

Forsvar i dybden — 13 uavhengige lag

Intet enkelt lag er tilstrekkelig alene. Hvis ett lag er kompromittert, fortsetter de gjenværende lagene å beskytte systemet.

LagNavnHåndhevelse
01KanalautentiseringKodeverifisert identitet ved sesjonsetablering
02Tillatelsesbevisst datatilgangKildesystemtillatelser, ikke systemlegitimasjon
03Session Taint-sporingAutomatisk, obligatorisk, kun eskalering
04DatalinjeFullstendig provenansrekke for hvert dataelement
05Policy-håndhevelseshooksDeterministisk, ikke-omgåelig, logget
06MCP GatewayPer-verktøy-tillatelser, serverkslassifisering
07Plugin-sandkasseDeno + WASM dobbel sandkasse (Pyodide)
08HemmelighetsisolasjonOS-nøkkelring eller vault, under LLM-laget
09Filsystemverktøy-sandkasseStifengsel, stikelassifisering, taint-avgrenset I/U
10Agentidentitet og delegasjonKryptografiske delegeringskjeder
11RevisjonsloggingKan ikke deaktiveres
12SSRF-forebyggingIP-avvisningsliste + DNS-oppløsningssjekker
13MinneklassifiseringsgatingSkriv på eget nivå, les ned bare

Les den fullstendige Forsvar i dybden-arkitekturdokumentasjonen.

Hvorfor sub-LLM-håndhevelse er viktig

De fleste KI-agentplattformer håndhever sikkerhet gjennom systempromter — instruksjoner til LLM-en om å «ikke dele sensitive data». Prompt-injeksjonsangrep kan overstyre disse instruksjonene.

Triggerfish tar en annen tilnærming: LLM-en har null autoritet over sikkerhetsbeslutninger. All håndhevelse skjer i deterministisk kode under LLM-laget. Det finnes ingen vei fra LLM-utdata til sikkerhetskonfigurasjon. :::

Samsvarsveiplan

Triggerfish er pre-sertifisering. Vår sikkerhetsposisjon er arkitektonisk og verifiserbar i kildekoden i dag. Formelle sertifiseringer er på planen.

SertifiseringStatusMerknader
SOC 2 Type I PLANNEDSikkerhet + konfidensialitet tillitstjenestekriteria
SOC 2 Type II PLANNEDVedvarende kontrolleffektivitet over observasjonsperioden
HIPAA BAA PLANNEDForretningsforbindelsesavtale for helsekundere
ISO 27001 PLANNEDStyringssystem for informasjonssikkerhet
Tredjeparts penetrasjonstest PLANNEDUavhengig sikkerhetsvurdering
GDPR-samsvar PLANNEDSelvhostet arkitektur med konfigurerbar oppbevaring og sletting

En note om tillit

Sikkerhetskjernen er åpen kildekode under Apache 2.0. Du kan lese hver linje med policy-håndhevelseskode, kjøre testpakken og verifisere påstander selv. Sertifiseringer er på planen. :::

Revider kildekoden

Den fullstendige Triggerfish-kodebasen er tilgjengelig på github.com/greghavens/triggerfish — Apache 2.0-lisensiert.

Sårbarheterapportering

Hvis du oppdager en sikkerhetssårbarhet, vennligst rapporter den gjennom vår Policy for ansvarlig avsløring. Ikke åpne offentlige GitHub-problemer for sikkerhetssårbarheter.