Skip to content

Pusat Kepercayaan

Triggerfish menguatkuasakan keselamatan dalam kod deterministik di bawah lapisan LLM -- bukan dalam arahan yang mungkin diabaikan oleh model. Setiap keputusan dasar dibuat oleh kod yang tidak boleh dipengaruhi oleh suntikan arahan, kejuruteraan sosial, atau salah laku model. Lihat halaman Reka Bentuk Keselamatan-Dahulu penuh untuk penjelasan teknikal mendalam.

Kawalan Keselamatan

Kawalan ini aktif dalam keluaran semasa. Setiap satu dikuatkuasakan dalam kod, diuji dalam CI, dan boleh diaudit dalam repositori sumber terbuka.

KawalanStatusKeterangan
Penguatkuasaan Dasar Sub-LLM ACTIVELapan hook deterministik memintas setiap tindakan sebelum dan selepas pemprosesan LLM. Model tidak boleh memintas, mengubah suai, atau mempengaruhi keputusan keselamatan.
Sistem Pengkelasan Data ACTIVEHierarki empat peringkat (PUBLIC, INTERNAL, CONFIDENTIAL, RESTRICTED) dengan penguatkuasaan tanpa-tulis-bawah mandatori.
Penjejakan Taint Sesi ACTIVESetiap sesi menjejaki pengkelasan data tertinggi yang diakses. Taint hanya meningkat, tidak pernah menurun.
Log Audit Tidak Boleh Diubah ACTIVESemua keputusan dasar dilog dengan konteks penuh. Log audit tidak boleh dilumpuhkan oleh mana-mana komponen sistem.
Pengasingan Rahsia ACTIVEKelayakan disimpan dalam keychain OS atau vault. Tidak pernah dalam fail konfigurasi, storan, log, atau konteks LLM.
Sandboxing Plugin ACTIVEPlugin pihak ketiga berjalan dalam sandbox berganda Deno + WASM (Pyodide). Tiada akses rangkaian yang tidak diisytiharkan, tiada pengeluaran data.
Pengimbasan Kebergantungan ACTIVEPengimbasan kelemahan automatik melalui GitHub Dependabot. PR dibuka secara automatik untuk CVE hulu.
Kod Sumber Terbuka ACTIVESeni bina keselamatan penuh berlesen Apache 2.0 dan boleh diaudit secara awam.
Pelancaran Dalam Premis ACTIVEBerjalan sepenuhnya pada infrastruktur anda. Tiada kebergantungan awan, tiada telemetri, tiada pemprosesan data luaran.
Enkripsi ACTIVETLS untuk semua data dalam transit. Enkripsi peringkat OS semasa rehat. Integrasi vault perusahaan tersedia.
Program Pendedahan Bertanggungjawab ACTIVEProses pelaporan kelemahan yang terdokumentasi dengan garis masa respons yang ditentukan. Lihat dasar pendedahan.
Imej Bekas Dikeraskan PLANNEDImej Docker pada asas Google Distroless dengan hampir sifar CVE. Pengimbasan Trivy automatik dalam CI.

Pertahanan Berlapis -- 13 Lapisan Bebas

Tiada satu lapisan pun yang mencukupi sendiri. Jika satu lapisan terkompromi, lapisan yang tinggal terus melindungi sistem.

LapisanNamaPenguatkuasaan
01Pengesahan SaluranIdentiti yang disahkan oleh kod semasa penubuhan sesi
02Akses Data Sedar-KebenaranKebenaran sistem sumber, bukan kelayakan sistem
03Penjejakan Taint SesiAutomatik, mandatori, peningkatan sahaja
04Keturunan DataRantaian provenance penuh untuk setiap elemen data
05Hook Penguatkuasaan DasarDeterministik, tidak boleh dipintas, dilog
06MCP GatewayKebenaran per-alat, pengkelasan pelayan
07Sandbox PluginSandbox berganda Deno + WASM (Pyodide)
08Pengasingan RahsiaKeychain OS atau vault, di bawah lapisan LLM
09Sandbox Alat Sistem FailPenjara laluan, pengkelasan laluan, I/O berlingkup-taint
10Identiti & Delegasi EjenRantaian delegasi kriptografi
11Log AuditTidak boleh dilumpuhkan
12Pencegahan SSRFSenarai tolak IP + semakan resolusi DNS
13Penggerbangan Pengkelasan MemoriTulis pada tahap sendiri, baca ke bawah sahaja

Baca dokumentasi seni bina Pertahanan Berlapis penuh.

Mengapa Penguatkuasaan Sub-LLM Penting

Kebanyakan platform ejen AI menguatkuasakan keselamatan melalui arahan sistem -- arahan kepada LLM yang berkata "jangan kongsi data sensitif." Serangan suntikan arahan boleh mengatasi arahan ini.

Triggerfish mengambil pendekatan berbeza: LLM mempunyai sifar autoriti ke atas keputusan keselamatan. Semua penguatkuasaan berlaku dalam kod deterministik di bawah lapisan LLM. Tiada laluan dari output LLM ke konfigurasi keselamatan. :::

Peta Jalan Pematuhan

Triggerfish adalah pra-pensijilan. Kedudukan keselamatan kami adalah seni bina dan boleh disahkan dalam kod sumber hari ini. Pensijilan formal ada dalam peta jalan.

PensijilanStatusNota
SOC 2 Jenis I PLANNEDKriteria perkhidmatan kepercayaan Keselamatan + Kerahsiaan
SOC 2 Jenis II PLANNEDKeberkesanan kawalan berterusan sepanjang tempoh pemerhatian
HIPAA BAA PLANNEDPerjanjian rakan kongsi perniagaan untuk pelanggan penjagaan kesihatan
ISO 27001 PLANNEDSistem pengurusan keselamatan maklumat
Ujian Penembusan Pihak Ketiga PLANNEDPenilaian keselamatan bebas
Pematuhan GDPR PLANNEDSeni bina hos sendiri dengan pengekalan dan pemadaman yang boleh dikonfigurasi

Nota tentang Kepercayaan

Teras keselamatan adalah sumber terbuka di bawah Apache 2.0. Anda boleh membaca setiap baris kod penguatkuasaan dasar, menjalankan suite ujian, dan mengesahkan tuntutan sendiri. Pensijilan ada dalam peta jalan. :::

Audit Sumber

Kod sumber Triggerfish penuh tersedia di github.com/greghavens/triggerfish -- berlesen Apache 2.0.

Pelaporan Kelemahan

Jika anda menemui kelemahan keselamatan, sila laporkannya melalui Dasar Pendedahan Bertanggungjawab kami. Jangan buka isu GitHub awam untuk kelemahan keselamatan.