Pusat Kepercayaan
Triggerfish menguatkuasakan keselamatan dalam kod deterministik di bawah lapisan LLM -- bukan dalam arahan yang mungkin diabaikan oleh model. Setiap keputusan dasar dibuat oleh kod yang tidak boleh dipengaruhi oleh suntikan arahan, kejuruteraan sosial, atau salah laku model. Lihat halaman Reka Bentuk Keselamatan-Dahulu penuh untuk penjelasan teknikal mendalam.
Kawalan Keselamatan
Kawalan ini aktif dalam keluaran semasa. Setiap satu dikuatkuasakan dalam kod, diuji dalam CI, dan boleh diaudit dalam repositori sumber terbuka.
| Kawalan | Status | Keterangan |
|---|---|---|
| Penguatkuasaan Dasar Sub-LLM | ACTIVE | Lapan hook deterministik memintas setiap tindakan sebelum dan selepas pemprosesan LLM. Model tidak boleh memintas, mengubah suai, atau mempengaruhi keputusan keselamatan. |
| Sistem Pengkelasan Data | ACTIVE | Hierarki empat peringkat (PUBLIC, INTERNAL, CONFIDENTIAL, RESTRICTED) dengan penguatkuasaan tanpa-tulis-bawah mandatori. |
| Penjejakan Taint Sesi | ACTIVE | Setiap sesi menjejaki pengkelasan data tertinggi yang diakses. Taint hanya meningkat, tidak pernah menurun. |
| Log Audit Tidak Boleh Diubah | ACTIVE | Semua keputusan dasar dilog dengan konteks penuh. Log audit tidak boleh dilumpuhkan oleh mana-mana komponen sistem. |
| Pengasingan Rahsia | ACTIVE | Kelayakan disimpan dalam keychain OS atau vault. Tidak pernah dalam fail konfigurasi, storan, log, atau konteks LLM. |
| Sandboxing Plugin | ACTIVE | Plugin pihak ketiga berjalan dalam sandbox berganda Deno + WASM (Pyodide). Tiada akses rangkaian yang tidak diisytiharkan, tiada pengeluaran data. |
| Pengimbasan Kebergantungan | ACTIVE | Pengimbasan kelemahan automatik melalui GitHub Dependabot. PR dibuka secara automatik untuk CVE hulu. |
| Kod Sumber Terbuka | ACTIVE | Seni bina keselamatan penuh berlesen Apache 2.0 dan boleh diaudit secara awam. |
| Pelancaran Dalam Premis | ACTIVE | Berjalan sepenuhnya pada infrastruktur anda. Tiada kebergantungan awan, tiada telemetri, tiada pemprosesan data luaran. |
| Enkripsi | ACTIVE | TLS untuk semua data dalam transit. Enkripsi peringkat OS semasa rehat. Integrasi vault perusahaan tersedia. |
| Program Pendedahan Bertanggungjawab | ACTIVE | Proses pelaporan kelemahan yang terdokumentasi dengan garis masa respons yang ditentukan. Lihat dasar pendedahan. |
| Imej Bekas Dikeraskan | PLANNED | Imej Docker pada asas Google Distroless dengan hampir sifar CVE. Pengimbasan Trivy automatik dalam CI. |
Pertahanan Berlapis -- 13 Lapisan Bebas
Tiada satu lapisan pun yang mencukupi sendiri. Jika satu lapisan terkompromi, lapisan yang tinggal terus melindungi sistem.
| Lapisan | Nama | Penguatkuasaan |
|---|---|---|
| 01 | Pengesahan Saluran | Identiti yang disahkan oleh kod semasa penubuhan sesi |
| 02 | Akses Data Sedar-Kebenaran | Kebenaran sistem sumber, bukan kelayakan sistem |
| 03 | Penjejakan Taint Sesi | Automatik, mandatori, peningkatan sahaja |
| 04 | Keturunan Data | Rantaian provenance penuh untuk setiap elemen data |
| 05 | Hook Penguatkuasaan Dasar | Deterministik, tidak boleh dipintas, dilog |
| 06 | MCP Gateway | Kebenaran per-alat, pengkelasan pelayan |
| 07 | Sandbox Plugin | Sandbox berganda Deno + WASM (Pyodide) |
| 08 | Pengasingan Rahsia | Keychain OS atau vault, di bawah lapisan LLM |
| 09 | Sandbox Alat Sistem Fail | Penjara laluan, pengkelasan laluan, I/O berlingkup-taint |
| 10 | Identiti & Delegasi Ejen | Rantaian delegasi kriptografi |
| 11 | Log Audit | Tidak boleh dilumpuhkan |
| 12 | Pencegahan SSRF | Senarai tolak IP + semakan resolusi DNS |
| 13 | Penggerbangan Pengkelasan Memori | Tulis pada tahap sendiri, baca ke bawah sahaja |
Baca dokumentasi seni bina Pertahanan Berlapis penuh.
Mengapa Penguatkuasaan Sub-LLM Penting
Kebanyakan platform ejen AI menguatkuasakan keselamatan melalui arahan sistem -- arahan kepada LLM yang berkata "jangan kongsi data sensitif." Serangan suntikan arahan boleh mengatasi arahan ini.
Triggerfish mengambil pendekatan berbeza: LLM mempunyai sifar autoriti ke atas keputusan keselamatan. Semua penguatkuasaan berlaku dalam kod deterministik di bawah lapisan LLM. Tiada laluan dari output LLM ke konfigurasi keselamatan. :::
Peta Jalan Pematuhan
Triggerfish adalah pra-pensijilan. Kedudukan keselamatan kami adalah seni bina dan boleh disahkan dalam kod sumber hari ini. Pensijilan formal ada dalam peta jalan.
| Pensijilan | Status | Nota |
|---|---|---|
| SOC 2 Jenis I | PLANNED | Kriteria perkhidmatan kepercayaan Keselamatan + Kerahsiaan |
| SOC 2 Jenis II | PLANNED | Keberkesanan kawalan berterusan sepanjang tempoh pemerhatian |
| HIPAA BAA | PLANNED | Perjanjian rakan kongsi perniagaan untuk pelanggan penjagaan kesihatan |
| ISO 27001 | PLANNED | Sistem pengurusan keselamatan maklumat |
| Ujian Penembusan Pihak Ketiga | PLANNED | Penilaian keselamatan bebas |
| Pematuhan GDPR | PLANNED | Seni bina hos sendiri dengan pengekalan dan pemadaman yang boleh dikonfigurasi |
Nota tentang Kepercayaan
Teras keselamatan adalah sumber terbuka di bawah Apache 2.0. Anda boleh membaca setiap baris kod penguatkuasaan dasar, menjalankan suite ujian, dan mengesahkan tuntutan sendiri. Pensijilan ada dalam peta jalan. :::
Audit Sumber
Kod sumber Triggerfish penuh tersedia di github.com/greghavens/triggerfish -- berlesen Apache 2.0.
Pelaporan Kelemahan
Jika anda menemui kelemahan keselamatan, sila laporkannya melalui Dasar Pendedahan Bertanggungjawab kami. Jangan buka isu GitHub awam untuk kelemahan keselamatan.
