信任中心

Triggerfish 在 LLM 層之下的確定性程式碼中執行安全——不是在模型可能忽略的提示中。每個策略決策都由無法被提示注入、社交工程或模型不當行為影響的程式碼做出。完整的深入技術解釋請參閱安全優先設計頁面。

安全控制

這些控制在目前版本中處於活躍狀態。每個都在程式碼中執行、在 CI 中測試，並且在開源倉庫中可稽核。

控制	狀態	描述
LLM 之下策略執行	ACTIVE	八個確定性 hook 在 LLM 處理前後攔截每個操作。模型無法繞過、修改或影響安全決策。
資料分類系統	ACTIVE	四等級階層（PUBLIC、INTERNAL、CONFIDENTIAL、RESTRICTED），具有強制性的禁止降級寫入執行。
工作階段 Taint 追蹤	ACTIVE	每個工作階段追蹤存取的最高資料分類。Taint 只能提升，永不降低。
不可變稽核日誌	ACTIVE	所有策略決策以完整上下文記錄。稽核日誌無法被系統的任何元件停用。
密鑰隔離	ACTIVE	憑證儲存在作業系統金鑰鏈或保險庫中。永遠不在設定檔、儲存、日誌或 LLM 上下文中。
Plugin 沙箱	ACTIVE	第三方 plugin 在 Deno + WASM 雙重沙箱（Pyodide）中執行。無未宣告的網路存取，無資料竊取。
依賴掃描	ACTIVE	透過 GitHub Dependabot 自動漏洞掃描。上游 CVE 自動開啟 PR。
開源程式碼庫	ACTIVE	完整安全架構以 Apache 2.0 授權並可公開稽核。
本地部署	ACTIVE	完全在您的基礎設施上執行。無雲端依賴、無遙測、無外部資料處理。
加密	ACTIVE	所有傳輸中的資料使用 TLS。靜態使用作業系統級加密。企業保險庫整合可用。
負責任揭露計畫	ACTIVE	記錄的漏洞報告流程，有定義的回應時程。參閱揭露政策。
強化容器映像	PLANNED	基於 Google Distroless 的 Docker 映像，接近零 CVE。CI 中自動 Trivy 掃描。

沒有單一層單獨足夠。如果一層被攻破，其餘層繼續保護系統。

閱讀完整的縱深防禦架構文件。

大多數 AI 代理平台透過系統提示執行安全——告訴 LLM「不要分享敏感資料」的指示。提示注入攻擊可以覆寫這些指示。

Triggerfish 採取不同的方法：LLM 對安全決策沒有任何權限。所有執行都在 LLM 層之下的確定性程式碼中進行。從 LLM 輸出到安全配置沒有路徑。 :::

Triggerfish 處於認證前階段。我們的安全態勢是架構性的，今天就可以在原始碼中驗證。正式認證在路線圖上。

安全核心在 Apache 2.0 下開源。您可以閱讀每一行策略執行程式碼、執行測試套件並自行驗證聲明。認證在路線圖上。 :::

完整的 Triggerfish 程式碼庫可在 github.com/greghavens/triggerfish 取得——Apache 2.0 授權。

如果您發現安全漏洞，請透過我們的負責任揭露政策報告。請勿為安全漏洞開啟公開的 GitHub issue。