Skip to content

信任中心

Triggerfish 在 LLM 層之下的確定性程式碼中執行安全——不是在模型可能忽略的提示中。每個策略決策都由無法被提示注入、社交工程或模型不當行為影響的程式碼做出。完整的深入技術解釋請參閱安全優先設計頁面。

安全控制

這些控制在目前版本中處於活躍狀態。每個都在程式碼中執行、在 CI 中測試,並且在開源倉庫中可稽核。

控制狀態描述
LLM 之下策略執行 ACTIVE八個確定性 hook 在 LLM 處理前後攔截每個操作。模型無法繞過、修改或影響安全決策。
資料分類系統 ACTIVE四等級階層(PUBLIC、INTERNAL、CONFIDENTIAL、RESTRICTED),具有強制性的禁止降級寫入執行。
工作階段 Taint 追蹤 ACTIVE每個工作階段追蹤存取的最高資料分類。Taint 只能提升,永不降低。
不可變稽核日誌 ACTIVE所有策略決策以完整上下文記錄。稽核日誌無法被系統的任何元件停用。
密鑰隔離 ACTIVE憑證儲存在作業系統金鑰鏈或保險庫中。永遠不在設定檔、儲存、日誌或 LLM 上下文中。
Plugin 沙箱 ACTIVE第三方 plugin 在 Deno + WASM 雙重沙箱(Pyodide)中執行。無未宣告的網路存取,無資料竊取。
依賴掃描 ACTIVE透過 GitHub Dependabot 自動漏洞掃描。上游 CVE 自動開啟 PR。
開源程式碼庫 ACTIVE完整安全架構以 Apache 2.0 授權並可公開稽核。
本地部署 ACTIVE完全在您的基礎設施上執行。無雲端依賴、無遙測、無外部資料處理。
加密 ACTIVE所有傳輸中的資料使用 TLS。靜態使用作業系統級加密。企業保險庫整合可用。
負責任揭露計畫 ACTIVE記錄的漏洞報告流程,有定義的回應時程。參閱揭露政策
強化容器映像 PLANNED基於 Google Distroless 的 Docker 映像,接近零 CVE。CI 中自動 Trivy 掃描。

縱深防禦——13 個獨立層

沒有單一層單獨足夠。如果一層被攻破,其餘層繼續保護系統。

名稱執行
01通道驗證工作階段建立時程式碼驗證的身分
02權限感知的資料存取來源系統權限,而非系統憑證
03工作階段 Taint 追蹤自動的、強制的、僅提升
04資料血統每個資料元素的完整來源鏈
05策略執行 Hook確定性的、不可繞過的、有記錄的
06MCP Gateway每工具權限、伺服器分類
07Plugin 沙箱Deno + WASM 雙重沙箱(Pyodide)
08密鑰隔離作業系統金鑰鏈或保險庫,LLM 層之下
09檔案系統工具沙箱路徑監獄、路徑分類、taint 範圍的 I/O
10代理身分與委派加密委派鏈
11稽核日誌無法停用
12SSRF 防護IP 拒絕清單 + DNS 解析檢查
13記憶分類閘控以自己的等級寫入,只能向下讀取

閱讀完整的縱深防禦架構文件。

為什麼 LLM 之下執行很重要

大多數 AI 代理平台透過系統提示執行安全——告訴 LLM「不要分享敏感資料」的指示。提示注入攻擊可以覆寫這些指示。

Triggerfish 採取不同的方法:LLM 對安全決策沒有任何權限。所有執行都在 LLM 層之下的確定性程式碼中進行。從 LLM 輸出到安全配置沒有路徑。 :::

合規路線圖

Triggerfish 處於認證前階段。我們的安全態勢是架構性的,今天就可以在原始碼中驗證。正式認證在路線圖上。

認證狀態備註
SOC 2 Type I PLANNED安全 + 機密性信任服務標準
SOC 2 Type II PLANNED觀察期內持續的控制效能
HIPAA BAA PLANNED醫療保健客戶的商業夥伴協議
ISO 27001 PLANNED資訊安全管理系統
第三方滲透測試 PLANNED獨立安全評估
GDPR 合規 PLANNED具有可配置保留和刪除的自託管架構

關於信任的說明

安全核心在 Apache 2.0 下開源。您可以閱讀每一行策略執行程式碼、執行測試套件並自行驗證聲明。認證在路線圖上。 :::

稽核原始碼

完整的 Triggerfish 程式碼庫可在 github.com/greghavens/triggerfish 取得——Apache 2.0 授權。

漏洞報告

如果您發現安全漏洞,請透過我們的負責任揭露政策報告。請勿為安全漏洞開啟公開的 GitHub issue。