Skip to content

信任中心

Triggerfish 在 LLM 层之下的确定性代码中执行安全 —— 而非模型可能忽略的提示中。每个策略决策都由不能被提示注入、社会工程或模型不当行为影响的代码做出。完整的技术解释参见安全优先设计页面。

安全控制

这些控制在当前版本中活跃。每个都在代码中执行、在 CI 中测试,并在开源仓库中可审计。

控制状态描述
LLM 之下的策略执行 ACTIVE八个确定性 hook 在 LLM 处理前后拦截每个操作。模型不能绕过、修改或影响安全决策。
数据分类系统 ACTIVE四级层次结构(PUBLIC、INTERNAL、CONFIDENTIAL、RESTRICTED),强制禁止降级写入。
会话 Taint 跟踪 ACTIVE每个会话跟踪访问的数据的最高分类。Taint 只升级,永不降低。
不可变审计日志 ACTIVE所有策略决策以完整上下文记录。审计日志不能被系统的任何组件禁用。
密钥隔离 ACTIVE凭证存储在操作系统钥匙串或保管库中。永远不在配置文件、存储、日志或 LLM 上下文中。
Plugin 沙箱 ACTIVE第三方插件在 Deno + WASM 双重沙箱(Pyodide)中运行。无未声明的网络访问,无数据外泄。
依赖扫描 ACTIVE通过 GitHub Dependabot 自动漏洞扫描。上游 CVE 自动开设 PR。
开源代码库 ACTIVE完整安全架构为 Apache 2.0 许可,可公开审计。
本地部署 ACTIVE完全在你的基础设施上运行。无云依赖,无遥测,无外部数据处理。
加密 ACTIVE所有传输中数据使用 TLS。操作系统级静态加密。可用企业保管库集成。
负责任的披露计划 ACTIVE文档化的漏洞报告流程,有明确的响应时间表。参见披露政策
加固容器镜像 PLANNED基于 Google Distroless 的 Docker 镜像,近零 CVE。CI 中自动 Trivy 扫描。

纵深防御 —— 13 个独立层

没有单独一层是够用的。如果一层被攻破,其余层继续保护系统。

名称执行方式
01渠道认证会话建立时代码验证的身份
02权限感知的数据访问源系统权限,而非系统凭证
03会话 Taint 跟踪自动的、强制的、仅升级的
04数据溯源每个数据元素的完整出处链
05策略执行 Hook确定性的、不可绕过的、有日志记录的
06MCP Gateway按工具的权限、服务器分类
07Plugin 沙箱Deno + WASM 双重沙箱(Pyodide)
08密钥隔离操作系统钥匙串或保管库,在 LLM 层之下
09文件系统工具沙箱路径限制、路径分类、taint 作用域 I/O
10智能体身份与委托加密委托链
11审计日志不能被禁用
12SSRF 防护IP 拒绝列表 + DNS 解析检查
13记忆分类门控写入自身级别,只能向下读取

阅读完整的纵深防御架构文档。

为什么 LLM 之下的执行很重要

大多数 AI 智能体平台通过系统提示执行安全 —— 告诉 LLM "不要分享敏感数据"的指令。提示注入攻击可以覆盖这些指令。

Triggerfish 采用不同的方法:LLM 对安全决策零权限。所有执行发生在 LLM 层之下的确定性代码中。从 LLM 输出到安全配置没有通路。 :::

合规路线图

Triggerfish 处于预认证阶段。我们的安全态势是架构性的,今天在源代码中可以验证。正式认证在路线图上。

认证状态备注
SOC 2 Type I PLANNED安全 + 保密性信任服务标准
SOC 2 Type II PLANNED观察期内持续控制有效性
HIPAA BAA PLANNED医疗保健客户的业务伙伴协议
ISO 27001 PLANNED信息安全管理系统
第三方渗透测试 PLANNED独立安全评估
GDPR 合规 PLANNED自托管架构,可配置的保留和删除

关于信任的说明

安全核心在 Apache 2.0 下开源。你可以阅读策略执行代码的每一行、运行测试套件并自行验证声明。认证在路线图上。 :::

审计源代码

完整的 Triggerfish 代码库可在 github.com/greghavens/triggerfish 获取 —— Apache 2.0 许可。

漏洞报告

如果你发现安全漏洞,请通过我们的负责任的披露政策报告。不要为安全漏洞开设公开的 GitHub issue。