信任中心

Triggerfish 在 LLM 层之下的确定性代码中执行安全 —— 而非模型可能忽略的提示中。每个策略决策都由不能被提示注入、社会工程或模型不当行为影响的代码做出。完整的技术解释参见安全优先设计页面。

安全控制

这些控制在当前版本中活跃。每个都在代码中执行、在 CI 中测试，并在开源仓库中可审计。

控制	状态	描述
LLM 之下的策略执行	ACTIVE	八个确定性 hook 在 LLM 处理前后拦截每个操作。模型不能绕过、修改或影响安全决策。
数据分类系统	ACTIVE	四级层次结构（PUBLIC、INTERNAL、CONFIDENTIAL、RESTRICTED），强制禁止降级写入。
会话 Taint 跟踪	ACTIVE	每个会话跟踪访问的数据的最高分类。Taint 只升级，永不降低。
不可变审计日志	ACTIVE	所有策略决策以完整上下文记录。审计日志不能被系统的任何组件禁用。
密钥隔离	ACTIVE	凭证存储在操作系统钥匙串或保管库中。永远不在配置文件、存储、日志或 LLM 上下文中。
Plugin 沙箱	ACTIVE	第三方插件在 Deno + WASM 双重沙箱（Pyodide）中运行。无未声明的网络访问，无数据外泄。
依赖扫描	ACTIVE	通过 GitHub Dependabot 自动漏洞扫描。上游 CVE 自动开设 PR。
开源代码库	ACTIVE	完整安全架构为 Apache 2.0 许可，可公开审计。
本地部署	ACTIVE	完全在你的基础设施上运行。无云依赖，无遥测，无外部数据处理。
加密	ACTIVE	所有传输中数据使用 TLS。操作系统级静态加密。可用企业保管库集成。
负责任的披露计划	ACTIVE	文档化的漏洞报告流程，有明确的响应时间表。参见披露政策。
加固容器镜像	PLANNED	基于 Google Distroless 的 Docker 镜像，近零 CVE。CI 中自动 Trivy 扫描。

没有单独一层是够用的。如果一层被攻破，其余层继续保护系统。

阅读完整的纵深防御架构文档。

大多数 AI 智能体平台通过系统提示执行安全 —— 告诉 LLM "不要分享敏感数据"的指令。提示注入攻击可以覆盖这些指令。

Triggerfish 采用不同的方法：LLM 对安全决策零权限。所有执行发生在 LLM 层之下的确定性代码中。从 LLM 输出到安全配置没有通路。 :::

Triggerfish 处于预认证阶段。我们的安全态势是架构性的，今天在源代码中可以验证。正式认证在路线图上。

安全核心在 Apache 2.0 下开源。你可以阅读策略执行代码的每一行、运行测试套件并自行验证声明。认证在路线图上。 :::

完整的 Triggerfish 代码库可在 github.com/greghavens/triggerfish 获取 —— Apache 2.0 许可。

如果你发现安全漏洞，请通过我们的负责任的披露政策报告。不要为安全漏洞开设公开的 GitHub issue。