トラストセンター

Triggerfishはセキュリティをモデルが無視する可能性のあるプロンプトではなく、LLMレイヤーの下の決定論的なコードで強制します。すべてのポリシー決定は、プロンプトインジェクション、ソーシャルエンジニアリング、またはモデルの誤動作によって影響を受けることができないコードによって行われます。詳細な技術的説明については、完全なセキュリティファーストの設計ページをご覧ください。

セキュリティコントロール

これらのコントロールは現在のリリースでアクティブです。各コントロールはコードで強制され、 CIでテストされ、オープンソースリポジトリで監査可能です。

コントロール	ステータス	説明
LLM下のポリシー強制	ACTIVE	8つの決定論的hookがLLM処理の前後ですべてのアクションをインターセプトします。モデルはセキュリティ決定を回避、変更、または影響させることができません。
データ分類システム	ACTIVE	4レベル階層（PUBLIC、INTERNAL、CONFIDENTIAL、RESTRICTED）、必須のライトダウン禁止強制。
セッションTaint追跡	ACTIVE	すべてのセッションがアクセスされたデータの最高分類を追跡します。Taintはエスカレートのみ、低下しません。
不変監査ログ	ACTIVE	すべてのポリシー決定が完全なコンテキストでログ記録されます。監査ログはシステムのどのコンポーネントによっても無効化できません。
シークレット分離	ACTIVE	認証情報はOSキーチェーンまたはvaultに保存されます。設定ファイル、ストレージ、ログ、LLMコンテキストには決して保存されません。
プラグインサンドボックス	ACTIVE	サードパーティプラグインはDeno + WASMダブルサンドボックス（Pyodide）で実行されます。宣言されていないネットワークアクセスなし、データ漏洩なし。
依存関係スキャン	ACTIVE	GitHub Dependabotによる自動脆弱性スキャン。上流のCVEに対してPRが自動的に開かれます。
オープンソースコードベース	ACTIVE	完全なセキュリティアーキテクチャはApache 2.0ライセンスで公開監査可能です。
オンプレミスデプロイメント	ACTIVE	インフラ上で完全に実行されます。クラウド依存なし、テレメトリなし、外部データ処理なし。
暗号化	ACTIVE	転送中のすべてのデータにTLS。OSレベルの保存時暗号化。エンタープライズvault統合利用可能。
責任ある情報開示プログラム	ACTIVE	定義された対応タイムラインを持つ文書化された脆弱性報告プロセス。開示ポリシーを参照。
強化されたコンテナイメージ	PLANNED	Google DistrolessベースのDockerイメージ、CVEほぼゼロ。CIで自動Trivyスキャン。

多層防御 — 13の独立したレイヤー

単独ではどのレイヤーも十分ではありません。1つのレイヤーが侵害されても、残りのレイヤーが引き続きシステムを保護します。

レイヤー	名前	強制
01	チャンネル認証	セッション確立時のコード検証済みアイデンティティ
02	権限対応データアクセス	ソースシステムの権限、システム認証情報ではない
03	セッションTaint追跡	自動、必須、エスカレートのみ
04	データ系譜	すべてのデータ要素の完全なプロベナンスチェーン
05	ポリシー強制Hook	決定論的、回避不可能、ログ記録済み
06	MCP Gateway	ツールごとの権限、サーバー分類
07	プラグインサンドボックス	Deno + WASMダブルサンドボックス（Pyodide）
08	シークレット分離	OSキーチェーンまたはvault、LLMレイヤーの下
09	ファイルシステムツールサンドボックス	パスジェイル、パス分類、taintスコープI/O
10	エージェントアイデンティティ & 委任	暗号化された委任チェーン
11	監査ログ	無効化できない
12	SSRF防止	IPデナイリスト + DNS解決チェック
13	メモリ分類ゲーティング	自身のレベルで書き込み、下方向にのみ読み取り

完全な多層防御アーキテクチャドキュメントをご覧ください。

LLM下の強制が重要な理由

ほとんどのAIエージェントプラットフォームはシステムプロンプト — LLMへの「機密データを

共有しないでください」という指示 — を通じてセキュリティを強制しています。プロンプトインジェクション攻撃はこれらの指示を上書きできます。

Triggerfishは異なるアプローチを取ります：LLMはセキュリティ決定に対して権限ゼロです。すべての強制はLLMレイヤーの下の決定論的なコードで行われます。LLM出力からセキュリティ設定へのパスウェイはありません。 :::

コンプライアンスロードマップ

Triggerfishは認証取得前の段階です。セキュリティ体制はアーキテクチャ的であり、今日のソースコードで検証可能です。正式な認証はロードマップにあります。

認証	ステータス	備考
SOC 2 タイプI	PLANNED	セキュリティ + 機密性の信頼サービス基準
SOC 2 タイプII	PLANNED	観察期間にわたる継続的なコントロールの有効性
HIPAA BAA	PLANNED	ヘルスケア顧客向けのビジネスアソシエイト契約
ISO 27001	PLANNED	情報セキュリティマネジメントシステム
サードパーティ侵入テスト	PLANNED	独立したセキュリティ評価
GDPRコンプライアンス	PLANNED	設定可能な保持と削除を持つセルフホスティングアーキテクチャ

信頼についての注記

セキュリティコアはApache 2.0でオープンソースです。ポリシー強制コードのすべての

行を読み、テストスイートを実行し、自分で主張を検証できます。認証はロードマップにあります。 :::

ソースコードの監査

完全なTriggerfishコードベースは github.com/greghavens/triggerfish で利用可能です — Apache 2.0ライセンス。

脆弱性報告

セキュリティ脆弱性を発見した場合は、責任ある情報開示ポリシーを通じて報告してください。セキュリティ脆弱性についてはGitHubのパブリックIssueを開かないでください。

トラストセンター ​

セキュリティコントロール ​

多層防御 — 13の独立したレイヤー ​

LLM下の強制が重要な理由 ​

コンプライアンスロードマップ ​

信頼についての注記 ​

ソースコードの監査 ​

脆弱性報告 ​