Skip to content

トラストセンター

Triggerfishはセキュリティをモデルが無視する可能性のあるプロンプトではなく、LLMレイヤーの 下の決定論的なコードで強制します。すべてのポリシー決定は、プロンプトインジェクション、 ソーシャルエンジニアリング、またはモデルの誤動作によって影響を受けることができないコードに よって行われます。詳細な技術的説明については、完全なセキュリティファーストの設計 ページをご覧ください。

セキュリティコントロール

これらのコントロールは現在のリリースでアクティブです。各コントロールはコードで強制され、 CIでテストされ、オープンソースリポジトリで監査可能です。

コントロールステータス説明
LLM下のポリシー強制 ACTIVE8つの決定論的hookがLLM処理の前後ですべてのアクションをインターセプトします。モデルはセキュリティ決定を回避、変更、または影響させることができません。
データ分類システム ACTIVE4レベル階層(PUBLIC、INTERNAL、CONFIDENTIAL、RESTRICTED)、必須のライトダウン禁止強制。
セッションTaint追跡 ACTIVEすべてのセッションがアクセスされたデータの最高分類を追跡します。Taintはエスカレートのみ、低下しません。
不変監査ログ ACTIVEすべてのポリシー決定が完全なコンテキストでログ記録されます。監査ログはシステムのどのコンポーネントによっても無効化できません。
シークレット分離 ACTIVE認証情報はOSキーチェーンまたはvaultに保存されます。設定ファイル、ストレージ、ログ、LLMコンテキストには決して保存されません。
プラグインサンドボックス ACTIVEサードパーティプラグインはDeno + WASMダブルサンドボックス(Pyodide)で実行されます。宣言されていないネットワークアクセスなし、データ漏洩なし。
依存関係スキャン ACTIVEGitHub Dependabotによる自動脆弱性スキャン。上流のCVEに対してPRが自動的に開かれます。
オープンソースコードベース ACTIVE完全なセキュリティアーキテクチャはApache 2.0ライセンスで公開監査可能です。
オンプレミスデプロイメント ACTIVEインフラ上で完全に実行されます。クラウド依存なし、テレメトリなし、外部データ処理なし。
暗号化 ACTIVE転送中のすべてのデータにTLS。OSレベルの保存時暗号化。エンタープライズvault統合利用可能。
責任ある情報開示プログラム ACTIVE定義された対応タイムラインを持つ文書化された脆弱性報告プロセス。開示ポリシーを参照。
強化されたコンテナイメージ PLANNEDGoogle DistrolessベースのDockerイメージ、CVEほぼゼロ。CIで自動Trivyスキャン。

多層防御 — 13の独立したレイヤー

単独ではどのレイヤーも十分ではありません。1つのレイヤーが侵害されても、残りのレイヤーが 引き続きシステムを保護します。

レイヤー名前強制
01チャンネル認証セッション確立時のコード検証済みアイデンティティ
02権限対応データアクセスソースシステムの権限、システム認証情報ではない
03セッションTaint追跡自動、必須、エスカレートのみ
04データ系譜すべてのデータ要素の完全なプロベナンスチェーン
05ポリシー強制Hook決定論的、回避不可能、ログ記録済み
06MCP Gatewayツールごとの権限、サーバー分類
07プラグインサンドボックスDeno + WASMダブルサンドボックス(Pyodide)
08シークレット分離OSキーチェーンまたはvault、LLMレイヤーの下
09ファイルシステムツールサンドボックスパスジェイル、パス分類、taintスコープI/O
10エージェントアイデンティティ & 委任暗号化された委任チェーン
11監査ログ無効化できない
12SSRF防止IPデナイリスト + DNS解決チェック
13メモリ分類ゲーティング自身のレベルで書き込み、下方向にのみ読み取り

完全な多層防御アーキテクチャドキュメントをご覧ください。

LLM下の強制が重要な理由

ほとんどのAIエージェントプラットフォームはシステムプロンプト — LLMへの「機密データを

共有しないでください」という指示 — を通じてセキュリティを強制しています。プロンプト インジェクション攻撃はこれらの指示を上書きできます。

Triggerfishは異なるアプローチを取ります:LLMはセキュリティ決定に対して権限ゼロです。 すべての強制はLLMレイヤーの下の決定論的なコードで行われます。LLM出力からセキュリティ 設定へのパスウェイはありません。 :::

コンプライアンスロードマップ

Triggerfishは認証取得前の段階です。セキュリティ体制はアーキテクチャ的であり、今日の ソースコードで検証可能です。正式な認証はロードマップにあります。

認証ステータス備考
SOC 2 タイプI PLANNEDセキュリティ + 機密性の信頼サービス基準
SOC 2 タイプII PLANNED観察期間にわたる継続的なコントロールの有効性
HIPAA BAA PLANNEDヘルスケア顧客向けのビジネスアソシエイト契約
ISO 27001 PLANNED情報セキュリティマネジメントシステム
サードパーティ侵入テスト PLANNED独立したセキュリティ評価
GDPRコンプライアンス PLANNED設定可能な保持と削除を持つセルフホスティングアーキテクチャ

信頼についての注記

セキュリティコアはApache 2.0でオープンソースです。ポリシー強制コードのすべての

行を読み、テストスイートを実行し、自分で主張を検証できます。認証はロードマップに あります。 :::

ソースコードの監査

完全なTriggerfishコードベースは github.com/greghavens/triggerfish で 利用可能です — Apache 2.0ライセンス。

脆弱性報告

セキュリティ脆弱性を発見した場合は、責任ある情報開示ポリシー を通じて報告してください。セキュリティ脆弱性についてはGitHubのパブリックIssueを 開かないでください。