
しばらく前から、AIエージェントが実際に何ができるかに注意を払うようになりました。デモではなく、本物のデータで、ミスに結果が伴う本物の環境で動く本物のエージェントを。私が見つけたのは、機能が本物だということでした。エージェントをメール、カレンダー、コード、ファイルに接続すれば、意味のある仕事ができる。その点は印象的でした。
印象的でなかったのは、セキュリティモデルでした。いや、むしろセキュリティモデルの不在でした。私が見たすべてのプラットフォームは同じ方法でルールを強制していました:モデルがやってはいけないことを伝えること。良いシステムプロンプトを書き、境界を説明し、モデルがその中に留まることを信頼する。それは、誰かがモデルに「ここでは、今この特定のケースでは、ルールは適用されない」と確信させる方法を見つけるまでは機能します。そして人々はそれを見つけるのです。それほど難しくありません。
私が実際に使いたいバージョンのものを誰かが作るのをずっと待っていました。すべてのものに接続でき、すでに使っているすべてのチャンネルで動き、モデルが今日は調子良いかどうかに指をクロスして願うことなく真に機密性の高いデータを扱えるもの。それは現れませんでした。
だから自分で作りました。
Triggerfishは私が欲しかったエージェントです。メール、カレンダー、ファイル、コード、メッセージングアプリに接続します。プロアクティブに動き、プロンプトを送った時だけでなく。すでに作業している場所どこでも動きます。しかし最も真剣に取り組んだのはセキュリティアーキテクチャです。エージェントが何にアクセスでき、データがどこに流れるかのルールは、プロンプトの中にありません。モデルの外側に完全に置かれた強制レイヤーの中にあります。モデルがやりたいことをシステムに伝え、別のレイヤーがそれが実際に起こるかどうかを決定します。モデルはそのレイヤーと交渉できません。その周りを論理的に考えることもできません。見ることさえできません。
その区別は聞こえるよりも重要です。それは、システムのセキュリティ特性がモデルの性能向上とともに低下しないことを意味します。侵害されたサードパーティツールがエージェントを説得してやってはいけないことをさせることができないことを意味します。ルールを実際に見て、理解して、信頼できることを意味します。なぜならそれはコードであり、散文ではないからです。
まさにその理由で強制コアをオープンソース化しました。読めなければ信頼できません。それはあらゆるセキュリティの主張に当てはまりますし、最も機密性の高いデータにアクセスできる自律エージェントを保護しているときは特にそうです。
プラットフォームは個人には無料で、自分で実行できます。インフラについて考えたくない場合は、モデルと検索を私たちが担当するサブスクリプションオプションがあります。どちらにしても、セキュリティモデルは同じです。
これは当時欲しかったエージェントです。多くの人が同じものを待っていたと思います。
