
AIエージェントを本当に有用にするものの1つが、時に不安を感じさせる原因でもあります。エージェントにツールへのアクセス権を与えると、それを使います。タスクに必要と思えばすべてのツールを使います。メッセージの下書きを手伝うよう頼むと、予定確認のためにカレンダーに手を伸ばし、ファイルからいくつかのコンテキストを引き出し、Slackのスレッドを確認します。気づくと、シンプルなタスクが3つの異なる分類レベルの3つの異なるデータソースに触れており、あなたのセッションは意図していなかったレベルに汚染されています。
これはバグではありません。エージェントが仕事をしているのです。しかし、実際の使いやすさの問題を生み出します。カジュアルな作業をしていて機密データが関与するコンテキストに誤ってエスカレーションしたくない場合、エージェントを常にマイクロマネージするか、セッションが漂流するのを受け入れるしかありません。
BumpersがそれをFixします。

このアイデアはボウリングから直接来ています。バンパーを立てると、ボールはレーンに留まります。レーン内でどこでも行けて、弾み回り、好き勝手にできます。ただガターに落ちることはできません。TriggerfishのBumpersも同じように機能します。オンのとき、エージェントは現在のセッションの分類レベル以下で動作するすべてのことができます。できないのは、セッションのTaintをエスカレーションさせるアクションを取ることです。試みると、アクションは実行される前にブロックされ、エージェントは別の方法を見つけるか、さらに進むにはBumpersをDropする必要があることをあなたに伝えるよう言われます。
Bumpersはデフォルトでオンです。セッションが開始すると「Bumpers deployed」と表示されます。エージェントに完全な動作範囲を与えたい場合は、/bumpersを実行すると外れます。もう一度実行すると戻ります。あなたの設定はセッションをまたいで持続するため、常にBumpersなしで作業する方なら、一度設定するだけです。
BumpersがすることとしないことについてのThe important thingは、一般的な目的のエージェントへの制限ではないことです。エージェントが呼び出せるツール、読めるデータ、現在の分類レベル内で何かを処理する方法を制限しません。セッションがすでにCONFIDENTIALに汚染されていてエージェントが別のCONFIDENTIALリソースにアクセスする場合、BumpersはTaintが動かないため何も言いません。Bumpersが気にするのはエスカレーションだけです。

これが重要なのは、Bumpersがあなたの邪魔をしないように設計されているからです。通常の作業セッション中に分類レベルについて考えなくていいようにすることが全体の目的です。Bumpersをオンにして、作業し、エージェントがセッションの性質を変えるような何かに手を伸ばせばそれを止めて伝えます。解除するかどうかはあなたが決めます。それが全体のインタラクションです。
知っておく価値のあるエッジケースが1つあります。セッションの途中でBumpersをオフにしてエージェントがTaintをエスカレーションした場合、Bumpersを戻してもTaintは下がりません。Taintは単調増加です。上がるだけです。したがって、Bumpersを無効にして、より高いレベルで作業し、再度有効にすると、Bumpersは元のレベルではなくそのより高いレベルから保護します。クリーンな低レベルのセッションに戻りたい場合は、フルリセットを行ってください。

ほとんどの人にとって、Bumpersは静かにオンになっていて、エージェントが自動的にやる代わりに何かを有効にするよう頼んだ理由を時々説明する存在になります。それが意図された体験です。エージェントはレーンに留まり、あなたはコントロールを維持し、実際にさらに進みたいときだけ能動的な判断をすればよいのです。
