مدتی پیش شروع کردم به بررسی دقیق اینکه AI agent ها واقعاً چه کاری میتوانند انجام دهند. نه دموها. سیستمهای واقعی، روی دادههای واقعی، در محیطهای واقعی که اشتباهات پیامدهای جدی دارند. چیزی که فهمیدم این بود که توانایی واقعاً وجود دارد. میتوانید یک agent را به ایمیل، تقویم، کد و فایلهایتان متصل کنید و کار معناداری انجام دهد. این بخش واقعاً تحت تأثیرم قرار داد.
آنچه تحت تأثیرم قرار نداد، مدل امنیتی بود. یا بهتر بگویم، نبود آن. هر پلتفرمی که بررسی کردم، قوانینش را به یک شکل اعمال میکرد: به model میگفت چه کاری نباید بکند. یک system prompt خوب بنویس، مرزها را توصیف کن و اعتماد کن که model درون آنها میماند. این تا زمانی کار میکند که کسی بفهمد چگونه درخواستی بنویسد که model را متقاعد کند قوانین اینجا، الان، در این مورد خاص اعمال نمیشوند. و مردم این کار را میکنند. آنقدرها هم سخت نیست.
مدام منتظر بودم کسی نسخهای بسازد که واقعاً بخواهم از آن استفاده کنم. نسخهای که به همه چیز متصل شود، روی تمام کانالهایی که از قبل استفاده میکنم کار کند و بتواند دادههای واقعاً حساس را طوری مدیریت کند که نیازی نباشد انگشتانم را در هم قفل کنم و امیدوار باشم model امروز روز خوبی دارد. آن نسخه هیچوقت نیامد.
پس خودم ساختمش.
Triggerfish همان agent ای است که میخواستم. به ایمیل، تقویم، فایلها، کد و اپلیکیشنهای پیامرسانتان متصل میشود. به صورت فعالانه کار میکند، نه فقط وقتی که prompt بدهید. همانجا کار میکند که شما از قبل کار میکنید. اما بخشی که بیشترین جدیت را دربارهاش دارم، معماری امنیتی است. قوانین مربوط به اینکه agent به چه چیزی دسترسی داشته باشد و دادهها به کجا جریان پیدا کنند، در prompt نیستند. در یک enforcement layer قرار دارند که کاملاً خارج از model است. model به سیستم میگوید چه میخواهد بکند و یک لایه جداگانه تصمیم میگیرد که آیا واقعاً اتفاق بیفتد یا نه. model نمیتواند با آن لایه مذاکره کند. نمیتواند با استدلال دورش بزند. حتی نمیتواند ببیندش.
این تمایز بسیار مهمتر از آن چیزی است که به نظر میرسد. یعنی ویژگیهای امنیتی سیستم با قویتر شدن model تضعیف نمیشوند. یعنی یک ابزار جانبی آلوده نمیتواند agent را متقاعد کند کاری بکند که نباید. یعنی واقعاً میتوانید قوانین را بخوانید، بفهمید و به آنها اعتماد کنید -- چون کد هستند، نه نثر.
enforcement core را دقیقاً به همین دلیل open-source کردم. اگر نمیتوانید بخوانیدش، نمیتوانید بهش اعتماد کنید. این برای هر ادعای امنیتی صادق است و بهویژه وقتی صادقتر است که چیزی که دارید امنش میکنید یک agent خودمختار با دسترسی به حساسترین دادههایتان باشد.
این پلتفرم برای افراد رایگان است و میتوانید خودتان اجرایش کنید. اگر ترجیح میدهید درباره زیرساخت فکر نکنید، گزینه اشتراک وجود دارد که ما model و جستجو را مدیریت میکنیم. در هر صورت، مدل امنیتی یکسان است.
این همان agent ای است که دو سال پیش آرزویش را داشتم. فکر میکنم خیلیها منتظر همین چیز بودند.
