من آن AI Agent را ساختم که آرزویش را داشتم | Triggerfish | Multi Channel AI Agent

مدتی پیش شروع کردم به بررسی دقیق اینکه AI agent ها واقعاً چه کاری می‌توانند انجام دهند. نه دموها. سیستم‌های واقعی، روی داده‌های واقعی، در محیط‌های واقعی که اشتباهات پیامدهای جدی دارند. چیزی که فهمیدم این بود که توانایی واقعاً وجود دارد. می‌توانید یک agent را به ایمیل، تقویم، کد و فایل‌هایتان متصل کنید و کار معناداری انجام دهد. این بخش واقعاً تحت تأثیرم قرار داد.

آنچه تحت تأثیرم قرار نداد، مدل امنیتی بود. یا بهتر بگویم، نبود آن. هر پلتفرمی که بررسی کردم، قوانینش را به یک شکل اعمال می‌کرد: به model می‌گفت چه کاری نباید بکند. یک system prompt خوب بنویس، مرزها را توصیف کن و اعتماد کن که model درون آن‌ها می‌ماند. این تا زمانی کار می‌کند که کسی بفهمد چگونه درخواستی بنویسد که model را متقاعد کند قوانین اینجا، الان، در این مورد خاص اعمال نمی‌شوند. و مردم این کار را می‌کنند. آنقدرها هم سخت نیست.

مدام منتظر بودم کسی نسخه‌ای بسازد که واقعاً بخواهم از آن استفاده کنم. نسخه‌ای که به همه چیز متصل شود، روی تمام کانال‌هایی که از قبل استفاده می‌کنم کار کند و بتواند داده‌های واقعاً حساس را طوری مدیریت کند که نیازی نباشد انگشتانم را در هم قفل کنم و امیدوار باشم model امروز روز خوبی دارد. آن نسخه هیچ‌وقت نیامد.

پس خودم ساختمش.

Triggerfish همان agent ای است که می‌خواستم. به ایمیل، تقویم، فایل‌ها، کد و اپلیکیشن‌های پیام‌رسانتان متصل می‌شود. به صورت فعالانه کار می‌کند، نه فقط وقتی که prompt بدهید. همان‌جا کار می‌کند که شما از قبل کار می‌کنید. اما بخشی که بیشترین جدیت را درباره‌اش دارم، معماری امنیتی است. قوانین مربوط به اینکه agent به چه چیزی دسترسی داشته باشد و داده‌ها به کجا جریان پیدا کنند، در prompt نیستند. در یک enforcement layer قرار دارند که کاملاً خارج از model است. model به سیستم می‌گوید چه می‌خواهد بکند و یک لایه جداگانه تصمیم می‌گیرد که آیا واقعاً اتفاق بیفتد یا نه. model نمی‌تواند با آن لایه مذاکره کند. نمی‌تواند با استدلال دورش بزند. حتی نمی‌تواند ببیندش.

این تمایز بسیار مهم‌تر از آن چیزی است که به نظر می‌رسد. یعنی ویژگی‌های امنیتی سیستم با قوی‌تر شدن model تضعیف نمی‌شوند. یعنی یک ابزار جانبی آلوده نمی‌تواند agent را متقاعد کند کاری بکند که نباید. یعنی واقعاً می‌توانید قوانین را بخوانید، بفهمید و به آن‌ها اعتماد کنید -- چون کد هستند، نه نثر.

enforcement core را دقیقاً به همین دلیل open-source کردم. اگر نمی‌توانید بخوانیدش، نمی‌توانید بهش اعتماد کنید. این برای هر ادعای امنیتی صادق است و به‌ویژه وقتی صادق‌تر است که چیزی که دارید امنش می‌کنید یک agent خودمختار با دسترسی به حساس‌ترین داده‌هایتان باشد.

این پلتفرم برای افراد رایگان است و می‌توانید خودتان اجرایش کنید. اگر ترجیح می‌دهید درباره زیرساخت فکر نکنید، گزینه اشتراک وجود دارد که ما model و جستجو را مدیریت می‌کنیم. در هر صورت، مدل امنیتی یکسان است.

این همان agent ای است که دو سال پیش آرزویش را داشتم. فکر می‌کنم خیلی‌ها منتظر همین چیز بودند.