التصميم القائم على الأمان أولاً
بُني Triggerfish على مقدمة واحدة: ليس لدى LLM أي صلاحية. إنه يطلب إجراءات؛ وطبقة السياسات تقرر. كل قرار أمني يُتخذ بواسطة كود حتمي لا يستطيع الذكاء الاصطناعي تجاوزه أو تعديله أو التأثير عليه.
لماذا يجب أن يكون الأمان أسفل LLM
نماذج اللغة الكبيرة يمكن حقنها بـ prompt. إذا كان نموذج أمانك يعتمد على اتباع LLM للقواعد، فحقنة واحدة ناجحة يمكنها تجاوز كل حماية بنيتها.
يحل Triggerfish هذا بنقل جميع تنفيذ الأمان إلى طبقة كود تقع أسفل LLM. الذكاء الاصطناعي لا يرى قرارات الأمان أبداً.
الثابت الأساسي
نفس المدخلات تنتج دائماً نفس القرار الأمني. بدون عشوائية، بدون استدعاءات LLM، بدون تقدير.
أقسام الأمان
| القسم | الوصف |
|---|---|
| قاعدة منع الكتابة للأسفل | الثابت الأمني الأساسي |
| تفويض الوكيل | سلاسل التفويض المشفرة |
| تسجيل التدقيق | تسجيل أمني شامل |
| الهوية | كيف يُحدد Triggerfish من هو المالك |
| إدارة الأسرار | تخزين بيانات الاعتماد بأمان |
| مركز الثقة | تسلسل الثقة الهرمي |
| الإفصاح المسؤول | الإبلاغ عن ثغرات أمنية |
