सुरक्षा-प्रथम डिज़ाइन

Triggerfish एक एकल आधार पर बनाया गया है: LLM के पास शून्य अधिकार है। यह कार्यों का अनुरोध करता है; policy परत निर्णय लेती है। प्रत्येक सुरक्षा निर्णय निश्चयात्मक कोड द्वारा लिया जाता है जिसे AI बायपास, ओवरराइड, या प्रभावित नहीं कर सकता।

सुरक्षा LLM के नीचे क्यों होनी चाहिए

बड़े भाषा मॉडल prompt-inject किए जा सकते हैं। एक सावधानी से तैयार किया गया इनपुट LLM को उसके निर्देशों की अनदेखी करने और ऐसे कार्य करने के लिए प्रेरित कर सकता है जो उसे नहीं करने चाहिए। यदि आपका सुरक्षा मॉडल LLM पर नियमों का पालन करने पर निर्भर करता है, तो एक सफल injection प्रत्येक सुरक्षा उपाय को बायपास कर सकता है।

Triggerfish सभी सुरक्षा प्रवर्तन को एक कोड परत पर ले जाकर इसे हल करता है जो LLM के नीचे बैठती है।

प्रवर्तन परतें: LLM के पास शून्य अधिकार, policy परत सभी निर्णय निश्चयात्मक रूप से लेती है

सुरक्षा LLM परत के पास policy प्रवर्तन परत को ओवरराइड, छोड़ने, या

प्रभावित करने का कोई तंत्र नहीं है। कोई "LLM आउटपुट से बायपास कमांड पार्स करें" तर्क नहीं है। अलगाव आर्किटेक्चरल है, व्यवहारिक नहीं। :::

मूल अपरिवर्तनीय

समान इनपुट हमेशा समान सुरक्षा निर्णय उत्पन्न करता है। कोई यादृच्छिकता नहीं, कोई LLM कॉल नहीं, कोई विवेकाधिकार नहीं।

सुरक्षा सिद्धांत

सिद्धांत	इसका अर्थ	विस्तृत पृष्ठ
डेटा वर्गीकरण	सभी डेटा एक संवेदनशीलता स्तर रखता है (RESTRICTED, CONFIDENTIAL, INTERNAL, PUBLIC)।	आर्किटेक्चर: वर्गीकरण
No Write-Down	डेटा केवल समान या उच्चतर वर्गीकरण स्तर वाले चैनलों और प्राप्तकर्ताओं तक प्रवाहित हो सकता है।	No Write-Down नियम
Session Taint	जब session डेटा तक पहुँचती है, तो पूरी session उस स्तर तक tainted हो जाती है।	आर्किटेक्चर: Taint
निश्चयात्मक Hooks	आठ प्रवर्तन hook हर डेटा प्रवाह में महत्वपूर्ण बिंदुओं पर चलते हैं।	आर्किटेक्चर: Policy Engine
कोड में पहचान	उपयोगकर्ता पहचान session स्थापना पर कोड द्वारा निर्धारित होती है।	पहचान और प्रमाणीकरण
Agent Delegation	Agent-से-agent कॉल क्रिप्टोग्राफ़िक प्रमाणपत्रों द्वारा शासित हैं।	Agent Delegation
Secrets अलगाव	Credentials OS keychains या vaults में संग्रहीत, कभी कॉन्फ़िग फ़ाइलों में नहीं।	Secrets प्रबंधन
सब कुछ ऑडिट करें	प्रत्येक policy निर्णय पूर्ण संदर्भ के साथ लॉग किया जाता है।	ऑडिट और अनुपालन

गहन रक्षा

Triggerfish रक्षा की तेरह परतें लागू करता है:

चैनल प्रमाणीकरण -- session स्थापना पर कोड-सत्यापित पहचान
अनुमति-जागरूक डेटा एक्सेस -- स्रोत सिस्टम अनुमतियाँ
Session taint ट्रैकिंग -- स्वचालित, अनिवार्य, केवल-वृद्धि
डेटा lineage -- प्रत्येक डेटा तत्व के लिए पूर्ण उत्पत्ति श्रृंखला
Policy प्रवर्तन hooks -- निश्चयात्मक, बायपास-रहित, लॉग किए गए
MCP Gateway -- प्रति-tool अनुमतियों के साथ सुरक्षित बाहरी tool एक्सेस
Plugin sandbox -- Deno + WASM दोहरा अलगाव
Secrets अलगाव -- OS keychain या vault
Filesystem tool sandbox -- पथ jail, पथ वर्गीकरण, taint-स्कोप्ड I/O
Agent पहचान -- क्रिप्टोग्राफ़िक delegation chains
ऑडिट लॉगिंग -- सभी निर्णय रिकॉर्ड, कोई अपवाद नहीं
SSRF रोकथाम -- IP denylist + DNS resolution जाँच
Memory वर्गीकरण गेटिंग -- writes session taint पर मजबूर, reads canFlowTo द्वारा फ़िल्टर

अगले कदम

पृष्ठ	विवरण
वर्गीकरण गाइड	चैनलों, MCP servers, और एकीकरणों के लिए सही स्तर चुनने की व्यावहारिक गाइड
No Write-Down नियम	मूलभूत डेटा प्रवाह नियम और इसे कैसे लागू किया जाता है
पहचान और प्रमाणीकरण	चैनल प्रमाणीकरण और owner पहचान सत्यापन
Agent Delegation	Agent-से-agent पहचान, प्रमाणपत्र, और delegation chains
Secrets प्रबंधन	Triggerfish कैसे credentials को स्तरों में संभालता है
ऑडिट और अनुपालन	ऑडिट ट्रेल संरचना, ट्रेसिंग, और अनुपालन निर्यात

सुरक्षा-प्रथम डिज़ाइन ​

सुरक्षा LLM के नीचे क्यों होनी चाहिए ​

मूल अपरिवर्तनीय ​

सुरक्षा सिद्धांत ​

गहन रक्षा ​

अगले कदम ​