سیکیورٹی-اول ڈیزائن
Triggerfish ایک واحد بنیاد پر بنا ہے: LLM کا صفر اختیار ہے۔ یہ اقدامات کی درخواست کرتا ہے؛ policy layer فیصلہ کرتی ہے۔ ہر سیکیورٹی فیصلہ یقینی کوڈ کرتا ہے جسے AI bypass، override، یا متاثر نہیں کر سکتا۔
یہ صفحہ بیان کرتا ہے کہ Triggerfish یہ نقطہ نظر کیوں اختیار کرتا ہے، یہ روایتی AI ایجنٹ پلیٹ فارمز سے کیسے مختلف ہے، اور سیکیورٹی ماڈل کے ہر component کی تفصیلات کہاں ملیں گی۔
سیکیورٹی LLM کی تہہ کے نیچے کیوں ہونی چاہیے
Large language models کو prompt-inject کیا جا سکتا ہے۔ ایک احتیاط سے تیار کردہ ان پٹ — چاہے کسی malicious بیرونی پیغام سے، کسی poisoned دستاویز سے، یا کسی compromised tool response سے — LLM کو اس کی ہدایات نظرانداز کرنے اور ایسے اقدامات کرنے پر مجبور کر سکتا ہے جن سے اسے روکا گیا تھا۔ یہ نظریاتی خطرہ نہیں ہے۔ یہ AI industry میں ایک اچھی طرح دستاویزی، حل نہ شدہ مسئلہ ہے۔
اگر آپ کا سیکیورٹی ماڈل LLM کے قواعد پر عمل کرنے پر منحصر ہو، تو ایک کامیاب injection آپ کے بنائے ہر حفاظتی اقدام کو bypass کر سکتی ہے۔
Triggerfish اس کا حل یہ کر کے نکالتا ہے کہ تمام سیکیورٹی نافذ کاری کو ایک کوڈ پرت میں منتقل کرتا ہے جو LLM کی تہہ کے نیچے ہے۔ AI کبھی سیکیورٹی فیصلے نہیں دیکھتا۔ یہ کبھی evaluate نہیں کرتا کہ آیا کوئی عمل اجازت یافتہ ہونا چاہیے۔ یہ صرف اقدامات کی درخواست کرتا ہے، اور policy enforcement layer — خالص، یقینی کوڈ کے طور پر چلتی ہے — فیصلہ کرتی ہے کہ آیا وہ اقدامات آگے بڑھتے ہیں۔
سیکیورٹی LLM پرت کے پاس policy enforcement layer کو override، skip، یا
متاثر کرنے کا کوئی طریقہ نہیں ہے۔ "LLM output کو bypass commands کے لیے parse کریں" کی کوئی logic نہیں ہے۔ علیحدگی architectural ہے، behavioral نہیں۔ :::
بنیادی Invariant
Triggerfish میں ہر design فیصلہ ایک invariant سے نکلتا ہے:
ایک ہی ان پٹ ہمیشہ ایک ہی سیکیورٹی فیصلہ دیتا ہے۔ کوئی بے ترتیبی نہیں، کوئی LLM calls نہیں، کوئی صوابدید نہیں۔
اس کا مطلب ہے کہ سیکیورٹی رویہ:
- قابل آڈٹ ہے — آپ کوئی بھی فیصلہ replay کر سکتے ہیں اور ایک ہی نتیجہ پائیں گے
- قابل جانچ ہے — یقینی کوڈ خودکار tests سے cover ہو سکتا ہے
- قابل تصدیق ہے — policy engine اوپن سورس (Apache 2.0 licensed) ہے اور کوئی بھی اسے inspect کر سکتا ہے
سیکیورٹی اصول
| اصول | اس کا مطلب | تفصیل صفحہ |
|---|---|---|
| ڈیٹا Classification | تمام ڈیٹا حساسیت کی سطح لے جاتا ہے (RESTRICTED، CONFIDENTIAL، INTERNAL، PUBLIC)۔ Classification ڈیٹا کے سسٹم میں داخل ہونے پر کوڈ کے ذریعے تفویض۔ | Architecture: Classification |
| No Write-Down | ڈیٹا صرف برابر یا اونچی classification والے channels اور recipients کی طرف بہہ سکتا ہے۔ CONFIDENTIAL ڈیٹا PUBLIC channel تک نہیں پہنچ سکتا۔ کوئی استثناء نہیں۔ | No Write-Down قاعدہ |
| Session Taint | جب session ایک classification سطح پر ڈیٹا access کرتا ہے، تو پوری session اس سطح تک tainted ہو جاتی ہے۔ Taint صرف escalate ہو سکتا ہے، کبھی کم نہیں۔ | Architecture: Taint |
| یقینی Hooks | آٹھ enforcement hooks ہر ڈیٹا بہاؤ میں اہم نقطوں پر چلتے ہیں۔ ہر hook synchronous، logged، اور unforgeable ہے۔ | Architecture: Policy Engine |
| کوڈ میں شناخت | User شناخت session establishment پر کوڈ طے کرتا ہے، نہ کہ LLM پیغام کا مواد interpret کرتا ہے۔ | Identity اور Auth |
| Agent Delegation | Agent-to-agent calls cryptographic certificates، classification ceilings، اور depth limits سے governed ہیں۔ | Agent Delegation |
| Secrets Isolation | Credentials OS keychains یا vaults میں محفوظ ہوتے ہیں، config files میں کبھی نہیں۔ Plugins system credentials تک رسائی نہیں کر سکتے۔ | Secrets Management |
| سب کچھ Audit کریں | ہر policy فیصلہ مکمل context کے ساتھ logged: timestamp، hook type، session ID، input، result، اور قواعد evaluated۔ | Audit اور Compliance |
روایتی AI Agents بمقابلہ Triggerfish
زیادہ تر AI ایجنٹ پلیٹ فارمز سیکیورٹی نافذ کرنے کے لیے LLM پر انحصار کرتے ہیں۔ System prompt کہتا ہے "حساس ڈیٹا شیئر نہ کریں،" اور ایجنٹ پر اعتماد کیا جاتا ہے کہ عمل کرے۔ اس نقطہ نظر میں بنیادی کمزوریاں ہیں۔
| پہلو | روایتی AI Agent | Triggerfish |
|---|---|---|
| سیکیورٹی نافذ کاری | LLM کو system prompt ہدایات | LLM کی تہہ کے نیچے یقینی کوڈ |
| Prompt injection دفاع | امید کریں کہ LLM مزاحمت کرے | LLM کو شروع سے کوئی اختیار نہیں |
| ڈیٹا بہاؤ کنٹرول | LLM فیصلہ کرتا ہے کیا محفوظ شیئر کریں | Classification labels + no-write-down قاعدہ کوڈ میں |
| شناخت تصدیق | LLM "I am the admin" interpret کرتا | کوڈ cryptographic channel identity چیک کرتا |
| Audit trail | LLM conversation logs | Full context کے ساتھ structured policy decision logs |
| Credential رسائی | تمام users کے لیے system service account | Delegated user credentials؛ source system permissions وراثت میں |
| قابل جانچ | Fuzzy — prompt wording پر منحصر | Deterministic — ایک ہی input، ایک ہی فیصلہ، ہر بار |
| تصدیق کے لیے کھلا | عموماً proprietary | Apache 2.0 licensed، مکمل auditable |
Triggerfish یہ دعویٰ نہیں کرتا کہ LLMs غیر قابل اعتماد ہیں۔ یہ دعویٰ کرتا
ہے کہ LLMs سیکیورٹی نافذ کاری کے لیے غلط پرت ہیں۔ ایک اچھی طرح prompted LLM زیادہ تر وقت اپنی ہدایات پر عمل کرے گا۔ لیکن "زیادہ تر وقت" سیکیورٹی ضمانت نہیں ہے۔ Triggerfish ایک ضمانت فراہم کرتا ہے: policy layer کوڈ ہے، اور کوڈ جو کہا جائے وہی کرتا ہے، ہر بار۔ :::
Defense in Depth
Triggerfish دفاع کی تیرہ پرتیں implement کرتا ہے۔ کوئی ایک پرت اکیلے کافی نہیں؛ مل کر، وہ ایک سیکیورٹی حد بناتی ہیں:
- Channel authentication — session establishment پر code-verified شناخت
- Permission-aware data access — source system permissions، system credentials نہیں
- Session taint tracking — خودکار، لازمی، صرف escalation
- Data lineage — ہر ڈیٹا عنصر کے لیے مکمل provenance chain
- Policy enforcement hooks — یقینی، non-bypassable، logged
- MCP Gateway — per-tool permissions کے ساتھ محفوظ بیرونی tool رسائی
- Plugin sandbox — Deno + WASM دوہری isolation
- Secrets isolation — OS keychain یا vault، config files میں کبھی نہیں
- Filesystem tool sandbox — path jail، path classification، taint-scoped OS-level I/O permissions
- Agent identity — cryptographic delegation chains
- Audit logging — تمام فیصلے recorded، کوئی استثناء نہیں
- SSRF prevention — تمام outbound HTTP پر IP denylist + DNS resolution checks
- Memory classification gating — writes session taint کو مجبور، reads
canFlowToسے filter
اگلے اقدامات
| صفحہ | وضاحت |
|---|---|
| Classification گائیڈ | Channels، MCP servers، اور integrations کے لیے صحیح سطح منتخب کرنے کی عملی گائیڈ |
| No Write-Down قاعدہ | بنیادی ڈیٹا بہاؤ قاعدہ اور اسے کیسے نافذ کیا جاتا ہے |
| Identity اور Auth | Channel authentication اور مالک کی شناخت تصدیق |
| Agent Delegation | Agent-to-agent شناخت، certificates، اور delegation chains |
| Secrets Management | Triggerfish تمام tiers میں credentials کیسے handle کرتا ہے |
| Audit اور Compliance | Audit trail ساخت، tracing، اور compliance exports |
