ಭದ್ರತಾ-ಪ್ರಥಮ ವಿನ್ಯಾಸ
Triggerfish ಒಂದೇ ಒಂದು ಮೂಲ ತತ್ವದ ಮೇಲೆ ನಿರ್ಮಿಸಲಾಗಿದೆ: LLM ಗೆ ಶೂನ್ಯ ಅಧಿಕಾರ. ಅದು ಕ್ರಿಯೆಗಳನ್ನು ವಿನಂತಿಸುತ್ತದೆ; ನೀತಿ ಪದರ ನಿರ್ಧರಿಸುತ್ತದೆ. ಪ್ರತಿ ಭದ್ರತಾ ನಿರ್ಧಾರ AI ಬೈಪಾಸ್ ಮಾಡಲು, ಅತಿಕ್ರಮಿಸಲು ಅಥವಾ ಪ್ರಭಾವಿಸಲು ಸಾಧ್ಯವಿಲ್ಲದ ನಿರ್ಧಾರಾತ್ಮಕ ಕೋಡ್ನಿಂದ ಮಾಡಲ್ಪಡುತ್ತದೆ.
ಭದ್ರತೆ ಏಕೆ LLM ಕೆಳಗೆ ಇರಬೇಕು
ದೊಡ್ಡ ಭಾಷಾ ಮಾದರಿಗಳನ್ನು prompt-inject ಮಾಡಬಹುದು. ದುರ್ಮಾರ್ಗ ಬಾಹ್ಯ ಸಂದೇಶ, ವಿಷಯ ದಾಖಲೆ ಅಥವಾ ರಾಜಿ ಆದ tool response ನಿಂದ ಎಚ್ಚರಿಕೆಯಿಂದ ರೂಪಿಸಿದ ಇನ್ಪುಟ್ LLM ಅದಕ್ಕೆ ಹೇಳಲ್ಪಟ್ಟ ಕ್ರಿಯೆಗಳನ್ನು ನಿರ್ಲಕ್ಷಿಸಿ ಕ್ರಿಯೆ ತೆಗೆದುಕೊಳ್ಳುವಂತೆ ಮಾಡಬಹುದು.
ನಿಮ್ಮ ಭದ್ರತಾ ಮಾದರಿ LLM ನಿಯಮಗಳನ್ನು ಅನುಸರಿಸುತ್ತಿರುವ ಮೇಲೆ ಅವಲಂಬಿಸಿದ್ದರೆ, ಒಂದು ಯಶಸ್ವಿ injection ನೀವು ನಿರ್ಮಿಸಿದ ಪ್ರತಿ ರಕ್ಷಣೆ ಬೈಪಾಸ್ ಮಾಡಬಹುದು.
Triggerfish LLM ಕೆಳಗೆ ಕೂರುವ ಕೋಡ್ ಪದರಕ್ಕೆ ಎಲ್ಲ ಭದ್ರತಾ ಜಾರಿ ಸ್ಥಳಾಂತರಿಸುತ್ತದೆ.
ಭದ್ರತಾ ತತ್ವಗಳು
| ತತ್ವ | ಅರ್ಥ | ವಿವರ ಪುಟ |
|---|---|---|
| ಡೇಟಾ ವರ್ಗೀಕರಣ | ಎಲ್ಲ ಡೇಟಾ ಸೂಕ್ಷ್ಮತೆ ಮಟ್ಟ ಹೊಂದಿದೆ. ಡೇಟಾ ಸಿಸ್ಟಂ ಪ್ರವೇಶಿಸಿದಾಗ ಕೋಡ್ನಿಂದ ನಿಯೋಜಿಸಲಾಗುತ್ತದೆ. | Architecture: Classification |
| No Write-Down | ಡೇಟಾ ಕೇವಲ ಸಮಾನ ಅಥವಾ ಹೆಚ್ಚಿನ ವರ್ಗೀಕರಣ ಮಟ್ಟ ಹೊಂದಿರುವ ಚಾನೆಲ್ಗಳಿಗೆ ಹರಿಯಬಹುದು. ಯಾವ ಅಪವಾದ ಇಲ್ಲ. | No Write-Down ನಿಯಮ |
| Session Taint | Session ವರ್ಗೀಕರಣ ಮಟ್ಟದಲ್ಲಿ ಡೇಟಾ ಪ್ರವೇಶಿಸಿದಾಗ, ಇಡೀ session ಆ ಮಟ್ಟಕ್ಕೆ tainted ಆಗುತ್ತದೆ. | Architecture: Taint |
| ನಿರ್ಧಾರಾತ್ಮಕ Hooks | ಎಂಟು ಜಾರಿ hooks ಪ್ರತಿ ಡೇಟಾ ಹರಿವಿನ ಮುಖ್ಯ ಬಿಂದುಗಳಲ್ಲಿ ಚಲಿಸುತ್ತವೆ. ಪ್ರತಿ hook ಸಮಕಾಲೀನ, ದಾಖಲಿಸಲ್ಪಟ್ಟ ಮತ್ತು ಅಭೇದ್ಯ. | Architecture: Policy Engine |
| ಕೋಡ್ನಲ್ಲಿ ಗುರುತು | ಬಳಕೆದಾರ ಗುರುತು LLM ಸಂದೇಶ ವ್ಯಾಖ್ಯಾನಿಸುವ ಮೂಲಕ ಅಲ್ಲ, session ಸ್ಥಾಪನೆಯಲ್ಲಿ ಕೋಡ್ನಿಂದ ನಿರ್ಧರಿಸಲ್ಪಡುತ್ತದೆ. | Identity & Auth |
| Secrets ಪ್ರತ್ಯೇಕತೆ | ರುಜುವಾತುಗಳು OS keychains ಅಥವಾ vaults ನಲ್ಲಿ ಸಂಗ್ರಹಿಸಲ್ಪಡುತ್ತವೆ, ಎಂದಿಗೂ config ಫೈಲ್ಗಳಲ್ಲಿ ಅಲ್ಲ. | Secrets Management |
| ಎಲ್ಲವನ್ನೂ ಆಡಿಟ್ ಮಾಡಿ | ಪ್ರತಿ ನೀತಿ ನಿರ್ಧಾರ ಸಂಪೂರ್ಣ ಸಂದರ್ಭದೊಂದಿಗೆ ದಾಖಲಿಸಲ್ಪಡುತ್ತದೆ. | Audit & Compliance |
ಸಾಂಪ್ರದಾಯಿಕ AI ಏಜೆಂಟ್ಗಳು vs. Triggerfish
| ಅಂಶ | ಸಾಂಪ್ರದಾಯಿಕ AI ಏಜೆಂಟ್ | Triggerfish |
|---|---|---|
| ಭದ್ರತಾ ಜಾರಿ | LLM ಗೆ system prompt ಸೂಚನೆಗಳು | LLM ಕೆಳಗಿನ ನಿರ್ಧಾರಾತ್ಮಕ ಕೋಡ್ |
| Prompt injection ರಕ್ಷಣೆ | LLM ಪ್ರತಿರೋಧಿಸುತ್ತದೆ ಎಂದು ನಿರೀಕ್ಷಿಸಿ | LLM ಗೆ ಮೊದಲೇ ಅಧಿಕಾರ ಇಲ್ಲ |
| ಡೇಟಾ ಹರಿವು ನಿಯಂತ್ರಣ | LLM ಏನು ಸುರಕ್ಷಿತ ಎಂದು ನಿರ್ಧರಿಸುತ್ತದೆ | ವರ್ಗೀಕರಣ labels + ಕೋಡ್ನಲ್ಲಿ no-write-down ನಿಯಮ |
| ಗುರುತು ಪರಿಶೀಲನೆ | LLM "ನಾನು admin" ಎಂದು ವ್ಯಾಖ್ಯಾನಿಸುತ್ತದೆ | ಕೋಡ್ ಕ್ರಿಪ್ಟೋಗ್ರಾಫಿಕ್ ಚಾನೆಲ್ ಗುರುತು ಪರಿಶೀಲಿಸುತ್ತದೆ |
| ಆಡಿಟ್ ಟ್ರೇಲ್ | LLM ಸಂಭಾಷಣೆ ಲಾಗ್ಗಳು | ಸಂಪೂರ್ಣ ಸಂದರ್ಭದೊಂದಿಗೆ ರಚನಾತ್ಮಕ ನೀತಿ ನಿರ್ಧಾರ ಲಾಗ್ಗಳು |
| ಪರೀಕ್ಷಾರ್ಹತೆ | Fuzzy -- prompt ಪದ ಆಧಾರಿತ | ನಿರ್ಧಾರಾತ್ಮಕ -- ಒಂದೇ ಇನ್ಪುಟ್, ಒಂದೇ ನಿರ್ಧಾರ, ಪ್ರತಿ ಬಾರಿ |
ಮುಂದಿನ ಹೆಜ್ಜೆಗಳು
| ಪುಟ | ವಿವರಣೆ |
|---|---|
| ವರ್ಗೀಕರಣ ಮಾರ್ಗದರ್ಶಿ | ಚಾನೆಲ್ಗಳು, MCP servers ಮತ್ತು ಏಕೀಕರಣಗಳಿಗಾಗಿ ಸರಿಯಾದ ಮಟ್ಟ ಆಯ್ಕೆ ಮಾಡಲು ಪ್ರಾಯೋಗಿಕ ಮಾರ್ಗದರ್ಶಿ |
| No Write-Down ನಿಯಮ | ಮೂಲಭೂತ ಡೇಟಾ ಹರಿವು ನಿಯಮ ಮತ್ತು ಅದು ಹೇಗೆ ಜಾರಿಗೊಳ್ಳುತ್ತದೆ |
| Identity & Auth | ಚಾನೆಲ್ ದೃಢೀಕರಣ ಮತ್ತು ಮಾಲೀಕ ಗುರುತು ಪರಿಶೀಲನೆ |
| Secrets Management | Triggerfish ಹಲವು tiers ಅಡ್ಡಲಾಗಿ ರುಜುವಾತುಗಳನ್ನು ಹೇಗೆ ನಿರ್ವಹಿಸುತ್ತದೆ |
| Audit & Compliance | ಆಡಿಟ್ ಟ್ರೇಲ್ ರಚನೆ, ಟ್ರೇಸಿಂಗ್ ಮತ್ತು compliance exports |
