מרכז האמון
Triggerfish אוכף אבטחה בקוד דטרמיניסטי מתחת לשכבת ה-LLM -- לא בפרומפטים שהמודל עלול להתעלם מהם. כל החלטת מדיניות מתקבלת על ידי קוד שאינו ניתן להשפעה על ידי הזרקת פרומפט, הנדסה חברתית, או התנהגות שגויה של המודל. ראו את עמוד עיצוב מונחה-אבטחה המלא לצורך ההסבר הטכני המעמיק.
בקרות אבטחה
בקרות אלו פעילות בגרסה הנוכחית. כל אחת נאכפת בקוד, נבדקת ב-CI, וניתנת לביקורת במאגר הקוד הפתוח.
| בקרה | סטטוס | תיאור |
|---|---|---|
| אכיפת מדיניות תת-LLM | ACTIVE | שמונה ווים דטרמיניסטיים מיירטים כל פעולה לפני ואחרי עיבוד ה-LLM. המודל אינו יכול לעקוף, לשנות או להשפיע על החלטות אבטחה. |
| מערכת סיווג נתונים | ACTIVE | היררכיה בת ארבע רמות (PUBLIC, INTERNAL, CONFIDENTIAL, RESTRICTED) עם אכיפת אין-כתיבה-למטה חובה. |
| מעקב זיהום סשן | ACTIVE | כל סשן עוקב אחר רמת הסיווג הגבוהה ביותר של נתונים שנגישו. זיהום רק עולה, לעולם לא יורד. |
| תיעוד ביקורת בלתי ניתן לשינוי | ACTIVE | כל החלטות המדיניות מתועדות עם הקשר מלא. תיעוד ביקורת אינו ניתן לביטול על ידי שום רכיב במערכת. |
| בידוד סודות | ACTIVE | אישורים מאוחסנים ב-OS keychain או כספת. לעולם לא בקובצי תצורה, אחסון, יומנים, או הקשר LLM. |
| ארגז חול לתוספים | ACTIVE | תוספי צד שלישי רצים בארגז חול כפול Deno + WASM (Pyodide). ללא גישת רשת לא מוצהרת, ללא חילוץ נתונים. |
| סריקת תלויות | ACTIVE | סריקת פגיעויות אוטומטית דרך GitHub Dependabot. בקשות משיכה נפתחות אוטומטית עבור CVE של ספריות. |
| בסיס קוד פתוח | ACTIVE | ארכיטקטורת האבטחה המלאה מורשית ב-Apache 2.0 וניתנת לביקורת ציבורית. |
| פריסה מקומית | ACTIVE | רץ לחלוטין על התשתית שלכם. ללא תלות בענן, ללא טלמטריה, ללא עיבוד נתונים חיצוני. |
| הצפנה | ACTIVE | TLS לכל הנתונים בתנועה. הצפנה ברמת מערכת ההפעלה בזמן מנוחה. אינטגרציית כספת ארגונית זמינה. |
| תוכנית חשיפה אחראית | ACTIVE | תהליך דיווח פגיעויות מתועד עם לוחות זמנים מוגדרים לתגובה. ראו מדיניות חשיפה. |
| תמונת מכולה מוקשחת | PLANNED | תמונות Docker על בסיס Google Distroless עם CVE כמעט-אפסיים. סריקת Trivy אוטומטית ב-CI. |
הגנה בעומק -- 13 שכבות עצמאיות
אף שכבה בודדת אינה מספיקה לבדה. אם שכבה אחת נפרצת, השכבות הנותרות ממשיכות להגן על המערכת.
| שכבה | שם | אכיפה |
|---|---|---|
| 01 | אימות ערוץ | זהות מאומתת בקוד בעת הקמת סשן |
| 02 | גישה מודעת-הרשאות | הרשאות מערכת מקור, לא אישורי מערכת |
| 03 | מעקב זיהום סשן | אוטומטי, חובה, העלאה בלבד |
| 04 | שושלת נתונים | שרשרת מקור מלאה לכל אלמנט נתונים |
| 05 | ווי אכיפת מדיניות | דטרמיניסטיים, בלתי ניתנים לעקיפה, מתועדים |
| 06 | שער MCP | הרשאות לכל כלי, סיווג שרת |
| 07 | ארגז חול לתוספים | ארגז חול כפול Deno + WASM (Pyodide) |
| 08 | בידוד סודות | OS keychain או כספת, מתחת לשכבת ה-LLM |
| 09 | ארגז חול לכלי מערכת קבצים | כלא נתיבים, סיווג נתיבים, I/O לפי זיהום |
| 10 | זהות והאצלת סוכנים | שרשראות האצלה קריפטוגרפיות |
| 11 | תיעוד ביקורת | אינו ניתן לביטול |
| 12 | מניעת SSRF | רשימת IP חסומים + בדיקות רזולוציית DNS |
| 13 | שערי סיווג זיכרון | כתיבה ברמה עצמית, קריאה כלפי מטה בלבד |
קראו את תיעוד הארכיטקטורה המלא של הגנה בעומק.
מדוע אכיפה תת-LLM חשובה
רוב פלטפורמות סוכני ה-AI אוכפות אבטחה דרך פרומפטים של מערכת --
הוראות ל-LLM האומרות "אל תשתף נתונים רגישים." מתקפות הזרקת פרומפט יכולות לדרוס הוראות אלו.
Triggerfish נוקט בגישה שונה: ל-LLM אין סמכות כלל על החלטות אבטחה. כל האכיפה מתרחשת בקוד דטרמיניסטי מתחת לשכבת ה-LLM. אין נתיב מפלט ה-LLM לתצורת האבטחה. :::
מפת דרכים לתאימות
Triggerfish נמצא בשלב טרום-הסמכה. עמדת האבטחה שלנו היא ארכיטקטונית וניתנת לאימות בקוד המקור כבר היום. הסמכות רשמיות נמצאות במפת הדרכים.
| הסמכה | סטטוס | הערות |
|---|---|---|
| SOC 2 Type I | PLANNED | קריטריוני שירותי אמון אבטחה + סודיות |
| SOC 2 Type II | PLANNED | יעילות בקרות מתמשכת על פני תקופת צפייה |
| HIPAA BAA | PLANNED | הסכם שותף עסקי ללקוחות בריאות |
| ISO 27001 | PLANNED | מערכת ניהול אבטחת מידע |
| בדיקת חדירה של צד שלישי | PLANNED | הערכת אבטחה עצמאית |
| תאימות GDPR | PLANNED | ארכיטקטורה באירוח עצמי עם שימור ומחיקה ניתנים להגדרה |
הערה על אמון
ליבת האבטחה היא קוד פתוח תחת Apache 2.0. ניתן לקרוא כל שורת
קוד של אכיפת מדיניות, להריץ את חבילת הבדיקות ולאמת טענות בעצמכם. הסמכות נמצאות במפת הדרכים. :::
בקרו את המקור
בסיס הקוד המלא של Triggerfish זמין ב- github.com/greghavens/triggerfish -- מורשה ב-Apache 2.0.
דיווח פגיעויות
אם גיליתם פגיעות אבטחה, אנא דווחו אותה דרך מדיניות החשיפה האחראית שלנו. אל תפתחו issues ציבוריים ב-GitHub עבור פגיעויות אבטחה.
