Skip to content

מערכת הסיווג

מערכת סיווג הנתונים היא הבסיס למודל האבטחה של Triggerfish. כל פיסת נתונים שנכנסת, עוברת דרך או יוצאת מהמערכת נושאת תווית סיווג. תוויות אלו קובעות לאן נתונים יכולים לזרום -- ויותר חשוב, לאן הם לא יכולים.

רמות סיווג

Triggerfish משתמשת בהיררכיה מסודרת אחת בת ארבע רמות לכל הפריסות.

רמהדירוגתיאורדוגמאות
RESTRICTED4 (הגבוה)הנתונים הרגישים ביותר הדורשים הגנה מקסימליתמסמכי M&A, חומרי דירקטוריון, PII, חשבונות בנק, רשומות רפואיות
CONFIDENTIAL3מידע רגיש עסקית או אישיתנתוני CRM, פיננסיים, רשומות HR, חוזים, רשומות מס
INTERNAL2לא מיועד לשיתוף חיצוניויקי פנימי, מסמכי צוות, הערות אישיות, אנשי קשר
PUBLIC1 (הנמוך)בטוח לכולם לראותחומרי שיווק, תיעוד ציבורי, תוכן אינטרנט כללי

כלל אי-כתיבה למטה

עיקרון האבטחה החשוב ביותר ב-Triggerfish:

נתונים יכולים לזרום רק לערוצים או נמענים בסיווג שווה או גבוה יותר.

זהו כלל קבוע -- אי אפשר להגדיר, לדרוס או להשבית אותו. ה-LLM לא יכול להשפיע על החלטה זו. :::

היררכיית סיווג: PUBLIC → INTERNAL → CONFIDENTIAL → RESTRICTED. נתונים זורמים רק כלפי מעלה.

משמעות הדבר:

  • תגובה המכילה נתוני CONFIDENTIAL לא יכולה להישלח לערוץ PUBLIC
  • סשן שה-Taint שלו RESTRICTED לא יכול לפלוט לשום ערוץ מתחת ל-RESTRICTED
  • אין דריסת מנהל, אין escape hatch ארגוני, ואין עקיפת LLM

סיווג אפקטיבי

ערוצים ונמענים שניהם נושאים רמות סיווג. כאשר נתונים עומדים לצאת מהמערכת, הסיווג האפקטיבי של היעד קובע מה ניתן לשלוח:

EFFECTIVE_CLASSIFICATION = min(channel_classification, recipient_classification)

הסיווג האפקטיבי הוא ה_נמוך_ מבין השניים. זה אומר שערוץ בסיווג גבוה עם נמען בסיווג נמוך עדיין מטופל כסיווג נמוך.

ערוץנמעןאפקטיבייכול לקבל נתוני CONFIDENTIAL?
INTERNALINTERNALINTERNALלא (CONFIDENTIAL > INTERNAL)
INTERNALEXTERNALPUBLICלא
CONFIDENTIALINTERNALINTERNALלא (CONFIDENTIAL > INTERNAL)
CONFIDENTIALEXTERNALPUBLICלא
RESTRICTEDINTERNALINTERNALלא (CONFIDENTIAL > INTERNAL)

כללי סיווג ערוצים

לכל סוג ערוץ יש כללים ספציפיים לקביעת רמת הסיווג שלו.

Email

  • התאמת דומיין: הודעות @company.com מסווגות כ-INTERNAL
  • המנהל מגדיר אילו דומיינים הם פנימיים
  • דומיינים לא מוכרים או חיצוניים מוגדרים כ-EXTERNAL כברירת מחדל
  • נמענים חיצוניים מפחיתים את הסיווג האפקטיבי ל-PUBLIC

Slack / Teams

  • חברות ב-Workspace: חברים באותו workspace/tenant הם INTERNAL
  • משתמשי Slack Connect חיצוניים מסווגים כ-EXTERNAL
  • משתמשים אורחים מסווגים כ-EXTERNAL
  • הסיווג נגזר מ-API של הפלטפורמה, לא מפרשנות ה-LLM

WhatsApp / Telegram / iMessage

  • ארגוני: מספרי טלפון מותאמים לספריית HR לקביעת פנימי לעומת חיצוני
  • אישי: כל הנמענים מוגדרים כ-EXTERNAL כברירת מחדל
  • משתמשים יכולים לסמן אנשי קשר מהימנים, אך זה לא משנה את חישוב הסיווג -- זה משנה את סיווג הנמען

WebChat

  • מבקרי WebChat תמיד מסווגים כ-PUBLIC (מבקרים אינם מאומתים כבעלים)
  • WebChat מיועד לאינטראקציות פומביות

CLI

  • ערוץ ה-CLI רץ מקומית ומסווג לפי המשתמש המאומת
  • גישת טרמינל ישירה היא בדרך כלל INTERNAL או גבוהה יותר

מקורות סיווג נמענים

ארגוני

  • סנכרון ספרייה (Okta, Azure AD, Google Workspace) מאכלס אוטומטית סיווגי נמענים
  • כל חברי הספרייה מסווגים כ-INTERNAL
  • אורחים וספקים חיצוניים מסווגים כ-EXTERNAL
  • מנהלים יכולים לדרוס לפי איש קשר או דומיין

אישי

  • ברירת מחדל: כל הנמענים הם EXTERNAL
  • משתמשים מסווגים מחדש אנשי קשר מהימנים דרך הנחיות בזרימה או אפליקציית Buoy
  • סיווג מחדש הוא מפורש ומתועד

מצבי ערוצים

כל ערוץ עובר דרך מכונת מצבים לפני שהוא יכול לשאת נתונים:

מכונת מצבי ערוץ: UNTRUSTED → CLASSIFIED או BLOCKED
מצביכול לקבל נתונים?יכול לשלוח נתונים להקשר הסוכן?תיאור
UNTRUSTEDלאלאברירת מחדל לערוצים חדשים/לא מוכרים. מבודד לחלוטין.
CLASSIFIEDכן (במסגרת מדיניות)כן (עם סיווג)נבדק וקיבל רמת סיווג.
BLOCKEDלאלאנחסם מפורשות על ידי מנהל או משתמש.

אבטחה ערוצים חדשים תמיד נכנסים למצב UNTRUSTED. הם לא יכולים לקבל

שום נתונים מהסוכן ולא יכולים לשלוח נתונים להקשר הסוכן. הערוץ נשאר מבודד לחלוטין עד שמנהל (ארגוני) או המשתמש (אישי) מסווג אותו מפורשות. :::

כיצד סיווג מתקשר עם מערכות אחרות

סיווג אינו תכונה עצמאית -- הוא מניע החלטות ברחבי כל הפלטפורמה:

מערכתכיצד סיווג משמש
Taint של סשןגישה לנתונים מסווגים מעלה את הסשן לרמה זו
Hook-י מדיניותPRE_OUTPUT משווה Taint של סשן מול סיווג יעד
MCP Gatewayתגובות שרת MCP נושאות סיווג שמזהם את הסשן
שושלת נתוניםכל רשומת שושלת כוללת את רמת הסיווג והסיבה
התראותתוכן התראות כפוף לאותם כללי סיווג
האצלת סוכןתקרת הסיווג של סוכן הנקרא חייבת לעמוד ב-Taint של הקורא
ארגז חול לתוספיםPlugin SDK מסווג אוטומטית את כל הנתונים הנפלטים