Skip to content
← 部落格

AI 資料洩漏防護:每家企業在傳送下一條提示之前必須做的事

AI 資料洩漏防護指的是當員工和系統與人工智慧工具互動時,阻止敏感的企業資訊被暴露、保留或濫用的政策、技術控制和組織實踐。它解決了一類傳統防護工具未被設計來捕獲的資料遺失問題。

這個問題在機制上看似簡單,在發生範圍上卻令人意外地廣泛。員工將客戶合約貼到 AI 工具中以取得摘要。開發人員將專有原始碼輸入編碼助理以修復錯誤。財務團隊成員向 AI 寫作工具提交一份盈餘報告草稿以潤色。在每個案例中,員工都完成了一些有用的事情。在每個案例中,敏感的組織資料都流向了組織無法控制的基礎設施,在員工從未閱讀過的服務條款下,在可能包括用該內容訓練模型的保留和使用做法下。沒有防火牆標記它。沒有 DLP 警示觸發。沒有稽核日誌以合規團隊能夠採取行動的形式捕獲它。這就是 AI 資料洩漏問題,它正在各種規模和產業的組織中以大多數安全計畫尚未跟上的規模上演。本指南解釋了導致 AI 資料洩漏的原因、它造成最嚴重暴露的位置,以及組織需要採取哪些措施來防止它。

AI agent

理解為什麼 AI 工具構成獨有的資料洩漏類別

繞過現有控制的通道

傳統的資料遺失防護工具透過監控已知的資料通道並套用規則來偵測通過這些通道移動的敏感內容來運作。電子郵件附件會被掃描。向雲端儲存的檔案傳輸會被審查。USB 裝置寫入會被記錄。這些控制反映了 AI 工具成為工作場所標準組成部分之前準確的資料移動模型。

AI 工具代表了大多數現有 DLP 架構沒有正確分類或監控的資料通道。從網路流量的角度來看,員工向 AI 工具提交機密文件看起來與員工使用任何其他網路應用程式完全相同。在網路層面,向 AI 工具伺服器發出的 HTTPS 請求與向生產力應用程式、研究資料庫或新聞網站發出的請求無法區分。DLP 工具看到的是允許的網路流量。安全團隊什麼也看不到。敏感資料已經離開了大樓。

這一架構差距是 AI 資料洩漏防護需要專門關注的原因,而不是假設現有控制已經涵蓋。威脅模型不同,資料通道不同,解決它所需的控制也與處理常規資料遺失情境的控制不同。

資料進入 AI 工具後會發生什麼

具體的資料洩漏風險取決於 AI 供應商如何處理提交到其系統的資料,這在供應商、產品和層級之間差異很大。瞭解做法的範圍有助於組織圍繞實際風險而非籠統的擔憂來校準其防護工作。

模型訓練使用是最直接將資料暴露事件轉變為持續洩漏問題的風險。當供應商的服務條款允許使用提交的內容來改進其模型時,資料不僅僅是暫時通過其系統。它可能影響模型未來的輸出,以一種可能在對其他使用者的回覆中浮現該資訊片段的方式。與主要供應商的企業協議作為標準條款禁止這種做法,但消費者和免費層級通常允許,而使用個人帳戶進行工作任務的員工通常在消費者條款下運作。

推理日誌保留創造了一個有時間限制的暴露視窗,而不是持續的訓練風險。大多數 AI 供應商出於除錯、品質保證和法律合規目的,在規定的期間內保留查詢和回應日誌。在該保留期間,提交到這些查詢中的敏感資料存在於供應商的基礎設施上,可能可被供應商員工存取,受供應商自身安全控制的約束,並可能回應針對供應商的法律程序。

跨境資料傳輸發生在 AI 推理基礎設施位於提交資料的組織所在司法管轄區之外的情況下。對於有資料駐留義務的組織,這造成了獨立於任何安全失敗的合規暴露。資料可能在供應商的基礎設施上技術上是安全的,同時違反關於資料可在何處處理的法規要求。

瞭解 AI 安全框架如何處理每個特定的資料處理風險類別,有助於組織建構針對其 AI 工具環境實際風險的防護計畫,而不是針對一般資料遺失擔憂的計畫。

AI agent

AI 資料洩漏在何處造成最嚴重的暴露

風險最高的受監管和機密資料類別

並非所有組織資料都承擔相同的洩漏風險。當進入未經授權的 AI 系統時造成最嚴重暴露的資料類別有一個共同特徵:它們的處理受法律義務、合約承諾或競爭敏感性的約束,使得未經授權的揭露代價高昂,遠遠超出直接的資訊損失。

受 GDPR、HIPAA 或同等框架約束的個人資料,當透過 AI 工具處理而沒有這些框架所要求的法律依據、供應商協議和技術保障時,會造成監管暴露。一名員工將客戶個人資訊試算表提交到消費者 AI 工具進行資料清理,可能在貼上內容到聊天視窗所需的時間內,就造成了 GDPR 下的可報告資料外洩、HIPAA 下的商業夥伴協議違規,以及任何數量的行業特定法規下的合規事件。

提交到 AI 工具的法律特權內容,造成了大多數組織的法律團隊尚未完全解決的律師-客戶特權問題。AI 工具處理是否構成放棄特權的揭露,在大多數司法管轄區是一個不斷演變的法律問題,最安全的組織立場是防止特權內容進入處理方式不是專門為法律行業要求設計和簽約的 AI 工具。

包括原始碼、產品規格、演算法和研究資料在內的專有技術資訊,代表了組織大量投資保護的競爭情報。AI 編碼助理和文件分析工具是技術和研究組織中最常用的 AI 工具之一,也是最經常與組織最希望不要進入外部系統的資料類別一起使用的工具。

資料類別來自 AI 洩漏的主要風險監管或法律後果
客戶個人資料未經授權的第三方處理GDPR 違規通知、HIPAA 違規、行業特定處罰
員工個人資料透過 AI HR 工具的人力資源資料暴露勞動法和資料保護違規
法律特權內容因揭露而可能放棄特權敏感事務失去法律保護
專有原始碼競爭情報暴露智慧財產權損失、與客戶的合約違約
財務草稿資訊揭露前的重大非公開資訊證券法暴露、選擇性揭露風險
客戶機密資訊違反專業保密義務客戶關係損害、專業責任
商業秘密透過模型訓練的競爭情報如果公開揭露則失去商業秘密保護

影子 AI 維度

最困難的 AI 資料洩漏防護挑戰不是組織已經核准並在治理框架下部署的工具。而是員工在沒有組織知情或監督的情況下使用的工具。影子 AI,即在任何核准計畫之外使用 AI 工具,在大多數組織中產生了大多數 AI 資料洩漏事件,因為它完全在 AI 治理計畫建立的控制之外運作。

影子 AI 使用主要不是不良行為者的合規失敗。這是員工的生產力回應,他們發現 AI 工具有助於他們的工作,並採用了任何可以存取的工具,而不是等待時間表可能不明確的組織核准流程。理解這種動機對於設計實際減少洩漏的防護方法至關重要,而不是將使用進一步推向地下。

最有效的影子 AI 防護結合了對整個組織正在使用的 AI 工具的可見性、滿足員工實際需求的清晰且可存取的核准工具計畫,以及為已經在核准計畫之外使用工具的員工提供非懲罰性揭露通道。主要以禁止應對影子 AI 的組織發現,潛在的生產力需求繼續透過逐漸不那麼可見的方式得到滿足,造成了更大的洩漏暴露而不是更少。

審查關於已核准 AI 工具部署的 AI 架構決策如何影響影子替代方案的吸引力,有助於組織設計其核准計畫,使其成為阻力最小的路徑,而不是合規摩擦最大的路徑。

真正有效的技術和組織控制

AI 資料洩漏防護的技術控制

AI 資料洩漏防護的技術控制在多個層面運作,每一層都解決敏感資料如何到達 AI 系統的不同方面。有效的計畫將這些控制分層,而不是依賴於任何單一方法。

網路級控制可以透過阻止或監控到不在核准清單上的 AI 工具網域的流量,限制從組織網路和裝置存取未經核准的 AI 服務。這種方法在受管理的企業網路上比在員工可能使用個人網路和裝置的遠端工作環境中更有效,並且隨著新 AI 工具出現以及現有工具更改其網域基礎設施,需要持續維護。

設定為識別 AI 工具上傳模式並對透過 AI 介面提交的資料套用內容檢查的端點資料遺失防護,將 DLP 涵蓋延伸到傳統 DLP 架構遺漏的 AI 通道。這需要專門為 AI 工具流量模式而不僅僅是常規外洩通道設定的 DLP 工具。

在提交點執行資料分類政策的瀏覽器擴充功能和基於代理的控制,防止分類高於定義敏感性閾值的內容被提交到核准計畫之外的 AI 工具,代表了比網路級阻止更有針對性的方法。這些控制可以設定為警告接近政策邊界的使用者,而不僅僅是在越過後阻止,在技術控制之外建立行為強化機制。

企業 AI 閘道產品已經出現作為一個專門的控制類別,透過集中檢查和政策執行層路由所有組織 AI 流量。這些產品提供整個組織 AI 工具使用情況的可見性,對所有 AI 提交套用資料分類和內容檢查,執行核准的工具政策,並以合規和安全團隊可以使用的格式產生稽核日誌。

控制類型所解決的問題限制
網路阻止防止在企業網路上存取未經核准的 AI 工具在個人網路和非託管裝置上無效
用於 AI 的端點 DLP檢查透過 AI 介面提交的內容需要超出標準 DLP 的 AI 特定設定
瀏覽器擴充功能控制在 AI 提交點的政策執行涵蓋範圍限於受管理的瀏覽器環境
企業 AI 閘道集中可見性、檢查和政策執行需要透過閘道基礎設施路由所有 AI 流量
資料分類標籤指導員工關於 AI 工具適用性的決策依賴員工合規而非技術執行
零信任存取控制將 AI 工具存取限制為定義上下文中的授權使用者不解決授權提交的內容

補充技術防護的組織控制

技術控制透過自動化執行減少洩漏。組織控制透過決定技術控制是被繞過、被規避還是真正整合到工作完成方式中的員工判斷和行為來減少洩漏。

將敏感性級別對應到允許的 AI 處理環境的清晰資料分類政策,為員工提供了一個他們可以一致套用的決策規則,而無需為每項任務查閱政策文件。當員工知道分類為機密的資料只能透過內部部署 AI 工具或具有簽署資料協議的企業級雲端工具處理時,他們就有了一個可操作的指南,而不是一個模糊的小心指示。

使用具體的、角色特定的情境而不是通用資料保護意識內容的培訓,產生了抽象培訓所沒有的行為變化。能夠描述提交到流行編碼助理的原始碼在其預設服務條款下會發生什麼的工程師,具有改變其行為的實用知識。參加過關於資料保護原則培訓的工程師有意識,但當截止日期造成使用最快可用工具的壓力時,這種意識可能轉化為也可能不轉化為不同的行為。

將過去影子 AI 使用的首次揭露視為學習機會而不是合規違規的事件揭露流程,創造了鼓勵員工浮現現有暴露而不是隱藏的心理安全。未知洩漏的組織成本高於可以評估和解決的已知洩漏的成本。

瞭解已核准企業 AI 工具中的 AI 功能如何向使用者傳達其資料處理實踐,有助於組織建構將政策要求與員工在實踐中遇到的特定工具行為連接的培訓,而不是將政策與工具之間的連接視為員工應該獨立弄清楚的事情。

AI agent

建構 AI 資料洩漏防護計畫

清單和評估基礎

有效的 AI 資料洩漏防護計畫從整個組織正在使用的 AI 工具的準確畫面開始,而不僅僅是已正式核准的工具。這兩個清單之間的差距定義了直接的防護計畫範圍。

建構實際的 AI 工具清單需要結合多個資料來源,因為沒有單一來源能夠捕獲完整畫面。IT 管理的軟體清單捕獲正式採購的工具。網路流量分析揭示了整個組織的 AI 工具流量到達的網域。員工調查和部門訪談揭示了員工正在使用的、IT 採購從未看到的工具。瀏覽器擴充功能和端點清單識別在單個裝置級別安裝的 AI 工具。完整清單是所有這些來源的聯集,幾乎總是比任何組織在進行此練習之前預期的更大、更多樣化。

清單存在後,每個工具都需要根據資料安全要求進行評估,涵蓋供應商資料處理實踐、認證狀態、合約保護可用性,以及員工實際使用的資料類別。評估輸出是清單中每個 AI 工具的風險分層分類,從所有資料類別核准、到有限制核准、到待審查禁止、到完全禁止。

供應商和合約保護

僅依賴行為和技術控制而沒有相應合約保護的防護計畫,建立了一個在基礎上不完整的治理結構。技術控制減少了透過未經授權的工具發生洩漏的可能性。合約保護定義了當使用授權工具時適用的保護,以及當這些保護未被履行時組織擁有的追索權。

每個其工具處理高於最低敏感性級別的組織資料的 AI 供應商,都需要一份簽署的資料處理協議,明確禁止訓練資料使用、定義保留限制、承諾在所需時間範圍內通知違規,並記錄套用於組織資料的安全控制。對於醫療保健組織,涵蓋特定 AI 產品的商業夥伴協議是法律前提,而不是合約偏好。

合約保護計畫需要像技術控制一樣維護。供應商更新其服務條款。在一份協議下涵蓋的產品可能因產品組合變化而與該協議分離。認證期到期。將年度供應商協議審查週期納入計畫,可以防止組織資料在不再反映供應商實際實踐的協議下被處理的情況。

關於建構從清單和評估到技術控制和供應商管理的 AI 資料洩漏防護計畫的全面 AI 指南,幫助組織建構解決完整防護挑戰的計畫,而不是其最可見的部分。

需要知道的事

關於 AI 資料洩漏防護,組織在建構其計畫時一致遇到的幾個重要現實:

來自企業 AI 供應商的消費者級產品與其企業產品具有不同的資料處理實踐,有時差異巨大。透過個人帳戶和透過企業帳戶存取的相同基礎 AI 能力,可能具有完全不同的訓練資料政策、保留實踐和合約保護可用性。因為組織帳戶需要核准或要花錢而透過個人帳戶存取企業 AI 工具的員工,在工作資料上使用消費者級保護,而沒有認識到這種差異。

AI 的 30% 規則有用地適用於資料洩漏防護計畫設計。自動化技術控制應處理約 30% 的防護工作,特別是自動化在規模上一致處理的高頻、政策執行任務。人類判斷和組織治理涵蓋剩餘的 70%,涉及風險評估、供應商評估、事件回應,以及決定技術控制是整合到工作實際完成方式中還是被視為繞過障礙的培訓和文化建設。

僅透過網路級阻止來控制基於瀏覽器的 AI 工具使用是最難的類別。在個人網路上遠端工作、使用個人裝置進行工作任務、或透過類似於一般網路使用的瀏覽器介面存取 AI 工具的員工,呈現了端點方法比基於網路的方法更好地解決的控制挑戰。

嵌入在廣泛使用的生產力軟體中的生成式 AI 工具創造了對大多數員工來說不像 AI 工具使用的洩漏暴露。當文字處理器使用 AI 建議文字補全、試算表使用 AI 解釋資料輸入、或電子郵件用戶端使用 AI 起草回應時,員工正在使用 AI,而沒有任何可能提示他們考慮資料分類的有意決策。僅解決獨立 AI 工具的治理計畫在這裡有盲點。

Stephen Hawking 關於 AI 的警告集中在來自超級智慧系統的存在風險,而不是具體的資料洩漏,但他關於在 AI 能力上比在 AI 治理上推進更快的更廣泛警告,直接轉化為資料洩漏問題。比其資料保護框架能夠適應的速度更快部署 AI 工具的組織,正是創造了 Hawking 關於 AI 治理不足的一般擔憂所指向的未管理暴露。資料洩漏防護的實際教訓是,治理基礎設施需要在部署規模之前發展,而不是追趕它。

稽核軌跡品質決定了組織在洩漏事件發生時能多好地回應。知道員工向未經授權的 AI 工具提交了敏感資料是有用的。知道提交了哪些具體資料、何時、AI 工具的回應是什麼、員工對該回應做了什麼,這才使有效的事件回應成為可能。AI 資料洩漏防護的日誌基礎設施需要為事件調查實用性而建構,而不僅僅是合規勾選方塊的滿足。

國際員工和辦公室為洩漏防護增加了資料駐留複雜性。在一個司法管轄區核准用於非個人業務資料的 AI 工具,當在另一個司法管轄區與相同資料類別一起使用時,可能觸發資料駐留違規。跨國組織需要資料洩漏防護計畫,考慮司法管轄區差異,而不是套用沒有地理敏感性的統一全球政策。

將 AI 資料洩漏防護作為持續學科

AI 資料洩漏防護不是一個有完成日期的專案。它是一個持續的營運學科,需要與 AI 工具環境、監管環境和它管理的組織 AI 足跡同步演進。十二個月前不存在的工具,今天是許多員工工作流程的標準部分。一年前還是願景的法規,現在是可執行的要求。曾經侷限於獨立工具的 AI 能力,現在以模糊 AI 工具使用與常規系統使用之間界限的方式嵌入到營運基礎設施中。

將 AI 資料洩漏防護建構為可持續營運計畫的組織,具有使其自我強化而非依賴執行的可見性基礎設施、治理流程和文化基礎,正在建構隨時間累積的保護。新增到計畫中的每個核准工具都減少了影子替代方案的吸引力。每個培訓週期都改進員工對資料分類和工具選擇的判斷。每次供應商協議審查都在記錄與實際保護之間的偏差造成未被發現的暴露之前捕獲它。

流經貴組織 AI 工具的資料是您的業務生成的一些最敏感的資訊,在治理資料處理的正常控制最不成熟的背景下被處理。建構適當保護它的防護計畫不是合規練習。這是對貴組織已經成為的 AI 賦能業務的基礎性安全投資。

常見問題

什麼是 AI 中的資料洩漏?

**AI 中的資料洩漏指的是透過 AI 工具使用而暴露敏感的組織資訊,當員工向其供應商資料處理實踐、保留政策或訓練資料使用造成超出預期處理目的的未經授權揭露的 AI 系統提交機密資料時發生。**它與傳統資料洩漏不同,因為它透過現有 DLP 工具通常不監控的通道發生,透過真正具有生產力而非疏忽或惡意的員工行為發生,並且後果可能不僅包括即時暴露,還包括將敏感資訊持久編碼到供應商模型基礎設施中。

AI 的 30% 規則是什麼?

**AI 的 30% 規則是 AI 系統和自動化控制應處理工作流程或計畫功能約 30% 的原則,特別是自動化提供明確效率和可靠性益處的高頻、定義明確且一致可執行的任務,而人類判斷和治理涵蓋剩餘的 70%,涉及上下文評估、風險決策,以及需要由人而不是自動化系統承擔的責任。**在 AI 資料洩漏防護中,這意味著自動化技術控制處理日常政策執行,而人類治理擁有風險評估、供應商評估、事件回應,以及決定技術控制是否整合到實際行為中的文化和培訓維度。

Stephen Hawking 關於 AI 的警告是什麼?

**Stephen Hawking 關於 AI 的主要警告涉及超越人類認知能力並追求與人類福祉不一致的目標的通用人工智慧可能的存在風險,表達了對人類在 AI 能力發展上行動太快、對安全和治理關注不足的擔憂。**雖然他的擔憂針對的是長期存在風險而不是近期業務資料安全,但潛在的治理原則直接轉化為實際的 AI 部署:比其治理框架能夠適應的速度更快推進 AI 能力的組織,創造了能力沒有責任所產生的未管理風險。

如何在不洩漏資料的情況下使用 AI?

**在不洩漏資料的情況下使用 AI 需要一致套用四種做法:在每次使用前僅提交已根據 AI 工具核准的資料類別評估過的資料;僅依賴具有簽署的禁止訓練資料使用的資料處理協議的企業級 AI 工具;瞭解每個用於工作任務的 AI 工具的具體資料處理實踐,包括嵌入在生產力軟體中的工具;並遵循定義哪些敏感性級別允許與哪些 AI 工具一起使用的組織資料分類政策。**對於最高敏感性資料類別,唯一完全防洩漏的方法是使用部署在私有基礎設施上的 AI 工具,資料永遠不會離開組織自己的網路邊界。

不應該告訴 ChatGPT 什麼?

**透過 ChatGPT 的標準消費者介面,員工不應提交客戶個人資訊、員工記錄、法律特權通訊、專有原始碼或演算法、財務揭露草稿或重大非公開資訊、商業秘密、客戶機密資訊,或任何其他其未經授權揭露將為組織造成法律、監管、競爭或合約後果的資料。**ChatGPT 的消費者版本在不包括使企業級 AI 工具適用於業務資料的資料處理協議、訓練資料禁止和合約保護的服務條款下運營,這意味著透過個人帳戶提交的內容可能以組織無法控制甚至無法發現的方式被保留和潛在使用。