Skip to content
بلاگ →

AI ڈیٹا کی خلاف ورزی کیا ہے؟ سب کے لیے ایک واضح رہنما

AI ڈیٹا کی خلاف ورزی کیا ہے؟ یہ ایک سیکیورٹی واقعہ ہے جس میں ایک AI سسٹم -- اپنے تربیتی ڈیٹا، ماڈل آؤٹ پٹس، یا انفراسٹرکچر کے ذریعے -- بغیر اجازت کے حساس معلومات کو لیک، ظاہر، یا غلط طریقے سے ہینڈل کرتا ہے۔ جیسے جیسے AI ٹولز روزمرہ کے کاموں کا حصہ بن رہے ہیں، اس خطرے کو سمجھنا اب ایسے کاروباروں اور افراد کے لیے اختیاری نہیں رہا جو اپنی ڈیجیٹل سیکیورٹی کا خیال رکھتے ہیں۔

آپ پوچھ سکتے ہیں کہ یہ آپ کو ذاتی طور پر کیوں اہم ہے۔ چاہے آپ کسٹمر سپورٹ کے لیے چیٹ بوٹ استعمال کرتے ہوں، کام پر AI سے چلنے والے ٹولز پر انحصار کرتے ہوں، یا صرف آن لائن سفارشاتی انجنوں کے ساتھ تعامل کرتے ہوں، آپ پہلے ہی AI ایکوسسٹم کے اندر ہیں۔ جب وہ ایکوسسٹم ٹوٹتا ہے، تو حقیقی لوگوں کے بارے میں حقیقی ڈیٹا باہر نکل آتا ہے۔ یہ رہنما آپ کو ٹھیک ٹھیک یہ بتاتا ہے کہ کیا ہوتا ہے، کیوں ہوتا ہے، اور آپ اس کے بارے میں کیا کر سکتے ہیں۔

AI agent

AI ڈیٹا کی خلاف ورزی بالکل کیا ہے؟

AI ڈیٹا کی خلاف ورزی کیا ہے، یہ سمجھنے کے لیے، آپ کو پہلے یہ سوچنا ہوگا کہ AI سسٹمز اصل میں کیسے کام کرتے ہیں۔ یہ سسٹمز بڑے ڈیٹا سیٹس پر تربیت یافتہ ہوتے ہیں، جن میں اکثر ای میلز، طبی ریکارڈز، خریداری کی تاریخیں، یا صارف کے رویے کے لاگز ہوتے ہیں۔ وہ ڈیٹا تربیت کے بعد محض غائب نہیں ہو جاتا -- یہ ماڈل میں اس طرح سرایت کر جاتا ہے کہ بعض اوقات اسے واپس حاصل کیا جا سکتا ہے۔

ایک خلاف ورزی کئی پرتوں پر ہو سکتی ہے۔ تربیتی ڈیٹا خود سیکھنے کے عمل سے پہلے یا اس کے دوران چوری ہو سکتا ہے۔ ماڈل حساس اندراجات کو "یاد" رکھ سکتا ہے اور صحیح طریقے سے کہنے پر انہیں دوبارہ تخلیق کر سکتا ہے۔ یا حملہ آور AI چلانے والے API یا کلاؤڈ ماحول میں کمزوریوں کا فائدہ اٹھا سکتے ہیں۔

اسے سمجھنے کا ایک مفید طریقہ یہ ہے: روایتی ڈیٹا کی خلاف ورزیاں ایسی ہیں جیسے کوئی فائلنگ کیبینٹ میں گھس رہا ہو۔ AI ڈیٹا کی خلاف ورزی زیادہ اس بات سے مشابہت رکھتی ہے کہ کوئی فائلنگ کیبینٹ کو بولنے پر مجبور کرنے کا طریقہ ڈھونڈ لیتا ہے -- اور یہ ان تمام چیزوں کی فہرست پیش کرنا شروع کر دیتا ہے جو اس نے کبھی محفوظ کی ہیں۔

AI ڈیٹا کی خلاف ورزیوں کو زیادہ پیچیدہ کیوں بناتا ہے

روایتی سائبر سیکیورٹی فائر والز اور رسائی کنٹرولز کے ساتھ ڈیٹا بیسز اور سرورز کو محفوظ بنانے پر مرکوز تھی۔ AI کئی نئی پیچیدگیاں شامل کرتا ہے جو دفاع کو مشکل بناتی ہیں۔

پہلی بات، AI ماڈلز غیر ارادی طور پر مخصوص ڈیٹا پوائنٹس کو یاد کر سکتے ہیں۔ Google Brain اور دیگر اداروں کی تحقیق نے ظاہر کیا ہے کہ بڑے زبان کے ماڈلز جزوی ان پٹس کے ساتھ کہنے پر درست تربیتی ڈیٹا کو دوبارہ تخلیق کر سکتے ہیں۔ اسے "میموریزیشن حملہ" کہا جاتا ہے اور اس کے لیے روایتی معنوں میں کسی ہیکنگ کی ضرورت نہیں ہوتی -- صرف چالاک پرومپٹنگ کی۔

دوسری بات، AI پائپ لائنوں میں اکثر تیسرے فریق کے ڈیٹا فروشندے، کلاؤڈ انفرنس فراہم کنندگان، اور اوپن سورس ماڈل وزن شامل ہوتے ہیں۔ ہر منتقلی نقطہ ممکنہ نمائش ہے۔ کسی بھی AI تنصیب کے پیچھے سیکیورٹی فن تعمیر کو سمجھنا اس بات کی نشاندہی میں مدد کرتا ہے کہ وہ منتقلیاں کہاں خطرہ پیدا کرتی ہیں۔

تیسری بات، جب کوئی خلاف ورزی ہوتی ہے، تو اس کے دائرہ کار کی تعریف کرنا مشکل ہوتا ہے۔ ڈیٹا بیس کی خلاف ورزی کے ساتھ، آپ اکثر بے نقاب ہونے والے ریکارڈز کو شمار کر سکتے ہیں۔ AI ماڈل کے ساتھ، آپ کو یہ نہیں معلوم ہو سکتا کہ اس نے کیا یاد کیا، یا کب وہ معلومات دوبارہ سامنے آ سکتی ہیں۔

AI agent

AI ڈیٹا کی خلاف ورزیوں کے بارے میں جاننے کی چیزیں

گہرائی میں جانے سے پہلے، یہاں کچھ اہم حقائق ہیں جنہیں ذہن میں رکھنا ضروری ہے:

  • AI سسٹمز روایتی معنوں میں "ہیک" ہوئے بغیر ڈیٹا کو ظاہر کر سکتے ہیں۔ بعض اوقات، ماڈل خود غیر ارادی ڈیٹا ماخذ بن جاتا ہے۔
  • تمام AI ڈیٹا کی خلاف ورزیاں بدنیتی پر مبنی افراد کو شامل نہیں کرتیں۔ غلط کنفیگرڈ سٹوریج بکٹس، حد سے زیادہ اجازت دینے والے APIs، یا حادثاتی ڈیٹا لاگنگ سب نمائش کا سبب بن سکتے ہیں۔
  • GDPR اور HIPAA جیسے ریگولیٹری فریم ورک AI کے زیر انتظام ڈیٹا پر اسی طرح لاگو ہوتے ہیں جیسے کسی دوسرے سسٹم پر۔ آپ کا AI فروشندہ تربیتی ڈیٹا کے ساتھ کیا کرتا ہے، اس سے لاعلمی کوئی قانونی دفاع نہیں ہے۔
  • AI کی خلاف ورزی میں نمائش کے پیمانے کو ماپنا مشکل ہو سکتا ہے۔ SQL ڈیٹا بیس کے برعکس جہاں قطاریں قابل شمار ہوتی ہیں، ذاتی ڈیٹا کے بارے میں ماڈل کا "علم" احتمالی ہوتا ہے۔
  • پرومپٹ انجیکشن -- جس میں ایک حملہ آور ذخیرہ شدہ معلومات نکالنے کے لیے ان پٹ کو ہیرا پھیری کرتا ہے -- 2024 اور 2025 کے مطابق سب سے تیزی سے بڑھنے والے AI حملے کے ویکٹرز میں سے ایک ہے۔

AI ڈیٹا کی خلاف ورزی اصل میں کیسے ہوتی ہے

خلاف ورزی ہونے کے لیے کئی الگ راستے ہیں۔ ہر ایک کو سمجھنا آپ کو کسی بھی AI سے چلنے والے ٹول کا جائزہ لیتے وقت صحیح سوالات پوچھنے میں مدد دیتا ہے۔

تربیتی ڈیٹا کا زہر اور نکالنا

تربیت سے پہلے ڈیٹا پائپ لائن تک رسائی حاصل کرنے والے حملہ آور یا تو ڈیٹا سیٹ کو مکمل طور پر چرا سکتے ہیں یا بدنیتی پر مبنی ریکارڈز داخل کر سکتے ہیں۔ تربیت کے بعد، حملوں کی ایک علیحدہ کلاس یہ نکالنے کی کوشش کرتی ہے کہ ماڈل نے کیا سیکھا۔ محققین نے دکھایا ہے کہ ماڈل کو بار بار اس کے اپنے آؤٹ پٹ سے کھلانا -- جسے کبھی کبھی "ڈیٹا نکالنے کا لوپ" کہا جاتا ہے -- اسے تربیتی مثالوں کو لفظ بہ لفظ دوبارہ پیدا کرنے کا سبب بن سکتا ہے۔

API اور انفرنس لیئر کے حملے

جب ایک ماڈل API کے ذریعے تعینات کیا جاتا ہے، تو ہر استفسار جانچ پڑتال کا موقع ہوتا ہے۔ ایک حملہ آور ہزاروں احتیاط سے تیار کردہ پرومپٹس بھیج سکتا ہے جو تربیت کے دوران ماڈل کو ملنے والی ذاتی معلومات نکالنے کے لیے ڈیزائن کیے گئے ہوں۔ یہی وجہ ہے کہ AI تنصیبات کے لیے اچھی طرح سے ڈیزائن کیے گئے سیکیورٹی فیچرز میں استفسار کی شرح کی حد بندی، آؤٹ پٹ فلٹرنگ، اور انفرنس لاگز پر بے قاعدگی کا پتہ لگانا شامل ہے۔

تیسرے فریق کے انضمام کے خطرات

بہت سے کاروبار AI ٹولز کو موجودہ سافٹ ویئر اسٹیکس میں جوڑتے ہیں -- CRMs، HR پلیٹ فارمز، صحت کی دیکھ بھال کے ریکارڈ سسٹمز۔ ہر انضمام ایک نیا ڈیٹا راستہ بناتا ہے۔ اگر AI فروشندہ اپنی طرف سے خلاف ورزی کا تجربہ کرتا ہے، تو ہر منسلک سسٹم کا ڈیٹا ممکنہ طور پر ظاہر ہو جاتا ہے۔

حملے کا ویکٹریہ کیسے کام کرتا ہےسب سے زیادہ خطرے میں کون ہے
تربیتی ڈیٹا نکالنایاد کردہ ڈیٹا کو دوبارہ تخلیق کرنے کے لیے ڈیزائن کیے گئے پرومپٹساپنی مرضی کے مطابق تربیت یافتہ ماڈلز استعمال کرنے والے ادارے
API کی جانچ پڑتالماڈل کے علم کا نقشہ بنانے کے لیے بار بار کے استفساراتعوامی AI APIs والے کاروبار
تیسرے فریق کے انضمام کی خلاف ورزیفروشندے کا انفراسٹرکچر سمجھوتہ ہو جاتا ہےپلگ اینڈ پلے AI ٹولز استعمال کرنے والے SMBs
غلط کنفیگرڈ سٹوریجتربیتی ڈیٹا رکھنے والے کلاؤڈ بکٹس کھلے چھوڑ دیے جاتے ہیںتیز رفتار AI تنصیبات والی تنظیمیں

حقیقی دنیا کے اثرات: کیا ظاہر ہوتا ہے؟

AI کی خلاف ورزی میں خطرے میں آنے والے ڈیٹا کی اقسام نمایاں طور پر مختلف ہوتی ہیں اس بات پر منحصر ہے کہ ماڈل کس پر تربیت یافتہ تھا یا یہ رن ٹائم پر کس ڈیٹا پر کارروائی کرتا ہے۔

صحت کی دیکھ بھال کے AI سسٹمز کے لیے، مریض کی تشخیص، دوائی کی تاریخیں، اور ذاتی شناخت کنندگان واضح تشویش ہیں۔ مالی AI کے لیے، لین دین کے نمونے، اکاؤنٹ نمبرز، اور کریڈٹ کا رویہ ہدف بن جاتے ہیں۔ ادارہ جاتی پیداواری ٹولز کے لیے -- وہ قسم جو ای میلز کا خلاصہ کرتی ہے یا رپورٹس تیار کرتی ہے -- ایک AI کی خلاف ورزی اندرونی حکمت عملی کی دستاویزات، عملے کی فائلیں، یا کلائنٹ کی بات چیت کو ظاہر کر سکتی ہے۔

2023 میں، ایک مقبول AI کوڈنگ معاون سے متعلق ایک وسیع پیمانے پر رپورٹ شدہ واقعے نے انکشاف کیا کہ کچھ پرومپٹس سسٹم کو ان نجی ذخیروں سے کوڈ کے ٹکڑے دوبارہ تخلیق کرنے کا سبب بن سکتے ہیں جن پر اسے تربیت دی گئی تھی۔ جن ڈویلپرز کا نجی کوڈ ظاہر ہوا، انہوں نے اسے تربیتی مواد کے طور پر استعمال کرنے کی رضامندی نہیں دی تھی اور انہیں اس بات کا کوئی اندازہ بھی نہیں تھا کہ یہ خطرے میں تھا۔

یہ ناخوشگوار حقیقت ہے: آپ کے پاس پہلے سے ہی ایسے AI سسٹمز کے اندر ڈیٹا ہو سکتا ہے جن کے ساتھ آپ نے کبھی بھی شعوری طور پر تعامل نہیں کیا۔

AI agent

AI ڈیٹا کی خلاف ورزیوں کا روایتی خلاف ورزیوں سے موازنہ

ان دو خطرے کی اقسام کو ایک ساتھ دیکھنا مددگار ہے۔ اگرچہ ان میں کچھ مشترکہ بنیادیں ہیں، تاہم کھوج، دائرہ کار، اور ازالے میں اختلافات اتنے اہم ہیں کہ ان کو الگ چیلنجز کے طور پر سمجھا جائے۔

عنصرروایتی ڈیٹا کی خلاف ورزیAI ڈیٹا کی خلاف ورزی
بنیادی حملے کا ہدفڈیٹا بیسز، سرورز، فائل سسٹمزماڈل وزن، تربیتی ڈیٹا، انفرنس APIs
کھوج کی رفتارگھنٹوں سے دنوں (مناسب نگرانی کے ساتھ)اکثر ہفتوں یا مہینوں، بعض اوقات کبھی نہیں
دائرہ کار کی پیمائشگنتی کے قابل ریکارڈزاحتمالی، مقدار کا تعین کرنا مشکل
ازالہپیچ، اسناد کو گھمائیں، صارفین کو مطلع کریںماڈل کو دوبارہ تربیت دیں، ڈیٹا پائپ لائنوں کا آڈٹ کریں، پرومپٹس کو محدود کریں
ریگولیٹری وضاحتاچھی طرح سے قائم شدہ فریم ورکزیادہ تر دائرہ کاروں میں اب بھی ترقی پذیر

AI ڈیٹا کی خلاف ورزی سے کیسے بچا جائے

خطرے کو جاننا صرف اسی صورت میں مفید ہے جب یہ عمل کی طرف لے جائے۔ یہاں عملی اقدامات ہیں جو لاگو ہوتے ہیں چاہے آپ ایک انفرادی صارف ہوں، چھوٹے کاروبار کے مالک ہوں، یا IT کا فیصلہ ساز ہوں۔

انفرادی صارفین کے لیے

AI ٹولز کے ساتھ، خاص طور پر صارف کا سامنا کرنے والے چیٹ بوٹس کے ساتھ آپ کیا شیئر کرتے ہیں اس میں منتخب رہیں۔ اگر کوئی پلیٹ فارم آپ کو اپنی ای میل، کیلنڈر، یا دستاویزات کو منسلک کرنے کے لیے کہتا ہے تاکہ اس کے AI ردعمل کو بہتر بنایا جا سکے، تو غور کریں کہ کیا اس رسائی کی واقعی ضرورت ہے۔ یہ سمجھنے کے لیے رازداری کی پالیسی پڑھیں کہ آیا آپ کے ان پٹس کو مستقبل کی تربیت کے لیے استعمال کیا جاتا ہے۔

AI تعینات کرنے والے کاروباروں کے لیے

اپنے AI فروشندے کی ڈیٹا ہینڈلنگ کی مشقوں کا مکمل جائزہ لینے سے شروع کریں۔ پوچھنے کے قابل سوالات میں شامل ہیں: کیا فروشندہ صارف کے ان پٹس کو برقرار رکھتا ہے؟ کیا ان پٹس کو شیئرڈ ماڈلز کو دوبارہ تربیت دینے کے لیے استعمال کیا جاتا ہے؟ ٹرانزٹ میں اور آرام میں ڈیٹا پر کون سی انکرپشن لاگو کی جاتی ہے؟ گاہکوں کو خلاف ورزیاں کیسے ظاہر کی جاتی ہیں؟

ایک لچکدار AI ماحول بنانے کا مطلب اپنی تنصیب کی سیکیورٹی پوزیشن کو کچھ غلط ہونے کے بعد کے بجائے پہلے سمجھنا بھی ہے۔ آپ کے ماڈل کے تربیتی ڈیٹا، انفرنس لاگز، اور انضمام کی اسناد تک کس کی رسائی ہے، اس کے فعال آڈٹس اختیاری اضافات نہیں ہیں -- وہ بنیادی صفائی ہیں۔

تکنیکی ٹیموں کے لیے

ذاتی طور پر شناختی معلومات کی طرح نظر آنے والے نمونے کو ماڈل کے دوبارہ تخلیق کرنے سے روکنے کے لیے آؤٹ پٹ فلٹرنگ کو نافذ کریں۔ بڑے پیمانے پر نکالنے کے حملوں کو غیر عملی بنانے کے لیے انفرنس APIs پر سخت شرح کی حدیں مقرر کریں۔ غیر معمولی رویے کے لیے پرومپٹ ان پٹس کو لاگ اور مانیٹر کریں۔ اور ماڈل وزنوں کے ساتھ ایسا برتاؤ کریں جیسے آپ کسی حساس کوڈ بیس کے ساتھ کرتے ہیں -- رسائی کنٹرولز، ورژننگ، اور آڈٹ ٹریلز کے ساتھ۔

AI ڈیٹا کی خلاف ورزی کے بعد کیا ہوتا ہے؟

ایک خلاف ورزی کے بعد کے اثرات ایک واقف لیکن تکلیف دہ پیٹرن کی پیروی کرتے ہیں۔ تنظیمیں دائرہ کار کا جائزہ لینے، متاثرہ فریقوں کو مطلع کرنے، اور لاگو ضوابط کی تعمیل کا مظاہرہ کرنے کے لیے دوڑتی ہیں۔ AI کی خلاف ورزیوں کے معاملے میں، وہ دائرہ کار کا جائزہ حقیقی طور پر مشکل ہوتا ہے۔

متاثرہ افراد کو شناخت کی چوری یا غیر مجاز اکاؤنٹ تک رسائی کے لیے نگرانی کرنے کی ضرورت پڑ سکتی ہے۔ کاروبار ممکنہ ریگولیٹری جرمانوں، شہرت کے نقصان، اور واقعے کے ردعمل کی لاگت کا سامنا کرتے ہیں۔ ازالہ کے عمل میں اکثر متاثرہ ماڈل کو دوبارہ تربیت دینا یا واپس رول کرنا شامل ہوتا ہے، جو کافی وقت اور وسائل لے سکتا ہے۔

یہاں شفافیت اہم ہے۔ وہ صارفین جنہیں واضح طور پر بتایا جاتا ہے کہ کیا ہوا، کون سا ڈیٹا شامل تھا، اور کون سے اقدامات کیے جا رہے ہیں، ان لوگوں کے مقابلے میں اعتماد کو برقرار رکھنے کا کہیں زیادہ امکان رکھتے ہیں جو حقیقت کے ہفتوں بعد مبہم اطلاع وصول کرتے ہیں۔

AI ڈیٹا کی خلاف ورزی کیا ہے، اس پر حتمی خیالات

AI ڈیٹا کی خلاف ورزی کیا ہے، یہ سمجھنا خطرے کو سنجیدگی سے لینے کی طرف پہلا قدم ہے۔ AI سسٹمز ان ڈیٹا بیسز اور سرورز سے جادوئی طور پر زیادہ محفوظ نہیں ہیں جو ان سے پہلے آئے تھے -- کچھ طریقوں سے، وہ خطرے کی مکمل نئی اقسام متعارف کراتے ہیں جن کو سیکیورٹی صنعت ابھی پکڑ رہی ہے۔

اچھی خبر یہ ہے کہ آگاہی حقیقی طور پر تحفظ دیتی ہے۔ ڈیٹا کی برقراری، ماڈل کی تربیت کی مشقوں، اور API کی سیکیورٹی کے بارے میں صحیح سوالات پوچھنا کچھ ایسا ہے جو کوئی بھی صارف یا تنظیم آج کر سکتی ہے۔ ہم میں سے جتنے زیادہ AI فروشندوں سے واضح جوابات کا مطالبہ کریں گے، مجموعی ایکوسسٹم اتنا ہی مضبوط ہو جائے گا۔

اگر آپ AI کے ساتھ بنا رہے ہیں یا صرف روزانہ اسے استعمال کر رہے ہیں، تو ڈیٹا کی صفائی کو بعد کے خیال کے بجائے ایک عادت کے طور پر برتیں۔ آپ کی معلومات -- اور ہر ایک کی معلومات جو اپنے ڈیٹا کے ساتھ آپ پر بھروسہ کرتے ہیں -- اس پر منحصر ہے۔

اکثر پوچھے جانے والے سوالات

AI ڈیٹا کی خلاف ورزی کی ایک مثال کیا ہے؟

ایک معروف مثال ایک AI کوڈنگ معاون کے ساتھ پیش آئی جس نے پرومپٹنگ سیشنز کے دوران ڈویلپر ریپازٹریز سے نجی کوڈ کو دوبارہ تخلیق کیا، ملکیتی کوڈ کو ظاہر کیا جس کا کبھی بھی عوامی ہونا مقصود نہیں تھا۔

عملی طور پر، اس قسم کی خلاف ورزی اس وقت ہوتی ہے جب ایک ماڈل اس ڈیٹا پر تربیت پاتا ہے جسے اسے برقرار نہیں رکھنا چاہیے تھا، اور ایک ہوشیاری سے تیار کیا گیا پرومپٹ اس معلومات کو سامنے لاتا ہے۔ اس کے لیے روایتی معنوں میں ہیکر کی ضرورت نہیں ہوتی -- صرف غلط ماڈل سے صحیح سوال پوچھا جاتا ہے۔

ڈیٹا کی خلاف ورزی کے بعد کیا ہوتا ہے؟

خلاف ورزی کے بعد، تنظیمیں دائرہ کار کا جائزہ لیتی ہیں، متاثرہ صارفین کو مطلع کرتی ہیں، ریگولیٹرز کو رپورٹ کرتی ہیں، اور ازالہ شروع کرتی ہیں -- جس میں ماڈلز کو دوبارہ تربیت دینا، اسناد گھمانا، یا کمزور سسٹمز کو پیچ کرنا شامل ہو سکتا ہے۔

متاثرہ افراد کو عام طور پر اپنے اکاؤنٹس کی نگرانی کرنے اور متعلقہ جگہوں پر پاس ورڈ تبدیل کرنے کا مشورہ دیا جاتا ہے۔

AI کے خطرے کی 4 اقسام کون سی ہیں؟

عام طور پر حوالہ دی جانے والی AI کے خطرے کی چار اقسام سیکیورٹی کا خطرہ، رازداری کا خطرہ، اخلاقی خطرہ، اور آپریشنل خطرہ ہیں۔

سیکیورٹی کا خطرہ خلاف ورزیوں اور مخالفانہ حملوں کا احاطہ کرتا ہے۔ رازداری کا خطرہ ذاتی ڈیٹا کے غلط استعمال کو شامل کرتا ہے۔ اخلاقی خطرہ متعصب یا نقصان دہ آؤٹ پٹس کی طرف اشارہ کرتا ہے۔ آپریشنل خطرہ کاروباری تسلسل کو متاثر کرنے والی ماڈل کی ناکامیوں کو شامل کرتا ہے۔

ڈیٹا کی خلاف ورزی کا کیا مطلب ہے؟

ڈیٹا کی خلاف ورزی کا مطلب ہے کہ غیر مجاز فریقوں نے ایسی معلومات تک رسائی حاصل کی، ظاہر کی، یا چوری کی ہے جو نجی یا محفوظ ہونی چاہیے تھی۔

اس میں متاثرہ سسٹم کے لحاظ سے گاہک کے ریکارڈ، اندرونی دستاویزات، صحت کا ڈیٹا، یا کوئی دوسری حساس معلومات شامل ہو سکتی ہیں۔

ڈیٹا کی خلاف ورزی کی ایک مثال کیا ہے؟

سب سے زیادہ حوالہ دی جانے والی مثالوں میں سے ایک 2013 کی Yahoo کی خلاف ورزی ہے، جہاں تین ارب سے زائد صارف اکاؤنٹس کی ای میل ایڈریسز، پاس ورڈز، اور ذاتی تفصیلات ظاہر ہو گئی تھیں۔

AI کے سیاق و سباق میں، ایک قابل موازنہ واقعہ نجی ڈیٹا پر تربیت یافتہ ماڈل کا ہوگا جو عوامی استفسارات کے جواب میں اس ڈیٹا کو دوبارہ تخلیق کرتا ہے -- ایک روایتی "گھس آنے" کے بغیر بڑے پیمانے پر معلومات کو ظاہر کرنا۔