Skip to content
وبلاگ →

خطرات حریم خصوصی داده‌ها در هوش مصنوعی: هر بار که از یک ابزار AI استفاده می‌کنید، در واقع چه چیزی را در معرض دید قرار می‌دهید

خطرات حریم خصوصی داده‌ها در هوش مصنوعی فوری‌تر و شخصی‌تر از آن چیزی است که اکثر مردم تصور می‌کنند و همه چیز را از پرامپت‌هایی که تایپ می‌کنید تا فایل‌هایی که آپلود می‌کنید پوشش می‌دهد. همه اینها می‌توانند ذخیره، تحلیل و در برخی موارد برای آموزش همان مدلی که با آن صحبت می‌کنید استفاده شوند. اگر به طور منظم از ابزارهای هوش مصنوعی استفاده می‌کنید بدون اینکه زیاد به این فکر کنید که چه اتفاقی برای اطلاعاتی که به اشتراک می‌گذارید می‌افتد، خواندن این راهنما پیش از جلسه بعدی شما ارزش دارد.

گفت‌وگو پیرامون هوش مصنوعی و حریم خصوصی معمولاً بین دو افراط در نوسان است. یا مردم نگرانی را به طور کامل کنار می‌گذارند چون هنوز هیچ اتفاق بدی نیفتاده، یا به سطحی از هشدار می‌رسند که فناوری را غیرقابل استفاده جلوه می‌دهد. هیچ یک از این واکنش‌ها مفید نیست. آنچه واقعاً به شما خدمت می‌کند، درکی روشن و مبتنی بر واقعیت از این است که خطرات واقعی کجا هستند، چه کاری می‌توانید برای کاهش آنها انجام دهید، و چه عادت‌هایی را پیش از آنکه چیزی اشتباه پیش رود، نه پس از آن، ایجاد کنید. این دقیقاً همان چیزی است که این راهنما ارائه می‌کند.

AI agent

خطرات حریم خصوصی داده‌ها در هوش مصنوعی واقعاً از کجا می‌آیند

برای درک خطر، باید مسیر را درک کنید. وقتی چیزی را در یک ابزار هوش مصنوعی تایپ می‌کنید، آن ورودی از دستگاه شما به یک سرور راه دور که مدل در آن اجرا می‌شود، منتقل می‌شود. پردازش می‌شود، پاسخی تولید می‌شود و بسته به پلتفرم و تنظیمات شما، آن گفت‌وگو ممکن است ثبت، ذخیره، توسط آموزش‌دهندگان انسانی بررسی و برای بهبود نسخه‌های آینده مدل استفاده شود.

این زنجیره ساده به نظر می‌رسد اما هر گامی در آن نشان‌دهنده یک نقطه افشای بالقوه است. داده‌ها دستگاه شما را ترک می‌کنند. روی سرورهای شخص دیگری قرار می‌گیرند. ممکن است ماه‌ها یا بیشتر نگه داشته شوند. ممکن است توسط افراد خارج از خود مدل هوش مصنوعی دیده شوند. و اگر شرکت مدیر پلتفرم دچار نقض امنیتی شود، داده‌های شما بخشی از چیزی هستند که افشا می‌شود.

این یک نگرانی فرضی نیست. در سال 2023، OpenAI یک باگ را تأیید کرد که به طور موقت به برخی کاربران اجازه می‌داد عناوینی از تاریخچه چت کاربران دیگر را ببینند. کارمندان سامسونگ پس از آنکه کد منبع داخلی و یادداشت‌های جلسات در ChatGPT جای‌گذاری شده و متعاقباً در سرورهای OpenAI ذخیره شد، تیتر خبرها شدند. این رویدادها فناوری را غیرقابل استفاده نکردند، اما روشن کردند که خطرات حریم خصوصی داده‌ها در هوش مصنوعی موارد حاشیه‌ای نظری نیستند. آنها رویدادهایی هستند که برای سازمان‌های واقعی زمانی که حفاظ‌ها در جای خود نیستند، رخ می‌دهند.

تصویر خطر به سه دسته اصلی تقسیم می‌شود. چه چیزی جمع‌آوری می‌شود، چگونه استفاده می‌شود و چه کسی می‌تواند به آن دسترسی داشته باشد. درک هر سه چیزی است که کاربران آگاه را از کاربران در معرض خطر جدا می‌کند.

ابزارهای هوش مصنوعی چه چیزی جمع‌آوری می‌کنند و چرا این موضوع اهمیت دارد

اکثر مردم به تعاملات هوش مصنوعی خود به عنوان گفت‌وگوهایی فکر می‌کنند که پس از پایان جلسه ناپدید می‌شوند. در واقعیت، چرخه عمر داده‌ها برای اکثر ابزارهای هوش مصنوعی مصرف‌کننده به طور قابل توجهی طولانی‌تر و پیچیده‌تر از این است.

داده‌های پرامپت. هر چیزی که در یک ابزار هوش مصنوعی تایپ می‌کنید، حداقل برای تولید پاسخ شما جمع‌آوری می‌شود. فراتر از آن، بسته به تنظیمات پلتفرم، ممکن است برای بررسی ایمنی، بهبود کیفیت و آموزش مدل نگه داشته شود. پیش‌فرض در اکثر پلتفرم‌های مصرف‌کننده، نگه‌داری و استفاده بالقوه برای آموزش است، مگر اینکه شما به طور فعال انصراف دهید.

ابرداده‌های مصرف. فراتر از محتوای پرامپت‌های شما، پلتفرم‌ها معمولاً اطلاعاتی درباره چگونگی استفاده شما از ابزار، زمان جلسه، فراوانی، نوع دستگاه، داده‌های مکان و الگوهای استفاده از ویژگی‌ها جمع‌آوری می‌کنند. این ابرداده‌ها یک پروفایل رفتاری می‌سازند، حتی زمانی که خود محتوا بی‌خطر به نظر می‌رسد.

فایل‌ها و اسناد آپلود شده. بسیاری از ابزارهای هوش مصنوعی اکنون آپلود فایل، تصاویر، صفحات گسترده و PDF را می‌پذیرند. محتوای این آپلودها وارد همان مسیر داده‌ای پرامپت‌های تایپ شده می‌شود و همان ملاحظات نگه‌داری و استفاده را به همراه دارد، اغلب با کاربرانی که به اشتباه فرض می‌کنند فایل‌های آپلود شده به طور متفاوتی مدیریت می‌شوند.

داده‌های حساب و هویت. آدرس ایمیل شما، اطلاعات پرداخت، جزئیات سازمان و هر داده پروفایلی که ارائه می‌کنید، در همان سیستمی قرار دارد که داده‌های گفت‌وگوی شما در آن قرار دارد و در معرض همان خطر نقض امنیتی مانند هر حساب آنلاین دیگری است.

دلیل اهمیت این موضوع این نیست که شرکت‌های هوش مصنوعی با نیت بد عمل می‌کنند. اکثر آنها چنین نیستند. دلیل اهمیت آن این است که داده‌های نگه‌داری شده، داده‌های در معرض خطر هستند، و هر چه اطلاعاتی که به اشتراک می‌گذارید حساس‌تر باشد، عواقب آن در صورت تحقق آن خطر، قابل توجه‌تر خواهد بود.

AI agent

چیزهایی که هرگز نباید با ابزار هوش مصنوعی به اشتراک بگذارید

این بخشی است که اکثر مردم بیشترین نیاز را به آن دارند و کمترین توجه را به آن می‌کنند. مشخص بودن درباره اینکه چه چیزی را از ابزارهای هوش مصنوعی دور نگه دارید، از هشدارهای کلی درباره احتیاط مفیدتر است.

رمزهای عبور و اعتبارنامه‌های احراز هویت. این باید واضح باشد اما بیشتر از آنچه فکر می‌کنید پیش می‌آید، به ویژه زمانی که افراد از ابزارهای هوش مصنوعی می‌خواهند به آنها در اشکال‌زدایی سیستم‌های ورود به سیستم یا عیب‌یابی دسترسی به حساب کمک کنند. هرگز اعتبارنامه‌های واقعی را در هیچ پرامپتی صرف نظر از اینکه پلتفرم چقدر ادعای امنیت دارد، گنجانده نشود.

شماره‌های تأمین اجتماعی، شناسه‌های مالیاتی و شناسه‌های دولتی. اینها بلوک‌های ساختمانی سرقت هویت هستند و نزدیک هیچ سیستم هوش مصنوعی شخص ثالثی نباید قرار گیرند.

داده‌های شخصی مشتری و خریدار. نام‌ها، آدرس‌های ایمیل، شماره‌های تلفن، جزئیات مالی، اطلاعات بهداشتی و هر اطلاعات قابل شناسایی شخصی دیگری متعلق به افرادی غیر از خودتان، تعهدات قانونی و اخلاقی در مورد چگونگی به اشتراک گذاشتن آن را به همراه دارد. جای‌گذاری فهرست مشتریان در یک پنجره چت تقریباً به طور قطع این تعهدات را نقض می‌کند.

اطلاعات تجاری اختصاصی. استراتژی قیمت‌گذاری داخلی، جزئیات محصولات منتشر نشده، گفت‌وگوهای ادغام و خرید، استراتژی حقوقی و هوش رقابتی از نوع اطلاعاتی هستند که شرکت‌ها منابع قابل توجهی را برای محافظت از آنها صرف می‌کنند. ارسال آنها از طریق یک ابزار هوش مصنوعی مصرف‌کننده، فوراً این محافظت را دور می‌زند.

اطلاعات پزشکی و بهداشتی. داده‌های بهداشتی خودتان یا هر کس دیگری به همان دسته محافظت شده داده‌های مشتری تعلق دارد. حساسیت بالاست و چارچوب‌های نظارتی پیرامون اطلاعات بهداشتی در بسیاری از حوزه‌های قضایی سختگیرانه است.

جزئیات حساب مالی. شماره‌های حساب بانکی، جزئیات کارت، موقعیت‌های سرمایه‌گذاری و اطلاعات مشابه باید کاملاً خارج از جریان‌های کاری هوش مصنوعی صرف نظر از وظیفه بمانند.

معماری امنیتی ابزارهای هوش مصنوعی شما در اینجا اهمیت دارد، زیرا حتی با بهترین عادت‌های شخصی، پلتفرمی که از آن استفاده می‌کنید باید سهم خود را از معادله حفاظت ایفا کند تا داده‌های شما واقعاً ایمن بمانند.

AI agent

داده‌های شما در هوش مصنوعی واقعاً چقدر ایمن هستند؟

دادن پاسخی صادقانه به این سؤال به معنای پذیرش این است که بسته به پلتفرم، سطح طرح و شیوه‌های خودتان به طور قابل توجهی متفاوت است. یک بله یا خیر ساده نیست.

نوع پلتفرمداده‌های استفاده شده برای آموزشرمزنگاریبررسی انسانی ممکنخطر نقض
هوش مصنوعی رایگان مصرف‌کنندهبله به طور پیش‌فرضپایهبلهموجود
هوش مصنوعی پولی مصرف‌کنندهاغلب انصراف در دسترس استاستانداردکاهش یافتهموجود
طرح‌های هوش مصنوعی سازمانیخیر، معمولاً قراردادیپیشرفتهخیر، معمولاً قراردادیکمتر اما صفر نیست
مدل‌های هوش مصنوعی خود-میزبانخیر، روی سرورهای شما باقی می‌ماندمسئولیت شماخیرکمترین

سطوح سازمانی و خود-میزبان نشان‌دهنده حفاظت از داده‌ها به طور معناداری بهتر از محصولات مصرف‌کننده هستند، اما با هزینه بالاتر و پیچیدگی راه‌اندازی بیشتری همراه هستند. برای اکثر افرادی که از هوش مصنوعی برای بهره‌وری شخصی استفاده می‌کنند، محصول مصرف‌کننده با انصراف از داده‌های آموزشی فعال و عادت‌های دقیق در مورد ورودی‌های حساس، یک خط مبنای منطقی است. برای کسب‌وکارها، سطح سازمانی نقطه شروع مسئولانه است.

درک ویژگی‌های امنیتی هر پلتفرم هوش مصنوعی پیش از تعهد به استفاده منظم از آن، نوعی دقت نظر است که از شما پیش از پیدا شدن مشکل، نه پس از آن، محافظت می‌کند.

یک نکته صادقانه که ارزش گفتن دارد: هیچ سیستم دیجیتالی به طور کامل از نقض ایمن نیست. سؤال این نیست که آیا یک پلتفرم کاملاً ایمن است، بلکه این است که آیا آنقدر حفاظت از داده‌ها را جدی می‌گیرد که خطر متناسب با ارزشی باشد که از استفاده از آن به دست می‌آورید.

خطرات حریم خصوصی داده‌ها در هوش مصنوعی به طور خاص برای کسب‌وکارها

ریسک‌های پیرامون خطرات حریم خصوصی داده‌ها در هوش مصنوعی برای سازمان‌ها بیشتر از افراد است، زیرا داده‌های درگیر اغلب متعلق به افراد دیگر، مشتریان، کارمندان و شرکا است که با پردازش اطلاعات‌شان از طریق یک سیستم هوش مصنوعی شخص ثالث موافقت نکرده‌اند.

سه دسته از خطر کسب‌وکار از بقیه برجسته‌تر هستند.

افشای نظارتی. بسته به صنعت شما و مناطقی که در آنها فعالیت می‌کنید، به اشتراک گذاشتن انواع خاصی از داده‌ها با ابزارهای هوش مصنوعی بدون توافق‌نامه‌های پردازش داده مناسب ممکن است شما را در نقض GDPR، HIPAA، CCPA یا سایر مقررات قابل اجرا قرار دهد. بی‌اطلاعی از مقررات دفاع نیست و جریمه‌ها در برخی حوزه‌های قضایی قابل توجه است.

تعهدات مشتری و قراردادی. بسیاری از شرکت‌های خدمات حرفه‌ای، دفاتر حقوقی، مشاوران مالی و مشاوره‌ای تحت توافق‌نامه‌های محرمانگی فعالیت می‌کنند که به اشتراک گذاشتن اطلاعات مشتری با اشخاص ثالث را ممنوع می‌کند. یک پلتفرم هوش مصنوعی تقریباً به طور قطع تحت آن توافق‌نامه‌ها به عنوان شخص ثالث واجد شرایط است، و اکثر کارمندانی که به طور تصادفی از ابزارهای هوش مصنوعی استفاده می‌کنند، قراردادهای مشتری خود را پیش از انجام آن بررسی نمی‌کنند.

خطر اعتباری. فراتر از افشای حقوقی، آسیب اعتباری ساده‌ای وجود دارد که از کشف مشتری ناشی می‌شود که داده‌هایش از طریق یک ابزار هوش مصنوعی که با آن موافقت نکرده، پردازش شده است. آن گفت‌وگو پس از واقعه بسیار سخت‌تر از گفت‌وگوی سیاستی است که از بروز آن در وهله اول جلوگیری می‌کند.

ساختن استفاده مسئولانه از هوش مصنوعی در جریان کاری و ویژگی‌های کسب‌وکار شما از همان ابتدا به طور قابل توجهی ارزان‌تر از مدیریت عواقب یک رویداد حریم خصوصی است که می‌توانست با یک سیاست واضح و انتخاب پلتفرم مناسب اجتناب شود.

AI agent

چرا، چگونه و کدام: ساختن عادات بهتر پیرامون هوش مصنوعی و حریم خصوصی

چرا خطرات حریم خصوصی داده‌ها در هوش مصنوعی سزاوار توجه بیشتری نسبت به آنچه معمولاً دریافت می‌کنند، هستند؟ زیرا منحنی پذیرش ابزارهای هوش مصنوعی در داخل سازمان‌ها بسیار سریع‌تر از چارچوب‌های حاکمیت و سیاست‌گذاری طراحی شده برای مدیریت آنها حرکت کرده است. اکثر تیم‌ها به طور روزانه از ابزارهای هوش مصنوعی استفاده می‌کنند که بخش‌های حقوقی و امنیتی‌شان هرگز به طور رسمی آنها را ارزیابی نکرده‌اند.

چگونه می‌توان رویکردی عملی ساخت بدون آنکه فلج شد؟ با یک قاعده شخصی ساده شروع کنید: اگر با دیدن آن اطلاعات توسط یک غریبه در شرکت هوش مصنوعی راحت نیستید، آن را در پرامپت قرار ندهید. آن قاعده اکثر ورودی‌های پرخطر را حذف می‌کند بدون اینکه نیاز باشد معماری فنی کامل هر پلتفرمی که استفاده می‌کنید را درک کنید.

برای سازمان‌ها، یک چارچوب سه سطحی خوب کار می‌کند. سطح سبز وظایفی را پوشش می‌دهد که فقط از اطلاعات عمومی در دسترس یا غیرحساس استفاده می‌کنند، دسترسی کامل به ابزار هوش مصنوعی مجاز است. سطح زرد اطلاعات داخلی اما غیرمحرمانه را پوشش می‌دهد، ابزارهای سطح سازمانی مورد نیاز هستند. سطح قرمز داده‌های تحت نظارت، محرمانه یا متعلق به مشتری را پوشش می‌دهد، ابزارهای هوش مصنوعی ممنوع یا مشمول بررسی ویژه پیش از استفاده هستند.

کدام شیوه‌ها بزرگ‌ترین تفاوت را ایجاد می‌کنند؟ سه عادت بالاتر از همه چیز برجسته هستند. اول، از استفاده از داده‌های آموزشی در هر پلتفرمی که این گزینه را ارائه می‌دهد، انصراف دهید. دوم، هرگز داده‌های حساس خام را در یک پرامپت جای‌گذاری نکنید وقتی می‌توانید موقعیت را بدون داده‌های واقعی توصیف کنید. سوم، خروجی‌های تولید شده توسط هوش مصنوعی را به عنوان پیش‌نویس‌هایی در نظر بگیرید که نیاز به تأیید انسانی پیش از اتخاذ هرگونه تصمیم پیامدداری بر اساس آنها دارند.

راهنمای استقرار مسئولانه هوش مصنوعی چگونگی اجرای این شیوه‌ها در سطح سازمانی را به گونه‌ای پوشش می‌دهد که واقعاً رفتار را تغییر دهد به جای آنکه صرفاً در یک سند سیاستی که کسی نمی‌خواند، قرار گیرد.

AI agent

نتیجه نهایی در مورد خطرات حریم خصوصی داده‌ها در هوش مصنوعی

پس از مرور آنچه جمع‌آوری می‌شود، آنچه هرگز نباید به اشتراک گذاشته شود، چگونگی مقایسه پلتفرم‌ها در حفاظت از داده‌ها، و چگونگی ساختن حاکمیت عملی توسط سازمان‌ها پیرامون این ابزارها، تصویر کامل خطرات حریم خصوصی داده‌ها در هوش مصنوعی، تصویری جدی اما قابل مدیریت است.

این فناوری از بین نخواهد رفت و ارزش بهره‌وری واقعی است. پاسخ اجتناب از ابزارهای هوش مصنوعی نیست، بلکه استفاده از آنها با همان قصدمندی است که به هر سیستمی که اطلاعات حساس را لمس می‌کند، می‌آورید. بدانید پلتفرم با داده‌های شما چه می‌کند. در صورت امکان از آموزش انصراف دهید. اطلاعات واقعاً حساس را از ابزارهای سطح مصرف‌کننده دور نگه دارید. سیاست‌های سازمانی را پیش از آنکه حوادث آنها را ضروری کنند، بسازید.

خطرات حریم خصوصی داده‌ها در هوش مصنوعی دلیلی برای عقب‌نشینی از ابزارهایی نیست که می‌توانند کار شما را به طور معناداری بهتر کنند. آنها دلیلی برای حرکت متفکرانه به جلو هستند، با چشمان باز و حفاظ‌های صحیح در جای خود.

پرسش‌های متداول

قاعده 30% برای هوش مصنوعی چیست؟

قاعده 30% یک راهنمای غیررسمی است که پیشنهاد می‌کند محتوای تولید شده توسط هوش مصنوعی نباید بیش از 30% از هر خروجی نهایی را تشکیل دهد، در حالی که 70% باقی‌مانده از ورودی، بازبینی و قضاوت انسانی باشد.

این یک استاندارد رسمی نیست اما به عنوان روشی عملی برای جلوگیری از اتکای بیش از حد به هوش مصنوعی در حالی که هنوز دستاوردهای کارایی را جذب می‌کند، مورد توجه قرار گرفته است.

استیون هاوکینگ درباره هوش مصنوعی چه هشداری داد؟

استیون هاوکینگ هشدار داد که توسعه هوش مصنوعی کامل می‌تواند پایان نژاد بشر را اعلام کند اگر اهداف آن به دقت با ارزش‌های انسانی هماهنگ نباشند و اگر رشد آن به درستی کنترل نشود.

او به طور خاص نگرانی خود را در مورد امکان توسعه مستقل هوش مصنوعی به گونه‌ای بیان کرد که از توانایی بشریت برای مدیریت یا درک آنچه انجام می‌دهد، پیشی بگیرد.

چه چیزی را هرگز نباید به ChatGPT بگویید؟

شما هرگز نباید رمزهای عبور، شماره‌های شناسایی دولتی، داده‌های شخصی مشتری، اطلاعات تجاری اختصاصی، سوابق پزشکی یا جزئیات حساب مالی را با ChatGPT یا هر ابزار هوش مصنوعی مصرف‌کننده به اشتراک بگذارید.

قاعده اصلی ساده است: اگر اطلاعات متعلق به شخص دیگری است یا در صورت افشا می‌تواند آسیب برساند، آن را کاملاً خارج از پرامپت نگه دارید.

داده‌های من با هوش مصنوعی چقدر ایمن هستند؟

ایمنی داده‌های شما به این بستگی دارد که از کدام پلتفرم استفاده می‌کنید، در کدام سطح طرح هستید و چه تنظیمات حریم خصوصی را فعال کرده‌اید. طرح‌های سازمانی معمولاً حفاظت‌های قوی‌تری نسبت به حساب‌های رایگان مصرف‌کننده ارائه می‌دهند.

هیچ پلتفرمی به طور کامل از نقض ایمن نیست، اما شکاف بین یک حساب مصرف‌کننده با تنظیمات پیش‌فرض و یک حساب سازمانی با کنترل‌های مناسب آنقدر قابل توجه است که برای استفاده تجاری اهمیت داشته باشد.

آیا هوش مصنوعی می‌تواند اطلاعات شما را افشا کند؟

بله، پلتفرم‌های هوش مصنوعی می‌توانند داده‌های کاربر را از طریق نقض‌های امنیتی، نگه‌داری ناخواسته داده، فرآیندهای بررسی انسانی، یا در موارد نادر از طریق خروجی‌هایی که به طور ناخواسته اطلاعاتی را از ورودی‌های کاربران دیگر آشکار می‌کنند، افشا کنند.

خطر تضمین نشده اما واقعی است، و بهترین حفاظت ترکیبی از انتخاب پلتفرم‌های معتبر، انصراف از استفاده داده‌های آموزشی و نگه داشتن اطلاعات واقعاً حساس به طور کامل خارج از ابزارهای هوش مصنوعی است.