أكدتها دراستان جديدتان حول حماية الخصوصية

متصفحات الإنترنت تسرّب البيانات الشخصية لشركاتها لحظياً

البيانات المسرّبة تشمل نشاط الشخص وسلوكياته المختلفة في التصفح والشراء والتواصل مع الآخرين. من المصدر

صدرت هذا الأسبوع دراستان في مجال الخصوصية وحماية البيانات الشخصية، أكدت الأولى أن برامج التصفح الكبرى واسعة الاستخدام، تسرّب البيانات الشخصية لحظياً إلى الحاسبات الخادمة التابعة للشركات المنتجة لها، وللعديد من شركائها وزبائنها من وكالات تسويق ووكالات حكومية وخلافه، وتشمل البيانات المتعلقة بنشاط الشخص على الإنترنت، وسلوكياته المختلفة في التصفح والشراء والتواصل مع الآخرين.

فيما أكدت الدراسة الثانية أن عملية حذف الهوية وإزالة بيانات التعريف التي تمكن من الاستدلال على الشخصية الحقيقية لصاحب البيانات، ليست مجدية. ولإثبات ذلك، طور الباحثون خوارزمية جديدة تمكنت من استعادة الهوية المحذوفة للمستخدمين، استناداً إلى أجزاء صغيرة جداً ومتفرقة من البيانات التي تخصهم، وأن نسبة النجاح والدقة في ذلك بلغت 99.8%.

وصدرت الدراسة الأولى عن كلية «ترينيتي» في دبلن، وأعدها الدكتور دوغلاس ليث، المتخصص في قضايا الخصوصية وحماية أمن البيانات الشخصية، وأجريت على متصفحات «غوغل كروم»، و«موزيلا فايرفوكس»، و«أبل سفاري»، و«مايكروسوفت إيدج»، و«بريف» مفتوح المصدر، و«ياندكس» شائع الاستخدام في روسيا.

ونشرت الدراسة كاملة في صورة ورقة أكاديمية على موقع scss.tcd.ie، أخيراً، أما الدراسة الثانية فأجراها باحثون في جامعة «إمبريال كوليدج» في لندن، و«جامعة كاتدرائية لوفان» في بلجيكا، ونشروها كاملة بمجلة «نيتشر كوميونيكيشنز». ونشر قسم التقنية بصحيفة «نيويورك تايمز» ملخصاً وافياً لها.

نقل البيانات

وجدت دراسة كلية «ترينيتي» في دبلن أن كل برامج التصفح التي خضعت للبحث، باستثناء متصفح «بريف»، تنقل لحظياً مكونات سجل تصفح المستخدمين مع الشركات التي تمتلكها، إلى جانب «معرّفات» تشير إلى موقع المستخدم أو هويته. وتجادل الشركات المنتجة للمتصفحات بأنها تزيل المعلومات الدالة على هوية أصحاب هذه البيانات عند إرسالها، لكن الدراسة تؤكد أن تخزين البيانات على خوادم الشركات يعني أيضاً إمكانية مشاركتها مع الوكالات الحكومية أو الشركاء التجاريين الخارجيين.

«برايف» الأكثر حماية

وفقاً لنتائج الدراسة، حصل متصفح «برايف» مفتوح المصدر على أعلى تصنيف من حيث الخصوصية وحماية البيانات الشخصية لمستخدميه، حيث بيّنت الدراسة أنه لا يستخدم أي «معرفات» تسمح بتتبع موقع المستخدم أو هويته بمرور الوقت، ولا ينقل أو يجعل بيانات المستخدمين في وضعية المشاركة مع الحاسبات الخادمة الخلفية الخاصة بالمتصفح أو أية جهات أخرى، ولذلك فهو المتصفح الأكثر خصوصية بين المتصفحات التي تمت دراستها.

وفي المستوى الثاني من الخصوصية، جاءت متصفحات «غوغل كروم»، و«موزيلا فايرفوكس»، و«أبل سفاري»، حيث تبين أن «كروم» يقوم بمشاركة التفاصيل الخاصة بنشاط المستخدم مع خوادم «غوغل»، عبر خاصية بإعدادات البرنامج قابلة للتعطيل، لكن الوضع الافتراضي لها هو التشغيل، ويقوم المتصفح بإرسال البيانات عبر ميزة الإكمال التلقائي للبحث في «كروم».

وينطبق الشيء نفسه على متصفح «فايرفوكس»، الذي يميز بيانات المستخدمين بـ«معرّف» فريد، ويرسل بيانات التصفح لخوادم «موزيلا».

أما متصفح «سفاري» فوجد أنه يشمل خاصية لحماية خصوصية صفحة البداية الافتراضية، ويحتوي على بعض خواص التتبع التي يمكن تعطيلها من خلال الإعدادات، لكن وجد أيضاً أنه يسرّب المعلومات إلى خوادم «أبل»، وبصفة خاصة خدمة «آي كلاود» السحابية التابعة لـ«أبل»، فضلاً عن جهات خارجية أخرى، على رأسها «تويتر» و«فيس بوك»، وذلك باستخدام معرّفات فريدة يمكن تتبعها.

وأخيراً، جاء متصفح «مايكروسوفت إيدج»، ومتصفح «ياندكس»، كأسوأ متصفحين شملتهما الدراسة، من حيث خرق الخصوصية وحماية البيانات، ووصفهما الباحثون بأنهما الأكثر إثارة للقلق مقارنة بالمتصفحات الأخرى.

كما يرسلان أيضاً بيانات التصفح عبر وظيفة الإكمال التلقائي للبحث، ولا يمكن للمستخدم تعطيل هذه الوظائف.

تجارب سابقة

أفاد علماء جامعتي «إمبريال كوليدج» في لندن، و«لوفان» في بلجيكا، بأنه ليست هذه هي المرة الأولى التي يثبت فيها العلماء أن البيانات المنزوع عنها «معرّفات الهوية» هي في الحقيقة ليست بيانات مجهولة الهوية على الإطلاق. ففي عام 2016، تم تحديد هوية الأفراد من خلال سجلات تصفح الإنترنت لثلاثة ملايين ألماني، وهي بيانات تم شراؤها من أحد البائعين. وفي وقت لاحق، أظهر علماء الوراثة أنه يمكن تحديد شخصية وهوية الأفراد الذين وضعت بياناتهم في قواعد بيانات الحمض النووي، وصنفت على أنها بيانات منزوع عنها معرفات الهوية.

خوارزمية استعادة الهوية بالذكاء الاصطناعي وتعلم الآلة

أجرى علماء جامعتي «إمبريال كوليدج» في لندن، و«لوفان» في بلجيكا، بحوثهم على البيانات المعروفة باسم «البيانات المحذوف منها معرفات الهوية»، وهي البيانات الخاصة بالسجلات الطبية، والبيانات التي تجمعها جهات الإحصاء الوطنية، وبيانات متصفحات الويب، وغيرها من البيانات في المجالات الأخرى، التي تزال منها أجزاء أو قطع البيانات التي يمكن من خلالها الاستدلال على شخصية أصحابها وهويتهم، وبالتالي يمكن مشاركتها وبيعها دون انتهاك قوانين الخصوصية.

وقال العلماء إنهم ابتكروا خوارزمية أو نموذجاً رياضياً بتقنيات الذكاء الاصطناعي وتعلم الآلة، يمكنه تحديد هوية الشخص وشخصيته الحقيقية، من البيانات المحذوف منها «معرّفات» الشخصية، وذلك بنسبة نجاح بلغت 99.8%، وذلك بالاعتماد على الربط بين «جزيئات البيانات» الصغيرة جداً والمتفرقة، وأن هذه الخوارزمية تحتاج فقط إلى 15 بياناً أو سمة عن الشخص لتصل إلى هويته الحقيقية، منها مثلاً النوع الاجتماعي، والرمز البريدي أو الحالة الاجتماعية. في حين أن البيانات المحذوف منها «معرّفات الهوية»، تحتوي أحياناً على 248 من البيانات أو السمات المتفرقة الخاصة بالشخص الواحد، كما هو الحال مع البيانات الخاصة بسمات الأسرة التي يتعامل معها مكتب الإحصاء الأميركي. ولإثبات صحة نتائجه، قام الفريق البحثي بنشر هذه الخوارزمية كاملة على الإنترنت، ليستخدمها أي شخص.

تويتر