كشف هوية المستخدمين بالذكاء الاصطناعي

x32x01 · اليوم فى 18:46

من كام يوم ظهرت ورقة بحثية خطيرة جدًا بعنوان
Large-scale online deanonymization with LLMs
والكلام فيها ببساطة بيتكلم عن حاجة كانت شبه مستحيلة زمان…

إن الذكاء الاصطناعي بقى قادر يكشف هوية الأشخاص على الإنترنت حتى لو مستخدمين أسماء مستعارة! 🔍
يعني الحساب اللي فاكر إنه مجهول 100%؟
ممكن ميكونش مجهول زي ما متخيل خالص.

يعني إيه كشف الهوية على الإنترنت (Deanonymization)؟ 🕵️‍♂️

زمان لو حد عنده حساب على مواقع زي:

Reddit
Hacker News
Forums
Communities تقنية

وكان بيستخدم اسم وهمي ومن غير صورة…
كان صعب جدًا تعرف مين الشخص الحقيقي ورا الحساب ده.

الموضوع كان محتاج:
✅ تحليل يدوي ✅ وقت طويل ✅ ربط معلومات كتير ببعض
لكن دلوقتي؟
الـ LLMs (نماذج الذكاء الاصطناعي الكبيرة) غيرت اللعبة بالكامل ⚡

الذكاء الاصطناعي بيكشفك إزاي؟ 🤯

الفكرة المرعبة شوية إن طريقة كتابتك نفسها تعتبر بصمة رقمية ليك.
أي تعليق بتكتبه بيحتوي بدون ما تحس على:

اهتماماتك
أسلوب كلامك
مجالك الوظيفي
دراستك
البلد اللي عشت فيها
خبراتك التقنية

الذكاء الاصطناعي بيجمع كل التفاصيل الصغيرة دي ويبدأ يركب الصورة زي محقق محترف جدًا 👇

Code:

User Comments
      ↓
Text Analysis
      ↓
Identity Clues Extraction
      ↓
Internet Search Matching
      ↓
Confidence Score

يعني ببساطة…
النموذج بيحلل كلامك وبعدها يدور مين على الإنترنت مواصفاته شبهك.

نظام ESRC المستخدم في البحث 🔬

الباحثين قدموا سيستم اسمه ESRC وده عبارة عن Pipeline ذكي مكوّن من 4 مراحل:

1️⃣ استخراج دلائل الهوية

السيستم يطلع أي معلومة من النص زي:

اشتغلت في Startup في برلين
درست AI سنة معينة
عندي خبرة في Cyber Security

2️⃣ البحث على الإنترنت

بعد كده يبدأ يعمل Search واسع يشوف مين بياناته قريبة من الكلام ده.

3️⃣ مقارنة المرشحين

يقارن بين الأشخاص المحتملين باستخدام تحليل منطقي وسلوكي.

4️⃣ حساب نسبة الثقة

في النهاية النظام يحسب:

✅ قد إيه متأكد إن الحساب ده تابع للشخص الحقيقي.

نتائج التجربة كانت صادمة 📊

الباحثين جربوا يربطوا حسابات Hacker News بهويات حقيقية على LinkedIn.
النتيجة 👇

حوالي 68% Recall
ودقة وصلت لـ 90% Precision

يعني لما النظام يقول: "ده الشخص الحقيقي" 👉
غالبًا بيكون فعلًا صح بنسبة كبيرة جدًا.
وده أداء أعلى بكتير من أي طرق تحليل قديمة.

أخطر نقطة لازم تفهمها ⚠️

إخفاء اسمك أو صورتك مش معناه إنك مجهول.
لأن:
✅ أسلوب كتابتك = بصمتك
✅ اهتماماتك = هويتك
✅ التفاصيل الصغيرة = دليل عليك
الذكاء الاصطناعي دلوقتي يقدر يربط كل ده تلقائيًا.

مثال بسيط يوضح الفكرة 💡

لو شخص كتب تعليقات زي:

اشتغلت Pentester في شركة fintech
عايش في القاهرة
بحب Rust و Linux Kernel

النموذج ممكن يبحث عن:

Pentesters
نفس المدينة
نفس الاهتمامات التقنية

ويقلص آلاف الأشخاص لشخص أو اتنين بس!

هل ده خطر على الخصوصية فعلًا؟ 🔐

آه… وبشكل كبير.
التقنية دي ممكن تستخدم في:

تتبع المستخدمين
كشف أصحاب الحسابات المجهولة
تحليل الناشطين أو الباحثين
مراقبة المحتوى

وده بيفتح نقاش ضخم جدًا حوالين Privacy و Digital Identity في عصر الذكاء الاصطناعي.

الخلاصة 🚨

الإنترنت زمان كان يسمح بدرجة عالية من إخفاء الهوية…
لكن مع تطور LLMs و AI Analysis الوضع بيتغير بسرعة.
دلوقتي:
مش لازم تقول اسمك 👉
مش لازم تحط صورتك 👉
كلامك نفسه ممكن يعرفك.
يعني ببساطة… الخصوصية على الإنترنت بقت أصعب من أي وقت فات.

كشف هوية المستخدمين بالذكاء الاصطناعي

يعني إيه كشف الهوية على الإنترنت (Deanonymization)؟ 🕵️‍♂️​

الذكاء الاصطناعي بيكشفك إزاي؟ 🤯​

نظام ESRC المستخدم في البحث 🔬​

1️⃣ استخراج دلائل الهوية​

2️⃣ البحث على الإنترنت​

3️⃣ مقارنة المرشحين​

4️⃣ حساب نسبة الثقة​

نتائج التجربة كانت صادمة 📊​

أخطر نقطة لازم تفهمها ⚠️​

مثال بسيط يوضح الفكرة 💡​

هل ده خطر على الخصوصية فعلًا؟ 🔐​

الخلاصة 🚨​