- بواسطة x32x01 ||
من كام يوم ظهرت ورقة بحثية خطيرة جدًا بعنوان
Large-scale online deanonymization with LLMs
والكلام فيها ببساطة بيتكلم عن حاجة كانت شبه مستحيلة زمان…
إن الذكاء الاصطناعي بقى قادر يكشف هوية الأشخاص على الإنترنت حتى لو مستخدمين أسماء مستعارة! 🔍
يعني الحساب اللي فاكر إنه مجهول 100%؟
ممكن ميكونش مجهول زي ما متخيل خالص.
كان صعب جدًا تعرف مين الشخص الحقيقي ورا الحساب ده.
الموضوع كان محتاج:
✅ تحليل يدوي ✅ وقت طويل ✅ ربط معلومات كتير ببعض
لكن دلوقتي؟
الـ LLMs (نماذج الذكاء الاصطناعي الكبيرة) غيرت اللعبة بالكامل ⚡
أي تعليق بتكتبه بيحتوي بدون ما تحس على:
يعني ببساطة…
النموذج بيحلل كلامك وبعدها يدور مين على الإنترنت مواصفاته شبهك.
✅ قد إيه متأكد إن الحساب ده تابع للشخص الحقيقي.
النتيجة 👇
غالبًا بيكون فعلًا صح بنسبة كبيرة جدًا.
وده أداء أعلى بكتير من أي طرق تحليل قديمة.
لأن:
✅ أسلوب كتابتك = بصمتك
✅ اهتماماتك = هويتك
✅ التفاصيل الصغيرة = دليل عليك
الذكاء الاصطناعي دلوقتي يقدر يربط كل ده تلقائيًا.
التقنية دي ممكن تستخدم في:
لكن مع تطور LLMs و AI Analysis الوضع بيتغير بسرعة.
دلوقتي:
مش لازم تقول اسمك 👉
مش لازم تحط صورتك 👉
كلامك نفسه ممكن يعرفك.
يعني ببساطة… الخصوصية على الإنترنت بقت أصعب من أي وقت فات.
Large-scale online deanonymization with LLMs
والكلام فيها ببساطة بيتكلم عن حاجة كانت شبه مستحيلة زمان…
إن الذكاء الاصطناعي بقى قادر يكشف هوية الأشخاص على الإنترنت حتى لو مستخدمين أسماء مستعارة! 🔍
يعني الحساب اللي فاكر إنه مجهول 100%؟
ممكن ميكونش مجهول زي ما متخيل خالص.
يعني إيه كشف الهوية على الإنترنت (Deanonymization)؟ 🕵️♂️
زمان لو حد عنده حساب على مواقع زي:- Hacker News
- Forums
- Communities تقنية
كان صعب جدًا تعرف مين الشخص الحقيقي ورا الحساب ده.
الموضوع كان محتاج:
✅ تحليل يدوي ✅ وقت طويل ✅ ربط معلومات كتير ببعض
لكن دلوقتي؟
الـ LLMs (نماذج الذكاء الاصطناعي الكبيرة) غيرت اللعبة بالكامل ⚡
الذكاء الاصطناعي بيكشفك إزاي؟ 🤯
الفكرة المرعبة شوية إن طريقة كتابتك نفسها تعتبر بصمة رقمية ليك.أي تعليق بتكتبه بيحتوي بدون ما تحس على:
- اهتماماتك
- أسلوب كلامك
- مجالك الوظيفي
- دراستك
- البلد اللي عشت فيها
- خبراتك التقنية
Code:
User Comments
↓
Text Analysis
↓
Identity Clues Extraction
↓
Internet Search Matching
↓
Confidence Score النموذج بيحلل كلامك وبعدها يدور مين على الإنترنت مواصفاته شبهك.
نظام ESRC المستخدم في البحث 🔬
الباحثين قدموا سيستم اسمه ESRC وده عبارة عن Pipeline ذكي مكوّن من 4 مراحل:1️⃣ استخراج دلائل الهوية
السيستم يطلع أي معلومة من النص زي:- اشتغلت في Startup في برلين
- درست AI سنة معينة
- عندي خبرة في Cyber Security
2️⃣ البحث على الإنترنت
بعد كده يبدأ يعمل Search واسع يشوف مين بياناته قريبة من الكلام ده.3️⃣ مقارنة المرشحين
يقارن بين الأشخاص المحتملين باستخدام تحليل منطقي وسلوكي.4️⃣ حساب نسبة الثقة
في النهاية النظام يحسب:✅ قد إيه متأكد إن الحساب ده تابع للشخص الحقيقي.
نتائج التجربة كانت صادمة 📊
الباحثين جربوا يربطوا حسابات Hacker News بهويات حقيقية على LinkedIn.النتيجة 👇
- حوالي 68% Recall
- ودقة وصلت لـ 90% Precision
غالبًا بيكون فعلًا صح بنسبة كبيرة جدًا.
وده أداء أعلى بكتير من أي طرق تحليل قديمة.
أخطر نقطة لازم تفهمها ⚠️
إخفاء اسمك أو صورتك مش معناه إنك مجهول.لأن:
✅ أسلوب كتابتك = بصمتك
✅ اهتماماتك = هويتك
✅ التفاصيل الصغيرة = دليل عليك
الذكاء الاصطناعي دلوقتي يقدر يربط كل ده تلقائيًا.
مثال بسيط يوضح الفكرة 💡
لو شخص كتب تعليقات زي:النموذج ممكن يبحث عن:اشتغلت Pentester في شركة fintech
عايش في القاهرة
بحب Rust و Linux Kernel
- Pentesters
- نفس المدينة
- نفس الاهتمامات التقنية
هل ده خطر على الخصوصية فعلًا؟ 🔐
آه… وبشكل كبير.التقنية دي ممكن تستخدم في:
- تتبع المستخدمين
- كشف أصحاب الحسابات المجهولة
- تحليل الناشطين أو الباحثين
- مراقبة المحتوى
الخلاصة 🚨
الإنترنت زمان كان يسمح بدرجة عالية من إخفاء الهوية…لكن مع تطور LLMs و AI Analysis الوضع بيتغير بسرعة.
دلوقتي:
مش لازم تقول اسمك 👉
مش لازم تحط صورتك 👉
كلامك نفسه ممكن يعرفك.
يعني ببساطة… الخصوصية على الإنترنت بقت أصعب من أي وقت فات.