- بواسطة x32x01 ||
لو مهتم بالـ SEO أو بتطوير المواقع، أكيد سألت نفسك قبل كده:
جوجل فعلاً بتشوف موقعك إزاي؟ 🤔
في فيديو جديد على قناة Google Search Central، كان فيه نقاش تقني بين Martin Splitt وGary Illyes من فريق Search Relations في جوجل.
الكلام في الفيديو كشف شوية تفاصيل مهمة جدًا عن البنية التحتية الخاصة بالـ Crawling أو طريقة زحف جوجل للمواقع، وكمان صحّح مفاهيم كتير كانت منتشرة بين مطوري المواقع وخبراء SEO.
خلينا نشرح الموضوع بطريقة بسيطة 👇
لكن الحقيقة مختلفة شوية.
جوجل عندها بنية تحتية ضخمة جدًا شغالة بنظام شبه Software as a Service (SaaS).
يعني أي فريق داخل جوجل محتاج يجمع بيانات من الإنترنت، بيبعت طلب للنظام ده.
الطلب ده بيكون فيه معلومات زي:
لو السيرفر بتاعك بدأ يبطأ أو يرجّع أخطاء زي:
يعني ببساطة:
معظم عمليات الزحف اللي بيعملها Googlebot بتيجي من عناوين IP أمريكية.
لو أنت عامل Geo-blocking وقافل الوصول للموقع من أمريكا، غالبًا جوجل مش هيقدر يقرأ موقعك.
بعض الناس بتفترض إن Googlebot ممكن يغير الـ IP لدولة تانية، لكن الحقيقة إن ده:
يعني فيه حد أقصى لحجم الصفحة اللي جوجل بيقرأها.
تقريبًا:
مثال:
زي مثلًا:
Crawler = زحف تلقائي
Fetcher = طلب مباشر لحظي
لو خدمة زي:
السيستم مش هيبعت طلبين لنفس الموقع.
بدل كده بيعمل: Caching داخلي
يعني:
مثال في Linux:
ولو حبيت تمنع أو تتحكم في الزحف من خلال
الكود ده بيسمح لـ Googlebot بالوصول لكل الموقع، لكنه يمنع باقي الروبوتات من مجلد معين.
جوجل فعلاً بتشوف موقعك إزاي؟ 🤔
في فيديو جديد على قناة Google Search Central، كان فيه نقاش تقني بين Martin Splitt وGary Illyes من فريق Search Relations في جوجل.
الكلام في الفيديو كشف شوية تفاصيل مهمة جدًا عن البنية التحتية الخاصة بالـ Crawling أو طريقة زحف جوجل للمواقع، وكمان صحّح مفاهيم كتير كانت منتشرة بين مطوري المواقع وخبراء SEO.
خلينا نشرح الموضوع بطريقة بسيطة 👇
إيه هو Googlebot وبيشتغل إزاي؟ 🤖
ناس كتير فاكرة إن Googlebot مجرد برنامج واحد بيدخل على المواقع ويقرأ الصفحات.لكن الحقيقة مختلفة شوية.
جوجل عندها بنية تحتية ضخمة جدًا شغالة بنظام شبه Software as a Service (SaaS).
يعني أي فريق داخل جوجل محتاج يجمع بيانات من الإنترنت، بيبعت طلب للنظام ده.
الطلب ده بيكون فيه معلومات زي:
- نوع الـ User-Agent
- حجم البيانات المطلوبة
- طريقة الزحف للموقع
جوجل بتحمي السيرفر بتاعك من الضغط ⚡
من أهم الحاجات اللي اتكلم عنها الفيديو إن جوجل مش هدفها تضغط على موقعك.لو السيرفر بتاعك بدأ يبطأ أو يرجّع أخطاء زي:
- 503 Server Error
- بطء شديد في الاستجابة
يعني ببساطة:
- يقلل عدد الطلبات
- يبطأ الزحف للموقع
- يحافظ على استقرار السيرفر
مشكلة Geo-Blocking وتأثيرها على الأرشفة 🌍
معلومة ناس كتير مش واخدة بالها منها:معظم عمليات الزحف اللي بيعملها Googlebot بتيجي من عناوين IP أمريكية.
لو أنت عامل Geo-blocking وقافل الوصول للموقع من أمريكا، غالبًا جوجل مش هيقدر يقرأ موقعك.
بعض الناس بتفترض إن Googlebot ممكن يغير الـ IP لدولة تانية، لكن الحقيقة إن ده:
- نادر جدًا
- مش مضمون
حد أقصى لحجم صفحات HTML 📄
جوجل مش بتقرأ الصفحة بالكامل دايمًا. فيه حاجة اسمها Truncation Limit.يعني فيه حد أقصى لحجم الصفحة اللي جوجل بيقرأها.
تقريبًا:
- النظام ممكن يسحب بيانات لحد 15MB
- لكن في نتائج البحث غالبًا بيقرأ أول 2MB من HTML فقط
- جوجل هيقرأ أول جزء بس
- باقي الصفحة ممكن يتجاهلها
- تقلل حجم الصفحة
- تقلل الأكواد غير الضرورية
- تستخدم تحميل كسول للصور (Lazy Loading)
الفرق بين Crawler وFetcher 🧠
الفيديو كمان وضح فرق مهم بين نوعين من الأنظمة.Crawler
ده اللي بيعمل الزحف التلقائي للموقع.مثال:
- قراءة الصفحات
- اكتشاف روابط جديدة
- تحديث الفهرسة
Fetcher
ده بيشتغل لما يحصل طلب مباشر.زي مثلًا:
- فحص URL في أدوات جوجل
- اختبار صفحة
Crawler = زحف تلقائي
Fetcher = طلب مباشر لحظي
جوجل بتستخدم الكاش لتقليل الضغط على المواقع 💾
جوجل ذكية جدًا في التعامل مع السيرفرات.لو خدمة زي:
- Google Search
- Google News
السيستم مش هيبعت طلبين لنفس الموقع.
بدل كده بيعمل: Caching داخلي
يعني:
- يخزن نسخة من الصفحة
- يشاركها بين الخدمات المختلفة
مثال بسيط لفحص Googlebot في السيرفر 🧑💻
لو بتدير موقع أو سيرفر، ممكن تتابع دخول Googlebot من خلال الـ logs.مثال في Linux:
Code:
grep "Googlebot" access.log robots.txt: Code:
User-agent: Googlebot
Allow: /
User-agent: *
Disallow: /private/ ليه الفيديو ده مهم لمطوري المواقع وSEO؟ 🚀
الفيديو بيديك صورة أوضح عن:- طريقة عمل Googlebot
- بنية الزحف داخل جوجل
- حدود قراءة الصفحات
- تأثير حظر الدول على الأرشفة
- تحسن SEO
- تخلي جوجل يقرأ موقعك بشكل أفضل
- تقلل مشاكل الأرشفة
👆 أضغط على الصورة لمشاهدة الفيديو 👆