x32x01
  • بواسطة x32x01 ||
كان يوم الإثنين الصبح… وبدأ الكابوس!
(قصة حقيقية من داخل شركة بيانات)
في شركة “DataVerse”، كان يوسف محلل البيانات قاعد بيشرب القهوة ومبسوط إن الدنيا هادية… لحد ما جاله الإيميل.
💢 الموضوع: انهيار مفاجئ في مبيعات قسم الشرق الأوسط!
😤 الـ CMO كانت غاضبة جداً، والإدارة العليا طالبة تحليل فوري.
"إحنا كنا بنبيع بـ 500 ألف دولار شهرياً، دلوقتي بقينا 120 ألف؟! عايزين تفسير… النهاردة!"
🤔 يوسف بدأ يفكر بسرعة.
فتح الـ dashboard… بص على الفلاتر…
ولقى المفاجأة:
👀 البيانات مبتتكلمش!
الـ Dashboard مش محدث بقاله أسبوعين!
و SQL query اللي بتسحب البيانات فيها شرط غلط:
SQL:
WHERE region = 'MiddleEast'
بينما الحقيقة في قاعدة البيانات كانت:
SQL:
region IN ('UAE', 'KSA', 'EGY', 'QAT', 'JOR')
💢 المشكلة؟
الداتا كانت مش موحدة (Inconsistent labels)، وكل واحد في الفريق بيستخدم تصنيف مختلف.
واحد بيكتب 'Middle East'، واحد بيحط الدول، وواحد بيكتب 'ME'.
✨ الحل؟
يوسف عمل حاجة بسيطة لكن فرقت:
1️⃣ عمل Data Dictionary موحد:
كل التصنيفات الإقليمية بقت موحدة ومعتمدة.
2️⃣ بنى Script صغير في Python للتنظيف:
Python:
def normalize_region(region):
    middle_east = ['UAE', 'KSA', 'EGY', 'QAT', 'JOR', 'MiddleEast', 'ME']
    if region in middle_east:
        return 'Middle East'
    return region
df['region'] = df['region'].apply(normalize_region)
3️⃣ طبق ده في الـ ETL pipeline بحيث البيانات تتنضف تلقائياً أول ما تدخل.

🌟 النتيجة؟
✅ الـ Dashboard بدأ يشتغل صح.
✅ الإدارة فهمت إن فيه تباطؤ حقيقي بس مش كارثي.
✅ يوسف بقى الـ Hero بتاع اليوم!
✨ الدرس؟
البيانات الغير نظيفة بتكلف وقت، فلوس، وثقة!
قبل ما تحلل، اتأكد إنك بتنضف، توحد، وتراجع الـ pipelines كويس.
 
المواضيع ذات الصلة
x32x01
الردود
0
المشاهدات
223
x32x01
x32x01
x32x01
الردود
0
المشاهدات
237
x32x01
x32x01
x32x01
الردود
0
المشاهدات
142
x32x01
x32x01
x32x01
الردود
0
المشاهدات
152
x32x01
x32x01
x32x01
الردود
0
المشاهدات
158
x32x01
x32x01
الوسوم : الوسوم
تحليل البيانات
الدخول أو التسجيل السريع
نسيت كلمة مرورك؟
إحصائيات المنتدى
المواضيع
1,660
المشاركات
1,864
أعضاء أكتب كود
360
أخر عضو
matus
عودة
أعلى