انطلق في رحلة ساحرة مع نورا المبتكرة وصديقها الروبوت قلبون، وهما يكتشفان كيف يمكن للبيانات أن تساعد في الحفاظ على صحة قلوب الجميع! قصة ملهمة عن الذكاء، الصداقة، وأهمية الرعاية المبكرة، مليئة بالمرح والألوان الزاهية التي ستسعد الصغار وتلهمهم.
الغرض العام: تطوير نموذج تعلم آلي يساعد الأطباء في التنبؤ المبكر باحتمالية إصابة المريض بمرض القلب بناءً على بياناته السريرية.المشكلة المراد حلها: التشخيص التقليدي قد يعاني من تأخير أو خطأ في التقدير لاعتماده الكلي على الخبرة البشرية وتحليل مؤشرات معقدة يدوياً.أهداف تطبيق الحل:دعم التشخيص الطبي بمساعدة الذكاء الاصطناعي.+1توفير نظام إنذار مبكر يعتمد على بيانات دقيقة وموضوعية.دمج النموذج في أنظمة دعم القرار داخل المستشفيات.معايير النجاح والفرضيات:المقاييس: تحقيق دقة (Accuracy) تتجاوز 85% بعد التحسين.الفرضية: استخدام خوارزمية Random Forest سيعطي نتائج أدق من النماذج الخطية لتعاملها الأفضل مع المتغيرات المتعددة.+1الجزء الثاني: مجموعة البيانات وإعدادها (B.P4)مصدر البيانات: تم استخدام UCI Heart Disease Dataset من مستودع (UCI Machine Learning Repository).+1خصائص البيانات: تشمل 303 مريض و 14 متغيراً طبياً ، منها: (العمر، الجنس، نوع ألم الصدر، ضغط الدم، الكوليسترول، ونبض القلب الأقصى) .+2خطوات معالجة البيانات (Preprocessing):تنظيف البيانات: إزالة أو تعويض القيم المفقودة وفحص القيم الشاذة.+2الترميز (Encoding): تحويل المتغيرات الفئوية إلى صيغة عددية.التطبيع (Normalization): لتوحيد مقاييس البيانات وتحسين أداء الخوارزميات.تقسيم البيانات: تم تقسيمها بنسبة 80% للتدريب و 20% للاختبار.الجزء الثالث: تطوير واختبار الحل (C.P5, C.M3, B.M2)1. اختيار الخوارزمية والأدواتنوع التعلم: تعلم خاضع للإشراف (Supervised Learning).+1الخوارزمية المختارة: Random Forest و Decision Tree.الأدوات: لغات برمجة (مثل Python) ومكتبات الذكاء الاصطناعي المتخصصة.+12. الاختبار والتحسين (النموذج الأولي vs المحسن)النموذجالدقة (الأولية)الدقة (بعد التحسين)إجراءات التحسين المتبعةLogistic Regression82% 85% اختيار أهم المتغيرات (Feature Selection).Decision Tree84% 86% تطبيق عملية التقليم (Pruning) لعلاج الـ Overfitting.Random Forest87% (تقريباً) 90% استخدام Grid Search لضبط المعلمات (Hyperparameter Tuning).الجزء الرابع: التقييم النهائي (BC.D2)نقاط القوة:خوارزمية Random Forest تفوقت لقدرتها على تقليل التباين بدمج عدة أشجار قرار.النماذج مثل Decision Tree توفر قواعد واضحة وسهلة التفسير للأطباء.نقاط الضعف: تأثر النتائج بجودة البيانات؛ حيث أن اختيار الميزات غير الصحيحة قد يقلل الدقة.رأي مدعوم بالأدلة: جودة البيانات وتحسينها (Data Refining) لا تقل أهمية عن اختيار الخوارزمية نفسها في نجاح الحل النهائي.+1المخاطر: احتمالية الـ Overfitting في أشجار القرار قبل المعالجة، مما قد يعطي نتائج مضللة على بيانات جديدة.