جدول المحتويات[يخفي][يعرض]
- 1. جبار
- 2. تصنيف الزهور الايرلندية
- 3. توقع أسعار البيت في بوسطن
- 4. اختبار جودة النبيذ
- 5. توقع سوق الأسهم
- 6. توصية الفيلم
- 7. توقع أهلية التحميل
- 8. تحليل المشاعر باستخدام بيانات تويتر
- 9. توقع المبيعات المستقبلية
- 10. كشف الأخبار الكاذبة
- 11. توقع شراء كوبونات
- 12. توقع زبد العميل
- 13. توقع مبيعات وول مارت
- 14. اوبر تحليل البيانات
- 15. تحليل Covid-19
- وفي الختام
التعلم الآلي عبارة عن دراسة بسيطة حول كيفية تعليم برنامج كمبيوتر أو خوارزمية للتحسين التدريجي لوظيفة معينة مقدمة على مستوى عالٍ. لقد أثبت التعرف على الصور واكتشاف الاحتيال وأنظمة التوصية وتطبيقات التعلم الآلي الأخرى شعبيتها بالفعل.
وظائف ML تجعل العمل البشري بسيطًا وفعالًا ، مما يوفر الوقت ويضمن نتيجة عالية الجودة. حتى جوجل ، محرك البحث الأكثر شهرة في العالم ، يستخدم آلة التعلم.
تتوفر مجموعة متنوعة من الخيارات بدءًا من تحليل استعلام المستخدم وتعديل النتيجة بناءً على النتائج وحتى إظهار الموضوعات الشائعة والإعلانات فيما يتعلق بالاستعلام.
التكنولوجيا التي تتسم بالإدراك والتصحيح الذاتي ليست بعيدة في المستقبل.
واحدة من أعظم الطرق للبدء هي التدريب العملي على المشروع وتصميمه. لذلك ، قمنا بتجميع قائمة تضم 15 مشروعًا من أفضل مشاريع التعلم الآلي للمبتدئين لتبدأ.
1. جبار
غالبًا ما تعتبر هذه إحدى أعظم المهام وأكثرها إمتاعًا لأي شخص مهتم بمعرفة المزيد عن التعلم الآلي. تيتانيك هو مشروع تعليمي آلي شهير يعمل أيضًا كطريقة جيدة للتعرف على منصة علوم البيانات Kaggle. تتكون مجموعة بيانات Titanic من بيانات حقيقية من غرق السفينة المنكوبة.
يتضمن تفاصيل مثل عمر الشخص ، والحالة الاجتماعية والاقتصادية ، والجنس ، ورقم المقصورة ، وميناء المغادرة ، والأهم من ذلك ، ما إذا كان قد نجا!
تم تحديد تقنية K-Nearest Neighbor ومصنف شجرة القرار لتحقيق أفضل النتائج لهذا المشروع. إذا كنت تبحث عن تحدٍ سريع في عطلة نهاية الأسبوع لتحسين قدرات التعلم الآلي، هذا على Kaggle يناسبك.
2. تصنيف الزهور الأيرلندية
يحب المبتدئون مشروع تصنيف زهرة السوسن ، وهو مكان رائع للبدء إذا كنت جديدًا في التعلم الآلي. يميز طول الكؤوس والبتلات أزهار القزحية عن الأنواع الأخرى. الغرض من هذا المشروع هو فصل الأزهار إلى ثلاثة أنواع: فرجينيا ، سيتوسا ، وفيرسيكولور.
بالنسبة لتمارين التصنيف ، يستخدم المشروع مجموعة بيانات زهرة Iris ، والتي تساعد المتعلمين في تعلم أساسيات التعامل مع القيم والبيانات الرقمية. مجموعة بيانات زهرة القزحية هي مجموعة صغيرة يمكن تخزينها في الذاكرة دون الحاجة إلى القياس.
3. توقع أسعار بوسطن هاوس
آخر مشهور مجموعة بيانات للمبتدئين في التعلم الآلي هي بيانات Boston Housing. هدفها هو التنبؤ بقيم المنازل في أحياء بوسطن المختلفة. يتضمن إحصاءات حيوية مثل العمر ومعدل ضريبة الأملاك ومعدل الجريمة وحتى القرب من مراكز العمل ، وكلها قد تؤثر على أسعار الإسكان.
مجموعة البيانات بسيطة وصغيرة ، مما يجعل من السهل تجربتها للمبتدئين. لمعرفة العوامل التي تؤثر على سعر العقار في بوسطن ، يتم استخدام تقنيات الانحدار بكثافة على معايير مختلفة. إنه مكان رائع لممارسة تقنيات الانحدار وتقييم مدى نجاحها.
4. اختبار جودة النبيذ
النبيذ مشروب كحولي غير معتاد يتطلب سنوات من التخمير. نتيجة لذلك ، فإن زجاجة النبيذ العتيقة هي نبيذ باهظ الثمن وعالي الجودة. يتطلب اختيار زجاجة النبيذ المثالية سنوات من المعرفة بتذوق النبيذ ، ويمكن أن تكون عملية ناجحة أو ضائعة.
يقوم مشروع اختبار جودة النبيذ بتقييم الخمور باستخدام الاختبارات الفيزيائية والكيميائية مثل مستوى الكحول والحموضة الثابتة والكثافة ودرجة الحموضة وعوامل أخرى. يحدد المشروع أيضًا معايير جودة النبيذ وكمياته. نتيجة لذلك ، يصبح شراء النبيذ نسيمًا.
5. توقع سوق الأسهم
هذه المبادرة مثيرة للاهتمام سواء كنت تعمل في القطاع المالي أم لا. تتم دراسة بيانات سوق الأسهم على نطاق واسع من قبل الأكاديميين والشركات وحتى كمصدر للدخل الثانوي. تعد قدرة عالم البيانات على دراسة واستكشاف بيانات السلاسل الزمنية أمرًا حيويًا أيضًا. تعتبر البيانات من سوق الأسهم مكانًا رائعًا للبدء.
جوهر المسعى هو التنبؤ بالقيمة المستقبلية للسهم. يعتمد هذا على أداء السوق الحالي بالإضافة إلى إحصاءات السنوات السابقة. تقوم Kaggle بجمع البيانات حول مؤشر NIFTY-50 منذ عام 2000 ، ويتم تحديثها حاليًا أسبوعيًا. منذ 1 يناير 2000 ، احتوت أسعار الأسهم لأكثر من 50 منظمة.
6. توصية الفيلم
أنا متأكد من أنك شعرت بهذا الشعور بعد مشاهدة فيلم جيد. هل شعرت يومًا بالاندفاع لإثارة حواسك من خلال مشاهدة أفلام مماثلة بنهم؟
نحن نعلم أن خدمات OTT مثل Netflix قد حسّنت أنظمة التوصيات الخاصة بها بشكل كبير. بصفتك طالبًا في تعلم الآلة ، ستحتاج إلى فهم كيفية استهداف هذه الخوارزميات للعملاء بناءً على تفضيلاتهم ومراجعاتهم.
من المحتمل أن تكون مجموعة بيانات IMDB على Kaggle واحدة من أكثرها اكتمالاً ، مما يسمح باستنتاج نماذج التوصية بناءً على عنوان الفيلم وتقييم العملاء والنوع وعوامل أخرى. إنها أيضًا طريقة ممتازة للتعرف على التصفية القائمة على المحتوى وهندسة الميزات.
7. توقع أهلية التحميل
العالم يدور حول القروض. مصدر ربح البنوك الرئيسي يأتي من الفوائد على القروض. ومن ثم فهم عملهم الأساسي.
يمكن للأفراد أو مجموعات الأفراد فقط توسيع الاقتصادات من خلال استثمار الأموال في شركة على أمل رؤيتها ترتفع من حيث القيمة في المستقبل. من المهم أحيانًا السعي للحصول على قرض لتكون قادرًا على تحمل مخاطر من هذا النوع وحتى المشاركة في بعض الملذات الدنيوية.
قبل قبول القرض ، عادة ما يكون لدى البنوك إجراءات صارمة إلى حد ما يجب اتباعها. نظرًا لأن القروض تمثل جانبًا مهمًا في حياة العديد من الأشخاص ، فإن توقع الأهلية للحصول على قرض يتقدم به شخص ما سيكون مفيدًا للغاية ، مما يسمح بتخطيط أفضل بعد قبول القرض أو رفضه.
8. تحليل المشاعر باستخدام بيانات تويتر
بفضل شبكات التواصل الاجتماعي مثل Twitter و Facebook و Reddit ، أصبح استقراء الآراء والاتجاهات سهلاً إلى حد كبير. تُستخدم هذه المعلومات لإزالة الآراء حول الأحداث والأشخاص والرياضة وموضوعات أخرى. يتم تطبيق مبادرات التعلم الآلي المتعلقة بالتعدين في الآراء في مجموعة متنوعة من الإعدادات ، بما في ذلك الحملات السياسية وتقييمات منتجات أمازون.
سيبدو هذا المشروع رائعًا في محفظتك! لاكتشاف المشاعر والتحليل القائم على الجوانب ، يمكن استخدام تقنيات مثل آلات ناقلات الدعم ، وخوارزميات الانحدار والتصنيف على نطاق واسع (العثور على الحقائق والآراء).
9. توقع المبيعات المستقبلية
يرغب التجار والشركات الكبيرة من B2C في معرفة مقدار بيع كل منتج في مخزونهم. يساعد التنبؤ بالمبيعات أصحاب الأعمال في تحديد العناصر ذات الطلب المرتفع. سيؤدي التنبؤ الدقيق بالمبيعات إلى تقليل الفاقد بشكل كبير مع تحديد التأثير المتزايد على الميزانيات المستقبلية.
يستخدم تجار التجزئة مثل Walmart و IKEA و Big Basket و Big Bazaar توقعات المبيعات لتقدير الطلب على المنتج. يجب أن تكون على دراية بالتقنيات المختلفة لتطهير البيانات الخام من أجل إنشاء مشاريع ML. أيضا ، الفهم الجيد لتحليل الانحدار ، وخاصة الانحدار الخطي البسيط ، مطلوب.
لهذه الأنواع من المهام ، ستحتاج إلى استخدام مكتبات مثل Dora و Scrubadub و Pandas و NumPy وغيرها.
10 كشف الأخبار الكاذبة
إنه جهد آخر لتعلم الآلة متطور يستهدف أطفال المدارس. الأخبار الكاذبة تنتشر كالنار في الهشيم كما نعلم جميعا كل شيء متاح على وسائل التواصل الاجتماعي ، من ربط الأفراد بقراءة الأخبار اليومية.
نتيجة لذلك ، أصبح اكتشاف الأخبار الكاذبة أكثر صعوبة هذه الأيام. تمتلك العديد من شبكات التواصل الاجتماعي الكبيرة ، مثل Facebook و Twitter ، بالفعل خوارزميات للكشف عن الأخبار الزائفة في المنشورات والموجزات.
لتحديد الأخبار الكاذبة ، يحتاج هذا النوع من مشروع ML إلى فهم شامل لمقاربات البرمجة اللغوية العصبية المتعددة وخوارزميات التصنيف (PassiveAggressiveClassifier أو مصنف Naive Bayes).
11 توقع شراء الكوبونات
يفكر العملاء بشكل متزايد في الشراء عبر الإنترنت عندما هاجم فيروس كورونا الكوكب في عام 2020. ونتيجة لذلك ، اضطرت مؤسسات التسوق إلى تحويل أعمالها عبر الإنترنت.
من ناحية أخرى ، لا يزال العملاء يبحثون عن عروض رائعة ، تمامًا كما كانوا في المتاجر ، ويبحثون بشكل متزايد عن كوبونات التوفير الفائق. هناك أيضًا مواقع ويب مخصصة لإنشاء قسائم لمثل هؤلاء العملاء. يمكنك التعرف على استخراج البيانات في التعلم الآلي ، وإنتاج الرسوم البيانية الشريطية ، والمخططات الدائرية ، والرسوم البيانية لتصور البيانات ، وهندسة الميزات في هذا المشروع.
لإنشاء تنبؤات ، يمكنك أيضًا النظر في مناهج احتساب البيانات لإدارة قيم زمالة المدمنين المجهولين وتشابه المتغيرات في جيب التمام.
12 توقع زبد العميل
المستهلكون هم أهم أصول الشركة ، والاحتفاظ بهم أمر حيوي لأي عمل يهدف إلى زيادة الإيرادات وبناء علاقات هادفة طويلة الأجل معهم.
علاوة على ذلك ، فإن تكلفة الحصول على عميل جديد أعلى بخمس مرات من تكلفة دعم عميل حالي. تعد مشكلة العميل / الاستنزاف مشكلة تجارية معروفة يتوقف فيها العملاء أو المشتركون عن التعامل مع خدمة أو شركة.
من الناحية المثالية ، لن يكونوا عملاء مدفوعين. يعتبر العميل مضطربًا إذا مرت فترة زمنية معينة منذ آخر تفاعل للعميل مع الشركة. إن تحديد ما إذا كان العميل سوف يتخبط ، وكذلك تقديم المعلومات ذات الصلة بسرعة بهدف الاحتفاظ بالعملاء ، أمر بالغ الأهمية لخفض الاضطراب.
إن أدمغتنا غير قادرة على توقع معدل دوران العملاء لملايين العملاء ؛ هنا حيث يمكن أن يساعد التعلم الآلي.
13 توقع مبيعات وول مارت
يعد التنبؤ بالمبيعات أحد أبرز تطبيقات التعلم الآلي ، والذي يتضمن اكتشاف الخصائص التي تؤثر على مبيعات المنتجات وتوقع حجم المبيعات في المستقبل.
تُستخدم مجموعة بيانات Walmart ، التي تحتوي على بيانات مبيعات من 45 موقعًا ، في دراسة التعلم الآلي هذه. يتم تضمين المبيعات لكل متجر ، حسب الفئة ، على أساس أسبوعي في مجموعة البيانات. الغرض من مشروع التعلم الآلي هذا هو توقع المبيعات لكل قسم في كل منفذ حتى يتمكنوا من اتخاذ قرارات أفضل لتخطيط المخزون وقنوات تعتمد على البيانات.
يعد العمل مع مجموعة بيانات Walmart أمرًا صعبًا نظرًا لأنه يحتوي على أحداث تخفيض السعر المختارة التي لها تأثير على المبيعات ويجب أخذها في الاعتبار.
14 تحليل بيانات اوبر
عندما يتعلق الأمر بتنفيذ ودمج التعلم الآلي والتعلم العميق في تطبيقاتهم ، فإن خدمة مشاركة الركوب الشهيرة ليست بعيدة عن الركب. كل عام ، يعالج مليارات الرحلات ، مما يسمح للمسافرين بالسفر في أي وقت من النهار أو الليل.
نظرًا لأن لديها قاعدة عملاء كبيرة ، فإنها تحتاج إلى خدمة عملاء استثنائية لمعالجة شكاوى المستهلكين في أسرع وقت ممكن.
تمتلك Uber مجموعة بيانات تضم ملايين من عمليات النقل التي يمكن استخدامها لتحليل رحلات العميل وعرضها للكشف عن الأفكار وتحسين تجربة العميل.
15 تحليل Covid-19
اجتاح COVID-19 العالم اليوم ، وليس مجرد جائحة. بينما يركز الخبراء الطبيون على إنتاج لقاحات فعالة وتحصين العالم ، علماء البيانات ليست بعيدة عن الركب.
يتم الإعلان عن الحالات الجديدة ، وعدد النشطاء اليومي ، والوفيات ، وإحصاءات الاختبارات. يتم عمل التوقعات على أساس يومي بناءً على اندلاع السارس في القرن الماضي. لهذا ، يمكنك استخدام تحليل الانحدار ودعم نماذج التنبؤ القائمة على آلة المتجه.
وفي الختام
للتلخيص ، لقد ناقشنا بعضًا من أهم مشاريع ML التي ستساعدك في اختبار برمجة التعلم الآلي بالإضافة إلى استيعاب أفكارها وتنفيذها. يمكن أن تساعدك معرفة كيفية دمج التعلم الآلي في التقدم في مهنتك حيث تتولى التكنولوجيا كل صناعة.
أثناء تعلم التعلم الآلي ، نوصيك بممارسة مفاهيمك وكتابة جميع الخوارزميات الخاصة بك. تعد كتابة الخوارزميات أثناء التعلم أكثر أهمية من تنفيذ المشروع ، كما أنها توفر لك ميزة في فهم الموضوعات بشكل صحيح.
اترك تعليق