جدول المحتويات[يخفي][يعرض]
يتغير العالم بسرعة بسبب الذكاء الاصطناعي والتعلم الآلي ، والذي له تأثير على كل جانب من جوانب حياتنا اليومية.
من المساعدين الصوتيين الذين يستخدمون البرمجة اللغوية العصبية والتعلم الآلي لحجز المواعيد ، والبحث عن الأحداث في تقويمنا ، وتشغيل الموسيقى على أجهزة دقيقة للغاية بحيث يمكنهم توقع احتياجاتنا قبل أن نفكر فيها.
يمكن لأجهزة الكمبيوتر أن تلعب الشطرنج ، وإجراء العمليات الجراحية ، والتطور إلى آلات أكثر ذكاءً وشبيهة بالإنسان بمساعدة خوارزميات التعلم الآلي.
نحن في وقت من التقدم التكنولوجي المستمر ، ومن خلال رؤية كيف تطورت أجهزة الكمبيوتر عبر الزمن ، يمكننا عمل تنبؤات حول ما سيحدث في المستقبل.
يعد إضفاء الطابع الديمقراطي على أدوات وأساليب الحوسبة أحد الجوانب الرئيسية لهذه الثورة التي تبرز. علماء البيانات قاموا بإنشاء أجهزة كمبيوتر قوية لمعالجة البيانات خلال السنوات الخمس الماضية من خلال تنفيذ منهجيات متطورة دون عناء. النتائج مذهلة.
في هذا المنشور ، سننظر عن كثب في آلة التعلم الخوارزميات وجميع أشكالها المختلفة.
إذن ، ما هي خوارزميات التعلم الآلي؟
يُعرف النهج الذي يستخدمه نظام الذكاء الاصطناعي لتنفيذ مهمته - بشكل عام ، التنبؤ بقيم المخرجات من بيانات إدخال معينة - باسم خوارزمية التعلم الآلي.
خوارزمية التعلم الآلي هي عملية تستخدم البيانات وتُستخدم لإنشاء نماذج تعلم آلي جاهزة للإنتاج. إذا كان التعلم الآلي هو القطار الذي يقوم بعمل ما ، فإن خوارزميات التعلم الآلي هي القاطرات التي تحرك العمل.
سيتم تحديد أفضل نهج للتعلم الآلي للاستخدام من خلال مشكلة العمل التي تحاول معالجتها ونوع مجموعة البيانات التي تستخدمها والموارد المتاحة لديك.
خوارزميات التعلم الآلي هي تلك التي تحول مجموعة البيانات إلى نموذج. اعتمادًا على نوع المشكلة التي تحاول الإجابة عليها ، يمكن أن تؤدي خوارزميات التعلم المعزز جيدًا وقوة المعالجة المتاحة ونوع البيانات التي تمتلكها أو خوارزميات التعلم الخاضعة للإشراف أو غير الخاضعة للإشراف أو التعزيز.
لذا ، تحدثنا عن التعلم الخاضع للإشراف ، وغير الخاضع للإشراف ، والمعزز ، ولكن ما هي؟ دعنا نستكشفهم.
التعلم الخاضع للإشراف وغير الخاضع للإشراف والمعزز
التعلم تحت الإشراف
في التعلم الخاضع للإشراف ، يتم تطوير نموذج الذكاء الاصطناعي بناءً على المدخلات التي تم توفيرها والتسمية التي تمثل النتيجة المتوقعة. استنادًا إلى المدخلات والمخرجات ، يطور النموذج معادلة تعيين ، وباستخدام معادلة التعيين هذه ، فإنه يتنبأ بتسمية المدخلات في المستقبل.
لنفترض أننا بحاجة إلى إنشاء نموذج يمكنه التمييز بين الكلب والقط. يتم إدخال صور متعددة للقطط والكلاب في النموذج مع ملصقات تشير إلى ما إذا كانت قطط أو كلاب من أجل تدريب النموذج.
يسعى النموذج إلى إنشاء معادلة تربط الملصقات على الصور المدخلة لتلك الصور. حتى لو لم يشاهد النموذج الصورة من قبل ، بعد التدريب ، يمكنه تحديد ما إذا كان من قطة أو كلب.
تعليم غير مشرف عليه
يتضمن التعلم غير الخاضع للإشراف تدريب نموذج الذكاء الاصطناعي فقط على المدخلات دون تصنيفها. يقسم النموذج بيانات الإدخال إلى مجموعات ذات خصائص ذات صلة.
يتم بعد ذلك التنبؤ بالتسمية المستقبلية للمدخلات اعتمادًا على مدى تطابق سماتها مع أحد التصنيفات. ضع في اعتبارك الموقف الذي يجب أن نقسم فيه مجموعة من الكرات الحمراء والزرقاء إلى فئتين.
لنفترض أن الخصائص الأخرى للكرات متطابقة ، باستثناء اللون. على أساس كيفية تقسيم الكرات إلى فئتين ، يبحث النموذج عن الخصائص التي تختلف بين الكرات.
يتم إنتاج مجموعتين من الكرات - واحدة زرقاء والأخرى حمراء - عندما يتم تقسيم الكرات إلى مجموعتين بناءً على لونها.
تعزيز التعلم
في التعلم المعزز ، يسعى نموذج الذكاء الاصطناعي إلى تعظيم الربح الإجمالي من خلال التصرف قدر الإمكان في ظروف معينة. تساعد التعليقات على نتائجه السابقة النموذج على التعلم.
فكر في السيناريو عندما يُطلب من الروبوت تحديد مسار بين النقطتين A و B. ويختار الروبوت أولاً أيًا من الدورات التدريبية لأنه ليس لديه خبرة سابقة.
يتلقى الروبوت مدخلات على المسار الذي يسلكه ويكتسب المعرفة منه. يمكن أن يستخدم الروبوت المدخلات لإصلاح المشكلة في المرة التالية التي يواجه فيها ظرفًا مشابهًا.
على سبيل المثال ، إذا اختار الروبوت الخيار "ب" وتلقى مكافأة ، مثل ردود الفعل الإيجابية ، فإنه يفهم هذه المرة أنه يجب عليه تحديد الطريقة "ب" لزيادة مكافأته.
الآن أخيرًا ما تنتظرونه جميعًا هو الخوارزميات.
خوارزميات التعلم الآلي الرئيسية
1. الانحدار الخطي
إن أبسط نهج للتعلم الآلي ينحرف عن التعلم الخاضع للإشراف هو الانحدار الخطي. مع المعرفة من المتغيرات المستقلة ، يتم استخدامها في الغالب لحل مشكلات الانحدار وإنشاء تنبؤات حول المتغيرات التابعة المستمرة.
إن العثور على الخط الأنسب ، والذي يمكن أن يساعد في التنبؤ بنتيجة المتغيرات التابعة المستمرة ، هو الهدف من الانحدار الخطي. أسعار المساكن والعمر والأجور هي بعض الأمثلة على القيم المستمرة.
يستخدم النموذج المعروف باسم الانحدار الخطي البسيط خطًا مستقيمًا لحساب الارتباط بين متغير مستقل واحد ومتغير تابع واحد. يوجد أكثر من متغيرين مستقلين في الانحدار الخطي المتعدد.
يحتوي نموذج الانحدار الخطي على أربعة افتراضات أساسية:
- الخطية: هناك علاقة خطية بين X ووسط Y.
- المثلية الجنسية: لكل قيمة X ، يكون التباين المتبقي هو نفسه.
- الاستقلال: الملاحظات مستقلة عن بعضها البعض من حيث الاستقلال.
- الحالة الطبيعية: عندما يتم إصلاح X ، يتم توزيع Y بشكل طبيعي.
يؤدي الانحدار الخطي أداءً رائعًا للبيانات التي يمكن فصلها على طول الخطوط. يمكنه التحكم في فرط التجهيز باستخدام تقنيات التنظيم والتحقق المتقاطع وتقليل الأبعاد. ومع ذلك ، هناك حالات تتطلب هندسة ميزات واسعة النطاق ، والتي يمكن أن تؤدي في بعض الأحيان إلى زيادة التجهيز والضوضاء.
2. الانحدار اللوجستي
الانحدار اللوجستي هو أسلوب آخر للتعلم الآلي يبتعد عن التعلم الخاضع للإشراف. استخدامه الرئيسي هو التصنيف ، في حين أنه يمكن استخدامه أيضًا في مشاكل الانحدار.
يستخدم الانحدار اللوجستي للتنبؤ بالمتغير التابع الفئوي باستخدام المعلومات من العوامل المستقلة. الهدف هو تصنيف المخرجات ، والتي يمكن أن تقع فقط بين 0 و 1.
تتم معالجة الإجمالي المرجح للمدخلات بواسطة دالة السيني ، وهي وظيفة تنشيط تقوم بتحويل القيم بين 0 و 1.
أساس الانحدار اللوجستي هو تقدير الاحتمالية القصوى ، وهي طريقة لحساب معلمات توزيع احتمالي مفترض بالنظر إلى البيانات المرصودة المحددة.
3. شجرة القرار
طريقة أخرى للتعلم الآلي تنفصل عن التعلم الخاضع للإشراف هي شجرة القرار. لكل من قضايا التصنيف والانحدار ، يمكن استخدام نهج شجرة القرار.
تستخدم أداة صنع القرار هذه ، التي تشبه الشجرة ، التمثيلات المرئية لإظهار النتائج والتكاليف والتداعيات المحتملة للإجراءات. من خلال تقسيم البيانات إلى أجزاء منفصلة ، تكون الفكرة مماثلة للعقل البشري.
تم تقسيم البيانات إلى أجزاء مميزة بقدر ما يمكننا تحبيبها. الهدف الرئيسي لشجرة القرار هو بناء نموذج تدريب يمكن استخدامه للتنبؤ بفئة المتغير المستهدف. يمكن معالجة القيم المفقودة تلقائيًا باستخدام شجرة القرار.
لا توجد متطلبات لتشفير اللقطة الواحدة أو المتغيرات الوهمية أو خطوات معالجة البيانات الأخرى. إنه جامد بمعنى أنه من الصعب إضافة بيانات جديدة إليه. إذا حصلت على بيانات مصنفة إضافية ، فيجب عليك إعادة تدريب الشجرة على مجموعة البيانات بأكملها.
نتيجة لذلك ، تعد أشجار القرار اختيارًا سيئًا لأي تطبيق يتطلب تغيير نموذج ديناميكي.
بناءً على نوع المتغير المستهدف ، يتم تصنيف أشجار القرار إلى نوعين:
- متغير فئوي: شجرة قرارات يكون فيها متغير الهدف فئويًا.
- متغير مستمر: شجرة قرار يكون فيها متغير الهدف مستمرًا.
4. الغابة العشوائية
طريقة الغابة العشوائية هي تقنية التعلم الآلي التالية وهي خوارزمية تعلم آلي خاضعة للإشراف تُستخدم على نطاق واسع في قضايا التصنيف والانحدار. إنها أيضًا طريقة قائمة على الأشجار ، تشبه شجرة القرار.
يتم استخدام غابة من الأشجار ، أو العديد من أشجار القرار ، بواسطة طريقة الغابة العشوائية لإصدار الأحكام. عند التعامل مع مهام التصنيف ، استخدمت طريقة الغابة العشوائية متغيرات فئوية أثناء التعامل مع مهام الانحدار مع مجموعات البيانات التي تحتوي على متغيرات مستمرة.
مجموعة ، أو خلط العديد من النماذج ، هو ما تفعله طريقة الغابة العشوائية ، مما يعني أن التنبؤات تتم باستخدام مجموعة من النماذج بدلاً من واحدة فقط.
تعد القدرة على استخدامها في مشاكل التصنيف والانحدار ، والتي تشكل غالبية أنظمة التعلم الآلي الحديثة ، من الفوائد الرئيسية للغابة العشوائية.
تستخدم Ensemble استراتيجيتين مختلفتين:
- التعبئة: من خلال القيام بذلك ، يتم إنتاج المزيد من البيانات لمجموعة بيانات التدريب. لتقليل التباين في التوقعات ، يتم القيام بذلك.
- التعزيز هو عملية الجمع بين المتعلمين الضعفاء والمتعلمين الأقوياء من خلال بناء نماذج متتالية ، مما ينتج عنه النموذج النهائي بأقصى قدر من الدقة.
5. ساذج بايز
يمكن حل مشكلة تصنيف ثنائي (فئتين) ومتعددة الفئات باستخدام تقنية Naive Bayes. عندما يتم شرح الطريقة باستخدام قيم إدخال ثنائية أو فئة ، يكون من الأسهل فهمها. الافتراض الذي قدمه مصنف Naive Bayes هو أن وجود ميزة واحدة في الفصل لا يؤثر على وجود أي ميزات أخرى.
تشير الصيغة أعلاه إلى:
- P (H): احتمال صحة الفرضية H. يشار إلى الاحتمال المسبق بهذا.
- ع (هـ): احتمالية الأدلة
- P (E | H): احتمال أن تكون الفرضية مدعومة بالأدلة.
- P (H | E): احتمالية صحة الفرضية ، بالنظر إلى الأدلة.
سيأخذ مصنف Naive Bayes في الاعتبار كل من هذه الخصائص على حدة عند تحديد احتمالية نتيجة معينة ، حتى لو كانت هذه السمات مرتبطة ببعضها البعض. نموذج Naive Bayesian بسيط في الإنشاء وفعال لمجموعات البيانات الكبيرة.
من المعروف أنها تؤدي أداءً أفضل حتى من أكثر تقنيات التصنيف تعقيدًا مع كونها أساسية. إنها مجموعة من الخوارزميات التي تستند جميعها إلى نظرية بايز ، بدلاً من طريقة واحدة.
6. K- أقرب الجيران
تعد تقنية K- الأقرب للجيران (kNN) مجموعة فرعية من التعلم الآلي الخاضع للإشراف والذي يمكن استخدامه لمعالجة مشكلات التصنيف والانحدار. تفترض خوارزمية KNN أنه يمكن العثور على كائنات مماثلة في مكان قريب.
أتذكره على أنه تجمع لأفراد متشابهين في التفكير. تستفيد kNN من فكرة التشابه بين نقاط البيانات الأخرى باستخدام القرب أو القرب أو المسافة. من أجل تسمية البيانات غير المرئية بناءً على أقرب نقاط بيانات يمكن ملاحظتها ، يتم استخدام طريقة رياضية لتحديد الفصل بين النقاط على الرسم البياني.
يجب عليك تحديد المسافة بين نقاط البيانات من أجل تحديد أقرب النقاط القابلة للمقارنة. يمكن استخدام قياسات المسافة لهذا الغرض ، مثل المسافة الإقليدية ، ومسافة هامينغ ، ومسافة مانهاتن ، ومسافة مينكوفسكي. يُعرف K بأقرب رقم جار ، وغالبًا ما يكون رقمًا فرديًا.
يمكن تطبيق KNN على مشاكل التصنيف والانحدار. يعتمد التنبؤ الذي يتم إجراؤه عند استخدام KNN في مشكلات الانحدار على متوسط أو متوسط التكرارات الأكثر تشابهًا في K.
يمكن تحديد نتيجة خوارزمية التصنيف المستندة إلى KNN على أنها الفئة ذات التردد الأعلى بين حالات K الأكثر تشابهًا. كل حالة تدلي بصوتها لفصلها ، والتنبؤ ينتمي إلى الفصل الذي حصل على أكبر عدد من الأصوات.
7. K- الوسائل
إنها تقنية للتعلم غير الخاضع للإشراف والتي تعالج قضايا التجميع. تنقسم مجموعات البيانات إلى عدد معين من المجموعات - نسميها K - بطريقة تجعل نقاط بيانات كل مجموعة متجانسة ومتميزة عن تلك الموجودة في المجموعات الأخرى.
منهجية التجميع K- يعني:
- لكل مجموعة ، تختار خوارزمية K- النقط الوسطى k ، أو النقاط.
- مع أقرب النقط الوسطى أو مجموعات K ، تشكل كل نقطة بيانات كتلة.
- الآن ، يتم إنتاج النقط الوسطى الجديدة اعتمادًا على أعضاء الكتلة الموجودين بالفعل.
- يتم حساب أقرب مسافة لكل نقطة بيانات باستخدام هذه النقط الوسطى المحدثة. حتى لا تتغير النقط الوسطى ، تتكرر هذه العملية.
إنه أسرع وأكثر موثوقية وأسهل في الفهم. إذا كانت هناك مشكلات ، فإن قابلية التكيف k-mean تجعل التعديلات بسيطة. عندما تكون مجموعات البيانات مميزة أو معزولة جيدًا عن بعضها البعض ، تكون النتائج أفضل. لا يمكنها إدارة البيانات غير المنتظمة أو القيم المتطرفة.
8. دعم آلات المتجهات
عند استخدام تقنية SVM لتصنيف البيانات ، يتم عرض البيانات الأولية كنقاط في مساحة ذات أبعاد n (حيث يمثل n عدد الميزات التي لديك). يمكن بعد ذلك تصنيف البيانات بسهولة لأنه يتم بعد ذلك توصيل قيمة كل ميزة بإحداثيات معينة.
لفصل البيانات ووضعها على رسم بياني ، استخدم الخطوط المعروفة باسم المصنفات. يرسم هذا الأسلوب كل نقطة بيانات كنقطة في فضاء ذي أبعاد n ، حيث يمثل n عدد الميزات التي لديك وتكون قيمة كل ميزة قيمة إحداثي محددة.
سنقوم الآن بتحديد موقع الخط الذي يقسم البيانات إلى مجموعتين من البيانات التي تم تصنيفها بشكل مختلف. ستكون المسافات من أقرب نقطة في كل من المجموعتين الأبعد على طول هذا الخط.
نظرًا لأن أقرب نقطتين هما الأكثر بعدًا عن السطر في المثال أعلاه ، فإن السطر الذي يقسم البيانات إلى مجموعتين تم تصنيفهما بشكل مختلف هو الخط الأوسط. المصنف لدينا هو هذا الخط.
9. تخفيض الأبعاد
باستخدام نهج تقليل الأبعاد ، قد تحتوي بيانات التدريب على متغيرات إدخال أقل. بعبارات بسيطة ، يشير إلى عملية تقليص حجم مجموعة الميزات الخاصة بك. دعنا نتخيل أن مجموعة البيانات الخاصة بك تحتوي على 100 عمود ؛ سيؤدي تقليل الأبعاد إلى تقليل هذا المقدار إلى 20 عمودًا.
يصبح النموذج تلقائيًا أكثر تعقيدًا ولديه مخاطر أكبر في التجهيز مع زيادة عدد الميزات. أكبر مشكلة في العمل مع البيانات بأبعاد أكبر هي ما يُعرف باسم "لعنة الأبعاد" ، والتي تحدث عندما تحتوي بياناتك على عدد كبير من الخصائص.
يمكن استخدام العناصر التالية لإنجاز تقليل الأبعاد:
- للعثور على الخصائص ذات الصلة واختيارها ، يتم استخدام اختيار الميزة.
- باستخدام الميزات الموجودة بالفعل ، تنشئ هندسة الميزات ميزات جديدة يدويًا.
وفي الختام
التعلم الآلي غير الخاضع للإشراف أو الخاضع للإشراف ممكن. اختر التعلم الخاضع للإشراف إذا كانت بياناتك أقل وفرة وذات علامات جيدة للتدريب.
غالبًا ما تعمل مجموعات البيانات الكبيرة وتنتج نتائج أفضل باستخدام التعلم غير الخاضع للإشراف. تعلم عميق تعد الطرق الأفضل إذا كان لديك مجموعة كبيرة من البيانات متوفرة بسهولة.
تعزيز التعلم والتعلم المعزز العميق هي بعض الموضوعات التي درستها. أصبحت خصائص الشبكات العصبية واستخداماتها وقيودها واضحة لك الآن. أخيرًا وليس آخرًا ، لقد فكرت في خيارات لغات البرمجة المختلفة و IDEs والأنظمة الأساسية عندما يتعلق الأمر بإنشاء الخاصة بك نماذج التعلم الآلي.
الشيء التالي الذي عليك القيام به هو البدء في الدراسة واستخدام كل منهما آلة التعلم يقترب. حتى لو كان الموضوع واسعًا ، يمكن فهم أي موضوع في غضون ساعات قليلة إذا ركزت على عمقه. كل موضوع يقف بمفرده عن الآخرين.
يجب أن تفكر في قضية واحدة في كل مرة ، وتدرسها ، وتطبقها ، وتستخدم لغة من اختيارك لتنفيذ الخوارزمية (الخوارزميات) فيها.
اترك تعليق