هل تساءلت يومًا كيف تعرف السيارة ذاتية القيادة متى تتوقف عند الإشارة الحمراء أو كيف يمكن لهاتفك التعرف على وجهك؟
هذا هو المكان الذي تأتي فيه الشبكة العصبية التلافيفية أو CNN باختصار.
يمكن مقارنة CNN بالدماغ البشري الذي يمكنه تحليل الصور لتحديد ما يحدث فيها. يمكن لهذه الشبكات حتى اكتشاف الأشياء التي قد يغفلها البشر!
في هذا المنشور ، سوف نستكشف CNN في التعلم العميق سياق. دعونا نرى ما يمكن أن تقدمه لنا هذه المنطقة المثيرة!
ما هو التعلم العميق؟
التعلم العميق هو نوع من الذكاء الاصطناعي. تمكن أجهزة الكمبيوتر من التعلم.
يعالج التعلم العميق البيانات باستخدام نماذج رياضية معقدة. لذلك ، يمكن للكمبيوتر اكتشاف الأنماط وتصنيف البيانات.
بعد التدريب بالعديد من الأمثلة ، يمكنه أيضًا اتخاذ القرارات.
لماذا نحن مهتمون بـ CNNs في التعلم العميق؟
الشبكات العصبية التلافيفية (CNNs) هي عنصر مهم في التعلم العميق.
أنها تسمح لأجهزة الكمبيوتر بفهم الصور وغيرها البيانات المرئية. يمكننا تدريب أجهزة الكمبيوتر على اكتشاف الأنماط وتحديد الأشياء بناءً على ما "تراه" من خلال استخدام شبكات CNN في التعلم العميق.
تعمل شبكات CNN كعيون للتعلم العميق ، وتساعد أجهزة الكمبيوتر في فهم البيئة!
إلهام من هندسة الدماغ
تستلهم شبكات CNN من كيفية تفسير الدماغ للمعلومات. تقبل الخلايا العصبية الاصطناعية ، أو العقد ، في شبكات CNN المدخلات ، وتعالجها ، وتقدم النتيجة كمخرجات ، تمامًا كما تفعل الخلايا العصبية في الدماغ في جميع أنحاء الجسم.
طبقة الإدخال
طبقة الإدخال للمعيار الشبكة العصبية يتلقى مدخلات في شكل صفائف ، مثل بكسل الصورة. في CNNs ، يتم توفير صورة كمدخل لطبقة الإدخال.
الطبقات المخفية
هناك عدة طبقات مخفية في شبكات CNN ، والتي تستخدم الرياضيات لاستخراج الميزات من الصورة. هناك عدة أنواع من الطبقات ، بما في ذلك الوحدات الخطية المصححة والمرتبطة تمامًا ، وطبقات التجميع ، وطبقات الالتواء.
طبقة الالتفاف
الطبقة الأولى لاستخراج المعالم من الصورة المدخلة هي طبقة الالتفاف. تخضع الصورة المدخلة للترشيح ، والنتيجة هي خريطة المعالم التي تبرز العناصر الأساسية للصورة.
التجمع في وقت لاحق
تُستخدم طبقة التجميع لتقليص حجم خريطة المعالم. يقوي مقاومة النموذج لتغيير موقع الصورة المدخلة.
طبقة الوحدة الخطية المصححة (ReLU)
يتم استخدام طبقة ReLU لإعطاء النموذج اللاخطي. يتم تنشيط إخراج الطبقة السابقة بواسطة هذه الطبقة.
طبقة متصلة بالكامل
تصنف الطبقة المتصلة بالكامل العنصر وتخصص له معرفًا فريدًا في طبقة الإخراج هو الطبقة المتصلة تمامًا.
CNNs هي شبكات Feedforward
تتدفق البيانات فقط من المدخلات إلى المخرجات بطريقة واحدة. إن بنيتها المعمارية مستوحاة من القشرة البصرية للدماغ ، والتي تتكون من طبقات متناوبة من الخلايا الأساسية والمتطورة.
كيف يتم تدريب شبكات CNN؟
ضع في اعتبارك أنك تحاول تعليم الكمبيوتر كيفية التعرف على قطة.
تعرض عليه العديد من صور القطط بينما تقول ، "ها هي قطة". بعد مشاهدة صور كافية للقطط ، يبدأ الكمبيوتر في التعرف على خصائص مثل الأذنين المدببة والشعيرات.
الطريقة التي تعمل بها CNN مشابهة تمامًا. يتم عرض العديد من الصور على الكمبيوتر ، ويتم إعطاء أسماء الأشياء في كل صورة.
ومع ذلك ، تقسم CNN الصور إلى أجزاء أصغر ، مثل المناطق. ويتعلم التعرف على الخصائص في تلك المناطق بدلاً من مجرد مشاهدة الصور ككل.
لذلك ، قد تكتشف الطبقة الأولية لـ CNN الخصائص الأساسية فقط مثل الحواف أو الزوايا. بعد ذلك ، تعتمد الطبقة التالية على ذلك للتعرف على ميزات أكثر تفصيلاً مثل النماذج أو القوام.
تستمر الطبقات في ضبط هذه الصفات وشحذها بينما يعرض الكمبيوتر المزيد من الصور. يستمر حتى يصبح بارعًا جدًا في تحديد كل ما تم تدريبه عليه ، سواء كان القطط أو الوجوه أو أي شيء آخر.
أداة قوية للتعلم العميق: كيف حولت CNN التعرف على الصور
من خلال تحديد الأنماط في الصور وفهمها ، حولت شبكات CNN التعرف على الصور. نظرًا لأنها توفر نتائج بدرجة عالية من الدقة ، فإن شبكات CNN هي البنية الأكثر كفاءة لتصنيف الصور واسترجاعها وتطبيقات الكشف عنها.
كثيرا ما تسفر عن نتائج ممتازة. وهم يحددون بدقة الأشياء في الصور في تطبيقات العالم الحقيقي ويحددونها.
البحث عن الأنماط في أي جزء من الصورة
بغض النظر عن مكان ظهور النمط في الصورة ، تم تصميم شبكات CNN للتعرف عليه. يمكنهم استخراج الخصائص المرئية تلقائيًا من أي مكان في الصورة.
هذا ممكن بفضل قدرتها المعروفة باسم "الثبات المكاني". من خلال تبسيط العملية ، يمكن لشبكات CNN التعلم مباشرة من الصور دون الحاجة إلى استخراج الميزات البشرية.
سرعة معالجة أكبر وذاكرة أقل مستخدمة
تعالج شبكات CNN الصور بشكل أسرع وأكثر كفاءة من العمليات التقليدية. هذا هو نتيجة طبقات التجميع ، التي تقلل عدد المعلمات المطلوبة لمعالجة الصورة.
بهذه الطريقة ، فإنها تقلل استخدام الذاكرة وتكاليف المعالجة. تستخدم العديد من المناطق شبكات CNN ، مثل ؛ تمييز الوجوهوتصنيف الفيديو وتحليل الصور. حتى أنهم معتادون على تصنيف المجرات.
أمثلة من الحياة الواقعية
صور جوجل هي إحدى استخدامات شبكات CNN في العالم الحقيقي التي توظفها للتعرف على الأشخاص والأشياء في الصور. علاوة على ذلك، Azure و أمازون توفير واجهات برمجة تطبيقات التعرف على الصور التي تحدد الكائنات وتعرفها باستخدام شبكات CNN.
يتم توفير واجهة عبر الإنترنت لتدريب الشبكات العصبية باستخدام مجموعات البيانات ، بما في ذلك مهام التعرف على الصور ، من خلال منصة التعلم العميق أرقام NVIDIA.
توضح هذه التطبيقات كيف يمكن استخدام شبكات CNN في مجموعة متنوعة من المهام ، بدءًا من حالات الاستخدام التجاري الصغيرة وحتى تنظيم الصور الشخصية. يمكن التفكير في العديد من الأمثلة.
كيف ستتطور الشبكات العصبية التلافيفية؟
الرعاية الصحية هي صناعة رائعة حيث من المتوقع أن يكون لشبكات CNN تأثير كبير. على سبيل المثال ، يمكن استخدامها لتقييم الصور الطبية مثل الأشعة السينية والتصوير بالرنين المغناطيسي. يمكنهم مساعدة الأطباء في تشخيص الأمراض بشكل أسرع وأكثر دقة.
السيارات ذاتية القيادة هي تطبيق آخر مثير للاهتمام حيث يمكن استخدام شبكات CNN للتعرف على الأشياء. يمكن أن يحسن مدى فهم المركبات والتفاعل مع محيطها.
يهتم عدد متزايد من الأشخاص أيضًا بإنشاء هياكل CNN أسرع وأكثر فاعلية ، بما في ذلك شبكات CNN المحمولة. من المتوقع أن يتم استخدامها في الأجهزة منخفضة الطاقة مثل الهواتف الذكية والأجهزة القابلة للارتداء.
اترك تعليق