מבוא לרשתות עצביות

תוכן העניינים[להתחבא][הופעה]

מהי רשת עצבית?
כיצד פועלות רשתות עצביות?
סוגי רשתות עצביות+-
יישומים
יתרונות
חסרונות
סיכום

בינה מלאכותית (AI) נחשבה במקור כחלום רחוק, טכנולוגיה לעתיד, אבל זה כבר לא כך.

מה שהיה פעם נושא מחקר מתפוצץ עכשיו בעולם האמיתי. AI נמצא כעת במגוון מקומות, כולל מקום העבודה שלך, בית הספר, הבנקאות, בתי החולים ואפילו הטלפון שלך.

הם העיניים של כלי רכב בנהיגה עצמית, הקולות של סירי ואלכסה, המוחות מאחורי חיזוי מזג האוויר, הידיים מאחורי ניתוח בסיוע רובוטי ועוד.

אינטליגנציה מלאכותית (AI) הופך למאפיין נפוץ בחיים המודרניים. בשנים האחרונות, AI התגלה כשחקן מרכזי במגוון רחב של טכנולוגיות IT.

לבסוף, הרשת העצבית משמשת את הבינה המלאכותית כדי ללמוד דברים חדשים.

אז היום נלמד על רשתות עצביות, איך זה עובד, הסוגים שלהם, היישומים, ועוד הרבה יותר.

מהי רשת עצבית?

In למידת מכונה, רשת עצבית היא רשת מתוכנתת של נוירונים מלאכותיים. הוא מנסה לחקות את המוח האנושי באמצעות שכבות רבות של "נוירונים", הדומות לנוירונים במוח שלנו.

השכבה הראשונה של נוירונים תקבל תמונות, וידאו, קול, טקסט וכניסות אחרות. נתונים אלה זורמים דרך כל הרמות, כאשר פלט של שכבה אחת זורם אל השכבה הבאה. זה קריטי עבור המשימות הקשות ביותר, כגון עיבוד שפה טבעית עבור למידת מכונה.

עם זאת, במקרים אחרים, הכוונה לדחיסת מערכת כדי להקטין את גודל הדגם תוך שמירה על דיוק ויעילות עדיפה. גיזום רשת עצבית היא שיטת דחיסה הכוללת הסרת משקולות ממודל נלמד. שקול רשת נוירונים של בינה מלאכותית שהוכשרה להבחין בין אנשים לבעלי חיים.

רשת נוירונים

התמונה תחולק לחלקים בהירים וכהים על ידי השכבה הראשונה של נוירונים. נתונים אלו יועברו לשכבה הבאה, שתקבע היכן נמצאים הקצוות.

השכבה הבאה תנסה לזהות את הצורות ששילוב הקצוות יצר. על פי הנתונים שעליהם הוא אומן, הנתונים יעברו דרך מספר רב של שכבות באופן דומה כדי לקבוע אם התמונה שהצגת היא של אדם או חיה.

כאשר נתונים ניתנים לרשת עצבית, היא מתחילה לעבד אותם. לאחר מכן, הנתונים מעובדים דרך הרמות שלהם כדי לקבל את התוצאה הרצויה. רשת עצבית היא מכונה שלומדת מקלט מובנה ומציגה את התוצאות. ישנם שלושה סוגי למידה שיכולים להתרחש ברשתות עצביות:

למידה מפוקחת - קלט ופלט ניתנים לאלגוריתמים באמצעות נתונים מסומנים. לאחר שלימדו כיצד לנתח נתונים, הם חוזים את התוצאה המיועדת.
למידה ללא פיקוח - ANN לומד ללא סיוע של אדם. אין נתונים מסומנים, והפלט נקבע לפי דפוסים שנמצאים בנתוני הפלט.
לימוד עם חיזוקים זה כאשר רשת לומדת מהמשוב שהיא מקבלת.

כיצד פועלות רשתות עצביות?

נוירונים מלאכותיים משמשים ברשתות עצביות, שהן מערכות מתוחכמות. הנוירונים המלאכותיים, הידועים גם כ-perceptrons, מורכבים מהרכיבים הבאים:

קֶלֶט
מִשׁקָל
הטיה
פונקציית הפעלה
תְפוּקָה

שכבות הנוירונים המרכיבות רשתות עצביות. רשת עצבית מורכבת משלוש שכבות:

שכבת קלט
שכבה נסתרת
שכבת פלט

נתונים בצורה של ערך מספרי נשלחים לשכבת הקלט. השכבות הנסתרות של הרשת הן אלו שעושות הכי הרבה חישובים. שכבת הפלט, אחרונה חביבה, חוזה את התוצאה. נוירונים שולטים זה בזה ברשת עצבית. נוירונים משמשים לבניית כל שכבה. הנתונים מנותבים לשכבה הנסתרת לאחר ששכבת הקלט מקבלת אותם.

משקולות מוחלים על כל קלט. בתוך השכבות הנסתרות של רשת עצבית, המשקל הוא ערך שמתרגם נתונים נכנסים. משקולות פועלות על ידי הכפלת נתוני קלט בערך המשקל בשכבת הקלט.

לאחר מכן הוא מתחיל את ערך השכבה הנסתרת הראשונה. נתוני הקלט עוברים טרנספורמציה ומועברים לשכבה השנייה דרך השכבות הנסתרות. שכבת הפלט אחראית על יצירת התוצאה הסופית. התשומות והמשקלים מוכפלים, והתוצאה מועברת לנוירוני השכבה הנסתרת כסכום. לכל נוירון ניתנת הטיה. כדי לחשב את הסכום הכולל, כל נוירון מוסיף את התשומות שהוא מקבל.

רשת עצבית עובדת

לאחר מכן, הערך עובר דרך פונקציית ההפעלה. התוצאה של פונקציית ההפעלה קובעת אם נוירון מופעל או לא. כאשר נוירון פעיל, הוא שולח מידע לשכבות האחרות. הנתונים נוצרים ברשת עד שהנוירון מגיע לשכבת הפלט בשיטה זו. התפשטות קדימה היא מונח נוסף לכך.

הטכניקה של הזנת נתונים לתוך צומת קלט והשגת הפלט דרך צומת פלט ידועה כריבוי הזנה קדימה. כאשר נתוני הקלט מתקבלים על ידי השכבה הנסתרת, מתרחשת הפצת הזנה קדימה. הוא מעובד בהתאם לפונקציית ההפעלה ולאחר מכן מועבר לפלט.

התוצאה מוקרן על ידי הנוירון בשכבת הפלט עם ההסתברות הגבוהה ביותר. הפצה לאחור מתרחשת כאשר הפלט שגוי. משקולות מאותחלות לכל קלט תוך יצירת רשת עצבית. הפצה לאחור היא תהליך של התאמה מחדש של המשקלים של כל קלט כדי להפחית טעויות ולספק פלט מדויק יותר.

סוגי רשתות עצביות

1. פרספטרון

מודל הפרצפטרון של Minsky-Papert הוא אחד מדגמי הנוירונים הפשוטים והעתיקים ביותר. זוהי היחידה הקטנה ביותר של רשת עצבית שמבצעת חישובים מסוימים על מנת לגלות מאפיינים או בינה עסקית בנתונים נכנסים. זה לוקח תשומות משוקלל ומחיל את פונקציית ההפעלה כדי לקבל את התוצאה הסופית. TLU (יחידת לוגיקה סף) הוא שם אחר לפרספטרון.

פרספטרון

Perceptron הוא מסווג בינארי שהוא מערכת למידה מפוקחת המחלקת נתונים לשתי קבוצות. שערים לוגיים כמו AND, OR ו-NAND ניתן ליישם עם פרסטרונים.

2. Feed-Forward Neural Network

הגרסה הבסיסית ביותר של רשתות עצביות, שבה נתוני קלט זורמים אך ורק בכיוון אחד, עוברת דרך צמתים עצביים מלאכותיים ויוצאת דרך צמתי פלט. שכבות קלט ופלט קיימות במקומות שבהם שכבות נסתרות עשויות להיות נוכחות או לא. ניתן לאפיין אותם כרשת עצבית חד-שכבתית או רב-שכבתית להזנה קדימה המבוססת על זה.

מספר השכבות בשימוש נקבע על פי מורכבות הפונקציה. הוא מתפשט רק קדימה בכיוון אחד ואינו מתפשט אחורה. כאן, המשקולות נשארות קבועות. הכניסות מוכפלות במשקלים כדי להזין פונקציית הפעלה. פונקציית הפעלת סיווג או פונקציית הפעלה שלב משמשת לשם כך.

3. פרצפטרון רב שכבתי

היכרות עם מתוחכם רשתות עצביות, שבו נתוני קלט מנותבים דרך שכבות רבות של נוירונים מלאכותיים. זוהי רשת עצבית מקושרת לחלוטין, שכן כל צומת מחובר לכל הנוירונים בשכבה הבאה. שכבות נסתרות מרובות, כלומר לפחות שלוש שכבות או יותר, קיימות בשכבות הקלט והפלט.

פרספטרון רב שכבתי

יש לו התפשטות דו-כיוונית, מה שאומר שהוא יכול להתפשט גם קדימה וגם אחורה. התשומות מוכפלות במשקלים ונשלחות לפונקציית ההפעלה, שם הן משתנות באמצעות הפצה לאחור כדי למזער את ההפסד.

משקולות הן ערכים שנלמדו על ידי מכונה מ- Neural Networks, בפשטות. בהתאם לפער בין התפוקות הצפויות לתשומות האימון, הם מתאימים את עצמם. Softmax משמש כפונקציית הפעלת שכבת פלט לאחר פונקציות הפעלה לא ליניאריות.

4. רשת עצבית Convolutional

בניגוד למערך הדו-ממדי המסורתי, לרשת נוירונים קונבולוציונית יש תצורה תלת-ממדית של נוירונים. השכבה הראשונה ידועה כשכבה קונבולוציונית. כל נוירון בשכבה הקונבולוציונית מעבד רק מידע מחלק מוגבל של שדה הראייה. כמו מסנן, תכונות הקלט נלקחות במצב אצווה.

הרשת מבינה תמונות בקטעים ויכולה לבצע פעולות אלו מספר רב של פעמים כדי לסיים את כל עיבוד התמונה.

רשת עצבית מתפתלת

התמונה מומרת מ-RGB או HSI לגווני אפור במהלך העיבוד. וריאציות נוספות בערך הפיקסלים יסייעו בזיהוי קצוות, וניתן למיין תמונות למספר קבוצות. התפשטות חד-כיוונית מתרחשת כאשר CNN מכיל שכבה אחת או יותר קונבולוציונית ולאחריה איגום, והתפשטות דו-כיוונית מתרחשת כאשר הפלט של שכבת הפיתול נשלח לרשת עצבית מחוברת במלואה לסיווג תמונה.

כדי לחלץ אלמנטים מסוימים של תמונה, משתמשים במסננים. ב-MLP, התשומות משוקללות ומסופקות לפונקציית ההפעלה. RELU משמש בקונבולציה, בעוד MLP משתמש בפונקציית הפעלה לא ליניארית ואחריה softmax. בזיהוי תמונות ווידאו, ניתוח סמנטי וזיהוי פרפרזה, רשתות עצביות קונבולוציוניות מייצרות תוצאות מצוינות.

5. רשת הטיה רדיאלית

וקטור קלט מלווה בשכבה של נוירונים RBF ושכבת פלט עם צומת אחד לכל קטגוריה ברשת פונקציית בסיס רדיאלית. הקלט מסווג על ידי השוואתו מול נקודות נתונים ממערך האימונים, כאשר כל נוירון מחזיק אב טיפוס. זו אחת הדוגמאות של מערך ההדרכה.

רשת הטיה רדיאלית

כל נוירון מחשב את המרחק האוקלידי בין הקלט לאב הטיפוס שלו כאשר יש לסווג וקטור קלט חדש [הווקטור ה-n-ממדי שאתה מנסה לסווג]. אם יש לנו שתי מחלקות, Class A ו- Class B, הקלט החדש שיש לסווג דומה יותר לאבות טיפוס Class A מאשר אבות טיפוס Class B.

כתוצאה מכך, הוא עשוי להיות מתויג או מסווג כמעמד A.

6. רשת עצבית חוזרת

רשתות עצביות חוזרות נועדו לשמור פלט של שכבה ואז להזין אותה בחזרה לקלט כדי לסייע בחיזוי התוצאה של השכבה. הזנה קדימה רשת עצבית היא בדרך כלל השכבה הראשונית, ואחריה שכבת רשת עצבית חוזרת, שבה פונקציית זיכרון זוכרת חלק מהמידע שהיה לה בשלב הזמן הקודם.

רשת עצבית חוזרת

תרחיש זה משתמש בהפצה קדימה. זה חוסך נתונים שיהיה צורך בעתיד. במקרה שהניבוי שגוי, קצב הלמידה משמש לביצוע התאמות קלות. כתוצאה מכך, ככל שההפצה לאחור תתקדם, היא תהפוך מדויקת יותר ויותר.

יישומים

רשתות עצביות משמשות לטיפול בבעיות נתונים במגוון דיסציפלינות; כמה דוגמאות מוצגות להלן.

זיהוי פנים - פתרונות זיהוי פנים משמשים כמערכות מעקב יעילות. מערכות זיהוי מקשרות תמונות דיגיטליות לפנים אנושיות. הם משמשים במשרדים לכניסה סלקטיבית. כך, המערכות מאמתות פנים אנושיות ומשוות אותו לרשימת תעודות זהות המאוחסנות במסד הנתונים שלה.
חיזוי מניות - השקעות חשופות לסיכוני שוק. כמעט קשה לחזות התפתחויות עתידיות בשוק המניות הפכפך ביותר. לפני רשתות עצבים, השלבים השווריים והדוביים המשתנים ללא הרף היו בלתי צפויים. אבל, מה שינה הכל? כמובן, אנחנו מדברים על רשתות עצביות... Multilayer Perceptron MLP (סוג של מערכת בינה מלאכותית הזנה קדימה) משמש ליצירת תחזית מניות מוצלחת בזמן אמת.
מדיה חברתית - לא משנה כמה נדוש זה נשמע, המדיה החברתית שינתה את נתיב הקיום הארצי. ההתנהגות של משתמשי מדיה חברתית נחקרת באמצעות רשתות עצביות מלאכותיות. לצורך ניתוח תחרותי, נתונים המסופקים מדי יום באמצעות אינטראקציות וירטואליות נערמים ונבדקים. הפעולות של משתמשי מדיה חברתית משוכפלות על ידי רשתות עצביות. ניתן לחבר התנהגויות של אנשים לדפוסי ההוצאות של אנשים לאחר ניתוח הנתונים באמצעות רשתות מדיה חברתית. נתונים מיישומי מדיה חברתית נכרים באמצעות Multilayer Perceptron ANN.
שירותי בריאות - אנשים בעולם של היום עושים שימוש ביתרונות הטכנולוגיה בתעשיית הבריאות. בעסקי הבריאות, רשתות עצביות Convolutional משמשות לגילוי קרני רנטגן, סריקות CT ואולטרסאונד. נתוני ההדמיה הרפואית המתקבלים מהבדיקות הנ"ל מוערכים ומוערכים באמצעות מודלים של רשתות עצביות, מכיוון ש-CNN משמש בעיבוד תמונה. בפיתוח מערכות זיהוי קול, נעשה שימוש גם ברשת העצבית החוזרת (RNN).
דיווח מזג אוויר – לפני יישום הבינה המלאכותית, תחזיות המחלקה המטאורולוגית מעולם לא היו מדויקות. חיזוי מזג האוויר נעשה בעיקר כדי לחזות את תנאי מזג האוויר שיתרחשו בעתיד. תחזיות מזג האוויר מנוצלות כדי לצפות את הסבירות לאסונות טבע בתקופה המודרנית. חיזוי מזג האוויר נעשה באמצעות פרצפטרון רב שכבתי (MLP), רשתות עצביות קונבולוציוניות (CNN) ורשתות עצביות חוזרות (RNN).
הגנה - לוגיסטיקה, ניתוח תקיפה מזוינת ומיקום פריט - כולם מעסיקים רשתות עצביות. הם גם מועסקים בסיורים אוויריים וימיים, כמו גם בניהול מל"טים אוטונומיים. בינה מלאכותית מעניקה לתעשיית הביטחון את הדחיפה הדרושה לה כדי להגדיל את הטכנולוגיה שלה. לזיהוי קיומם של מוקשים תת-מימיים, נעשה שימוש ברשתות עצביות קונבולוציוניות (CNN).

יתרונות

גם אם כמה נוירונים ברשת עצבית אינם פועלים כראוי, הרשתות העצביות עדיין ייצרו פלטים.
לרשתות עצביות יש את היכולת ללמוד בזמן אמת ולהסתגל להגדרות המשתנות שלהן.
רשתות עצביות יכולות ללמוד לבצע מגוון משימות. לספק את התוצאה הנכונה בהתבסס על הנתונים שסופקו.
לרשתות עצביות יש את הכוח והיכולת להתמודד עם מספר משימות בו זמנית.

חסרונות

רשתות עצביות משמשות לפתרון בעיות. היא אינה חושפת את ההסבר מאחורי "למה וכיצד" היא עשתה את פסקי הדין שעשתה בשל מורכבות הרשתות. כתוצאה מכך, אמון הרשת עלול להישחק.
מרכיבי רשת עצבית תלויים זה בזה. כלומר, רשתות עצביות דורשות (או נשענות מאוד על) מחשבים בעלי כוח מחשוב מספיק.
לתהליך רשת עצבית אין כלל (או כלל אצבע) ספציפי. בטכניקת ניסוי וטעייה, נוצר מבנה רשת נכון על ידי ניסיון לרשת האופטימלית. זה הליך שדורש הרבה כוונון עדין.

סיכום

שדה רשתות עצביות מתרחב במהירות. חשוב ללמוד ולהבין את המושגים במגזר זה כדי להיות מסוגל להתמודד איתם.

הסוגים הרבים של רשתות עצביות כוסו במאמר זה. אתה יכול להשתמש ברשתות עצביות כדי להתמודד עם בעיות נתונים בתחומים אחרים אם תלמד יותר על דיסציפלינה זו.

מבוא לרשתות עצביות

מהי רשת עצבית?

כיצד פועלות רשתות עצביות?