כיצד להפחית הזיות בבינה מלאכותית שלך

לפני שלוש שנים ביקרתי בתערוכת אמנות מעניינת למדי. "זכרונות מכונה" מאת רפיק אנאדול עורר בי עניין מההתחלה.

הוא שם פופולרי בקרב אלה שמתעניינים במפגש בין אמנות ובינה מלאכותית. אבל אל דאגה, הבלוג הזה לא עוסק באמנות. נתעמק ב"תפיסות" העמוקות של AI.

בתערוכה זו, אנאדול התנסה תמונות חקר החלל של נאס"א. התערוכה נוצרה בהשראת הרעיון שטלסקופים יכולים "לחלום" באמצעות הארכיונים החזותיים שלהם, ולטשטש את המחסומים בין עובדה לדמיון.

על ידי חקירת הקשרים בין נתונים, זיכרון והיסטוריה בקנה מידה קוסמי, אנאדול ביקשה מאיתנו לשקול את הפוטנציאל של בינה מלאכותית להתבונן ולהבין את העולם שסביבנו. ואפילו AI שיהיו לו חלומות משלו...

אז למה זה רלוונטי לנו?

חשבו על זה: ככל שאנאדול חקרה את הרעיון של טלסקופים חולמים מהנתונים שלהם, למערכות בינה מלאכותית יש סוג משלהן של חלום - או יותר נכון, הזיות - בתוך מאגרי הזיכרון הדיגיטליים שלהן.

הזיות אלו, כמו ההדמיות בתערוכה של אנאדול, יכולות לעזור לנו ללמוד יותר על נתונים, בינה מלאכותית והגבולות שלהם.

מהן בעצם הזיות בינה מלאכותית?

כאשר מודל שפה גדול, כגון צ'טבוט AI מחולל, מייצר פלטים עם דפוסים שאינם קיימים או בלתי נראים לצופים אנושיים, אנו קוראים לזה "הזיות בינה מלאכותית."

התפוקות הללו, השונות מהתשובה הצפויה בהתבסס על הקלט שניתן ל-AI, יכולות להיות שגויות לחלוטין או שטויות.

בהקשר של מחשבים, המונח "הזיה" אולי נראה יוצא דופן, אך הוא מתאר במדויק את האופי המוזר של הפלטים השגויים הללו. הזיות בינה מלאכותית נגרמות על ידי מגוון משתנים, כולל התאמת יתר, הטיות בנתוני האימון והמורכבות של מודל הבינה המלאכותית.

כדי להבין טוב יותר, זה דומה מבחינה רעיונית לאופן שבו בני אדם רואים צורות בעננים או פרצופים על הירח.

דוגמה:

Ekran Goruntusu 2024 04 16 001841

בדוגמה זו, שאלתי שאלה קלה מאוד ChatGPT. הייתי אמור לקבל תשובה כמו, "המחבר של סדרת ספרי חולית הוא פרנק הרברט".

למה זה קרה?

למרות שהם בנויים לכתיבת תוכן קוהרנטי וקולח, מודלים של שפה גדולים למעשה אינם מסוגלים להבין את מה שהם אומרים. זה קריטי מאוד בקביעת האמינות של תוכן שנוצר בינה מלאכותית.

אמנם מודלים אלה יכולים ליצור תגובות המחקות התנהגות אנושית, הם חסרים את המודעות ההקשרית ומיומנויות החשיבה הביקורתית העומדים בבסיס האינטליגנציה האמיתית.

כתוצאה מכך, תפוקות שנוצרו על ידי בינה מלאכותית עלולות להיות מטעות או שגויות מכיוון שהן מעדיפות דפוסי התאמה על פני נכונות עובדתית.

מה יכולים להיות מקרים אחרים של הזיות?

מידע מוטעה מסוכן: נניח שצ'אט בוט מחולל בינה מלאכותית בדה ראיות ועדויות כדי להאשים באופן שקרי איש ציבור בהתנהגות פלילית. למידע מטעה זה יש פוטנציאל לפגוע במוניטין של האדם ולגרום לנקמה בלתי מוצדקת.

תשובות מוזרות או מפחידות: כדי לתת דוגמה הומוריסטית, דמיין צ'אטבוט נותן למשתמש שאלת מזג אוויר ומשיב עם תחזית שאומרת שירד גשם של חתולים וכלבים, יחד עם תמונות של טיפות גשם שנראות כמו חתולים וכלבים. למרות שהם מצחיקים, זו עדיין תהיה "הזיה".

אי דיוקים עובדתיים: נניח שצ'אט בוט מבוסס מודלים של שפה קובע בטעות שניתן לצפות בחומה הסינית מהחלל מבלי להסביר שהיא גלויה רק בתנאים ספציפיים. למרות שההערה עשויה להיראות סבירה בעיני חלקם, היא לא מדויקת ועלולה להטעות אנשים לגבי מראה הקיר מהחלל.

כיצד נמנעים מהזיות בינה מלאכותית כמשתמש?

בצע הנחיות מפורשות

אתה צריך לתקשר עם מודלים של AI בצורה מפורשת.

חשבו על המטרות שלכם ועצבו את ההנחיות שלכם לפני הכתיבה.

לדוגמה, תנו הוראות ספציפיות כמו "הסבירו כיצד פועל האינטרנט וכתוב פסקה על משמעותו בחברה המודרנית" במקום להציג חקירה כללית כמו "ספר לי על האינטרנט".
מפורש עוזר למודל AI לפרש את הכוונה שלך.

דוגמה: שאל את שאלות AI כגון אלה:

"מהו מחשוב ענן ואיך הוא עובד?"

"הסבר את ההשפעה של סחף נתונים על ביצועי המודל."

"דון בהשפעה והעתיד הפוטנציאלי של טכנולוגיית VR על עסקי ה-IT."

אמצו את כוחה של הדוגמה

מתן דוגמאות בהנחיות שלך עוזר למודלים של AI להבין את ההקשר ולייצר תשובות מדויקות. בין אם אתם מחפשים תובנות היסטוריות או הסברים טכניים, מתן דוגמאות יכול לעזור לשפר את הדיוק של תוכן שנוצר בינה מלאכותית.

לדוגמה, אתה יכול לומר, "הזכיר רומני פנטזיה כגון הארי פוטר."

פירוק משימות מורכבות

הנחיות מורכבות עומסות יתר על המידה אלגוריתמי AI, והן עלולות להוביל לתוצאות לא רלוונטיות. כדי למנוע זאת, חלקו פעילויות מורכבות לחלקים קטנים יותר וניתנים לניהול. על ידי ארגון ההנחיות שלך ברצף, אתה מאפשר ל-AI להתמקד בכל רכיב באופן עצמאי, וכתוצאה מכך תשובות הגיוניות יותר.

לדוגמה, במקום לבקש מה-AI "להסביר את התהליך של יצירת א רשת נוירונים" בשאילתה אחת, חלק את ההקצאה לשלבים נפרדים כמו הגדרת בעיה ואיסוף נתונים.

אמת את הפלטים וספק משוב

בדוק תמיד את התוצאות המיוצרות על ידי מודלים של AI, במיוחד עבור פעילויות מבוססות עובדות או קריטיות. השווה את התשובות למקורות מהימנים ושם לב להבדלים או שגיאות.

ספק קלט למערכת AI כדי לשפר את הביצועים העתידיים ולהפחית הזיות.

אסטרטגיות למפתחים להימנע מהזיות בינה מלאכותית

יישום Generation-Augmented Retrieval (RAG).

שלב טכניקות דור מוגבר של אחזור במערכות בינה מלאכותית כדי לבסס תשובות על עובדות ממסדי נתונים אמינים.

Generation-Augmented Generation (RAG) משלב יצירת שפה טבעית סטנדרטית עם היכולת להשיג ולשלב מידע רלוונטי מבסיס ידע עצום, וכתוצאה מכך פלט עשיר יותר מבחינה הקשרית.

על ידי מיזוג תוכן שנוצר בינה מלאכותית עם מקורות נתונים מאומתים, אתה יכול לשפר את האמינות והאמינות של תוצאות AI.

אימות וניטור פלטי AI באופן רציף

הגדר הליכי אימות קפדניים כדי לאמת את הנכונות והעקביות של פלטי AI בזמן אמת. עקוב אחר ביצועי בינה מלאכותית בתשומת לב, חפש הזיות או טעויות פוטנציאליות, וחזור על אימון מודלים ואופטימיזציה מהירה כדי להגביר את האמינות לאורך זמן.

לדוגמה, השתמש בשגרות אימות אוטומטיות כדי לבדוק תוכן שנוצר על ידי AI עבור נכונות עובדתית ולהדגיש מקרים של הזיות אפשריות להערכה ידנית.

בדוק אם יש נתונים נסחפים

סחף נתונים הוא תופעה שבה המאפיינים הסטטיסטיים של הנתונים המשמשים לאימון מודל AI משתנים עם הזמן. אם מודל הבינה המלאכותית פוגש נתונים ששונים במידה ניכרת מנתוני האימון שלו במהלך ההסקה, הוא יכול לספק תוצאות שגויות או לא הגיוניות, וכתוצאה מכך להזיות.

לדוגמה, אם מודל בינה מלאכותית מאומן על נתוני עבר שכבר אינם רלוונטיים או מעידים על הסביבה הנוכחית, הוא עלול להסיק מסקנות או תחזיות שגויות.

כתוצאה מכך, ניטור ופתרון סחיפות נתונים הם קריטיים להבטחת ביצועים ואמינות של מערכת AI תוך הפחתת האפשרות להזיות.

סיכום

לפי IBM Data, הזיות בינה מלאכותית מתרחשות בסביבות 3% עד 10% מהתשובות מדגמי AI.

אז, כך או אחרת, סביר להניח שגם תצפו בהם. אני מאמין שזהו נושא מעניין להפליא מכיוון שהוא תזכורת מרתקת לדרך המתמשכת לקראת שיפור יכולות הבינה המלאכותית.

אנו זוכים להתבונן ולהתנסות באמינות של AI, המורכבויות של עיבוד נתונים ואינטראקציות בין אדם ל-AI.