די שטאַרק פריימווערק פון Bayesian סטאַטיסטיק איז וויידלי געניצט אין פילע דיסאַפּלאַנז, אַרייַנגערעכנט מאַשין לערנען.
בייעסיאַן סטאַטיסטיק אָפפערס אַ פלעקסאַבאַל און פּראָבאַביליסטיק אופֿן פון ינפעראַנס, אין קאַנטראַסט צו קלאַסיש סטאַטיסטיק, וואָס דעפּענדס אויף שטעלן פּאַראַמעטערס און פונט עסטאַמאַץ.
עס ינייבאַלז אונדז צו נעמען אין חשבון יגזיסטינג וויסן און מאָדיפיצירן אונדזער קוקן ווען נייַע אינפֿאָרמאַציע קומט צו ליכט.
בייעסיאַן סטאַטיסטיק גיט אונדז די פיייקייט צו מאַכן מער ינפאָרמד משפט און מאַכן מער פאַרלאָזלעך קאַנקלוזשאַנז דורך אָננעמען אַנסערטאַנטי און נוצן מאַשמאָעס דיסטריביושאַנז.
בייעסיאַן אַפּראָוטשיז צושטעלן אַ אָפּשיידנדיק מיינונג פֿאַר מאָדעלינג קאָמפּליצירט קאַנעקשאַנז, אָנפירונג לימיטעד דאַטן און האַנדלינג מיט אָוווערפיטטינג אין דעם קאָנטעקסט פון מאַשין וויסן.
מיר וועלן קוקן אין די ינער ווערקינגז פון Bayesian סטאַטיסטיק אין דעם אַרטיקל, ווי געזונט ווי זייַן ניצט און בענעפיץ אין די פעלד פון מאַשין לערנען.
עטלעכע שליסל קאַנסעפּס אין Bayesian סטאַטיסטיק זענען אָפט געניצט אין מאַשין לערנען. זאל ס טשעק די ערשטער איינער; מאַנטי קאַרלאָ מעטאַד.
מאַנטי קאַרלאָ מעטאַד
אין Bayesian סטאַטיסטיק, Monte Carlo טעקניקס זענען יקערדיק, און זיי האָבן וויכטיק ימפּלאַקיישאַנז פֿאַר מאַשין לערנען אַפּלאַקיישאַנז.
מאַנטי קאַרלאָ ינטיילז קריייטינג טראַפ סאַמפּאַלז פון מאַשמאָעס דיסטריביושאַנז צו דערנענטערן קאָמפּליצירט חשבונות ווי ינטאַגראַל אָדער שפּעטערדיק דיסטריביושאַנז.
די Monte Carlo מעטאַד גיט אַן עפעקטיוו צוגאַנג צו אָפּשאַצן קוואַנטאַטיז פון אינטערעס און ויספאָרשן הויך-דימענשאַנאַל פּאַראַמעטער ספּייסאַז דורך ריפּיטידלי מוסטערונג פון די פאַרשפּרייטונג פון אינטערעס און אַוורידזשינג די פיינדינגז.
באַזירט אויף סטאַטיסטיש סימיאַליישאַנז, דעם טעכניק העלפּס ריסערטשערז צו מאַכן ינפאָרמד דיסיזשאַנז, קוואַנטאַפייז אַנסערטאַנטי און באַקומען האַרט פיינדינגז.
ניצן Monte Carlo פֿאַר עפעקטיוו כעזשבן
קאַלקיאַלייטינג די שפּעטערדיק פאַרשפּרייטונג אין Bayesian סטאַטיסטיק אָפט ריקווייערז קאָמפּלעקס ינטאַגראַלז.
די עפעקטיוו אַפּראַקסאַמיישאַן פון די ינטאַגראַלז צוגעשטעלט דורך די Monte Carlo טעכניק ינייבאַלז אונדז צו יפישאַנטלי ויספאָרשן די שפּעטערדיק פאַרשפּרייטונג.
דאָס איז קריטיש אין מאַשין לערנען, ווו קאָמפּליצירט מאָדעלס און הויך-דימענשאַנאַל פּאַראַמעטער ספּייסאַז זענען אַ פּראָסט געשעעניש.
דורך יפעקטיוולי עסטימאַטעד וועריאַבאַלז פון אינטערעס ווי דערוואַרטונג וואַלועס, כיסטאַגראַמז און מאַרדזשאַנאַליזיישאַנז ניצן Monte Carlo טעקניקס, מיר זענען בעסער יקוויפּט צו ונטערזוכן די דאַטן און ציען קאַנקלוזשאַנז דערפון.
נעמען אַ מוסטער פון די שפּעטערדיק פאַרשפּרייטונג
אין Bayesian ינפעראַנס, מוסטערונג פון די שפּעטערדיק פאַרשפּרייטונג איז אַ וויכטיק שריט.
די פיייקייט צו מוסטער פון די צוריק איז קריטיש אין מאַשין לערנען אַפּלאַקיישאַנז, ווו מיר פּרובירן צו לערנען פון דאַטן און דזשענערייט פֿאָרויסזאָגן.
מאַנטי קאַרלאָ מעטהאָדס פאָרשלאָגן אַ פאַרשיידנקייַט פון מוסטערונג סטראַטעגיעס פון אַרביטראַריש דיסטריביושאַנז, אַרייַנגערעכנט די שפּעטערדיק.
די אַפּראָוטשיז, וואָס אַרייַננעמען די ינווערזשאַן אופֿן, זאַץ אופֿן, רידזשעקשאַן אופֿן און באַטייַט מוסטערונג, געבן אונדז צו עקסטראַקט רעפּריזענאַטיוו סאַמפּאַלז פון די שפּעטערדיק, אַלאַוינג אונדז צו ונטערזוכן און באַגרייַפן די אַנסערטאַנטי פֿאַרבונדן מיט אונדזער מאָדעלס.
מאַנטי קאַרלאָ אין מאַשין לערנען
מאַנטי קאַרלאָ אַלגערידאַמז זענען בכלל געניצט אין מאַשין לערנען צו דערנענטערן שפּעטערדיק דיסטריביושאַנז, וואָס ענקאַפּסאַלייט די אַנסערטאַנטי פון מאָדעל פּאַראַמעטערס געגעבן באמערקט דאַטן.
מאַנטי קאַרלאָ טעקניקס געבן די מעזשערמאַנט פון אַנסערטאַנטי און די אָפּשאַצונג פון קוואַנטאַטיז פון אינטערעס, אַזאַ ווי דערוואַרטונג וואַלועס און מאָדעל פאָרשטעלונג ינדיקאַטאָרס, דורך מוסטערונג פון די שפּעטערדיק פאַרשפּרייטונג.
די סאַמפּאַלז זענען געניצט אין פאַרשידן לערנען מעטהאָדס צו פּראָדוצירן פֿאָרויסזאָגן, דורכפירן מאָדעל סעלעקציע, מעסטן מאָדעל קאַמפּלעקסיטי און ויספירן Bayesian ינפעראַנס.
דערצו, Monte Carlo טעקניקס צושטעלן אַ ווערסאַטאַל פריימווערק פֿאַר האַנדלינג מיט הויך-דימענשאַנאַל פּאַראַמעטער ספּייסאַז און קאָמפּליצירט מאָדעלס, אַלאַוינג גיך יקספּלאָרינג די שפּעטערדיק פאַרשפּרייטונג און שטאַרק באַשלוס-מאכן.
אין מסקנא, Monte Carlo טעקניקס זענען וויכטיק אין מאַשין לערנען ווייַל זיי פאַסילאַטייט אַנסערטאַנטי מעזשערמאַנט, באַשלוס-מאכן און ינפעראַנס באזירט אויף די שפּעטערדיק פאַרשפּרייטונג.
מאַרקאָוו קייטן
מאַרקאָוו קייטן זענען מאַטאַמאַטיקאַל מאָדעלס וואָס זענען געניצט צו באַשרייַבן סטאָטשאַסטיק פּראַסעסאַז אין וואָס די שטאַט פון אַ סיסטעם אין אַ באַזונדער מאָמענט איז באשלאסן בלויז דורך זייַן פריערדיקן שטאַט.
א מאַרקאָוו קייט, אין פּשוט ווערטער, איז אַ סיקוואַנס פון טראַפ - געשעענישן אָדער שטאַטן אין וואָס די ליקעליהאָאָד פון יבערגאַנג פון איין שטאַט צו אנדערן איז דיפיינד דורך אַ גאַנג פון מאַשמאָעס באקאנט ווי יבערגאַנג מאַשמאָעס.
מאַרקאָוו קייטן ווערן גענוצט אין פיזיק, עקאָנאָמיק און קאָמפּיוטער וויסנשאַפֿט, און זיי צושטעלן אַ שטאַרק יסוד פֿאַר לערנען און סימיאַלייטינג קאָמפּליצירט סיסטעמען מיט פּראָבאַביליסטיק נאַטור.
מאַרקאָוו קייטן זענען ינטימאַטלי פארבונדן צו מאַשין לערנען ווייַל זיי לאָזן איר צו מאָדעל און אָפּשאַצן וועריאַבאַל שייכות און מאַכן סאַמפּאַלז פון קאָמפּליצירט מאַשמאָעס דיסטריביושאַנז.
מאַרקאָוו קייטן זענען אָנגעשטעלט אין מאַשין לערנען פֿאַר אַפּלאַקיישאַנז אַזאַ ווי דאַטן פאַרגרעסערונג, סיקוואַנס מאָדעלינג און גענעראַטיווע מאָדעלינג.
מאַשין לערנען טעקניקס קענען כאַפּן אַנדערלייינג פּאַטערנז און באציונגען דורך בויען און טריינינג מאַרקאָוו קייט מאָדעלס אויף באמערקט דאַטן, מאכן זיי נוציק פֿאַר אַפּלאַקיישאַנז אַזאַ ווי רעדע דערקענונג, נאַטירלעך שפּראַך פּראַסעסינג און צייט סעריע אַנאַליסיס.
מאַרקאָוו קייטן זענען ספּעציעל וויכטיק אין מאַנטי קאַרלאָ טעקניקס, אַלאַוינג פֿאַר עפעקטיוו מוסטערונג און אַפּראַקסאַמיישאַן ינפעראַנס אין בייעסיאַן מאַשין לערנען, וואָס יימז צו פאָרויסזאָגן שפּעטערדיק דיסטריביושאַנז געגעבן באמערקט דאַטן.
איצט, עס איז אן אנדער וויכטיק באַגריף אין Bayesian Statistics איז דזשענערייטינג טראַפ - נומערן פֿאַר אַרביטראַריש דיסטריביושאַנז. זאל ס זען ווי עס העלפּס צו מאַשין לערנען.
ראַנדאָם נומער דור פֿאַר אַרביטראַריש דיסטריביושאַנז
פֿאַר אַ פאַרשיידנקייַט פון טאַסקס אין מאַשין לערנען, די קאַפּאַציטעט צו פּראָדוצירן טראַפ - נומערן פֿון אַרביטראַריש דיסטריביושאַנז איז יקערדיק.
צוויי פאָלקס מעטהאָדס צו דערגרייכן דעם ציל זענען די ינווערזשאַן אַלגערידאַם און די אַקסעפּטאַנס-רידזשעקשאַן אַלגערידאַם.
ינווערזשאַן אַלגערידאַם
מיר קענען באַקומען טראַפ - נומערן פון אַ פאַרשפּרייטונג מיט אַ באַוווסט קיומיאַלאַטיוו פאַרשפּרייטונג פֿונקציע (CDF) ניצן די ינווערזשאַן אַלגערידאַם.
מיר קענען גער מונדיר טראַפ - נומערן אין טראַפ - נומערן מיט די צונעמען פאַרשפּרייטונג דורך ריווערסינג די CDF.
דער צוגאַנג איז צונעמען פֿאַר מאַשין לערנען אַפּלאַקיישאַנז וואָס רופן פֿאַר מוסטערונג פון באַוווסט דיסטריביושאַנז זינט עס איז עפעקטיוו און בכלל אָנווענדלעך.
אַקסעפּטאַנס-רידזשעקשאַן אַלגערידאַם
ווען אַ קאַנווענשאַנאַל אַלגערידאַם איז ניט בנימצא, די אַקסעפּטאַנס-רידזשעקשאַן אַלגערידאַם איז אַ ווערסאַטאַל און עפעקטיוו אופֿן צו פּראָדוצירן טראַפ - נומערן.
מיט דעם צוגאַנג, טראַפ ינטאַדזשערז זענען אנגענומען אָדער פארווארפן באזירט אויף קאַמפּעראַסאַנז צו אַ קאָנווערט פונקציע. עס פאַנגקשאַנז ווי אַ פאַרלענגערונג פון דעם זאַץ פּראָצעס און איז יקערדיק פֿאַר פּראַדוסינג סאַמפּאַלז פון ינטראַקאַט דיסטריביושאַנז.
אין מאַשין לערנען, די אַקסעפּטאַנס-רידזשעקשאַן אַלגערידאַם איז ספּעציעל וויכטיק ווען דילינג מיט מולטידימענסיאָנאַל ישוז אָדער סיטואַטיאָנס ווו אַ גלייַך אַנאַליסיס טעכניק איז ימפּראַקטאַקאַל.
באַניץ אין פאַקטיש לעבן און טשאַלאַנדזשיז
געפֿינען צונעמען קאָנווערט פאַנגקשאַנז אָדער אַפּראַקסאַמיישאַנז וואָס מאַדזשאָריזירן די ציל פאַרשפּרייטונג איז נייטיק פֿאַר ביידע אַפּראָוטשיז צו דורכפירן פּראַקטאַקלי.
דעם אָפט דאַרף אַ גרונטיק קאַמפּריכענשאַן פון די פּראָפּערטיעס פון די פאַרשפּרייטונג.
איין וויכטיק עלעמענט צו נעמען אין חשבון איז די אַקסעפּטאַנס פאַרהעלטעניש, וואָס גיידזשיז די יפעקטיוונאַס פון די אַלגערידאַם.
רעכט צו דער קאַמפּלעקסיטי פון די פאַרשפּרייטונג און די דימענשאַנאַליטי קללה, די אַקסעפּטאַנס-רידזשעקשאַן צוגאַנג קענען, פונדעסטוועגן, ווערן פּראָבלעמאַטיק אין הויך-דימענשאַנאַל ישוז. אַלטערנאַטיווע אַפּראָוטשיז זענען פארלאנגט צו האַנדלען מיט די פראבלעמען.
ענכאַנסינג מאַשין לערנען
פֿאַר טאַסקס ווי דאַטן פאַרגרעסערונג, מאָדעל סעטאַפּ און אַנסערטאַנטי עסטאַמאַץ, מאַשין לערנען ריקווייערז די דור פון טראַפ ינטאַדזשערז פון אַרביטראַריש דיסטריביושאַנז.
אַלגערידאַמז פֿאַר מאַשין לערנען קענען קלייַבן סאַמפּאַלז פון אַ פאַרשיידנקייַט פון דיסטריביושאַנז דורך ניצן די ינווערזשאַן און אַקסעפּטאַנס-רידזשעקשאַן מעטהאָדס, אַלאַוינג פֿאַר מער פלעקסאַבאַל מאָדעלינג און ימפּרוווד פאָרשטעלונג.
אין בייעסיאַן מאַשין לערנען, ווו דיסטריביושאַנז אָפט דאַרפֿן צו זיין עסטימאַטעד דורך מוסטערונג, די אַפּראָוטשיז זענען זייער נוציק.
איצט, לאָמיר גיין צו אן אנדער באַגריף.
הקדמה צו אַבק (דערנאַכט בייעסיאַן קאַמפּיוטיישאַן)
אַפּפּראָקסימאַטע Bayesian Computation (ABC) איז אַ סטאַטיסטיש צוגאַנג געניצט ווען קאַלקיאַלייטינג די ליקעליהאָאָד פונקציע, וואָס דיטערמאַנז די ליקעליהאָאָד פון וויטנאַסט דאַטן געגעבן מאָדעל פּאַראַמעטערס, איז טשאַלאַנדזשינג.
אַנשטאָט קאַלקיאַלייטינג די ליקעליהאָאָד פֿונקציע, ABC ניצט סימיאַליישאַנז צו פּראָדוצירן דאַטן פֿון די מאָדעל מיט אָלטערנאַטיוו פּאַראַמעטער וואַלועס.
די סימיאַלייטיד און באמערקט דאַטן זענען דעמאָלט קאַמפּערד, און פּאַראַמעטער סעטטינגס וואָס מאַכן פאַרגלייַכלעך סימיאַליישאַנז זענען געהאלטן.
א פּראָסט אָפּשאַצונג פון די שפּעטערדיק פאַרשפּרייטונג פון די פּאַראַמעטערס קענען זיין געשאפן דורך ריפּיטינג דעם פּראָצעס מיט אַ גרויס נומער פון סימיאַליישאַנז, אַלאַוינג פֿאַר Bayesian ינפעראַנס.
די ABC באַגריף
די האַרץ באַגריף פון אַבק איז צו פאַרגלייַכן סימיאַלייטיד דאַטן דזשענערייטאַד דורך די מאָדעל צו באמערקט דאַטן אָן בפירוש קאַמפּיוטינג די ליקעליהאָאָד פונקציע.
אַבק אַרבעט דורך גרינדן אַ דיסטאַנסע אָדער דיסימילאַריטי מעטריק צווישן באמערקט און סימיאַלייטיד דאַטן.
אויב די דיסטאַנסע איז ווייניקער ווי אַ זיכער שוועל, די פּאַראַמעטער וואַלועס געניצט צו בויען די פֿאַרבונדן סימיאַליישאַנז זענען געדאַנק צו זיין גלייַך.
אַבק קריייץ אַן אַפּראַקסאַמיישאַן פון די שפּעטערדיק פאַרשפּרייטונג דורך ריפּיטינג דעם אַקסעפּטאַנס-רידזשעקשאַן פּראָצעס מיט פאַרשידענע פּאַראַמעטער וואַלועס, ווייַזונג גלייבלעך פּאַראַמעטער וואַלועס געגעבן די באמערקט דאַטן.
די ABC פון מאַשין לערנען
אַבק איז געניצט אין מאַשין לערנען, ספּעציעל ווען ליקעליהאָאָד-באזירט ינפעראַנס איז שווער רעכט צו קאָמפּליצירט אָדער קאַמפּיוטישאַנאַלי טייַער מאָדעלס. אַבק קענען ווערן גענוצט פֿאַר אַ פאַרשיידנקייַט פון אַפּלאַקיישאַנז אַרייַנגערעכנט מאָדעל סעלעקציע, פּאַראַמעטער אָפּשאַצונג און גענעראַטיווע מאָדעלינג.
ABC אין מאַשין לערנען לעץ ריסערטשערז ציען ינפעראַנסאַז וועגן מאָדעל פּאַראַמעטערס און קלייַבן די בעסטער מאָדעלס דורך קאַמפּערינג סימיאַלייטיד און פאַקטיש דאַטן.
אַלגערידאַמז פֿאַר מאַשין לערנען קענען באַקומען ינסייץ אין מאָדעל אַנסערטאַנטי, דורכפירן מאָדעל קאַמפּעראַסאַנז און דזשענערייט פֿאָרויסזאָגן באזירט אויף באמערקט דאַטן דורך דערנענטערנ די שפּעטערדיק פאַרשפּרייטונג דורך אַבק, אפילו ווען די ליקעליהאָאָד אפשאצונג איז טייַער אָדער ינפיוזאַבאַל.
סאָף
צום סוף, Bayesian סטאַטיסטיק גיט אַ שטאַרק פריימווערק פֿאַר ינפעראַנס און מאָדעלינג אין מאַשין לערנען, אַלאַוינג אונדז צו ינקאָרפּערייט פרייַערדיק אינפֿאָרמאַציע, האַנדלען מיט אַנסערטאַנטי און דערגרייכן טראַסטווערדי רעזולטאַטן.
Monte Carlo מעטהאָדס זענען יקערדיק אין Bayesian סטאַטיסטיק און מאַשין לערנען ווייַל זיי לאָזן די עפעקטיוו עקספּלעריישאַן פון קאָמפּליצירט פּאַראַמעטער ספּייסאַז, אָפּשאַצונג פון וואַלועס פון אינטערעס און מוסטערונג פון שפּעטערדיק דיסטריביושאַנז.
מאַרקאָוו קייטן פאַרגרעסערן אונדזער קאַפּאַציטעט צו באַשרייַבן און סימולירן פּראָבאַביליסטיק סיסטעמען, און פּראַדוסינג טראַפ נומערן פֿאַר פאַרשידענע דיסטריביושאַנז אַלאַוז מער פלעקסאַבאַל מאָדעלינג און בעסער פאָרשטעלונג.
צום סוף, אַפּפּראָקסימאַטע בייעסיאַן קאַמפּיוטיישאַן (אַבק) איז אַ נוציק טעכניק פֿאַר פּערפאָרמינג שווער ליקעליהאָאָד קאַמפּיאַטיישאַנז און פּראָדוצירן בייעסיאַן משפט אין מאַשין לערנען.
מיר קענען אַנטוויקלען אונדזער פארשטאנד, פֿאַרבעסערן מאָדעלס און מאַכן געבילדעט משפט אין די פעלד פון מאַשין לערנען דורך לעווערידזשינג די פּרינסאַפּאַלז.
לאָזן אַ ענטפֿערן