טיש פון קאָנטענץ[באַהאַלטן][ווייַזן]
- 1 טיטאניק
- 2. איריש בלום קלאַססיפיקאַטיאָן
- 3. באָסטאָן הויז פּרייס פאָרויסזאָגן
- 4. ווייַן קוואַליטי טעסטינג
- 5. בערזע פּרידיקשאַן
- 6. פֿילם רעקאָממענדאַטיאָן
- 7. לאָדן בארעכטיגונג פּראָגנאָז
- 8. סענטימענט אַנאַליסיס ניצן טוויטטער דאַטאַ
- 9. צוקונפֿט סאַלעס פּראָגנאָז
- 10. שווינדל נייַעס דעטעקשאַן
- 11. קופּאָנז קויפן פּראָגנאָז
- 12. קונה טשערן פּראָגנאָז
- 13. וואַלמאַרט סאַלעס פאָרקאַסטינג
- 14. ובער דאַטאַ אַנאַליסיס
- 15. קאָוויד -19 אַנאַליסיס
- סאָף
מאַשין לערנען איז אַ פּשוט לערנען פון ווי צו דערציען אַ קאָמפּיוטער פּראָגראַם אָדער אַלגערידאַם צו ביסלעכווייַז פֿאַרבעסערן אַ ספּעציפיש אַרבעט דערלאנגט אויף אַ הויך מדרגה. בילד לעגיטימאַציע, שווינדל דיטעקשאַן, רעקאָמענדאַציע סיסטעמען און אנדערע מאַשין לערנען אַפּלאַקיישאַנז האָבן שוין פּראָווען צו זיין פאָלקס.
ML דזשאָבס מאַכן מענטש אַרבעט פּשוט און עפעקטיוו, שפּאָרן צייט און ינשורינג אַ הויך-קוואַליטעט רעזולטאַט. אפילו Google, די וועלט 'ס מערסט פאָלקס זוכן מאָטאָר, ניצט מאַשין וויסן.
פון אַנאַלייזינג די אָנפֿרעג פון דער באַניצער און ענדערן די רעזולטאַט באזירט אויף די רעזולטאַטן צו ווייַזן טרענדינג טעמעס און אַדווערץ אין באַציונג צו די אָנפֿרעג, עס זענען אַ פאַרשיידנקייַט פון אָפּציעס בנימצא.
טעכנאָלאָגיע וואָס איז ביידע פּערסעפּטיוו און זיך-קערעקטינג איז נישט ווייַט אַוועק אין דער צוקונפֿט.
איינער פון די ביגאַסט וועגן צו אָנהייבן איז צו אָנהייבן און פּלאַן אַ פּרויעקט. דעריבער, מיר האָבן צונויפגעשטעלט אַ רשימה פון 15 שפּיץ מאַשין לערנען פּראַדזשעקס פֿאַר ביגינערז צו באַקומען איר סטאַרטעד.
1. טיטאַניק
דאָס איז אָפט גערעכנט ווי איינער פון די ביגאַסט און מערסט ענדזשויאַבאַל טאַסקס פֿאַר ווער עס יז וואָס איז אינטערעסירט אין לערנען מער וועגן מאַשין לערנען. די טיטאַניק אַרויסרופן איז אַ פאָלקס מאַשין לערנען פּרויעקט וואָס אויך דינען ווי אַ גוט וועג צו באַקומען באַקאַנט מיט די קאַגגל דאַטן וויסנשאַפֿט פּלאַטפאָרמע. די טיטאַניק דאַטאַסעט איז קאַמפּרייזד פון עכט דאַטן פון די סינגקינג פון די קראַנק-פייטיד שיף.
עס ינקלודז דעטאַילס אַזאַ ווי דער מענטש 'ס עלטער, סאָסיאָ-עקאָנאָמיש סטאַטוס, דזשענדער, קאַבינע נומער, אָפּפאָר פּאָרט, און, רובֿ ימפּאָרטאַנטלי, צי זיי סערווייווד!
די K-Nearest Neighbor טעכניק און די באַשלוס בוים קלאַססיפיער זענען באשלאסן צו פּראָדוצירן די בעסטער רעזולטאַטן פֿאַר דעם פּרויעקט. אויב איר זוכט פֿאַר אַ שנעל אָפּרוטעג אַרויסרופן צו פֿאַרבעסערן דיין מאַשין לערנען אַבילאַטיז, דעם אויף Kaggle איז פֿאַר איר.
2. איריש בלום קלאַסאַפאַקיישאַן
ביגינערז ליב די יריס בלום קאַטאַגעריזיישאַן פּרויעקט, און עס איז אַ גרויס אָרט צו אָנהייבן אויב איר זענט נייַ צו מאַשין לערנען. די לענג פון סעפּאַלס און פּעטאַלז דיסטינגגווישיז יריס בלומז פון אנדערע מינים. דער ציל פון דעם פּרויעקט איז צו צעטיילן די בלומז אין דרייַ מינים: ווירזשיניע, סעטאָסאַ און ווערסיקאָלאָר.
פֿאַר קלאַסאַפאַקיישאַן עקסערסייזיז, די פּרויעקט ניצט די יריס בלום דאַטאַסעט, וואָס אַידז לערערס אין לערנען די פאַנדאַמענטאַלז פון האַנדלינג מיט נומעריק וואַלועס און דאַטן. די יריס בלום דאַטאַסעט איז אַ קליינטשיק איינער וואָס קענען זיין סטאָרד אין זכּרון אָן די נויט פֿאַר סקיילינג.
3. באָסטאָן הויז פּרייס פאָרויסזאָגן
אן אנדער באקאנט דאַטאַסעט פֿאַר נאַוואַסיז אין מאַשין לערנען איז די באָסטאָן האָוסינג דאַטן. זיין ציל איז צו פאָרויסזאָגן היים וואַלועס אין פאַרשידן באָסטאָן נייבערכודז. עס ינקלודז וויטאַל סטאַטיסטיק אַזאַ ווי עלטער, פאַרמאָג שטייַער קורס, פאַרברעכן קורס און אפילו נאָענטקייט צו אַרבעט סענטערס, אַלע וואָס קען ווירקן די פּרייסינג פון האָוסינג.
די דאַטאַסעט איז פּשוט און קליינטשיק, וואָס מאכט עס פּשוט צו עקספּערימענט מיט פֿאַר נאַוואַסיז. צו רעכענען אויס וואָס סיבות השפּעה די פאַרמאָג פּרייַז אין באָסטאָן, ראַגרעשאַן טעקניקס זענען שווער באנוצט אויף פאַרשידן פּאַראַמעטערס. עס איז אַ גרויס אָרט צו פיר ראַגרעשאַן טעקניקס און אַססעסס ווי גוט זיי אַרבעט.
4. ווייַן קוואַליטי טעסטינג
ווייַן איז אַ ומגעוויינטלעך אַלקאָהאָליקער געטראַנק וואָס ריקווייערז יאָרן פון פערמאַנטיישאַן. ווי אַ רעזולטאַט, די אַנטיק פלאַש פון ווייַן איז אַ פּרייסי און הויך-קוואַליטעט ווייַן. טשאָאָסינג די ידעאַל פלאַש פון ווייַן ריקווייערז יאָרן פון ווייַן טייסטינג וויסן, און עס קען זיין אַ שלאָגן-אָדער-פאַרפירן פּראָצעס.
די ווייַן קוואַליטעט פּרובירן פּרויעקט יוואַליוייץ וויינז ניצן פיזיקאָטשעמיקאַל טעסץ אַזאַ ווי אַלקאָהאָל מדרגה, פאַרפעסטיקט אַסידאַטי, געדיכטקייַט, ף און אנדערע סיבות. דער פּרויעקט אויך דיטערמאַנז די ווייַן ס קוואַליטעט קרייטיריאַ און קוואַנטאַטיז. ווי אַ רעזולטאַט, ווייַן פּערטשאַסינג ווערט אַ ווינטל.
5. לאַגער מאַרק פאָרויסזאָגן
די איניציאטיוו איז ינטריגינג צי איר אַרבעט אין די פינאַנציעל סעקטאָר אָדער נישט. לאַגער מאַרק דאַטן זענען וויידלי געלערנט דורך אַקאַדעמיקס, געשעפטן און אפילו ווי אַ מקור פון צווייטיק האַכנאָסע. די פיייקייט פון אַ דאַטן געלערנטער צו לערנען און ויספאָרשן צייט סעריע דאַטן איז אויך וויטאַל. דאַטן פון די לאַגער מאַרק איז אַ גרויס אָרט צו אָנהייבן.
די עסאַנס פון די מי איז צו פאָרויסזאָגן די צוקונפֿט ווערט פון אַ לאַגער. דאָס איז באזירט אויף קראַנט מאַרק פאָרשטעלונג און סטאַטיסטיק פון פריערדיקע יאָרן. Kaggle האט קאַלעקטינג דאַטן אויף די NIFTY-50 אינדעקס זינט 2000, און עס איז דערווייַל דערהייַנטיקט וויקלי. זינט יאנואר 1, 2000, עס כּולל לאַגער פּרייסיז פֿאַר איבער 50 אָרגאַניזאַציעס.
6. פֿילם רעקאָממענדאַטיאָן
איך בין זיכער אַז איר האָט געהאט דעם געפיל נאָך געזען אַ גוט פֿילם. האָבן איר אלץ פּעלץ דעם שטופּ צו סטימולירן דיין סענסיז דורך בינגע-וואַטשינג ענלעך פילמס?
מיר וויסן אַז OTT באַדינונגס אַזאַ ווי Netflix האָבן ימפּרוווד זייער רעקאָמענדאַציע סיסטעמען באטייטיק. ווי אַ מאַשין לערנען תּלמיד, איר וועט דאַרפֿן צו פֿאַרשטיין ווי אַזאַ אַלגערידאַמז ציל קלייאַנץ באזירט אויף זייער פּרעפֿערענצן און באריכטן.
די IMDB דאַטן שטעלן אויף Kaggle איז מסתּמא איינער פון די מערסט פולשטענדיק, אַלאַוינג רעקאָמענדאַציע מאָדעלס באזירט אויף דעם פֿילם טיטל, קונה שאַץ, זשאַנראַ און אנדערע סיבות. עס איז אויך אַ ויסגעצייכנט אופֿן צו לערנען וועגן אינהאַלט-באזירט פֿילטרירונג און שטריך אינזשעניריע.
7. לאָדן בארעכטיגונג פּראָגנאָז
די וועלט דרייט זיך אַרום הלוואות. די הויפּט מקור פון נוץ פון באַנקס קומט פון אינטערעס אויף לאָונז. דעריבער זיי זענען זייער פונדאַמענטאַל געשעפט.
מענטשן אָדער גרופּעס פון מענטשן קענען בלויז יקספּאַנד עקאָנאָמיעס דורך ינוועסטינג געלט אין אַ פירמע אין די האפענונגען צו זען עס העכערונג אין ווערט אין דער צוקונפֿט. עס איז אמאל וויכטיג צו זוכן א הלוואה כדי צו קענען נעמען סכנה פון אזא נאטור און אפילו זיך באטייליגן אין געוויסע וועלטליכע פארגעניגן.
איידער אַ אַנטלייַען קען זיין אנגענומען, באַנקס נאָרמאַלי האָבן אַ פערלי שטרענג פּראָצעס צו נאָכפאָלגן. ווי לאָונז זענען אַזאַ אַ קריטיש אַספּעקט פון פילע מענטשן ס לעבן, פּרידיקטינג בארעכטיגונג פֿאַר אַ אַנטלייַען אַז עמעצער אַפּלייז פֿאַר וואָלט זיין גאָר וווילטויק, אַלאַוינג פֿאַר בעסער פּלאַנירונג ווייַטער פון די אַנטלייַען וואָס איז אנגענומען אָדער אפגעזאגט.
8. סענטימענט אַנאַליסיס ניצן טוויטטער דאַטאַ
דאַנק צו געזעלשאַפטלעך מידיאַ נעטוואָרקס ווי טוויטטער, פאַסעבאָאָק און רעדדיט, עקסטראַפּאָלאַטינג מיינונגען און טרענדס האָבן שוין באטייטיק גרינג. די אינפֿאָרמאַציע איז געניצט צו עלימינירן מיינונגען אויף געשעענישן, מענטשן, ספּאָרט און אנדערע טעמעס. מיינונג מיינינג-פֿאַרבונדענע מאַשין לערנען ינישאַטיווז זענען געווענדט אין אַ פאַרשיידנקייַט פון סעטטינגס, אַרייַנגערעכנט פּאָליטיש קאַמפּיינז און אַמאַזאָן פּראָדוקט יוואַליויישאַנז.
דער פּרויעקט וועט קוקן פאַנטאַסטיש אין דיין פּאָרטפעל! פֿאַר עמאָציע דיטעקשאַן און אַספּעקט-באזירט אַנאַליסיס, טעקניקס אַזאַ ווי שטיצן וועקטאָר מאשינען, ראַגרעשאַן און קלאַסאַפאַקיישאַן אַלגערידאַמז קענען זיין געוויינט יקסטענסיוולי (דערגייונג פאקטן און מיינונגען).
9. צוקונפֿט סאַלעס פּראָגנאָז
גרויס B2C געשעפטן און סוחרים ווילן צו וויסן ווי פיל יעדער פּראָדוקט אין זייער ינוואַנטאָרי וועט פאַרקויפן. סאַלעס פאָרקאַסטינג אַידז געשעפט אָונערז אין דיטערמאַנינג וואָס זאכן זענען אין הויך פאָדערונג. פּינטלעך פארקויפונג פאָרויסזאָגן וועט באטייטיק פאַרמינערן וויסטידזש און אויך באַשטימען די ינקראַמענטאַל פּראַל אויף צוקונפֿט באַדזשיץ.
רעטאַילערס אַזאַ ווי וואַלמאַרט, ייקיאַ, ביג באַסקעט און ביג באַזאַר נוצן פארקויפונג פאָרויסזאָגן צו אָפּשאַצן פּראָדוקט פאָדערונג. איר מוזן זיין באַקאַנט מיט פאַרשידן טעקניקס פון קלענזינג רוי דאַטן צו בויען אַזאַ ML פּראַדזשעקס. אויך, אַ גוט אָנכאַפּן פון ראַגרעשאַן אַנאַליסיס, ספּעציעל פּשוט לינעאַר ראַגרעשאַן, איז פארלאנגט.
פֿאַר די טייפּס פון טאַסקס, איר דאַרפֿן צו נוצן לייברעריז ווי Dora, Scrubadub, Pandas, NumPy און אנדערע.
קסנומקס. שווינדל נייַעס דעטעקשאַן
דאָס איז אן אנדער שפּאָרעוודיק מאַשין לערנען מי אַימעד צו סקולטשילדראַן. שווינדל נייעס פארשפרייט זיך ווי א פייער, ווי מיר אלע ווייסן. אַלץ איז בנימצא אויף געזעלשאַפטלעך מידיאַ, פֿון קאַנעקטינג מענטשן צו לייענען די טעגלעך נייַעס.
ווי אַ רעזולטאַט, דיטעקטינג פאַלש נייַעס איז געווארן ינקריסינגלי שווער די טעג. פילע גרויס געזעלשאַפטלעך מידיאַ נעטוואָרקס, אַזאַ ווי פאַסעבאָאָק און טוויטטער, האָבן שוין אַלגערידאַמז צו דעטעקט פאַלש נייַעס אין פּאָוסטינגז און פידז.
צו ידענטיפיצירן פאַלש נייַעס, דעם טיפּ פון ML פּרויעקט דאַרף אַ גרונטיק פארשטאנד פון קייפל NLP אַפּראָוטשיז און קלאַסאַפאַקיישאַן אַלגערידאַמז (PassiveAggressiveClassifier אָדער Naive Bayes classifier).
קסנומקס. קופּאָנז קויפן פּראָגנאָז
קאַסטאַמערז זענען ינקריסינגלי קאַנסידערינג אָנליין בייינג ווען די קאָראָנאַווירוס אַטאַקירט דעם פּלאַנעט אין 2020. ווי אַ רעזולטאַט, שאַפּינג עסטאַבלישמאַנץ האָבן שוין געצווונגען צו יבעררוק זייער געשעפט אָנליין.
קאַסטאַמערז, אויף די אנדערע האַנט, זוכן נאָך גרויס אָפפערס, פּונקט ווי זיי זענען געווען אין סטאָרז, און זענען ינקריסינגלי גייעג פֿאַר סופּער-שפּאָרן קופּאָנז. עס זענען אפילו וועבסיטעס דעדאַקייטאַד צו שאַפֿן קופּאָנז פֿאַר אַזאַ קלייאַנץ. איר קענען לערנען וועגן דאַטן מיינינג אין מאַשין לערנען, פּראַדוסינג באַר גראַפס, פּיראָג טשאַרץ און כיסטאַגראַמז צו וויזשוואַלייז דאַטן און פֿעיִקייטן ינזשעניעריע מיט דעם פּרויעקט.
צו דזשענערייט פֿאָרויסזאָגן, איר קענט אויך קוקן אין די אַפּראָוטשיז פון דאַטן ימפּיוטיישאַן פֿאַר אָנפירונג NA וואַלועס און קאָסינע ענלעכקייט פון וועריאַבאַלז.
קסנומקס. קונה טשערן פּראָגנאָז
קאָנסומערס זענען די מערסט וויכטיק אַסעט פון אַ פירמע, און בעכעסקעם זיי איז וויטאַל פֿאַר קיין געשעפט מיט אַ ציל צו בוסט רעוועך און בויען לאַנג-טערמין מינינגפאַל קאַנעקשאַנז מיט זיי.
דערצו, די פּרייַז פון אַקוויירינג אַ נייַ קליענט איז פינף מאל העכער ווי די פּרייַז פון סאַסטיינינג אַ יגזיסטינג. קונה טשורן / אַטטרישאַן איז אַ באַוווסט געשעפט פּראָבלעם אין וואָס קאַסטאַמערז אָדער אבאנענטן האַלטן געשעפט מיט אַ דינסט אָדער אַ פירמע.
זיי וועלן יידילי ניט מער זיין אַ פּייינג קונה. א קונה איז דימד טשערנד אויב עס איז געווען אַ באַזונדער סומע פון צייט זינט דער קונה לעצטע ינטעראַקטיד מיט די פירמע. ידענטיפיצירן צי אַ קליענט וועט טשערן, ווי געזונט ווי געשווינד געבן באַטייַטיק אינפֿאָרמאַציע אַימעד צו קונה ריטענשאַן, זענען קריטיש צו לאָוערינג טשערן.
אונדזער סייכל איז ניט ביכולת צו פאָרויסזאָגן קונה ויסקער פֿאַר מיליאַנז פון קלייאַנץ; דאָ איז ווו מאַשין לערנען קענען העלפן.
קסנומקס. וואַלמאַרט סאַלעס פאָרקאַסטינג
איינער פון די מערסט באַוווסט אַפּלאַקיישאַנז פון מאַשין לערנען איז פארקויפונג פאָרויסזאָגן, וואָס ינוואַלווז דיטעקטינג קעראַקטעריסטיקס וואָס השפּעה פּראָדוקט פארקויפונג און אַנטיסאַפּייטינג צוקונפֿט פארקויפונג באַנד.
די וואַלמאַרט דאַטאַסעט, וואָס כּולל פארקויפונג דאַטן פון 45 לאָוקיישאַנז, איז געניצט אין דעם מאַשין לערנען לערנען. פארקויפונג פּער קראָם, לויט קאַטעגאָריע, אויף אַ וואכנשריפט יקער זענען אַרייַנגערעכנט אין די דאַטאַסעט. דער ציל פון דעם מאַשין לערנען פּרויעקט איז צו פאָרויסזאָגן פארקויפונג פֿאַר יעדער אָפּטיילונג אין יעדער ווענטיל אַזוי אַז זיי קענען מאַכן בעסער דאַטן-געטריבן קאַנאַל אַפּטאַמאַזיישאַן און ינוואַנטאָרי פּלאַנירונג דיסיזשאַנז.
ארבעטן מיט די וואַלמאַרט דאַטאַסעט איז שווער ווייַל עס כּולל אויסדערוויילטע מאַרקדאַון געשעענישן וואָס האָבן אַ פּראַל אויף פארקויפונג און זאָל זיין קאַנסידערד.
קסנומקס. ובער דאַטאַ אַנאַליסיס
ווען עס קומט צו ימפּלאַמענינג און ינטאַגרייטינג מאַשין לערנען און טיף לערנען אין זייער אַפּפּס, די פאָלקס פאָר-ייַנטיילונג דינסט איז נישט ווייַט הינטער. יעדער יאָר, עס פּראַסעסאַז ביליאַנז פון טריפּס, אַלאַוינג קאַמיוטערז צו אַרומפאָרן אין קיין צייט פון טאָג אָדער נאַכט.
ווייַל עס האט אַזאַ אַ גרויס קליענט באַזע, עס דאַרף יקסעפּשאַנאַל קונה דינסט צו אַדרעס קאַנסומער טענות ווי געשווינד ווי מעגלעך.
Uber האט אַ דאַטאַסעט פון מיליאַנז פון פּיקאַפּס אַז עס קענען נוצן צו אַנאַלייז און אַרויסווייַזן קליענט טריפּס צו ופדעקן ינסייץ און פֿאַרבעסערן די קונה דערפאַרונג.
קסנומקס. קאָוויד -19 אַנאַליסיס
COVID-19 האט סוועפּט די וועלט הייַנט, און ניט נאָר אין דעם זינען פון אַ פּאַנדעמיק. בשעת מעדיציניש עקספּערץ קאַנסאַנטרייט אויף דזשענערייטינג עפעקטיוו וואַקסאַניישאַנז און ימיונייזינג די וועלט, דאַטן סייאַנטיס זענען נישט ווייַט הינטער.
נייַע קאַסעס, טעגלעך אַקטיוו ציילן, פאַטאַלאַטיז און טעסטינג סטאַטיסטיק זענען אַלע געמאכט עפנטלעך. פאָרקאַסץ זענען געמאכט אויף אַ טעגלעך יקער באזירט אויף די סאַרס ויסברוך פון די פריערדיקע יאָרהונדערט. פֿאַר דעם, איר קענען נוצן ראַגרעשאַן אַנאַליסיס און שטיצן וועקטאָר מאַשין-באזירט פּראָגנאָז מאָדעלס.
סאָף
צו סאַמערייז, מיר האָבן דיסקאַסט עטלעכע פון די שפּיץ ML פראיעקטן וואָס וועט אַרוישעלפן איר אין טעסטינג מאַשין לערנען פּראָגראַממינג און אָנכאַפּן די יידיאַז און ימפּלאַמענטיישאַן. וויסן ווי צו ויסשטימען מאַשין לערנען קענען העלפֿן איר שטייַגן אין דיין פאַך ווי די טעכנאָלאָגיע נעמט איבער אין יעדער אינדוסטריע.
ווען איר לערנען מאַשין לערנען, מיר רעקאָמענדירן אַז איר פיר דיין קאַנסעפּס און שרייַבן אַלע דיין אַלגערידאַמז. שרייבן אַלגערידאַמז בשעת לערנען איז מער וויכטיק ווי פּערפאָרמינג אַ פּרויעקט, און עס אויך גיט אַ מייַלע צו פֿאַרשטיין די סאַבדזשעקץ רעכט.
לאָזן אַ ענטפֿערן