Բառը[Թաքցնել][Ցուցադրում]
- 1 Տիտանիկ
- 2. Իռլանդական ծաղիկների դասակարգում
- 3. Բոստոնի տան գների կանխատեսում
- 4. Գինու որակի ստուգում
- 5. Ֆոնդային շուկայի կանխատեսում
- 6. Ֆիլմի խորհուրդ
- 7. Բեռի իրավասության կանխատեսում
- 8. Զգացմունքների վերլուծություն Twitter-ի տվյալների միջոցով
- 9. Ապագա վաճառքի կանխատեսում
- 10. Կեղծ լուրերի հայտնաբերում
- 11. Կտրոնների գնման կանխատեսում
- 12. Հաճախորդների խափանումների կանխատեսում
- 13. Wallmart վաճառքի կանխատեսում
- 14. Uber տվյալների վերլուծություն
- 15. Covid-19 վերլուծություն
- Եզրափակում
Մեքենայական ուսուցումը պարզ ուսումնասիրություն է այն մասին, թե ինչպես կրթել համակարգչային ծրագիր կամ ալգորիթմ՝ աստիճանաբար կատարելագործելու բարձր մակարդակով ներկայացված կոնկրետ աշխատանքը: Պատկերների նույնականացումը, խարդախության հայտնաբերումը, առաջարկությունների համակարգերը և մեքենայական ուսուցման այլ հավելվածներն արդեն իսկ հայտնի են դարձել:
ML-ի աշխատանքները դարձնում են մարդկային աշխատանքը պարզ և արդյունավետ՝ խնայելով ժամանակ և ապահովելով բարձրորակ արդյունք: Նույնիսկ Google-ը՝ աշխարհի ամենահայտնի որոնողական համակարգը, օգտագործում է Machine Learning.
Օգտատիրոջ հարցումը վերլուծելուց և արդյունքների հիման վրա արդյունքը փոխելուց մինչև հարցման հետ կապված գերժամանակակից թեմաներ և գովազդներ ցուցադրելը, կան մի շարք տարբերակներ:
Տեխնոլոգիան, որը և՛ ընկալունակ է, և՛ ինքնուրույն շտկվող, հեռու չէ ապագայում:
Սկսելու լավագույն միջոցներից մեկը գործնականում ձեռք բերելն ու նախագիծ նախագծելն է: Հետևաբար, մենք կազմել ենք մեքենայական ուսուցման 15 լավագույն նախագծերի ցանկը սկսնակների համար՝ սկսելու համար:
1. Տիտանական
Սա հաճախ համարվում է ամենամեծ և ամենահաճելի առաջադրանքներից մեկը յուրաքանչյուրի համար, ով ցանկանում է ավելին իմանալ մեքենայական ուսուցման մասին: Titanic մարտահրավերը մեքենայական ուսուցման հանրահայտ նախագիծ է, որը նաև լավ միջոց է ծանոթանալու Kaggle տվյալների գիտության հարթակին: Titanic-ի տվյալների բազան կազմված է չարաբաստիկ նավի խորտակման իրական տվյալներից:
Այն ներառում է այնպիսի մանրամասներ, ինչպիսիք են անձի տարիքը, սոցիալ-տնտեսական կարգավիճակը, սեռը, խցիկի համարը, մեկնման նավահանգիստը և, ամենակարևորը, ողջ են մնացել:
K-Nearest Neighbor տեխնիկան և որոշման ծառի դասակարգիչը որոշվել են այս նախագծի համար լավագույն արդյունքներ ապահովելու համար: Եթե դուք փնտրում եք հանգստյան օրերի արագ մարտահրավեր՝ ձեր բարելավման համար Մեքենայի ուսուցման ունակություններ, սա Kaggle-ում ձեզ համար է:
2. Իռլանդական ծաղիկների դասակարգում
Սկսնակները սիրում են ծիածանաթաղանթի ծաղիկների դասակարգման նախագիծը, և դա հիանալի վայր է սկսելու համար, եթե դուք նոր եք մեքենայական ուսուցման մեջ: Սեպալների և ծաղկաթերթիկների երկարությունը տարբերում է ծիածանաթաղանթի ծաղկունքը մյուս տեսակներից: Այս նախագծի նպատակն է առանձնացնել ծաղկաբույլերը երեք տեսակի՝ Վիրջինիա, սետոզա և Վերսիկոլոր:
Դասակարգման վարժությունների համար նախագիծն օգտագործում է Iris flower տվյալների հավաքածուն, որն օգնում է սովորողներին սովորել թվային արժեքների և տվյալների հետ գործ ունենալու հիմունքները: Ծիածանաթաղանթի ծաղկի հավաքածուն փոքր է, որը կարող է պահվել հիշողության մեջ՝ առանց մասշտաբի մեծացման:
3. Բոստոնի տան գների կանխատեսում
Մեկ այլ հայտնի տվյալների բազա մեքենայական ուսուցման նորեկների համար Բոստոն Հուսինգի տվյալներն են։ Դրա նպատակն է կանխատեսել տան արժեքները Բոստոնի տարբեր թաղամասերում: Այն ներառում է կենսական վիճակագրություն, ինչպիսիք են տարիքը, գույքահարկի դրույքաչափը, հանցավորության մակարդակը և նույնիսկ աշխատանքի կենտրոնների մոտ լինելը, որոնք բոլորը կարող են ազդել բնակարանների գնի վրա:
Տվյալների հավաքածուն պարզ է և փոքր, ինչը հեշտացնում է նորեկների համար փորձարկումները: Պարզելու համար, թե ինչ գործոններ են ազդում Բոստոնում գույքի գնի վրա, ռեգրեսիայի տեխնիկան մեծապես կիրառվում է տարբեր պարամետրերի վրա: Դա հիանալի վայր է ռեգրեսիայի տեխնիկան կիրառելու և գնահատելու, թե որքան լավ են դրանք աշխատում:
4. Գինու որակի փորձարկում
Գինին անսովոր ալկոհոլային խմիչք է, որը պահանջում է տարիներ խմորում: Արդյունքում հնաոճ գինու շիշը թանկարժեք և որակյալ գինի է։ Գինու իդեալական շիշ ընտրելը պահանջում է գինու համտեսի տարիների գիտելիքներ, և դա կարող է լինել անհաջող գործընթաց:
Գինու որակի փորձարկման նախագիծը գնահատում է գինիները՝ օգտագործելով ֆիզիկաքիմիական թեստեր, ինչպիսիք են ալկոհոլի մակարդակը, ֆիքսված թթվայնությունը, խտությունը, pH-ը և այլ գործոններ: Նախագիծը նաև սահմանում է գինու որակի չափանիշներն ու քանակները: Արդյունքում, գինի գնելը դառնում է հով։
5. Ֆոնդային շուկայի կանխատեսում
Այս նախաձեռնությունը հետաքրքիր է, անկախ նրանից՝ դուք աշխատում եք ֆինանսական ոլորտում, թե ոչ: Ֆոնդային շուկայի տվյալները լայնորեն ուսումնասիրվում են գիտնականների, ձեռնարկությունների կողմից և նույնիսկ որպես երկրորդական եկամտի աղբյուր: Տվյալների գիտնականի՝ ժամանակային շարքերի տվյալները ուսումնասիրելու և ուսումնասիրելու կարողությունը նույնպես կենսական նշանակություն ունի: Ֆոնդային շուկայից ստացված տվյալները հիանալի տեղ են սկսելու համար:
Ձեռնարկի էությունը բաժնետոմսի ապագա արժեքի կանխատեսումն է: Սա հիմնված է ընթացիկ շուկայի կատարողականի, ինչպես նաև նախորդ տարիների վիճակագրության վրա: Kaggle-ը NIFTY-50 ինդեքսի վերաբերյալ տվյալներ է հավաքում 2000 թվականից, և ներկայումս այն թարմացվում է շաբաթական: 1 թվականի հունվարի 2000-ից այն պարունակում է ավելի քան 50 կազմակերպությունների բաժնետոմսերի գներ:
6. Ֆիլմի խորհուրդ
Համոզված եմ, որ դուք այդ զգացողությունն եք ունեցել լավ ֆիլմ դիտելուց հետո: Երբևէ զգացե՞լ եք նման ֆիլմեր դիտելու միջոցով ձեր զգայարանները զարգացնելու մղումը:
Մենք գիտենք, որ OTT ծառայությունները, ինչպիսիք են Netflix-ը, զգալիորեն բարելավել են իրենց առաջարկությունների համակարգերը: Որպես մեքենայական ուսուցման ուսանող՝ դուք պետք է հասկանաք, թե ինչպես են նման ալգորիթմները թիրախավորում հաճախորդներին՝ հիմնվելով նրանց նախասիրությունների և ակնարկների վրա:
Kaggle-ի IMDB տվյալների հավաքածուն, ամենայն հավանականությամբ, ամենաամբողջականներից մեկն է, որը թույլ է տալիս եզրակացություններ անել՝ հիմնվելով ֆիլմի վերնագրի, հաճախորդների վարկանիշի, ժանրի և այլ գործոնների վրա: Դա նաև հիանալի մեթոդ է բովանդակության վրա հիմնված զտման և առանձնահատկությունների ճարտարագիտության մասին սովորելու համար:
7. Բեռնման իրավասության կանխատեսում
Աշխարհը պտտվում է վարկերի շուրջ. Բանկերի շահույթի հիմնական աղբյուրը ստացվում է վարկերի տոկոսներից: Այսպիսով, նրանք իրենց հիմնական գործն են:
Անհատները կամ անհատների խմբերը կարող են ընդլայնել տնտեսությունները միայն ընկերությունում գումար ներդնելով՝ ապագայում դրա արժեքի աճը տեսնելու հույսով: Երբեմն կարևոր է վարկ փնտրել, որպեսզի կարողանանք նման բնույթի ռիսկի դիմել և նույնիսկ մասնակցել որոշակի աշխարհիկ հաճույքներին:
Մինչև վարկի ընդունումը, բանկերը սովորաբար պետք է հետևեն բավականին խիստ գործընթաց: Քանի որ վարկերը շատ մարդկանց կյանքի կարևորագույն կողմն են, վարկի իրավունքը կանխատեսելը, որին ինչ-որ մեկը դիմում է, կլինի չափազանց շահավետ՝ թույլ տալով ավելի լավ պլանավորել վարկի ընդունումից կամ մերժումից դուրս:
8. Զգացմունքների վերլուծություն՝ օգտագործելով Twitter-ի տվյալները
Շնորհիվ սոցիալական լրատվամիջոցների ցանցեր ինչպես Twitter-ը, Facebook-ը և Reddit-ը, կարծիքների և միտումների էքստրապոլյացիաները զգալիորեն հեշտացել են: Այս տեղեկատվությունը օգտագործվում է իրադարձությունների, մարդկանց, սպորտի և այլ թեմաների վերաբերյալ կարծիքները վերացնելու համար: Կարծիքի մայնինգի հետ կապված մեքենայական ուսուցման նախաձեռնությունները կիրառվում են տարբեր միջավայրերում, ներառյալ քաղաքական արշավները և Amazon-ի արտադրանքի գնահատումները:
Այս նախագիծը ֆանտաստիկ տեսք կունենա ձեր պորտֆոլիոյում: Զգացմունքների հայտնաբերման և ասպեկտների վրա հիմնված վերլուծության համար մեթոդներ, ինչպիսիք են օժանդակ վեկտորային մեքենաները, ռեգրեսիան և դասակարգման ալգորիթմները, կարող են լայնորեն օգտագործվել (փաստեր և կարծիքներ գտնել):
9. Ապագա վաճառքի կանխատեսում
B2C խոշոր բիզնեսները և առևտրականները ցանկանում են իմանալ, թե որքանով կվաճառվի իրենց գույքագրման յուրաքանչյուր ապրանք: Վաճառքի կանխատեսումն օգնում է բիզնեսի սեփականատերերին որոշել, թե որ ապրանքներն են մեծ պահանջարկ ունեցող: Վաճառքի ճշգրիտ կանխատեսումը զգալիորեն կնվազեցնի վատնումը՝ միաժամանակ որոշելով հետագա բյուջեների վրա աճող ազդեցությունը:
Մանրածախ առևտրականները, ինչպիսիք են Walmart-ը, IKEA-ն, Big Basket-ը և Big Bazaar-ը, օգտագործում են վաճառքի կանխատեսումը՝ ապրանքի պահանջարկը գնահատելու համար: Նման ML նախագծեր կառուցելու համար դուք պետք է ծանոթ լինեք չմշակված տվյալների մաքրման տարբեր տեխնիկայի: Նաև, պահանջվում է ռեգրեսիոն վերլուծության լավ իմացություն, հատկապես պարզ գծային ռեգրեսիա:
Այս տեսակի առաջադրանքների համար դուք պետք է օգտագործեք գրադարաններ, ինչպիսիք են Dora, Scrubadub, Pandas, NumPy և այլն:
10: Կեղծ լուրերի հայտնաբերում
Դա մեքենայական ուսուցման ևս մեկ նորագույն փորձ է, որն ուղղված է դպրոցականներին: Կեղծ լուրերը տարածվում են հրդեհի պես, ինչպես բոլորս գիտենք: Սոցցանցերում ամեն ինչ հասանելի է՝ սկսած անհատներին կապելուց մինչև ամենօրյա նորություններ կարդալը:
Արդյունքում, այս օրերին կեղծ լուրերի հայտնաբերումն ավելի ու ավելի է դժվարացել: Շատ խոշոր սոցիալական մեդիա ցանցեր, ինչպիսիք են Facebook-ը և Twitter-ը, արդեն ունեն ալգորիթմներ՝ հրապարակումների և հոսքերում կեղծ լուրեր հայտնաբերելու համար:
Կեղծ լուրերը բացահայտելու համար ML նախագծի այս տեսակը կարիք ունի բազմաթիվ NLP մոտեցումների և դասակարգման ալգորիթմների (PassiveAggressiveClassifier կամ Naive Bayes դասակարգիչ) մանրակրկիտ իմացության:
11: Կտրոնների գնման կանխատեսում
Հաճախորդներն ավելի ու ավելի են մտածում առցանց գնումներ կատարելու մասին, երբ կորոնավիրուսը հարձակվեց մոլորակի վրա 2020 թվականին: Արդյունքում, առևտրի կազմակերպությունները ստիպված են եղել փոխել իրենց բիզնեսը առցանց:
Մյուս կողմից, հաճախորդները դեռ փնտրում են հիանալի առաջարկներ, ինչպես որ խանութներում էին, և գնալով ավելի շատ են փնտրում գերխնայող կտրոններ: Կան նույնիսկ կայքեր, որոնք նվիրված են նման հաճախորդների համար կտրոններ ստեղծելուն: Դուք կարող եք սովորել տվյալների արդյունահանման մասին մեքենայական ուսուցման մեջ, ստեղծելով գծապատկերներ, կարկանդակ գծապատկերներ և հիստոգրամներ՝ տվյալներ պատկերացնելու համար, և այս նախագծի հետ կապված առանձնահատկությունների ճարտարագիտություն:
Կանխատեսումներ ստեղծելու համար դուք կարող եք նաև դիտարկել տվյալների վերագրման մոտեցումները՝ NA արժեքները և փոփոխականների կոսինուսային նմանությունը կառավարելու համար:
12: Հաճախորդների խափանումների կանխատեսում
Սպառողները ընկերության ամենակարևոր ակտիվն են, և նրանց պահելը կենսական նշանակություն ունի ցանկացած բիզնեսի համար, որը նպատակ ունի բարձրացնել եկամուտները և կառուցել երկարաժամկետ բովանդակալից կապեր նրանց հետ:
Ավելին, նոր հաճախորդի ձեռքբերման արժեքը հինգ անգամ ավելի բարձր է, քան գոյություն ունեցողի պահպանման ծախսերը: Հաճախորդների խափանումը/հյուծումը հայտնի բիզնես խնդիր է, որի դեպքում հաճախորդները կամ բաժանորդները դադարում են առևտուր անել ծառայության կամ ընկերության հետ:
Իդեալում նրանք այլևս վճարող հաճախորդ չեն լինի: Հաճախորդը համարվում է շփոթված, եթե այն որոշակի ժամանակ է անցել այն պահից, երբ հաճախորդը վերջին անգամ շփվել է ընկերության հետ: Բացահայտելը, թե արդյոք հաճախորդը կփչանա, ինչպես նաև արագորեն համապատասխան տեղեկատվություն տրամադրելը` ուղղված հաճախորդների պահպանմանը, շատ կարևոր են հաճախորդը նվազեցնելու համար:
Մեր ուղեղը ի վիճակի չէ կանխատեսել հաճախորդների շրջանառությունը միլիոնավոր հաճախորդների համար. ահա թե որտեղ կարող է օգնել մեքենայական ուսուցումը:
13: Wallmart վաճառքի կանխատեսում
Մեքենայի ուսուցման ամենահայտնի կիրառություններից մեկը վաճառքի կանխատեսումն է, որը ներառում է ապրանքների վաճառքի վրա ազդող բնութագրերի հայտնաբերում և վաճառքի ապագա ծավալների կանխատեսում:
Walmart-ի տվյալների բազան, որը պարունակում է վաճառքի տվյալներ 45 վայրերից, օգտագործվում է մեքենայական ուսուցման այս ուսումնասիրության մեջ: Վաճառքները մեկ խանութում, ըստ կատեգորիայի, շաբաթական կտրվածքով ներառված են տվյալների բազայում: Այս մեքենայական ուսուցման նախագծի նպատակն է կանխատեսել վաճառքը յուրաքանչյուր բաժնի համար յուրաքանչյուր կետում, որպեսզի նրանք կարողանան ավելի լավ որոշումներ կայացնել տվյալների վրա հիմնված ալիքների օպտիմալացման և գույքագրման պլանավորման վերաբերյալ:
Walmart տվյալների բազայի հետ աշխատելը դժվար է, քանի որ այն պարունակում է ընտրված նշման իրադարձություններ, որոնք ազդում են վաճառքի վրա և պետք է հաշվի առնել:
14: Uber տվյալների վերլուծություն
Երբ խոսքը գնում է մեքենայական ուսուցման և խորը ուսուցման իրենց հավելվածներում ներդրման և ինտեգրման մասին, ուղևորությունների փոխանակման հանրաճանաչ ծառայությունը հետ չի մնում: Ամեն տարի այն մշակում է միլիարդավոր ուղևորություններ՝ թույլ տալով ուղևորներին ճանապարհորդել օրվա կամ գիշերվա ցանկացած ժամի:
Քանի որ այն ունի հաճախորդների այդքան մեծ բազա, այն կարիք ունի հաճախորդների բացառիկ սպասարկման՝ սպառողների բողոքները հնարավորինս արագ լուծելու համար:
Uber-ն ունի միլիոնավոր ընտրանքների տվյալների հավաքածու, որը կարող է օգտագործել հաճախորդների ուղևորությունները վերլուծելու և ցուցադրելու համար՝ բացահայտելու պատկերացումները և բարելավելու հաճախորդների փորձը:
15: Covid-19 վերլուծություն
COVID-19-ն այսօր ընդգրկել է աշխարհը, և ոչ միայն համաճարակի իմաստով: Մինչ բժշկական փորձագետները կենտրոնանում են արդյունավետ պատվաստումների ստեղծման և աշխարհը իմունիզացնելու վրա, տվյալների գիտնականներ հետ չեն մնում.
Նոր դեպքերը, ամենօրյա ակտիվ հաշվարկը, մահացությունները և թեստավորման վիճակագրությունը բոլորը հրապարակվում են: Կանխատեսումները կատարվում են ամեն օր՝ հիմնվելով նախորդ դարի SARS-ի բռնկման վրա: Դրա համար դուք կարող եք օգտագործել ռեգրեսիոն վերլուծություն և աջակցել վեկտորային մեքենայի վրա հիմնված կանխատեսման մոդելներին:
Եզրափակում
Ամփոփելու համար մենք քննարկել ենք մի քանի լավագույն ML նախագծեր, որոնք կօգնեն ձեզ փորձարկել Machine Learning ծրագրավորումը, ինչպես նաև հասկանալ դրա գաղափարներն ու իրականացումը: Մեքենայական ուսուցումը ինտեգրելու իմացությունը կարող է օգնել ձեզ առաջադիմել ձեր մասնագիտության մեջ, քանի որ տեխնոլոգիան տիրում է յուրաքանչյուր ոլորտում:
Մեքենայական ուսուցում սովորելիս խորհուրդ ենք տալիս կիրառել ձեր հասկացությունները և գրել ձեր բոլոր ալգորիթմները: Սովորելու ընթացքում ալգորիթմներ գրելն ավելի կարևոր է, քան նախագիծը կատարելը, և այն նաև առավելություն է տալիս առարկաները ճիշտ հասկանալու հարցում:
Թողնել գրառում