Saturs[Paslēpt][Rādīt]
- 1. Titāniks
- 2. Īru ziedu klasifikācija
- 3. Bostonas māju cenu prognozēšana
- 4. Vīna kvalitātes pārbaude
- 5. Akciju tirgus prognozēšana
- 6. Filmas ieteikums
- 7. Slodzes atbilstības prognoze
- 8. Sentimenta analīze, izmantojot Twitter datus
- 9. Nākotnes pārdošanas prognozēšana
- 10. Viltus ziņu noteikšana
- 11. Kuponu iegādes prognozēšana
- 12. Klientu atteikšanās prognozēšana
- 13. Wallmart pārdošanas prognozēšana
- 14. Uber datu analīze
- 15. Covid-19 analīze
- Secinājumi
Mašīnmācība ir vienkāršs pētījums par to, kā izglītot datorprogrammu vai algoritmu, lai pakāpeniski uzlabotu konkrētu darbu, kas tiek pasniegts augstā līmenī. Attēlu identificēšana, krāpšanas atklāšana, ieteikumu sistēmas un citas mašīnmācīšanās lietojumprogrammas jau ir izrādījušās populāras.
ML darbi padara cilvēka darbu vienkāršu un efektīvu, ietaupot laiku un nodrošinot kvalitatīvu rezultātu. Pat Google, pasaulē populārākā meklētājprogramma, izmanto mašīna mācīšanās.
Ir pieejamas dažādas iespējas, sākot no lietotāja vaicājuma analīzes un rezultāta mainīšanas, pamatojoties uz rezultātiem, līdz aktuālu tēmu un reklāmu rādīšanai saistībā ar vaicājumu.
Tehnoloģija, kas ir gan uztveroša, gan paškorektīva, nav tālu nākotnē.
Viens no labākajiem veidiem, kā sākt, ir praktiski un izstrādāt projektu. Tāpēc mēs esam izveidojuši sarakstu ar 15 populārākajiem mašīnmācīšanās projektiem iesācējiem, lai jūs varētu sākt darbu.
1. Titānisks
Tas bieži tiek uzskatīts par vienu no lielākajiem un patīkamākajiem uzdevumiem ikvienam, kurš vēlas uzzināt vairāk par mašīnmācīšanos. Titānika izaicinājums ir populārs mašīnmācības projekts, kas arī kalpo kā labs veids, kā iepazīties ar Kaggle datu zinātnes platformu. Titānika datu kopu veido patiesi dati no neveiksmīgā kuģa nogrimšanas.
Tajā ir iekļauta informācija, piemēram, personas vecums, sociāli ekonomiskais stāvoklis, dzimums, kajītes numurs, izbraukšanas osta un, pats galvenais, vai viņi izdzīvoja!
K-Tuvākā kaimiņa tehnika un lēmumu koku klasifikators tika noteikti, lai iegūtu vislabākos rezultātus šim projektam. Ja meklējat ātru nedēļas nogales izaicinājumu, lai uzlabotu savu Mašīnmācīšanās spējas, šis Kaggle ir paredzēts jums.
2. Īru ziedu klasifikācija
Iesācējiem patīk īrisa ziedu kategorizēšanas projekts, un tas ir lieliska vieta, kur sākt, ja esat iesācējs mašīnmācībā. Sepals un ziedlapu garums atšķir īrisu ziedēšanu no citām sugām. Šī projekta mērķis ir sadalīt ziedus trīs sugās: Virdžīnija, setosa un Versicolor.
Klasifikācijas uzdevumos projektā tiek izmantota Īrisa ziedu datu kopa, kas palīdz audzēkņiem apgūt pamatus, kā rīkoties ar skaitliskām vērtībām un datiem. Varavīksnenes ziedu datu kopa ir maza, ko var saglabāt atmiņā bez mērogošanas.
3. Bostonas māju cenu prognoze
Vēl viens labi zināms datu kopa mašīnmācības iesācējiem ir Bostonas mājokļu dati. Tās mērķis ir prognozēt mājas vērtības dažādos Bostonas rajonos. Tā ietver svarīgu statistiku, piemēram, vecumu, īpašuma nodokļa likmi, noziedzības līmeni un pat tuvumu darba centriem, kas viss var ietekmēt mājokļu cenas.
Datu kopa ir vienkārša un niecīga, tāpēc iesācējiem ir viegli eksperimentēt. Lai noskaidrotu, kādi faktori ietekmē nekustamā īpašuma cenu Bostonā, dažādiem parametriem tiek plaši izmantotas regresijas metodes. Tā ir lieliska vieta, kur praktizēt regresijas metodes un novērtēt, cik labi tās darbojas.
4. Vīna kvalitātes pārbaude
Vīns ir neparasts alkoholiskais dzēriens, kam nepieciešama gadiem ilga raudzēšana. Rezultātā antīkā vīna pudele ir dārgs un kvalitatīvs vīns. Lai izvēlētos ideālu vīna pudeli, ir vajadzīgas gadiem ilgas vīna degustācijas zināšanas, un tas var būt neveiksmīgs process.
Vīna kvalitātes pārbaudes projektā tiek vērtēti vīni, izmantojot fizikāli ķīmiskos testus, piemēram, alkohola līmeni, fiksēto skābumu, blīvumu, pH un citus faktorus. Projektā noteikti arī vīna kvalitātes kritēriji un daudzumi. Tā rezultātā vīna iegāde kļūst par brīze.
5. Fondu tirgus prognoze
Šī iniciatīva ir intriģējoša neatkarīgi no tā, vai strādājat vai nē finanšu sektorā. Akciju tirgus datus plaši pēta akadēmiķi, uzņēmumi un pat kā sekundāro ienākumu avotu. Svarīga ir arī datu zinātnieka spēja pētīt un izpētīt laikrindu datus. Dati no akciju tirgus ir lieliska vieta, kur sākt.
Centienu būtība ir prognozēt akciju nākotnes vērtību. Tas ir balstīts uz pašreizējo tirgus darbību, kā arī iepriekšējo gadu statistiku. Kaggle ir apkopojis datus par NIFTY-50 indeksu kopš 2000. gada, un pašlaik tas tiek atjaunināts katru nedēļu. Kopš 1. gada 2000. janvāra tajā ir ietvertas vairāk nekā 50 organizāciju akciju cenas.
6. Filmas ieteikums
Esmu pārliecināts, ka jums ir bijusi tāda sajūta pēc labas filmas noskatīšanās. Vai esat kādreiz sajutuši impulsu saviļņot savas sajūtas, ārprātīgi skatoties līdzīgas filmas?
Mēs zinām, ka OTT pakalpojumi, piemēram, Netflix, ir ievērojami uzlabojuši savas ieteikumu sistēmas. Kā mašīnmācības studentam jums ir jāsaprot, kā šādi algoritmi tiek atlasīti klientiem, pamatojoties uz viņu vēlmēm un atsauksmēm.
IMDB datu kopa vietnē Kaggle, iespējams, ir viena no vispilnīgākajām, kas ļauj secināt ieteikumu modeļus, pamatojoties uz filmas nosaukumu, klientu vērtējumu, žanru un citiem faktoriem. Tā ir arī lieliska metode, lai uzzinātu par satura filtrēšanu un funkciju inženieriju.
7. Slodzes piemērotības prognoze
Pasaule griežas ap aizdevumiem. Banku galvenais peļņas avots ir kredītu procenti. Tāpēc tie ir viņu pamatdarbība.
Atsevišķas personas vai personu grupas var paplašināt ekonomiku, tikai ieguldot naudu uzņēmumā, cerot, ka tā nākotnē palielināsies. Dažkārt ir svarīgi meklēt aizdevumu, lai varētu uzņemties šāda rakstura risku un pat baudīt noteiktus pasaulīgus priekus.
Pirms aizdevuma pieņemšanas bankām parasti ir jāievēro diezgan stingrs process. Tā kā aizdevumi ir ļoti svarīgs daudzu cilvēku dzīves aspekts, aizdevuma atbilstības prognozēšana, uz kuru kāds piesakās, būtu ārkārtīgi izdevīga, ļaujot labāk plānot ne tikai aizdevuma pieņemšanu vai atteikumu.
8. Sentimenta analīze, izmantojot Twitter datus
Pateicoties sociālo mediju tīkli piemēram, Twitter, Facebook un Reddit, viedokļu un tendenču ekstrapolēšana ir kļuvusi ievērojami vienkārša. Šī informācija tiek izmantota, lai novērstu viedokļus par notikumiem, cilvēkiem, sportu un citām tēmām. Ar viedokļu ieguvi saistītas mašīnmācīšanās iniciatīvas tiek izmantotas dažādos apstākļos, tostarp politiskās kampaņās un Amazon produktu novērtējumos.
Šis projekts lieliski izskatīsies jūsu portfolio! Emociju noteikšanai un uz aspektiem balstītai analīzei var plaši izmantot tādas metodes kā atbalsta vektora mašīnas, regresijas un klasifikācijas algoritmi (faktu un viedokļu atrašana).
9. Nākotnes pārdošanas prognozes
Lielie B2C uzņēmumi un tirgotāji vēlas zināt, cik daudz katrs viņu krājumā esošais produkts pārdos. Pārdošanas prognozēšana palīdz uzņēmumu īpašniekiem noteikt, kuras preces ir ļoti pieprasītas. Precīza pārdošanas prognozēšana ievērojami samazinās izšķērdēšanu, vienlaikus nosakot arī pieaugošo ietekmi uz turpmākajiem budžetiem.
Tādi mazumtirgotāji kā Walmart, IKEA, Big Basket un Big Bazaar izmanto pārdošanas prognozes, lai novērtētu produktu pieprasījumu. Lai izveidotu šādus ML projektus, jums ir jāzina dažādas neapstrādātu datu tīrīšanas metodes. Nepieciešama arī laba regresijas analīzes izpratne, īpaši vienkārša lineārā regresija.
Lai veiktu šādus uzdevumus, jums būs jāizmanto tādas bibliotēkas kā Dora, Scrubadub, Pandas, NumPy un citas.
10. Viltus ziņu noteikšana
Tas ir vēl viens moderns mašīnmācīšanās darbs, kas paredzēts skolēniem. Viltus ziņas izplatās zibenīgi, kā mēs visi zinām. Sociālajos medijos ir pieejams viss, sākot no personu savienošanas līdz ikdienas ziņu lasīšanai.
Līdz ar to viltus ziņu atklāšana mūsdienās ir kļuvusi arvien grūtāka. Daudzos lielos sociālo mediju tīklos, piemēram, Facebook un Twitter, jau ir izveidoti algoritmi, lai atklātu viltus ziņas ierakstos un plūsmās.
Lai identificētu viltus ziņas, šāda veida ML projektiem ir nepieciešama rūpīga izpratne par vairākām NLP pieejām un klasifikācijas algoritmiem (PassiveAggressiveClassifier vai Naive Bayes klasifikators).
11. Kuponu iegādes prognozēšana
Kad 2020. gadā planētu uzbruka koronavīruss, klienti arvien vairāk domā par pirkumiem tiešsaistē. Tā rezultātā iepirkšanās iestādes bija spiestas pārcelt savu biznesu tiešsaistē.
Savukārt klienti joprojām meklē lieliskus piedāvājumus, tāpat kā veikalos, un arvien vairāk meklē īpaši taupošus kuponus. Ir pat vietnes, kas paredzētas kuponu izveidei šādiem klientiem. Izmantojot šo projektu, varat uzzināt par datu ieguvi mašīnmācībā, joslu diagrammu, sektoru diagrammu un histogrammu veidošanu datu vizualizēšanai, kā arī funkciju inženieriju.
Lai ģenerētu prognozes, varat arī izpētīt datu imputācijas pieejas NA vērtību un mainīgo kosinusa līdzības pārvaldībai.
12. Klientu atteikšanās prognozēšana
Patērētāji ir uzņēmuma vissvarīgākā vērtība, un to saglabāšana ir ļoti svarīga jebkuram uzņēmumam, kura mērķis ir palielināt ieņēmumus un veidot ar viņiem jēgpilnus ilgtermiņa sakarus.
Turklāt jauna klienta iegūšanas izmaksas ir piecas reizes lielākas nekā esošā uzturēšanas izmaksas. Klientu samazināšanās/atrīvēšanās ir labi zināma uzņēmējdarbības problēma, kurā klienti vai abonenti pārtrauc darījumus ar pakalpojumu vai uzņēmumu.
Ideālā gadījumā viņi vairs nebūs maksājoši klienti. Klients tiek uzskatīts par atlaistu, ja ir pagājis noteikts laiks kopš klienta pēdējās mijiedarbības ar uzņēmumu. Lai samazinātu atteikšanos no klienta, ir ļoti svarīgi noteikt, vai klients atteiksies, kā arī ātri sniegt atbilstošu informāciju, kas paredzēta klientu noturēšanai.
Mūsu smadzenes nespēj paredzēt klientu apgrozījumu miljoniem klientu; šeit var palīdzēt mašīnmācīšanās.
13. Wallmart pārdošanas prognozēšana
Viens no redzamākajiem mašīnmācīšanās lietojumiem ir pārdošanas prognozēšana, kas ietver tādu īpašību noteikšanu, kas ietekmē produktu pārdošanu, un nākotnes pārdošanas apjoma paredzēšanu.
Šajā mašīnmācīšanās pētījumā tiek izmantota Walmart datu kopa, kurā ir pārdošanas dati no 45 vietām. Datu kopā ir iekļauti pārdošanas apjomi katrā veikalā, pēc kategorijas, katru nedēļu. Šī mašīnmācīšanās projekta mērķis ir paredzēt pārdošanas apjomu katrai nodaļai katrā tirdzniecības vietā, lai viņi varētu pieņemt labākus, uz datiem balstītus kanālu optimizācijas un krājumu plānošanas lēmumus.
Darbs ar Walmart datu kopu ir sarežģīts, jo tajā ir ietverti izvēlēti samazināšanas notikumi, kas ietekmē pārdošanu un kas ir jāņem vērā.
14. Uber datu analīze
Runājot par mašīnmācības un dziļās mācīšanās ieviešanu un integrēšanu savās lietotnēs, populārais kopbraukšanas pakalpojums neatpaliek. Katru gadu tas apstrādā miljardus braucienu, ļaujot piepilsētas iedzīvotājiem ceļot jebkurā dienas vai nakts laikā.
Tā kā tai ir tik liela klientu bāze, tai ir nepieciešama izcila klientu apkalpošana, lai pēc iespējas ātrāk risinātu patērētāju sūdzības.
Uber piedāvā miljoniem datu kopu, ko tas var izmantot, lai analizētu un parādītu klientu braucienus, lai atklātu ieskatus un uzlabotu klientu pieredzi.
15. Covid-19 analīze
COVID-19 šodien ir pārņēmis visu pasauli, un ne tikai pandēmijas izpratnē. Kamēr medicīnas eksperti koncentrējas uz efektīvu vakcināciju radīšanu un pasaules imunizāciju, datu zinātnieki neatpaliek daudz.
Tiek publiskoti jauni gadījumi, ikdienas aktīvo personu skaits, nāves gadījumi un pārbaužu statistika. Prognozes tiek veidotas katru dienu, pamatojoties uz iepriekšējā gadsimta SARS uzliesmojumu. Šim nolūkam varat izmantot regresijas analīzi un atbalstīt uz vektoriem balstītus prognozēšanas modeļus.
Secinājumi
Rezumējot, mēs esam apsprieduši dažus no populārākajiem ML projektiem, kas jums palīdzēs testēt mašīnmācības programmēšanu, kā arī izprast tās idejas un ieviešanu. Zināšanas, kā integrēt mašīnmācīšanos, var palīdzēt jums virzīties uz priekšu savā profesijā, jo tehnoloģija pārņem visas nozares.
Apgūstot mašīnmācīšanos, iesakām praktizēt savas koncepcijas un uzrakstīt visus savus algoritmus. Algoritmu rakstīšana mācīšanās laikā ir svarīgāka par projekta izpildi, kā arī sniedz priekšrocības, pareizi izprotot priekšmetus.
Atstāj atbildi