Orodha ya Yaliyomo[Ficha][Onyesha]
- 1 Titanic
- 2. Uainishaji wa Maua ya Kiayalandi
- 3. Utabiri wa Bei ya Boston House
- 4. Upimaji wa Ubora wa Mvinyo
- 5. Utabiri wa Soko la Hisa
- 6. Mapendekezo ya Filamu
- 7. Utabiri wa Kustahiki Mzigo
- 8. Uchambuzi wa Hisia kwa kutumia Data ya Twitter
- 9. Utabiri wa Mauzo ya Baadaye
- 10. Ugunduzi wa Habari za Uongo
- 11. Utabiri wa Ununuzi wa Kuponi
- 12. Utabiri wa Churn ya Wateja
- 13. Utabiri wa Uuzaji wa Wallmart
- 14. Uchambuzi wa Data wa Uber
- 15. Uchambuzi wa Covid-19
- Hitimisho
Kujifunza kwa mashine ni utafiti rahisi wa jinsi ya kuelimisha programu ya kompyuta au algoriti ili kuboresha hatua kwa hatua kwenye kazi mahususi inayowasilishwa kwa kiwango cha juu. Utambuzi wa picha, ugunduzi wa ulaghai, mifumo ya mapendekezo na programu zingine za kujifunza kwa mashine tayari zimethibitishwa kuwa maarufu.
Ajira za ML hufanya kazi ya binadamu kuwa rahisi na yenye ufanisi, kuokoa muda na kuhakikisha matokeo ya ubora wa juu. Hata Google, injini ya utafutaji maarufu zaidi duniani, hutumia mashine kujifunza.
Kutoka kwa kuchanganua hoja ya mtumiaji na kubadilisha matokeo kulingana na matokeo hadi kuonyesha mada na matangazo yanayovuma kuhusiana na hoja, kuna chaguo mbalimbali zinazopatikana.
Teknolojia ambayo ni ya utambuzi na ya kujisahihisha haiko mbali katika siku zijazo.
Mojawapo ya njia kuu za kuanza ni kupata mikono na kubuni mradi. Kwa hivyo, tumekusanya orodha ya miradi 15 bora ya kujifunza mashine kwa wanaoanza ili uanze.
1. Titanic
Hii mara nyingi huchukuliwa kuwa mojawapo ya kazi kuu na ya kufurahisha zaidi kwa mtu yeyote anayetaka kujifunza zaidi kuhusu kujifunza kwa mashine. Changamoto ya Titanic ni mradi maarufu wa kujifunza kwa mashine ambao pia hutumika kama njia nzuri ya kufahamiana na jukwaa la sayansi ya data la Kaggle. Seti ya data ya Titanic imeundwa na data halisi kutoka kwa kuzama kwa meli iliyoharibika.
Inajumuisha maelezo kama vile umri wa mtu huyo, hali ya kijamii na kiuchumi, jinsia, nambari ya chumba cha kuhifadhia ndege, bandari ya kuondoka, na muhimu zaidi, ikiwa alinusurika!
Mbinu ya Jirani ya K-Karibu zaidi na kiaainishaji cha mti wa uamuzi zilidhamiriwa kutoa matokeo bora zaidi kwa mradi huu. Ikiwa unatafuta changamoto ya wikendi haraka ili kuboresha yako Uwezo wa Kujifunza kwa Mashine, hii kwenye Kaggle ni kwa ajili yako.
2. Uainishaji wa Maua ya Ireland
Wanaoanza wanapenda mradi wa kuainisha maua ya iris, na ni mahali pazuri pa kuanzia ikiwa wewe ni mgeni katika kujifunza kwa mashine. Urefu wa sepals na petals hufautisha maua ya iris kutoka kwa aina nyingine. Madhumuni ya mradi huu ni kutenganisha maua katika aina tatu: Virginia, setosa na Versicolor.
Kwa mazoezi ya uainishaji, mradi unatumia mkusanyiko wa data wa maua ya Iris, ambayo huwasaidia wanafunzi kujifunza misingi ya kushughulika na maadili ya nambari na data. Seti ya data ya maua ya iris ni ndogo ambayo inaweza kuhifadhiwa kwenye kumbukumbu bila hitaji la kuongeza.
3. Utabiri wa Bei ya Boston House
Mwingine anayejulikana seti ya data kwa wanaoanza katika kujifunza kwa mashine ni data ya Boston Housing. Lengo lake ni kutabiri maadili ya nyumbani katika vitongoji mbalimbali vya Boston. Inajumuisha takwimu muhimu kama vile umri, kiwango cha kodi ya mali, kiwango cha uhalifu, na hata ukaribu na vituo vya kazi, ambayo yote yanaweza kuathiri bei ya nyumba.
Seti ya data ni rahisi na ndogo, na kuifanya iwe rahisi kufanya majaribio kwa wanaoanza. Ili kujua ni mambo gani yanayoathiri bei ya mali huko Boston, mbinu za urekebishaji hutumika sana kwenye vigezo mbalimbali. Ni mahali pazuri pa kufanya mazoezi ya mbinu za urejeshi na kutathmini jinsi zinavyofanya kazi vizuri.
4. Upimaji wa Ubora wa Mvinyo
Mvinyo ni kinywaji kisicho kawaida cha pombe ambacho kinahitaji miaka ya kuchachushwa. Matokeo yake, chupa ya kale ya divai ni divai ya bei na ya juu. Kuchagua chupa bora ya divai kunahitaji ujuzi wa kuonja divai kwa miaka mingi, na inaweza kuwa mchakato wa kugonga au kukosa.
Mradi wa kupima ubora wa mvinyo hutathmini mvinyo kwa kutumia vipimo vya kemikali ya fizikia kama vile kiwango cha pombe, asidi isiyobadilika, msongamano, pH na vipengele vingine. Mradi pia huamua vigezo vya ubora wa mvinyo na kiasi. Matokeo yake, ununuzi wa divai unakuwa rahisi.
5. Utabiri wa Soko la Hisa
Mpango huu unavutia ikiwa unafanya kazi au hufanyi kazi katika sekta ya fedha. Data ya soko la hisa husomwa sana na wasomi, biashara, na hata kama chanzo cha mapato ya upili. Uwezo wa mwanasayansi wa data wa kusoma na kuchunguza data ya mfululizo wa saa pia ni muhimu. Data kutoka soko la hisa ni mahali pazuri pa kuanzia.
Kiini cha jitihada ni kutabiri thamani ya baadaye ya hisa. Hii inatokana na utendaji wa sasa wa soko pamoja na takwimu za miaka ya awali. Kaggle imekuwa ikikusanya data kwenye faharasa ya NIFTY-50 tangu 2000, na kwa sasa inasasishwa kila wiki. Tangu Januari 1, 2000, imekuwa na bei za hisa kwa zaidi ya mashirika 50.
6. Mapendekezo ya Filamu
Nina hakika umekuwa na hisia hiyo baada ya kuona filamu nzuri. Je, umewahi kuhisi msukumo wa kufurahisha hisia zako kwa kutazama sana filamu kama hizo?
Tunajua kuwa huduma za OTT kama vile Netflix zimeboresha mifumo yao ya mapendekezo kwa kiasi kikubwa. Kama mwanafunzi wa kujifunza mashine, utahitaji kuelewa jinsi algoriti kama hizo zinavyolenga wateja kulingana na mapendeleo na maoni yao.
Data ya IMDB iliyowekwa kwenye Kaggle huenda ikawa mojawapo ya mifano kamili zaidi, ikiruhusu miundo ya mapendekezo kukisiwa kulingana na mada ya filamu, ukadiriaji wa mteja, aina na vipengele vingine. Pia ni njia bora ya kujifunza kuhusu Uchujaji wa Maudhui na Uhandisi wa Vipengele.
7. Utabiri wa Kustahiki Mzigo
Dunia inazunguka kwenye mikopo. Chanzo kikuu cha faida cha benki kinatokana na riba ya mikopo. Kwa hivyo ni biashara yao ya msingi.
Watu binafsi au vikundi vya watu binafsi vinaweza tu kupanua uchumi kwa kuwekeza pesa kwenye kampuni kwa matumaini ya kuiona ikipanda thamani katika siku zijazo. Wakati mwingine ni muhimu kutafuta mkopo ili kuweza kuchukua hatari ya aina hii na hata kushiriki katika anasa fulani za kidunia.
Kabla ya mkopo kukubaliwa, benki kwa kawaida huwa na utaratibu madhubuti wa kufuata. Kwa vile mikopo ni kipengele muhimu sana cha maisha ya watu wengi, kutabiri kustahiki kwa mkopo ambao mtu anaomba kunaweza kuwa na manufaa makubwa, hivyo basi kuruhusu mipango bora zaidi ya kukubaliwa au kukataliwa kwa mkopo.
8. Uchambuzi wa Hisia kwa kutumia Data ya Twitter
Shukrani kwa mitandao ya kijamii kama Twitter, Facebook, na Reddit, maoni na mienendo ya ziada imekuwa rahisi sana. Habari hii hutumiwa kuondoa maoni juu ya hafla, watu, michezo na mada zingine. Maoni, mipango ya kujifunza mashine inayohusiana na uchimbaji madini inatumika katika mipangilio mbalimbali, ikiwa ni pamoja na kampeni za kisiasa na tathmini za bidhaa za Amazon.
Mradi huu utaonekana mzuri katika kwingineko yako! Kwa ugunduzi wa hisia na uchanganuzi unaotegemea kipengele, mbinu kama vile mashine za vekta tegemezi, urekebishaji, na algoriti za uainishaji zinaweza kutumika kwa mapana (kutafuta ukweli na maoni).
9. Utabiri wa Mauzo ya Baadaye
Wafanyabiashara na wafanyabiashara wakubwa wa B2C wanataka kujua ni kiasi gani kila bidhaa katika orodha yao itauzwa. Utabiri wa mauzo husaidia wamiliki wa biashara katika kuamua ni bidhaa zipi zinahitajika sana. Utabiri sahihi wa mauzo utapunguza upotevu kwa kiasi kikubwa huku pia ukibainisha athari za nyongeza kwenye bajeti za siku zijazo.
Wauzaji wa reja reja kama vile Walmart, IKEA, Big Basket, na Big Bazaar hutumia utabiri wa mauzo kukadiria mahitaji ya bidhaa. Ni lazima ufahamu mbinu mbalimbali za kusafisha data mbichi ili kuunda miradi kama hiyo ya ML. Pia, ufahamu mzuri wa uchanganuzi wa rejista, haswa urejeshaji rahisi wa laini, inahitajika.
Kwa aina hizi za kazi, utahitaji kuajiri maktaba kama vile Dora, Scrubadub, Pandas, NumPy, na zingine.
10. Ugunduzi wa Habari za Uongo
Ni juhudi nyingine ya kisasa ya kujifunza kwa mashine inayolenga watoto wa shule. Habari za uwongo zinaenea kama moto wa nyika, kama sisi sote tunajua. Kila kitu kinapatikana kwenye mitandao ya kijamii, kuanzia kuunganisha watu binafsi hadi kusoma habari za kila siku.
Kwa hivyo, kugundua habari za uwongo kumezidi kuwa ngumu siku hizi. Mitandao mingi mikubwa ya mitandao ya kijamii, kama vile Facebook na Twitter, tayari ina algoriti ili kugundua habari za uwongo katika machapisho na milisho.
Ili kutambua habari za uongo, aina hii ya mradi wa ML inahitaji uelewa kamili wa mbinu nyingi za NLP na kanuni za uainishaji (PassiveAggressiveClassifier au Naive Bayes classifier).
11. Utabiri wa Ununuzi wa Kuponi
Wateja wanazidi kufikiria kununua mtandaoni wakati virusi vya corona viliposhambulia sayari mwaka wa 2020. Kwa sababu hiyo, mashirika ya ununuzi yamelazimishwa kuhamisha biashara zao mtandaoni.
Wateja, kwa upande mwingine, bado wanatafuta matoleo mazuri, kama walivyokuwa kwenye maduka, na wanazidi kuwinda kuponi zinazookoa sana. Kuna hata tovuti zilizojitolea kuunda kuponi kwa wateja kama hao. Unaweza kujifunza kuhusu uchimbaji wa data katika kujifunza kwa mashine, kutengeneza grafu za pau, chati za pai, na histogramu ili kuibua data, na uhandisi wa kuangazia mradi huu.
Ili kutoa utabiri, unaweza pia kuangalia mbinu za uwekaji data za kudhibiti maadili ya NA na ufanano wa cosine wa vigeu.
12. Utabiri wa Churn ya Wateja
Wateja ni rasilimali muhimu zaidi ya kampuni, na kuitunza ni muhimu kwa biashara yoyote inayolenga kuongeza mapato na kujenga uhusiano wa muda mrefu nao.
Zaidi ya hayo, gharama ya kupata mteja mpya ni kubwa mara tano kuliko gharama ya kudumisha mteja aliyepo. Customer Churn/Attrition ni tatizo la biashara linalojulikana sana ambapo wateja au waliojisajili huacha kufanya biashara na huduma au kampuni.
Kwa hakika hawatakuwa tena mteja anayelipa. Mteja anachukuliwa kuwa amechanganyikiwa ikiwa imepita muda fulani tangu mteja alipowasiliana na kampuni mara ya mwisho. Kutambua iwapo mteja atayumba, na pia kutoa taarifa muhimu kwa haraka zinazolenga kudumisha wateja, ni muhimu ili kupunguza mvutano.
Akili zetu hazina uwezo wa kutarajia mauzo ya wateja kwa mamilioni ya wateja; hapa ndipo kujifunza kwa mashine kunaweza kusaidia.
13. Utabiri wa Uuzaji wa Wallmart
Mojawapo ya matumizi maarufu ya kujifunza kwa mashine ni utabiri wa mauzo, ambao unahusisha kutambua sifa zinazoathiri mauzo ya bidhaa na kutarajia kiasi cha mauzo ya baadaye.
Seti ya data ya Walmart, iliyo na data ya mauzo kutoka maeneo 45, inatumika katika utafiti huu wa kujifunza mashine. Mauzo kwa kila duka, kwa kategoria, kila wiki yanajumuishwa kwenye mkusanyiko wa data. Madhumuni ya mradi huu wa kujifunza kwa mashine ni kutarajia mauzo kwa kila idara katika kila duka ili waweze kufanya uboreshaji bora wa vituo vinavyoendeshwa na data na maamuzi ya kupanga orodha.
Kufanya kazi na seti ya data ya Walmart ni vigumu kwa kuwa ina matukio yaliyochaguliwa ambayo yana athari kwa mauzo na yanapaswa kuzingatiwa.
14. Uchambuzi wa Data ya Uber
Linapokuja suala la kutekeleza na kuunganisha kujifunza kwa mashine na kujifunza kwa kina katika programu zao, huduma maarufu ya kushiriki safari haiko nyuma. Kila mwaka, huchakata mabilioni ya safari, na kuruhusu wasafiri kusafiri wakati wowote wa mchana au usiku.
Kwa sababu ina msingi mkubwa wa wateja, inahitaji huduma ya kipekee kwa wateja ili kushughulikia malalamiko ya watumiaji haraka iwezekanavyo.
Uber ina seti ya data ya mamilioni ya picha ambazo inaweza kutumia kuchanganua na kuonyesha safari za wateja ili kufichua maarifa na kuboresha matumizi ya wateja.
15. Uchambuzi wa Covid-19
COVID-19 imeenea ulimwenguni leo, na sio tu kwa maana ya janga. Wakati wataalam wa matibabu wanazingatia kutoa chanjo bora na chanjo ya ulimwengu, wanasayansi wa data hawako nyuma.
Kesi mpya, idadi inayoendelea ya kila siku, vifo na takwimu za majaribio zote zinawekwa hadharani. Utabiri unafanywa kila siku kulingana na mlipuko wa SARS wa karne iliyopita. Kwa hili, unaweza kutumia uchanganuzi wa urekebishaji na usaidizi wa mifano ya utabiri wa msingi wa mashine ya vekta.
Hitimisho
Kwa muhtasari, tumejadili baadhi ya miradi kuu ya ML ambayo itakusaidia katika kujaribu programu ya Kujifunza Mashine pamoja na kufahamu mawazo na utekelezaji wake. Kujua jinsi ya kujumuisha Mafunzo ya Mashine kunaweza kukusaidia kusonga mbele katika taaluma yako kadri teknolojia inavyochukua nafasi katika kila tasnia.
Unapojifunza Kujifunza kwa Mashine, tunapendekeza kwamba ufanyie mazoezi dhana zako na uandike kanuni zako zote. Kuandika algoriti unapojifunza ni muhimu zaidi kuliko kutekeleza mradi, na pia hukupa faida katika kuelewa masomo vizuri.
Acha Reply