Em şahidê şoreşek mezin a AI-yê ne!
Her roj em serîlêdanek nû digirin ku xwedan kapasîteyên ecêb e. Digel gelek sepan û bernameyên ku AI û fêrbûna makîneyê bikar tînin dikevin jiyana me; divê em bêtir wext bidin ku van tiştan hîn bibin.
Di vê postê de, em ê lêkolîn bikin fêrbûna makîneyê Bi kite kit. Di heman demê de, em ê bi taybetî li ser mijarên Perwerdehiya Fêrbûna Makîneyê û Encamê bisekinin.
Ka em bi bingehîn dest pê bikin.
Fêrbûna Machine i ye?
Gelek caran em dibînin ku têgînên "hînbûna makîneyê" û "îstîxbarata hunerî" bi hev re têne bikar anîn. Ji ber vê yekê, em pêşî wê yekê zelal bikin. Fêrbûna makîneyê şaxek îstîxbarata sûnî ye. Ew algorîtmayên perwerdehiyê vedihewîne da ku pêşbîniyên an vebijarkên dane-rêveber hilberîne.
Wekî din, ew dihêle pergalên ku li ser bingeha ezmûnên berê bixweber performansa xwe zêde bikin.
Intelligence intelligence, ji aliyê din ve teqlîda aqilê mirovan e. Ji ber vê yekê, komputer têne wateya ku wekî mirovan bifikirin û tevbigerin. Ew gelek bineqadên wekî fêrbûna makîneyê, dîtina komputerê, û pêvajoya zimanê xwezayî pêk tîne.
Pêşxistina Modelên Fêrbûna Makîneyê
Modela fêrbûna makîneyê algorîtmayek e. Em van algorîtmayan diafirînin ku bixweber bi fêrbûna daneyê performansê zêde bikin. Em wan bikar tînin da ku daneyên têketinê lêkolîn bikin, encamên pêşerojê pêşbîn bikin, an dadbar bikin.
Ka em mînakekê bidin. Ji bo kategorîzekirina wêneyan wekî kulîlk an pisîk in, modelek dikare were perwerde kirin ku wêneyan nas bike.
Û, ew dikare biryar bide ka wêneyê kulîlk an pisîk e. Prensîba sereke ya fêrbûna makîneyê ev e ku performansa modelê divê bi domdarî were baştir kirin. Pêdivî ye ku ew bi guheztina parametreyên di daneyê de baş bertek nîşan bide.
Bi piranî, em vê perwerdehiya fêrbûna makîneyê li ser dikin Jupyter Notebook, ku amûrek fantastîk e ji bo projeya têkildarî her daneyê.
Perwerdehiya Modelê
Pêvajoya hînkirina algorîtmayek ji bo çêkirina pêşbîniyan an kirina çalakiyan li ser bingeha daneyên têketinê wekî "perwerde" tê binav kirin. Di dema perwerdehiyê de, pîvanên pergalê têne guhertin da ku algorîtma kar bike. Di dawiyê de, em hewl didin ku pêşbîniyên rastîn li ser daneyên nû-nû çêbikin.
Çavdêrî û fêrbûna bêpergal du kategoriyên bingehîn ên fêrbûna makîneyê ne.
Fêrbûna Çavdêr
Daneyek nîşankirî tê bikar anîn da ku algorîtmayê di fêrbûna çavdêriyê de perwerde bike. Di vê celeb fêrbûna makîneyê de, ji bo her têketinê encama hêvîkirî tête diyar kirin. Algorîtma li ser daneyên nû pêşbîniyan dike. Di heman demê de, ew bi karanîna vê agahiyê têkiliyên di navbera ketin û derketinan de fêr dibe.
Ji ber ku modêl çavdêriya li ser encamên xwestinê werdigire, ev celeb fêrbûnê wekî "çavdêrî" tê binav kirin.
Serîlêdanên wekî naskirina axaftinê, tesnîfkirina wêneyê, û pêvajoya zimanê xwezayî hemî fêrbûna çavdêriyê bikar tînin. Di van serîlêdanan de, algorîtma li ser danûstendinên mezin ên nîşankirî têne perwerde kirin. Ji ber vê yekê, em dikarin daneyên nû, nepêşbînîkirî pêşbîn bikin.
Di heman demê de, nexşeyên ketin-derketinê divê fêr bibin ku bi qasî ku pêkan rast bin.
Dîtina nexşeya herî rast a di navbera ketin û derketinan de armanca fêrbûna çavdêrî ye.
Fêrbûna Bêserûber
Fêrbûna bêserûber beşek ji fêrbûna makîneyê ye. Em algorîtmayê li ser danûstendinek bê nîşankirî perwerde dikin. Ji ber vê yekê, model di nav daneyan de qalib an pêwendiyan kifş dikin. Ne hewce ye ku em bi taybetî diyar bikin ka divê çi encam bin. Ev cureyê fêrbûnê wekî "bê çavdêrî" tê binav kirin. Ev ji ber vê yekê ye ku modêl rêbernameyek eşkere li ser wê yekê werdigire ku divê encam çi bin.
Serîlêdanên mîna vedîtina anomalî, komkirin, û kêmkirina dimensîyonê fêrbûna bêserûber hewce dike. Di van serîlêdanan de, divê algorîtm di daneyan de qalib an hevgirêdan nas bike. Û, ew bêyî rêwerzek eşkere ye piştî ku li ser nimûneyek daneya bêlabelkirî hatî perwerde kirin.
Fêrbûna neçavdêrîkirî armanc dike ku nimûne an strukturên veşartî kifş bike. Em dikarin wê di cûrbecûr karan de bikar bînin, wek berhevkirina daneyan an komkirina tiştên mîna hev.
Optimîzasyona Fêrbûna Makîneyê
Pêvajoya xweşbîniyê di avakirina modelek fêrbûna makîneyê de pêdivî ye. Armanca xweşbîniyê ew e ku cûdahiya di navbera pêşbîniyên modelê û nirxên rastîn ên di daneyên perwerdehiyê de kêm bike.
Ev pêvajo di fêrbûna girêdanên di navbera ketin û derkan de ji modelê re dibe alîkar. Ji ber vê yekê, em dikarin pêşbîniyên herî rast ên gengaz bistînin.
Bi kêmkirina xeletiyê, dibe ku model bi daneyên nû, yên berê nenas re çêtir giştî bike. Ji ber vê yekê, ew dikare pêşbîniyên bihêztir û pêbawer hilberîne.
Di fêrbûna makîneyê de, pêvajoya xweşbîniyê bi karanîna algorîtmayên wekî daketina gradient pêk tê. Ji ber vê yekê, algorîtmaya me bi domdarî pîvanan eyar dike heya ku xeletî kêm bibe. Pêvajoya optimîzasyonê ji bo ku pêşbîniyên modelê rast bin hewce ye.
Daneyên Perwerdehiya Fêrbûna Makîneyê
Daneyên perwerdehiyê komek daneyan e ku ji bo perwerdekirina a tê bikar anîn modela fêrbûna makîneyê. Em modelê perwerde dikin ka meriv çawa pêşbîniyan bi nîşandana nimûneyên ketin û encaman çêdike. Li ser bingeha vê daneya perwerdehiyê, model parametreya xwe diguhezîne.
Ji ber vê yekê, rastbûna pêşbîniyên wê bi karanîna danûstendinek cihêreng, berhevoka pejirandinê tê nirxandin.
Divê berhevoka perwerdehiyê pirsgirêka ku tê çareser kirin nîşan bide. Û, pêdivî ye ku ew têr daneyên têr hebe ku modela bi têr perwerde bike. Dibe ku pêşbîniyên modelê nerast bin heke daneya perwerdehiyê pir piçûk be.
An jî, dibe ku ew ne pir nûner be. Wekî encamek, pêş-pêvajoya berfireh a databasa perwerdehiyê pêdivî ye. Ji ber vê yekê, em dikarin garantî bikin ku modela serfiraziya herî bilind e.
Mînakek Perwerdehiyê:
Ka em mînakek bidin ku pêvajoya perwerdehiyê fêm bikin.
Di vê nimûneyê de, em texmîn dikin ku me databasek bi navê "music.csv" heye. Nirxên wê yên zayendî, temen û celebê hene. Ji ber vê yekê, ew pêşbînî dike ku kesek li gorî temen û zayenda xwe li kîjan celeb muzîkê guhdarî dike.
Ev koda Python e ji bo perwerdehiyek fêrbûna makîneya hêsan a ku bi karanîna pirtûkxaneya scikit-learn bikar tîne: Nêzîkatiya paşveçûna lojîstîkî di vê kodê de tê bikar anîn da ku modelek li ser daneyê perwerde bike û dûv re rastbûna wê li ser daneyên ceribandinê binirxîne.
Daneyên destpêkê di çarçoveya daneya pandas de têne danîn berî ku di nav taybetmendiyên (X) û hedefan (Y) (y) de bêne dabeş kirin. Dûv re, dane li komên perwerdehî û ceribandinê têne dabeş kirin, ku 80% daneyê ji bo perwerdehiyê û 20% ji bo ceribandinê tê bikar anîn. Dûv re model li ser daneyên perwerdehiyê berî ku li ser daneyên ceribandinê were ceribandin tê perwerde kirin.
Encam di Fêrbûna Makîneyê de
Pêvajoya karanîna modelek perwerdekirî ji bo çêkirina pêşbîniyên li ser daneyên nû wekî encam tê binav kirin.
Bi awayekî din, ew serîlêdana agahdariya ku di dema perwerdehiyê de hatî bidestxistin e. Model daneyên nû distîne û li gorî şêwazên ku di daneya perwerdehiyê de keşif kiriye pêşbîniyek an dadwerek çêdike.
Pêşbîniyên modelê dê li gorî kalîteya daneyên perwerdehiyê rast bin. Di heman demê de, ew ê bi mîmariya modela bijartî, û teknîkên ku ji bo perwerdekirina modelê têne bikar anîn ve girêdayî be.
Di serlêdanan de girîngiya encamgirtinê
Di encamnameyê de, em digihîjin modelê ku ji bo armancek taybetî encamên peyda bike. Ev dikarin wekî dabeşkirina wêneyê, pêvajoya zimanê xwezayî, an pergalên pêşniyarê cûda bibin. Rastbûna pêngava encamgirtinê bandorek rasterast li ser tevahiya performansa pergalê heye.
Ew ji bo pêkanîna rastîn a modelên fêrbûna makîneyê di serîlêdanên cîhana rastîn de krîtîk e.
Ketina daneyên nû, nenas
Pêvajoya encamgirtinê di fêrbûna makîneyê de bi lêzêdekirina daneyên nû li modelê dest pê dike. Pêdivî ye ku ev dane pêş-pêvajoyê were kirin da ku bi forma têketinê ya ku ji bo perwerdekirina modelê tê bikar anîn li hev bike.
Pêşbîniyên li ser şêwazên fêrbûyî
Dûv re model daneyên têketinê bikar tîne da ku li ser bingeha şêwazên fêrbûyî yên daneyên perwerdehiyê pêşbîniyan bike. Rastiya pêşbîniyan bi kalîteya daneya perwerdehiyê û teknîkên ku têne bikar anîn ve girêdayî ye.
Mînakek Encamê:
Wek mînaka berê; em ê pêşî daneyan perwerde bikin û dûv re encamnameyê bicîh bînin. Di vê rewşê de, me li şûna LogisticRegression RandomForestClassifier bikar aniye.
Em dîsa di Python de pêşbîniyan bi karanîna amûra sci-kit-learn hilberînin. Bifikirin ku me modelek perwerde kiriye û danehevek bi navê X test heye ku em dixwazin li ser wê pêşbîniyan bikin.
Ev kod li ser testa daneya testê X-ê bi karanîna fonksiyona pêşbîniya modela perwerdekirî pêşbînî dike. Dûv re pêşbîn di çarçoveyek daneyê de têne tomar kirin, bi pênc yekem têne xuyang kirin.
Inference Performance Faktorên Bandora
Gelek hêmanên girîng di fêrbûna makîneyê de bandorê li performansa encamdanê dikin.
Leza qonaxa Inference
Leza encamgirtinê fikarek girîng e ji ber ku ew rasterast bandorê li performansa pergalê dike. Demên encamdana zûtir dikare rê bide biryargirtin an pêşbîniya zûtir. Di heman demê de, ew bikêrhatina modelê zêde dike.
Rastiya pêşbîniyê
Parçeyek din a bingehîn rastbûna pêşbîniyên ku di dema encamdanê de hatine afirandin e. Ji ber ku armanca modelê ew e ku encamên ku bi qasî ku pêkan nêzî nirxên rastîn in peyda bike. Rastiya hilberîna modelê bi kalîteya daneyên perwerdehiyê ve girêdayî ye.
Di heman demê de, ew bi mîmariya modelê re pir têkildar e.
Girîngiya xweşbînkirina qonaxa encamdanê
Ji ber girîngiya bilez û rastbûna encamdanê, girîng e ku meriv pêvajoya encamdanê ji bo encamên bikêr xweştir bike. Dibe ku ev stratejiyên mîna piçûkkirina mezinahiya modelê pêk bîne. An jî, hûn dikarin bilezkirina hardware-yê bi kar bînin, an jî pêvajoyên hilberandina daneya têketinê baştir bikin.
Xelasî
Di dawiyê de, di fêrbûna makîneyê de, perwerdehî, û encamgirtin pêvajoyên krîtîk in. Pêdivî ye ku em xwediyê zanîn û şiyanên taybetî bin ku wan bi bandor bi cih bînin. Perwerde rê dide modelê ku pêşbîniyan bike, lê encam dihêle ku model li ser bingeha daneyên nû pêşbîniyan bike.
Her du jî di diyarkirina serkeftin û rastbûna modelê de rolek girîng dilîzin. Ji ber vê yekê, di projeya xweya paşîn de wan di hişê xwe de bigirin!
Leave a Reply