Šiuolaikinė genetika sukūrė galingą metodą, vadinamą genomine atranka, kuris naudoja duomenis, esančius augalų ir gyvūnų genomuose, kad pagerintų veisimą.
Genominė atranka leidžia numatyti individo genetinį potencialą norimoms savybėms, tokioms kaip atsparumas ligoms, derlius ar kokybė, tiriant individų DNR sekos skirtumus.
Šie genetiniai duomenys padeda priimti labiau pagrįstus sprendimus, pagreitinti atrankos procesą ir sukurti efektyvesnes bei vaisingesnes veisimo programas.
Šioje įdomioje genetikos srityje mašininis mokymasis kūrė stebuklus ir tobulina lauką. Pasigilinkime ir sužinokime apie mašininį mokymąsi genominėje atrankoje.
Kas tiksliai yra genomo atranka?
Genominė atranka yra gyvūnų ir augalų veisime naudojama technika, skirta prognozuoti individo veiklą pagal jų genetinę sandarą.
Tai apima žmonių DNR peržiūrą, kad būtų galima rasti konkrečius žymenis, susijusius su pageidaujamomis savybėmis.
Tyrėjai gali nustatyti žmogaus genetinį potencialą tokioms ypatybėms kaip atsparumas ligoms, derlius ar kokybė, analizuodami šiuos žymenis visame genome.
Genominės atrankos dėka veisėjai gali tiksliau prognozuoti palikuonių našumą, nereikalaujant daug laiko reikalaujančių ir brangių fenotipinių vertinimų.
Leisdamas selekcininkams veisimo programoms pasirinkti asmenis, turinčius geriausią genetinį potencialą, šis metodas padeda pagreitinti veisimosi procesą, leidžiant efektyviau ir kryptingiau stiprinti norimas augalų ir gyvūnų populiacijų savybes.
Augalų veisimas genominės atrankos būdu
Augalininkystė patyrė revoliuciją dėl genominės selekcijos, kuri pagreitino procesą ir padidino pasėlių derlių.
Tačiau norint išspręsti kylančias problemas, kurias sukelia klimato kaita, reikia daugiau plėtros.
Norėdami tai išspręsti, tyrėjai naudoja pangenomas ir pažangiausius mašininio mokymosi metodus genomo atrankoje.
Visa rūšies genominė medžiaga, dar vadinama pangenoma, leidžia nuodugniai suprasti genetinę variaciją.
Galime atverti kelią pasėlių gerinimui ir sušvelninti žalingą klimato kaitos poveikį žemės ūkiui, žiūrėdami į pasėlių auginimo pavyzdžius, suprasdami mašininio mokymosi suvaržymus ir pabrėždami šių metodų žadą.
Augalų Pangenomai: Genominės įvairovės atskleidimas
Tradiciškai vienos nuorodos genomo rinkiniai buvo pagrindinis genomo atrankos akcentas, tačiau dabar pangenomos tampa vis labiau paplitusios. Augalų pangenomos, o ne atskiri genomo rinkiniai, atspindi rūšies ar šeimos genetinę medžiagą.
Jie atskleidžia reikšmingus genų variantus, įskaitant tuos, kurie nėra įtraukti į atskaitos rinkinį. Kelioms kultūroms buvo sukurtos pangenomos, nušviečiančios augalų prijaukinimo ir veisimo istoriją.
Jų derinys su genetine atranka dar tik iš dalies veiksmingas.
Veisėjai gali naudoti įvairesnius genetinius žymenis, pagerindami prognozavimo tikslumą ir užfiksuodami visus galimus ryšius, derindami pangenomas į genominę atranką.
Genominis pasirinkimas, pagrįstas mašininiu mokymusi
Tradiciniai genomo atrankos metodai turi sunkumų sprendžiant neaddityvius efektus, tokius kaip epistazė, genomo įspaudas ir genotipo sąveika. Modeliuodami šiuos poveikius, mašininio mokymosi metodai pateikia perspektyvius atsakymus.
Naujausiuose tyrimuose genomo atrankoje buvo naudojami mašininio mokymosi metodai, kurių rezultatai svyravo tarp duomenų rinkinių ir pasėlių.
Mašininio mokymosi algoritmai gali tvarkyti sudėtingus duomenų pateikimus, tokius kaip mišrūs fenotipai ir fenotipų ar genotipų sąveika.
Pavyzdžiui, mašininio mokymosi algoritmai buvo naudojami norint numatyti poliploidinių kultūrų, tokių kaip braškės ir mėlynės, produkcijos ir vaisių kokybės ypatybes.
Nors šios sistemos turi didelį potencialą, norint veiksmingai taikyti, labai svarbu suprasti jų aiškinamumą ir koreguoti hiperparametrus.
Įvairūs mašininio mokymosi metodai
Atliekant genomo numatymo tyrimus, mašininio mokymosi metodų naudojimas auga. Šiuos metodus galima suskirstyti į prižiūrimo ir neprižiūrimo mokymosi būdus.
Prižiūrimo mokymosi metodai yra ypač naudingi, nes juose galima atrasti modelius pažymėti duomenys ir numatyti rezultatus.
Nors įvairiuose tyrimuose buvo nagrinėjamas konkrečių mašininio mokymosi metodų prognozavimo efektyvumas, trūksta tyrimų, lyginančių įvairius metodų rinkinius.
Labai svarbu suprasti, kurios metodų grupės veikia geriau, ir pasverti jų privalumus bei trūkumus, palyginti su įprastais būdais.
Perspektyvūs genomo numatymo metodai
Linijiniai mišrūs modeliai
Genomo prognozavimo srityje įprasti linijiniai mišrūs modeliai pasirodė esąs patikimi ir naudingi. Siekiant atsižvelgti į genetinius populiacijos pokyčius, šie modeliai integruoja ir fiksuotus, ir atsitiktinius efektus.
Šie algoritmai gali tiksliai numatyti genomo veisimo vertes, atsižvelgiant į individualų ryšį.
Dėl konkurencingo nuspėjimo, skaičiavimo efektyvumo ir paprastumo linijiniai mišrūs modeliai plačiai naudojami augalų ir gyvūnų veisime. Jie reikalauja mažiau derinimo parametrų nei kiti metodai, todėl jie tinka genomo atrankai.
Sureguliuota regresija
Genomo prognozavimui reguliarūs regresijos metodai, tokie kaip LASSO (mažiausias absoliutus susitraukimo ir atrankos operatorius) ir keteros regresija, yra veiksmingos priemonės.
Šie metodai leidžia pasirinkti ir sureguliuoti kintamąjį, pridedant baudos terminą prie įprastinio regresijos modelio.
Šie metodai efektyviai apdoroja didelio matmens duomenis ir padidina numatymo tikslumą sumažindami mažiau reikšmingus žymenis iki nulio.
Reguliarios regresijos metodai yra patrauklūs genominės atrankos pasirinkimai tiek augalų, tiek gyvūnų veisimo tyrimuose, nes jie randa kompromisą tarp paprastumo ir efektyvumo.
Atsitiktiniai miškai
Ansamblinio mokymosi technika, vadinama atsitiktiniais miškais, prognozuoja naudojant sprendimų medžius. Atsitiktiniai miškai gali būti naudojami didelės apimties genominiams duomenims įvertinti genomo prognozavimo kontekste.
Taikant šį metodą, sukuriama daug sprendimų medžių, kurių kiekvienas apmokytas atsitiktiniu žymeklių pogrupiu, o jų prognozės sujungiamos, kad būtų sudaryta viena prognozė.
Atsitiktiniai miškai yra naudingas genomo atrankos įrankis, nes jie gali nustatyti sudėtingą sąveiką ir netiesinę charakteristikų ir žymenų koreliaciją.
Atsitiktiniai miškai taip pat yra atsparūs nuokrypiams ir gali apimti trūkstamus duomenis, o tai padidina jų vertę genominiam prognozavimui.
ANN (dirbtiniai neuroniniai tinklai)
Dirbtinis neuroniniai tinklai, kartais vadinami ANN arba neuroniniais tinklais, yra skaičiavimo modeliai, kurie semiasi įkvėpimo iš žmogaus smegenų neuroninės architektūros.
Dėl savo gebėjimo atpažinti sudėtingus duomenų modelius ir ryšius, ANN tampa vis labiau paplitę genetinėse prognozėse.
ANN gali įrašyti netiesinę žymenų ir atributų sąveiką dėl savo daugiasluoksnės architektūros ir tarpusavyje sujungtų mazgų (neuronų). Šiuos tinklus reikia nuodugniai apmokyti naudojant didžiulius duomenų rinkinius ir griežtą hiperparametrų reguliavimą.
Atskleisdami sudėtingus genetinius ryšius ir nustatydami paslėptus genominių duomenų modelius, ANN gali padidinti genomo prognozavimo tikslumą.
Tikslinės savybės ir duomenų svarba
Tyrimai rodo, kad konkretūs vertinami duomenys ir tiksliniai atributai turi įtakos mašininio mokymosi metodų prognozavimo našumui ir skaičiavimo išlaidoms.
Kaip galima pastebėti, tradicinių reguliarių metodų sudėtingumas gali sukelti didelių skaičiavimo išlaidų, nebūtinai padidinant numatymo tikslumą.
Skaičiavimo efektyvumo investicijos
Atsižvelgiant į tai, kad nuspėjamas našumas ir skaičiavimo našta priklauso nuo tikslinių duomenų rinkinių ir atributų, labai svarbu investuoti į mašininio mokymosi algoritmų ir skaičiavimo išteklių skaičiavimo efektyvumo gerinimą.
Tai padėtų pagerinti genominės atrankos tikslumą ir efektyvumą.
Išvada – kokia ateitis?
Atrodo, kad mašininis mokymasis genominėje atrankoje turi šviesią ateitį. Mašininio mokymosi metodai gali visiškai pakeisti genetinį prognozavimą, kai technologija vystosi ir kompiuterių ištekliai tampa vis plačiau prieinami.
Šie metodai leidžia tvarkyti didelės apimties genomo duomenis, atrasti sudėtingus modelius ir padidinti prognozavimo tikslumą.
Palengvinus greitesnę ir tikslesnę norimų savybių turinčių individų atranką, mašininio mokymosi algoritmų ir genomo atrankos derinys suteikia galimybę tobulinti veisimo programas.
Norint patobulinti šiuos metodus, spręsti skaičiavimo problemas ir ištirti jų taikymą skirtingoms augalų ir gyvūnų rūšims, reikia atlikti daugiau tyrimų.
Tikimės, kad mašininis mokymasis taps vis svarbesnis genominėje atrankoje, kai tobulėja technologija, paspartins genetinės pažangos greitį ir padėdamas žemės ūkio sektoriui.
Palikti atsakymą