Nykyaikainen genetiikka on kehittänyt tehokkaan menetelmän nimeltä genomivalinta, joka hyödyntää kasvien ja eläinten genomien sisältämää tietoa jalostuksen parantamiseksi.
Genominen valinta mahdollistaa yksilön geneettisen potentiaalin ennustamisen halutuille ominaisuuksille, kuten taudin vastustuskyvylle, satolle tai laadulle, tutkimalla yksilöiden välisiä DNA-sekvenssieroja.
Nämä geneettiset tiedot auttavat tekemään tietoisempia päätöksiä, nopeuttamaan valintaprosessia ja luomaan tehokkaampia ja hedelmällisempiä jalostusohjelmia.
Tällä mielenkiintoisella genetiikan alueella koneoppiminen on luonut ihmeitä ja parantanut alaa. Perehdytään ja opitaan genomisen valinnan koneoppimisesta.
Mitä genominen valinta oikein on?
Genominen valinta on tekniikka, jota käytetään eläin- ja kasvinjalostuksessa yksilön suorituskyvyn ennustamiseen hänen geneettisen rakenteensa perusteella.
Se sisältää ihmisten DNA:n tarkastelun löytääkseen erityisiä merkkiaineita, jotka liittyvät haluttuihin ominaisuuksiin.
Tutkijat voivat määrittää henkilön geneettisen potentiaalin sellaisille piirteille kuin taudin vastustuskyky, sato tai laatu analysoimalla näitä markkereita koko genomista.
Kasvattajat voivat ennustaa jälkeläisten suorituskykyä tarkemmin genomisen valinnan ansiosta ilman aikaa vieviä ja kalliita fenotyyppiarviointeja.
Antamalla kasvattajille mahdollisuuden valita jalostusohjelmiin yksilöitä, joilla on paras geneettinen potentiaali, tämä menetelmä auttaa nopeuttamaan jalostusprosessia mahdollistamalla haluttujen ominaisuuksien tehokkaamman ja kohdistetumman vahvistamisen kasvi- ja eläinpopulaatioissa.
Kasvinjalostus genomisella valinnalla
Kasvinjalostus on kokenut vallankumouksen genomisen valinnan ansiosta, joka on nopeuttanut prosessia ja lisännyt satoja.
Mutta ilmastonmuutoksen aiheuttamien ongelmien ratkaisemiseksi tarvitaan lisää kehitystä.
Tämän ratkaisemiseksi tutkijat käyttävät pangenomeja ja huippuluokan koneoppimismenetelmiä genomisessa valinnassa.
Lajin koko genominen materiaali, joka tunnetaan myös nimellä pangenomi, mahdollistaa perinnöllisen vaihtelun perusteellisen ymmärtämisen.
Voimme avata tien sadon parantamiselle ja lieventää ilmastonmuutoksen haitallisia vaikutuksia maatalouteen tarkastelemalla esimerkkejä kasvinjalostuksesta, ymmärtämällä koneoppimisen rajoitteita ja korostamalla näiden tekniikoiden lupauksia.
Kasvien pangenomit: Genomisen monimuotoisuuden paljastaminen
Perinteisesti yhden referenssigenomikokoonpanot ovat olleet genomisen valinnan pääpaino, mutta pangenomit ovat nyt yleistymässä. Kasvien pangenomit yksittäisten genomikokoonpanojen sijaan heijastavat lajin tai perheen geneettistä materiaalia.
Ne paljastavat merkittäviä geenivariantteja, mukaan lukien ne, jotka eivät sisälly vertailukokoonpanoon. Useille viljelykasveille on luotu pangenomeja, jotka valaisevat kasvien kesytyksen ja jalostuksen historiaa.
Niiden yhdistelmä geneettisen valinnan kanssa on vielä vain osittain tehokas.
Kasvattajat voivat käyttää laajempaa valikoimaa geneettisiä markkereita, mikä parantaa ennusteen tarkkuutta ja vangitsee kaikki mahdolliset yhteydet yhdistämällä pangenomeja genomiseen valintaan.
Koneoppimiseen perustuva genominen valinta
Perinteisillä genomisen valinnan lähestymistavoilla on vaikeuksia puuttua ei-additiivisiin vaikutuksiin, kuten epistaasiin, genomiseen painamiseen ja genotyyppivuorovaikutuksiin. Simuloimalla näitä vaikutuksia koneoppimisen lähestymistavat tarjoavat toteuttamiskelpoisia vastauksia.
Viimeaikaiset tutkimukset ovat käyttäneet koneoppimismenetelmiä genomisessa valinnassa, ja tulokset vaihtelevat aineistojen ja satojen välillä.
Koneoppimisalgoritmit pystyvät käsittelemään monimutkaisia dataesityksiä, kuten sekafenotyyppejä ja fenotyyppien tai genotyyppien välisiä vuorovaikutuksia.
Koneoppimisalgoritmeja on käytetty esimerkiksi polyploidisten viljelykasvien, kuten mansikoiden ja mustikoiden, tuotannon ja hedelmien laatuominaisuuksien ennustamiseen.
Vaikka näillä järjestelmillä on suuri potentiaali, niiden tulkittavuuden ymmärtäminen ja hyperparametrien säätäminen ovat ratkaisevan tärkeitä tehokkaan sovelluksen kannalta.
Erilaiset koneoppimismenetelmät
Genomiennustetutkimuksissa koneoppimistekniikoiden käyttö lisääntyy. Nämä tekniikat voidaan jakaa ohjatun ja ohjaamattoman oppimisen tavoihin.
Ohjatun oppimisen menetelmät ovat erityisen hyödyllisiä, koska ne voivat löytää kuvioita merkittyjä tietoja ja ennakoida tuloksia.
Vaikka useat tutkimukset ovat tutkineet tiettyjen koneoppimislähestymistapojen ennustetehokkuutta, eri menetelmiä vertaileva tutkimus puuttuu.
On tärkeää ymmärtää, mitkä menetelmäryhmät toimivat paremmin, ja punnita niiden etuja ja haittoja perinteisiin tapoihin verrattuna.
Lupaavat genomisen ennustusmenetelmät
Lineaariset sekamallit
Perinteisessä ennustamisessa tavanomaiset lineaariset sekamallit ovat osoittautuneet luotettaviksi ja hyödyllisiksi. Populaatiossa esiintyvän geneettisen vaihtelun huomioon ottamiseksi nämä mallit yhdistävät sekä kiinteät että satunnaiset vaikutukset.
Nämä algoritmit voivat ennustaa tarkasti genomisen jalostusarvot ottamalla huomioon yksilöllisen sukulaisuuden.
Lineaarisia sekamalleja hyödynnetään laajasti kasvinjalostuksessa, laskentatehokkuutensa ja yksinkertaisuutensa vuoksi. Ne vaativat vähemmän viritysparametreja kuin muut lähestymistavat, mikä tekee niistä sopivia genomiseen valintaan.
Regularisoitu regressio
Genomin ennustamiseen säännöllisesti säädetyt regressiomenetelmät, kuten LASSO (Least Absolute Shrinkage and Selection Operator) ja harjaregressio, ovat tehokkaita työkaluja.
Nämä tekniikat mahdollistavat muuttujien valinnan ja regularisoinnin lisäämällä sakkotermin tavanomaiseen regressiomalliin.
Nämä menetelmät käsittelevät tehokkaasti korkeadimensionaalista dataa ja parantavat ennusteen tarkkuutta vähentämällä vähemmän merkittäviä markkereita kohti nollaa.
Säännölliset regressiotekniikat ovat houkuttelevia valintoja genomivalintaan sekä kasvi- että eläinjalostustutkimuksissa, koska ne tekevät kompromissin yksinkertaisuuden ja tehokkuuden välillä.
Satunnaiset metsät
Ensemble-oppimistekniikka, jota kutsutaan satunnaisiksi metsiksi, tekee ennusteita päätöspuiden avulla. Satunnaisia metsiä voidaan käyttää korkeaulotteisen genomisen datan arvioimiseen genomisen ennustamisen yhteydessä.
Tällä menetelmällä rakennetaan suuri määrä päätöspuita, joista jokainen on koulutettu satunnaiselle merkkien osajoukolle, ja niiden ennusteet yhdistetään yhdeksi ennusteeksi.
Satunnaiset metsät ovat hyödyllinen työkalu genomisen valinnassa, koska ne voivat tunnistaa monimutkaisia vuorovaikutuksia ja epälineaarisia korrelaatioita ominaisuuksien ja merkkiaineiden välillä.
Satunnaiset metsät ovat myös kestäviä poikkeaville arvoille ja voivat sisältää puuttuvan tiedon, mikä lisää niiden arvoa genomisen ennustamisessa.
ANN:t (keinotekoiset hermoverkot)
Keinotekoinen hermoverkkoihinANN:t tai hermoverkot ovat laskennallisia malleja, jotka saavat inspiraatiota ihmisaivojen hermoarkkitehtuurista.
Koska ANN:t pystyvät tunnistamaan monimutkaisia malleja ja suhteita tiedoissa, ne ovat yleistyneet geneettisessä ennustamisessa.
ANN:t voivat tallentaa epälineaarisia vuorovaikutuksia markkerien ja attribuuttien välillä monikerroksisen arkkitehtuurinsa ja toisiinsa liittyvien solmujen (neuronien) vuoksi. Nämä verkot tarvitsevat perusteellisen koulutuksen käyttämällä laajoja tietojoukkoja ja tiukkaa hyperparametrien säätöä.
Paljastamalla monimutkaisia geneettisiä linkkejä ja tunnistamalla piilotettuja malleja genomitiedoista ANN:illa on potentiaalia lisätä genomisen ennusteen tarkkuutta.
Datan tavoiteominaisuudet ja tärkeys
Tutkimukset osoittavat, että arvioitavilla tiedoilla ja kohdemääritteillä on vaikutusta koneoppimislähestymistapojen ennusteen suorituskykyyn ja laskentakustannuksiin.
Kuten voidaan havaita, monimutkaisuuden lisääminen perinteisiin laillistettuihin lähestymistapoihin voi johtaa suuriin laskentakustannuksiin ilman, että se välttämättä lisää ennusteen tarkkuutta.
Laskennallisen tehokkuuden investoinnit
Koska ennakoivan suorituskyvyn ja laskentataakan luottaminen kohdetietojoukkoon ja -attribuutteihin liittyy, on erittäin tärkeää investoida koneoppimisalgoritmien ja laskentaresurssien laskennallisen tehokkuuden parantamiseen.
Tämä auttaisi parantamaan genomisen valinnan tarkkuutta ja tehokkuutta.
Johtopäätös – mitä tulevaisuus tuo tullessaan?
Koneoppimisella genomivalinnassa näyttää olevan valoisa tulevaisuus. Koneoppimistekniikat voivat muuttaa geneettisen ennusteen täysin tekniikan kehittyessä ja tietokoneresurssien saatavuuden lisääntyessä.
Nämä menetelmät mahdollistavat korkean ulottuvuuden genomitietojen käsittelyn, monimutkaisten kuvioiden löytämisen ja ennustetarkkuuden lisäämisen.
Koneoppimisalgoritmien ja genomisen valinnan yhdistäminen mahdollistaa jalostusohjelmien parantamisen helpottamalla yksilöiden nopeampaa ja tarkempaa valintaa halutuilla ominaisuuksilla.
Näiden tekniikoiden parantamiseksi, laskennallisten ongelmien käsittelemiseksi ja niiden soveltamisen eri kasvi- ja eläinlajeihin tutkimiseksi tarvitaan lisää tutkimusta.
Odotamme koneoppimisen nousevan yhä tärkeämmäksi genomivalinnassa teknologian kehittyessä, mikä nopeuttaa geneettistä kehitystä ja auttaa maataloutta.
Jätä vastaus