Genetica modernă a dezvoltat o metodă puternică numită selecție genomică care utilizează datele conținute în genomul plantelor și animalelor pentru a îmbunătăți reproducerea.
Selecția genomică permite predicția potențialului genetic al unui individ pentru calitățile dorite, cum ar fi rezistența la boli, randamentul sau calitatea, prin examinarea diferențelor de secvență ADN între indivizi.
Aceste date genetice ajută la luarea unor decizii mai bine informate, la accelerarea procesului de selecție și la crearea unor programe de reproducere care sunt mai eficiente și mai fructuoase.
În acest domeniu interesant al geneticii, masina de învățare a făcut minuni și a îmbunătățit domeniul. Să ne aprofundăm și să învățăm despre învățarea automată în selecția genomică.
Ce este exact selecția genomică?
Selecția genomică este o tehnică folosită în ameliorarea animalelor și a plantelor pentru a prognoza performanța unui individ pe baza structurii sale genetice.
Aceasta implică analizarea ADN-ului oamenilor pentru a găsi anumiți markeri legați de caracteristicile dorite.
Cercetătorii pot determina potențialul genetic al unei persoane pentru caracteristici precum rezistența la boli, randamentul sau calitatea analizând acești markeri în întregul genom.
Crescătorii pot prognoza performanța descendenților cu mai multă precizie datorită selecției genomice, fără a fi nevoie de evaluări fenotipice costisitoare și consumatoare de timp.
Permițând crescătorilor să aleagă indivizi cu cel mai bun potențial genetic pentru programele de reproducere, această metodă ajută la accelerarea procesului de reproducere, permițând îmbunătățirea mai eficientă și concentrată a trăsăturilor dorite în populațiile de plante și animale.
Ameliorarea plantelor prin selecție genomică
Ameliorarea plantelor a suferit o revoluție datorită selecției genomice, care a accelerat procesul și a crescut randamentul culturilor.
Dar pentru a aborda problemele viitoare aduse de schimbările climatice, este nevoie de mai multă dezvoltare.
Pentru a rezolva acest lucru, cercetătorii folosesc pangenoame și abordări de ultimă oră de învățare automată în selecția genomică.
Întregul material genomic al unei specii, cunoscut și sub numele de pangenom, permite o înțelegere aprofundată a variației genetice.
Putem deschide calea pentru îmbunătățirea culturilor și atenuarea efectelor negative ale schimbărilor climatice asupra agriculturii, analizând exemple din ameliorarea culturilor, înțelegând constrângerile învățării automate și subliniind promisiunea acestor tehnici.
Pangenoame de plante: dezvăluirea diversității genomice
În mod tradițional, ansamblurile de genom cu o singură referință au fost punctul principal al selecției genomice, dar pangenomii devin acum din ce în ce mai răspândi. Pangenomul de plante, mai degrabă decât ansamblurile individuale de genom, reflectă materialul genetic al unei specii sau familie.
Variante semnificative ale genelor, inclusiv cele care nu sunt incluse în ansamblul de referință, sunt dezvăluite de acestea. Pentru mai multe culturi, s-au creat pangenoame, luminând istoria domesticirii și ameliorării plantelor.
Combinația lor cu selecția genetică este încă doar parțial eficientă.
Crescătorii pot folosi o varietate mai largă de markeri genetici, îmbunătățind acuratețea predicției și captând toate conexiunile potențiale, prin combinarea pangenomului în selecția genomică.
Selecția genomică bazată pe învățarea automată
Abordările tradiționale de selecție genomică au dificultăți în abordarea efectelor neaditive, cum ar fi epistasis, amprenta genomică și interacțiunile genotipului. Simulând aceste efecte, abordările de învățare automată oferă răspunsuri viabile.
Studii recente au folosit metode de învățare automată în selecția genomică, cu rezultate variind între seturi de date și culturi.
Algoritmi de învățare automată sunt capabili să gestioneze reprezentări complicate de date, cum ar fi fenotipuri mixte și interacțiuni între fenotipuri sau genotipuri.
De exemplu, algoritmii de învățare automată au fost utilizați pentru a prezice caracteristicile producției și calității fructelor în culturile poliploide, cum ar fi căpșunile și afinele.
Deși aceste sisteme au un potențial mare, înțelegerea interpretabilității lor și ajustarea hiperparametrilor sunt esențiale pentru o aplicare eficientă.
Diferite metode de învățare automată
În studiile de predicție genomică, utilizarea tehnicilor de învățare automată este în creștere. Aceste tehnici pot fi separate în moduri de învățare supravegheată și nesupravegheată.
Metodele de învățare supravegheată sunt deosebit de utile, deoarece pot descoperi modele în date etichetate și anticipați rezultatele.
În timp ce diverse studii au examinat eficiența predicției a abordărilor specifice de învățare automată, lipsesc cercetările care să compare diverse seturi de metode.
Este esențial să înțelegem care grupări de metode au rezultate mai bune și să le cântărim beneficiile și dezavantajele în comparație cu metodele convenționale.
Metode promițătoare de predicție genomică
Modele liniare mixte
În predicția genomică, modelele mixte liniare convenționale s-au dovedit a fi demne de încredere și utile. Pentru a ține seama de variația genetică a populației, aceste modele integrează atât efecte fixe, cât și aleatorii.
Acești algoritmi pot prezice cu exactitate valorile de reproducere genomică ținând cont de relația individuală.
Datorită performanței lor predictive competitive, eficienței de calcul și simplității, modelele mixte liniare sunt utilizate pe scară largă în creșterea plantelor și animalelor. Acestea necesită mai puțini parametri de reglare decât alte abordări, făcându-le potrivite pentru selecția genomică.
Regresia regularizată
Pentru predicția genomului, metodele de regresie regularizată, cum ar fi LASSO (Operator de contracție și selecție minimă absolută) și regresia crestei, sunt instrumente eficiente.
Aceste tehnici permit selecția și regularizarea variabilelor prin adăugarea unui termen de penalizare la modelul de regresie convențional.
Aceste metode gestionează eficient datele cu dimensiuni mari și îmbunătățesc precizia predicției prin reducerea markerilor mai puțin semnificativi spre zero.
Tehnicile de regresie regularizate sunt alegeri atrăgătoare pentru selecția genomică atât în studiile de reproducere a plantelor, cât și a animalelor, deoarece ajung la un compromis între simplitate și eficacitate.
Păduri aleatorii
O tehnică de învățare de ansamblu numită păduri aleatorii face predicții folosind arbori de decizie. Pădurile aleatorii pot fi folosite pentru a evalua datele genomice cu dimensiuni mari în contextul predicției genomice.
Cu această metodă, se construiesc un număr mare de arbori de decizie, fiecare antrenat pe un subset aleatoriu de markeri, iar predicțiile lor sunt combinate pentru a produce o singură prognoză.
Pădurile aleatorii sunt un instrument util pentru selecția genomică, deoarece pot identifica interacțiuni complexe și corelații neliniare între caracteristici și markeri.
Pădurile aleatorii sunt, de asemenea, rezistente la valori aberante și pot găzdui datele lipsă, ceea ce le crește valoarea pentru predicția genomică.
ANN (rețele neuronale artificiale)
Artificial rețele neuronale, denumite uneori ANN-uri sau rețele neuronale, sunt modele de calcul care se inspiră din arhitectura neuronală a creierului uman.
Datorită capacității lor de a recunoaște modele și relații complicate în date, ANN-urile au devenit din ce în ce mai frecvente în predicția genetică.
ANN-urile pot înregistra interacțiuni neliniare între markeri și atribute datorită arhitecturii lor multistrat și a nodurilor interconectate (neuroni). Aceste rețele au nevoie de o pregătire aprofundată, folosind seturi de date vaste și ajustare riguroasă a hiperparametrilor.
Prin dezvăluirea legăturilor genetice complexe și prin identificarea modelelor ascunse în datele genomice, ANN-urile au potențialul de a crește acuratețea predicției genomice.
Trăsăturile țintă și importanța datelor
Studiile arată că datele specifice și atributele țintă evaluate au un impact asupra performanței de predicție și a costurilor de calcul ale abordărilor de învățare automată.
După cum se poate observa, adăugarea de complexitate la abordările regularizate tradiționale poate duce la costuri de calcul mari, fără a crește neapărat precizia predicției.
Investiții în eficiență computațională
Având în vedere dependența de seturile de date și atributele țintă pentru performanța predictivă și sarcina de calcul, este esențial să se investească în îmbunătățirea eficienței de calcul a algoritmilor de învățare automată și a resurselor de calcul.
Acest lucru ar ajuta la îmbunătățirea preciziei și eficienței selecției genomice.
Concluzie – Ce ne rezervă viitorul?
Învățarea automată în selecția genomică pare să aibă un viitor strălucit. Tehnicile de învățare automată au potențialul de a schimba complet predicția genetică pe măsură ce tehnologia se dezvoltă și resursele computerizate devin mai disponibile pe scară largă.
Aceste metode permit manipularea datelor genomice cu dimensiuni mari, descoperirea unor modele complicate și o creștere a preciziei predicției.
Facilitând o selecție mai rapidă și mai precisă a indivizilor cu caracteristicile dorite, combinația de algoritmi de învățare automată cu selecția genomică oferă posibilitatea de a îmbunătăți programele de reproducere.
Pentru a îmbunătăți aceste tehnici, a trata problemele de calcul și a investiga aplicarea lor la diferite specii de plante și animale, sunt necesare mai multe studii.
Ne așteptăm ca învățarea automată să devină din ce în ce mai importantă în selecția genomică pe măsură ce tehnologia se dezvoltă, accelerând rata progresului genetic și asistând sectorul agricol.
Lasă un comentariu