La genetica moderna ha sviluppato un potente metodo chiamato selezione genomica che utilizza i dati contenuti nei genomi di piante e animali per migliorare la riproduzione.
La selezione genomica consente la previsione del potenziale genetico di un individuo per le qualità desiderate, come la resistenza alle malattie, la resa o la qualità, esaminando le differenze di sequenza del DNA tra gli individui.
Questi dati genetici aiutano a prendere decisioni più informate, accelerare il processo di selezione e creare programmi di allevamento più efficaci e fruttuosi.
In questa interessante area della genetica, machine learning ha creato meraviglie e valorizzato il campo. Approfondiamo e impariamo a conoscere l'apprendimento automatico nella selezione genomica.
Cos'è esattamente la selezione genomica?
La selezione genomica è una tecnica utilizzata nell'allevamento di animali e piante per prevedere le prestazioni di un individuo in base al suo corredo genetico.
Si tratta di esaminare il DNA delle persone per trovare marcatori particolari collegati a caratteristiche desiderabili.
I ricercatori possono determinare il potenziale genetico di una persona per caratteristiche come la resistenza alle malattie, la resa o la qualità analizzando questi marcatori nell'intero genoma.
Gli allevatori possono prevedere le prestazioni della prole in modo più accurato grazie alla selezione genomica senza la necessità di valutazioni fenotipiche lunghe e costose.
Consentendo agli allevatori di scegliere individui con il miglior potenziale genetico per i programmi di allevamento, questo metodo aiuta ad accelerare il processo di allevamento consentendo un miglioramento più efficace e mirato dei tratti desiderati nelle popolazioni vegetali e animali.
Coltivazione vegetale tramite selezione genomica
Il miglioramento genetico delle piante ha subito una rivoluzione grazie alla selezione genomica, che ha accelerato il processo e aumentato i raccolti.
Ma per affrontare i problemi imminenti causati dal cambiamento climatico, è necessario più sviluppo.
Per risolvere questo problema, i ricercatori stanno utilizzando pangenomi e approcci di apprendimento automatico all'avanguardia nella selezione genomica.
L'intero materiale genomico di una specie, noto anche come pangenoma, consente una comprensione completa della variazione genetica.
Possiamo aprire la strada al miglioramento delle colture e mitigare gli effetti dannosi del cambiamento climatico sull'agricoltura osservando esempi tratti dall'allevamento delle colture, comprendendo i vincoli dell'apprendimento automatico ed evidenziando la promessa di queste tecniche.
Pangenomi delle piante: rivelare la diversità genomica
Tradizionalmente, gli assemblaggi del genoma a riferimento singolo sono stati l'obiettivo principale della selezione genomica, ma ora i pangenomi stanno diventando più diffusi. I pangenomi delle piante, piuttosto che le singole assemblee del genoma, riflettono il materiale genetico di una specie o di una famiglia.
Esse rivelano varianti geniche significative, comprese quelle non incluse nell'insieme di riferimento. Per diverse colture sono stati creati pangenomi, illuminando la storia dell'addomesticamento e dell'allevamento delle piante.
La loro combinazione con la selezione genetica è ancora solo parzialmente efficace.
Gli allevatori possono utilizzare una più ampia varietà di marcatori genetici, migliorando l'accuratezza della previsione e catturando tutte le potenziali connessioni, combinando i pangenomi nella selezione genomica.
Selezione genomica basata sull'apprendimento automatico
Gli approcci tradizionali di selezione genomica hanno difficoltà nell'affrontare effetti non additivi come l'epistasi, l'imprinting genomico e le interazioni genotipiche. Simulando questi impatti, gli approcci di apprendimento automatico forniscono risposte valide.
Studi recenti hanno utilizzato metodi di apprendimento automatico nella selezione genomica, con risultati che vanno da set di dati a colture.
Algoritmi di apprendimento automatico sono in grado di gestire complicate rappresentazioni di dati, come fenotipi misti e interazioni tra fenotipi o genotipi.
Ad esempio, sono stati utilizzati algoritmi di apprendimento automatico per prevedere le caratteristiche di produzione e qualità della frutta in colture poliploidi come fragole e mirtilli.
Sebbene questi sistemi abbiano un grande potenziale, la comprensione della loro interpretabilità e la regolazione degli iperparametri sono fondamentali per un'applicazione efficace.
Diversi metodi di apprendimento automatico
Negli studi di previsione genomica, l'uso di tecniche di apprendimento automatico è in crescita. Queste tecniche possono essere separate in modi per l'apprendimento supervisionato e non supervisionato.
I metodi di apprendimento supervisionato sono particolarmente utili poiché possono scoprire modelli in dati etichettati e anticipare i risultati.
Mentre vari studi hanno esaminato l'efficacia della previsione di specifici approcci di apprendimento automatico, mancano ricerche che confrontino diversi insiemi di metodi.
È fondamentale capire quali gruppi di metodi funzionano meglio e valutare i loro vantaggi e svantaggi rispetto ai metodi convenzionali.
Promettenti metodi di previsione genomica
Modelli misti lineari
Nella previsione genomica, i modelli misti lineari convenzionali si sono dimostrati affidabili e utili. Per tenere conto della variazione genetica nella popolazione, questi modelli integrano sia effetti fissi che casuali.
Questi algoritmi possono prevedere con precisione i valori di riproduzione genomica tenendo conto della parentela individuale.
A causa delle loro prestazioni predittive competitive, dell'efficienza computazionale e della semplicità, i modelli misti lineari sono ampiamente utilizzati nell'allevamento di piante e animali. Richiedono meno parametri di regolazione rispetto ad altri approcci, rendendoli adatti alla selezione genomica.
Regressione regolarizzata
Per la previsione del genoma, i metodi di regressione regolarizzata come LASSO (Least Absolute Shrinkage and Selection Operator) e la regressione della cresta sono strumenti efficaci.
Queste tecniche consentono la selezione e la regolarizzazione delle variabili aggiungendo un termine di penalità al modello di regressione convenzionale.
Questi metodi gestiscono in modo efficiente dati ad alta dimensione e migliorano l'accuratezza della previsione riducendo i marcatori meno significativi verso lo zero.
Le tecniche di regressione regolarizzata sono scelte allettanti per la selezione genomica negli studi sull'allevamento di piante e animali perché raggiungono un compromesso tra semplicità ed efficacia.
Foreste casuali
Una tecnica di apprendimento dell'insieme chiamata foreste casuali effettua previsioni utilizzando alberi decisionali. Le foreste casuali possono essere utilizzate per valutare i dati genomici ad alta dimensione nel contesto della previsione genomica.
Con questo metodo, viene costruito un gran numero di alberi decisionali, ciascuno addestrato su un sottoinsieme casuale di marcatori, e le loro previsioni vengono combinate per produrre un'unica previsione.
Le foreste casuali sono uno strumento utile per la selezione genomica perché possono identificare interazioni complesse e correlazioni non lineari tra caratteristiche e marcatori.
Le foreste casuali sono anche resilienti ai valori anomali e possono contenere dati mancanti, il che aumenta il loro valore per la previsione genomica.
ANN (reti neurali artificiali)
Artificiale reti neurali, a volte indicati come ANN o reti neurali, sono modelli computazionali che traggono ispirazione dall'architettura neurale del cervello umano.
Grazie alla loro capacità di riconoscere schemi e relazioni intricati nei dati, le RNA sono diventate sempre più comuni nella previsione genetica.
Le RNA possono registrare interazioni non lineari tra marcatori e attributi grazie alla loro architettura multistrato e ai nodi interconnessi (neuroni). Queste reti necessitano di una formazione approfondita utilizzando vasti set di dati e rigorose regolazioni degli iperparametri.
Rivelando complessi collegamenti genetici e identificando modelli nascosti nei dati genomici, le ANN hanno il potenziale per aumentare l'accuratezza della previsione genomica.
Caratteristiche dell'obiettivo e importanza dei dati
Gli studi dimostrano che i dati particolari e gli attributi target valutati hanno un impatto sulle prestazioni di previsione e sui costi computazionali degli approcci di machine learning.
Come si può osservare, l'aggiunta di complessità ai tradizionali approcci regolarizzati può comportare grandi costi di calcolo senza necessariamente aumentare la precisione della previsione.
Investimenti in efficienza computazionale
Data la dipendenza da set di dati e attributi di destinazione per le prestazioni predittive e l'onere computazionale, è fondamentale investire nel miglioramento dell'efficienza computazionale degli algoritmi di machine learning e delle risorse di calcolo.
Ciò contribuirebbe a migliorare la precisione e l'efficienza della selezione genomica.
Conclusione: cosa riserva il futuro?
L'apprendimento automatico nella selezione genomica sembra avere un futuro brillante. Le tecniche di apprendimento automatico hanno il potenziale per cambiare completamente la previsione genetica man mano che la tecnologia si sviluppa e le risorse informatiche diventano più ampiamente disponibili.
Questi metodi consentono la gestione di dati genomici ad alta dimensione, la scoperta di schemi complessi e un aumento dell'accuratezza della previsione.
Facilitando una selezione più rapida e accurata degli individui con le caratteristiche desiderate, la combinazione di algoritmi di apprendimento automatico con selezione genomica offre la possibilità di migliorare i programmi di allevamento.
Per migliorare queste tecniche, affrontare problemi computazionali e studiare la loro applicazione a diverse specie vegetali e animali, sono necessari ulteriori studi.
Ci aspettiamo che l'apprendimento automatico diventi sempre più importante nella selezione genomica man mano che la tecnologia si sviluppa, accelerando il tasso di progresso genetico e assistendo il settore agricolo.
Lascia un Commento