De moderne genetica heeft een krachtige methode ontwikkeld, genaamd genomische selectie, die de gegevens in het genoom van planten en dieren gebruikt om de fokkerij te verbeteren.
Genomische selectie maakt de voorspelling mogelijk van het genetische potentieel van een individu voor gewenste eigenschappen, zoals ziekteresistentie, opbrengst of kwaliteit, door de DNA-sequentieverschillen tussen individuen te onderzoeken.
Deze genetische gegevens helpen om beter geïnformeerde beslissingen te nemen, het selectieproces te versnellen en fokprogramma's te creëren die effectiever en vruchtbaarder zijn.
Op dit interessante gebied van de genetica, machine learning heeft wonderen gecreëerd en het veld verbeterd. Laten we ons verdiepen in en leren over machinaal leren in genomische selectie.
Wat is genomische selectie precies?
Genomische selectie is een techniek die wordt gebruikt in de dieren- en plantenveredeling om de prestaties van een individu te voorspellen op basis van zijn genetische samenstelling.
Het gaat om het kijken naar het DNA van mensen om bepaalde markers te vinden die verband houden met gewenste kenmerken.
Onderzoekers kunnen het genetisch potentieel van een persoon bepalen voor kenmerken zoals ziekteresistentie, opbrengst of kwaliteit door deze markers over het hele genoom te analyseren.
Fokkers kunnen de prestaties van nakomelingen nauwkeuriger voorspellen dankzij genomische selectie zonder tijdrovende en dure fenotypische beoordelingen.
Door fokkers in staat te stellen individuen met het beste genetische potentieel voor fokprogramma's te kiezen, helpt deze methode bij het versnellen van het fokproces door een effectievere en gerichte verbetering van gewenste eigenschappen in planten- en dierenpopulaties mogelijk te maken.
Plantenveredeling via genomische selectie
Plantenveredeling heeft een revolutie doorgemaakt dankzij genomic selection, wat het proces heeft versneld en de gewasopbrengst heeft verhoogd.
Maar om de naderende problemen als gevolg van klimaatverandering aan te pakken, is meer ontwikkeling nodig.
Om dit op te lossen, gebruiken onderzoekers pangenomen en geavanceerde machine-learningbenaderingen bij genomische selectie.
Het volledige genomische materiaal van een soort, ook wel bekend als het pangenoom, zorgt voor een grondig begrip van genetische variatie.
We kunnen de weg vrijmaken voor gewasverbetering en de schadelijke effecten van klimaatverandering op de landbouw verminderen door naar voorbeelden uit de veredeling van gewassen te kijken, de beperkingen van machine learning te begrijpen en de belofte van deze technieken te benadrukken.
Pangenomen van planten: onthullende genomische diversiteit
Traditioneel waren genoomassemblages met één referentie de primaire focus van genomische selectie, maar pangenomen komen nu steeds vaker voor. Plantenpangenomen weerspiegelen, in plaats van individuele genoomassemblages, het genetische materiaal van een soort of familie.
Significante genvarianten, inclusief degene die niet in de referentiesamenstelling zijn opgenomen, worden door hen onthuld. Voor verschillende gewassen zijn pangenomen gemaakt, die de geschiedenis van de domesticatie en veredeling van planten belichten.
Hun combinatie met genetische selectie is nog maar ten dele effectief.
Fokkers kunnen een grotere verscheidenheid aan genetische markers gebruiken, de voorspellingsnauwkeurigheid verbeteren en alle mogelijke verbindingen vastleggen, door pangenomen te combineren in genomische selectie.
Genomische selectie op basis van machinaal leren
Traditionele genomische selectiebenaderingen hebben problemen bij het aanpakken van niet-additieve effecten zoals epistase, genomische imprinting en genotype-interacties. Door deze effecten te simuleren, bieden machine learning-benaderingen haalbare antwoorden.
Recente studies hebben machine learning-methoden gebruikt bij genomische selectie, met resultaten die variëren tussen datasets en gewassen.
Algoritmen voor het leren van machines zijn in staat om ingewikkelde gegevensrepresentaties te verwerken, zoals gemengde fenotypes en interacties tussen fenotypes of genotypen.
Er zijn bijvoorbeeld machine learning-algoritmen gebruikt om productie- en fruitkwaliteitskenmerken te voorspellen in polyploïde gewassen zoals aardbeien en blauwe bessen.
Hoewel deze systemen een groot potentieel hebben, zijn het begrijpen van hun interpreteerbaarheid en het aanpassen van hyperparameters van cruciaal belang voor een effectieve toepassing.
Verschillende methoden van machinaal leren
In genomische voorspellingsstudies groeit het gebruik van machine learning-technieken. Deze technieken kunnen worden gescheiden in manieren voor begeleid en onbewaakt leren.
Methoden van begeleid leren zijn bijzonder nuttig omdat ze patronen kunnen ontdekken in gelabelde gegevens en anticiperen op resultaten.
Hoewel verschillende onderzoeken de voorspellingseffectiviteit van specifieke machine learning-benaderingen hebben onderzocht, ontbreekt het aan onderzoek waarin verschillende sets methoden worden vergeleken.
Het is van cruciaal belang om te begrijpen welke groeperingen van methoden beter presteren en om hun voor- en nadelen af te wegen in vergelijking met conventionele methoden.
Veelbelovende genomische voorspellingsmethoden
Lineaire gemengde modellen
Bij genomische voorspelling hebben conventionele lineaire gemengde modellen bewezen betrouwbaar en nuttig te zijn. Om rekening te houden met genetische variatie in de populatie, integreren deze modellen zowel vaste als willekeurige effecten.
Deze algoritmen kunnen genomic fokwaarden nauwkeurig voorspellen door rekening te houden met individuele verwantschap.
Vanwege hun competitieve voorspellende prestaties, rekenefficiëntie en eenvoud, worden lineaire gemengde modellen veel gebruikt bij het fokken van planten en dieren. Ze vereisen minder afstemmingsparameters dan andere benaderingen, waardoor ze geschikt zijn voor genomische selectie.
Geregulariseerde regressie
Voor genoomvoorspelling zijn geregulariseerde regressiemethoden zoals LASSO (Least Absolute Shrinkage and Selection Operator) en nokregressie effectieve hulpmiddelen.
Deze technieken maken variabele selectie en regularisatie mogelijk door een strafterm toe te voegen aan het conventionele regressiemodel.
Deze methoden gaan efficiënt om met hoogdimensionale gegevens en verbeteren de voorspellingsnauwkeurigheid door minder significante markeringen naar nul te verminderen.
Geregulariseerde regressietechnieken zijn aantrekkelijke keuzes voor genomische selectie in zowel planten- als dierveredelingsstudies omdat ze een compromis vinden tussen eenvoud en effectiviteit.
Willekeurige bossen
Een techniek voor het leren van ensembles, random forests genaamd, maakt voorspellingen met behulp van beslissingsbomen. Willekeurige forests kunnen worden gebruikt om hoog-dimensionale genomische gegevens te beoordelen in de context van genomische voorspelling.
Met deze methode wordt een groot aantal beslissingsbomen gebouwd, elk getraind op een willekeurige subset van markeringen, en hun voorspellingen worden gecombineerd om één enkele voorspelling te produceren.
Willekeurige forests zijn een handig hulpmiddel voor genomische selectie omdat ze ingewikkelde interacties en niet-lineaire correlaties tussen kenmerken en markers kunnen identificeren.
Willekeurige forests zijn ook bestand tegen uitschieters en kunnen ontbrekende gegevens bevatten, wat hun waarde voor genomische voorspelling vergroot.
ANN's (kunstmatige neurale netwerken)
Kunstmatig neurale netwerken, ook wel ANN's of neurale netwerken genoemd, zijn computermodellen die zijn geïnspireerd op de neurale architectuur van het menselijk brein.
Vanwege hun vermogen om ingewikkelde patronen en relaties in gegevens te herkennen, komen ANN's steeds vaker voor bij genetische voorspelling.
ANN's kunnen niet-lineaire interacties tussen markeringen en attributen vastleggen vanwege hun meerlagige architectuur en onderling verbonden knooppunten (neuronen). Deze netwerken hebben grondige training nodig met behulp van enorme datasets en rigoureuze hyperparameteraanpassing.
Door complexe genetische verbanden te onthullen en verborgen patronen in genomische gegevens te identificeren, hebben ANN's het potentieel om de nauwkeurigheid van genomische voorspelling te vergroten.
Doelkenmerken en belang van gegevens
Studies tonen aan dat de specifieke gegevens en doelattributen die worden geëvalueerd, van invloed zijn op de voorspellingsprestaties en rekenkosten van machine learning-benaderingen.
Zoals kan worden waargenomen, kan het toevoegen van complexiteit aan traditionele geregulariseerde benaderingen resulteren in hoge computerkosten zonder noodzakelijkerwijs de voorspellingsprecisie te vergroten.
Investeringen in rekenefficiëntie
Gezien de afhankelijkheid van doeldatasets en attributen voor voorspellende prestaties en rekenlast, is het van cruciaal belang om te investeren in het verbeteren van de rekenefficiëntie van algoritmen voor machine learning en computerbronnen.
Dit zou de precisie en efficiëntie van genomische selectie helpen verbeteren.
Conclusie – Wat heeft de toekomst in petto?
Machine learning in genomische selectie lijkt een mooie toekomst te hebben. Machine learning-technieken hebben het potentieel om genetische voorspelling volledig te veranderen naarmate de technologie zich ontwikkelt en computerbronnen op grotere schaal beschikbaar komen.
Deze methoden maken het mogelijk om hoogdimensionale genomische gegevens te verwerken, ingewikkelde patronen te ontdekken en de voorspellingsnauwkeurigheid te vergroten.
Door een snellere en nauwkeurigere selectie van individuen met gewenste kenmerken mogelijk te maken, biedt de combinatie van machine learning-algoritmen met genomische selectie de mogelijkheid om fokprogramma's te verbeteren.
Om deze technieken te verbeteren, rekenproblemen aan te pakken en hun toepassing op verschillende planten- en diersoorten te onderzoeken, is meer onderzoek nodig.
We verwachten dat machinaal leren steeds belangrijker zal worden in genomische selectie naarmate de technologie zich ontwikkelt, waardoor de genetische vooruitgang sneller gaat en de landbouwsector wordt ondersteund.
Laat een reactie achter