Modern genetik har utvecklat en kraftfull metod som kallas genomiskt urval som använder data som finns i arvsmassan hos växter och djur för att förbättra aveln.
Genomiskt urval möjliggör förutsägelse av en individs genetiska potential för önskade egenskaper, såsom sjukdomsresistens, avkastning eller kvalitet, genom att undersöka skillnaderna i DNA-sekvenser mellan individer.
Dessa genetiska data hjälper till att fatta bättre informerade beslut, påskynda urvalsprocessen och skapa avelsprogram som är mer effektiva och givande.
I detta intressanta område av genetik, maskininlärning har skapat underverk och förbättrat fältet. Låt oss fördjupa oss i och lära oss om maskininlärning i genomiskt urval.
Exakt vad är genomiskt urval?
Genomiskt urval är en teknik som används i djur- och växtförädling för att förutsäga en individs prestation baserat på deras genetiska sammansättning.
Det handlar om att titta på människors DNA för att hitta särskilda markörer kopplade till önskvärda egenskaper.
Forskare kan fastställa en persons genetiska potential för egenskaper som sjukdomsresistens, avkastning eller kvalitet genom att analysera dessa markörer över hela genomet.
Uppfödare kan förutsäga avkommans prestanda mer exakt tack vare genomiskt urval utan behov av tidskrävande och dyra fenotypiska bedömningar.
Genom att göra det möjligt för uppfödare att välja individer med den bästa genetiska potentialen för avelsprogram, hjälper denna metod till att påskynda avelsprocessen genom att möjliggöra mer effektiv och fokuserad förbättring av önskade egenskaper i växt- och djurpopulationer.
Växtförädling via genomiskt urval
Växtförädlingen har genomgått en revolution tack vare genomiskt urval, vilket har påskyndat processen och ökat skördarna.
Men för att ta itu med de kommande problemen som klimatförändringarna medför krävs mer utveckling.
För att lösa detta använder forskare pangenomer och banbrytande metoder för maskininlärning i genomiskt urval.
Hela genommaterialet hos en art, även känt som pangenomet, möjliggör en grundlig förståelse av genetisk variation.
Vi kan öppna vägen för förbättring av grödor och mildra de skadliga effekterna av klimatförändringar på jordbruket genom att titta på exempel från växtförädling, förstå begränsningarna för maskininlärning och lyfta fram löftet med dessa tekniker.
Pangenomer av växter: avslöjar genomisk mångfald
Traditionellt har enkelreferensgenomsamlingar varit det primära fokuset för genomiskt urval, men pangenomer blir nu mer utbredda. Växtpangenom, snarare än individuella genomsamlingar, återspeglar det genetiska materialet hos en art eller familj.
Signifikanta genvarianter, inklusive de som inte ingår i referenssammansättningen, avslöjas av dem. För flera grödor har pangenomer skapats, som belyser historien om växttämning och förädling.
Deras kombination med genetiskt urval är ändå bara delvis effektiv.
Uppfödare kan använda ett bredare utbud av genetiska markörer, förbättra prediktionsnoggrannheten och fånga alla potentiella kopplingar, genom att kombinera pangenomer i genomiskt urval.
Genomiskt urval baserat på maskininlärning
Traditionella genomiska selektionsmetoder har svårigheter med att ta itu med icke-additiva effekter som epistas, genomisk prägling och genotypinteraktioner. Genom att simulera dessa effekter ger tillvägagångssätt för maskininlärning genomförbara svar.
Nyligen genomförda studier har använt maskininlärningsmetoder i genomiskt urval, med resultat som sträcker sig mellan datauppsättningar och grödor.
Maskininlärningsalgoritmer är kapabla att hantera komplicerade datarepresentationer, såsom blandade fenotyper och interaktioner mellan fenotyper eller genotyper.
Till exempel har maskininlärningsalgoritmer använts för att förutsäga produktions- och fruktkvalitetsegenskaper i polyploida grödor som jordgubbar och blåbär.
Även om dessa system har stor potential, är förståelse för deras tolkningsbarhet och justering av hyperparametrar avgörande för effektiv tillämpning.
Olika metoder för maskininlärning
I genomiska prediktionsstudier växer användningen av maskininlärningstekniker. Dessa tekniker kan delas upp i sätt för övervakat och oövervakat lärande.
Metoder för övervakat lärande är särskilt användbara eftersom de kan upptäcka mönster i märkta data och förutse resultat.
Medan olika studier har undersökt förutsägelseeffektiviteten hos specifika metoder för maskininlärning, saknas forskning som jämför olika uppsättningar av metoder.
Det är viktigt att förstå vilka grupper av metoder som presterar bättre och att väga deras fördelar och nackdelar i jämförelse med konventionella sätt.
Lovande genomiska prediktionsmetoder
Linjära blandade modeller
I genomisk förutsägelse har konventionella linjära blandade modeller visat sig vara pålitliga och användbara. För att ta hänsyn till genetisk variation i befolkningen, integrerar dessa modeller både fixerade och slumpmässiga effekter.
Dessa algoritmer kan exakt förutsäga genomiska avelsvärden genom att ta hänsyn till individuell släktskap.
På grund av deras konkurrenskraftiga prediktiva prestanda, beräkningseffektivitet och enkelhet används linjära blandade modeller i stor utsträckning inom växt- och djuruppfödning. De kräver färre inställningsparametrar än andra tillvägagångssätt, vilket gör dem lämpliga för genomiskt urval.
Regulariserad regression
För genomförutsägelse är reglerade regressionsmetoder som LASSO (Least Absolute Shrinkage and Selection Operator) och åsregression effektiva verktyg.
Dessa tekniker möjliggör val av variabel och regularisering genom att lägga till en straffterm till den konventionella regressionsmodellen.
Dessa metoder hanterar effektivt högdimensionell data och förbättrar prediktionsnoggrannheten genom att reducera mindre signifikanta markörer mot noll.
Regulariserade regressionstekniker är tilltalande val för genomiskt urval i både växt- och djuruppfödningsstudier eftersom de gör en kompromiss mellan enkelhet och effektivitet.
Slumpmässiga skogar
En ensembleinlärningsteknik som kallas slumpmässiga skogar gör förutsägelser med hjälp av beslutsträd. Slumpmässiga skogar kan användas för att bedöma högdimensionella genomiska data i samband med genomisk förutsägelse.
Med denna metod byggs ett stort antal beslutsträd, var och en tränad på en slumpmässig delmängd av markörer, och deras förutsägelser kombineras för att producera en enda prognos.
Slumpmässiga skogar är ett användbart verktyg för genomiskt urval eftersom de kan identifiera invecklade interaktioner och olinjära korrelationer mellan egenskaper och markörer.
Slumpmässiga skogar är också motståndskraftiga mot extremvärden och kan ta emot saknade data, vilket ökar deras värde för genomisk förutsägelse.
ANN:er (artificiella neurala nätverk)
Artificiell neurala nätverk, ibland kallade ANN eller neurala nätverk, är beräkningsmodeller som hämtar inspiration från den mänskliga hjärnans neurala arkitektur.
På grund av deras förmåga att känna igen komplicerade mönster och samband i data, har ANNs blivit mer och mer vanliga i genetiska förutsägelser.
ANN:er kan spela in olinjära interaktioner mellan markörer och attribut på grund av deras flerskiktsarkitektur och sammankopplade noder (neuroner). Dessa nätverk behöver grundlig utbildning med hjälp av stora datamängder och rigorösa hyperparameterjusteringar.
Genom att avslöja komplexa genetiska länkar och identifiera dolda mönster i genomiska data har ANN: er potential att öka noggrannheten i genomisk förutsägelse.
Målegenskaper och vikten av data
Studier visar att de specifika data och målattribut som utvärderas har en inverkan på förutsägelseprestanda och beräkningskostnader för metoder för maskininlärning.
Som man kan observera kan att lägga till komplexitet till traditionella reglerade tillvägagångssätt resultera i stora beräkningskostnader utan att nödvändigtvis öka prediktionsprecisionen.
Beräkningseffektivitetsinvesteringar
Med tanke på beroendet av måldatauppsättningar och attribut för prediktiv prestanda och beräkningsbörda, är det avgörande att investera i att förbättra beräkningseffektiviteten för maskininlärningsalgoritmer och beräkningsresurser.
Detta skulle bidra till att förbättra precisionen och effektiviteten av genomiskt urval.
Slutsats – Hur ser framtiden ut?
Maskininlärning i genomiskt urval verkar ha en ljus framtid. Maskininlärningstekniker har potential att helt förändra genetiska förutsägelser i takt med att teknologin utvecklas och datorresurser blir mer allmänt tillgängliga.
Dessa metoder möjliggör hantering av högdimensionell genomisk data, upptäckt av invecklade mönster och en ökning av prediktionsnoggrannheten.
Genom att underlätta ett snabbare och mer exakt urval av individer med önskade egenskaper, ger kombinationen av maskininlärningsalgoritmer med genomiskt urval möjligheten att förbättra avelsprogram.
För att förbättra dessa tekniker, hantera beräkningsfrågor och undersöka deras tillämpning på olika växt- och djurarter krävs mer studier.
Vi förväntar oss att maskininlärning kommer att bli allt viktigare i genomiskt urval i takt med att teknologin utvecklas, vilket påskyndar hastigheten för genetiska framsteg och hjälper jordbrukssektorn.
Kommentera uppropet