Сучасна генетика розробила потужний метод під назвою геномний відбір, який використовує дані, що містяться в геномах рослин і тварин, для покращення селекції.
Геномний відбір дає змогу передбачити генетичний потенціал індивідуума щодо бажаних якостей, таких як стійкість до хвороб, урожайність або якість, досліджуючи відмінності послідовностей ДНК у різних індивідів.
Ці генетичні дані допомагають приймати більш обґрунтовані рішення, прискорювати процес відбору та створювати програми розведення, які є більш ефективними та плідними.
У цій цікавій галузі генетики, навчання за допомогою машини створював чудеса та покращував поле. Давайте заглибимося в машинне навчання в геномному відборі та дізнаємося про нього.
Що саме таке геномний відбір?
Геномна селекція — це техніка, яка використовується в селекції тварин і рослин для прогнозування продуктивності особини на основі її генетичної структури.
Він передбачає аналіз ДНК людей, щоб знайти певні маркери, пов’язані з бажаними характеристиками.
Дослідники можуть визначити генетичний потенціал людини щодо таких характеристик, як стійкість до хвороб, урожайність або якість, аналізуючи ці маркери в усьому геному.
Селекціонери можуть точніше прогнозувати продуктивність потомства завдяки геномному відбору без потреби у трудомістких і дорогих фенотипових оцінках.
Дозволяючи селекціонерам вибирати особин з найкращим генетичним потенціалом для програм розведення, цей метод допомагає прискорити процес розведення, забезпечуючи більш ефективне та цілеспрямоване покращення бажаних ознак у популяціях рослин і тварин.
Селекція рослин шляхом геномної селекції
Селекція рослин зазнала революції завдяки геномній селекції, яка прискорила процес і збільшила врожайність.
Але для вирішення майбутніх проблем, викликаних зміною клімату, потрібен більший розвиток.
Щоб вирішити цю проблему, дослідники використовують пангеноми та передові підходи машинного навчання в геномній селекції.
Весь геномний матеріал виду, також відомий як пангеном, дозволяє повністю зрозуміти генетичні варіації.
Ми можемо відкрити шлях для покращення врожаю та пом’якшення згубного впливу зміни клімату на сільське господарство, розглядаючи приклади селекції сільськогосподарських культур, розуміючи обмеження машинного навчання та підкреслюючи перспективність цих методів.
Пангеноми рослин: розкриття геномної різноманітності
Традиційно основним фокусом геномної селекції були збірки геномів з одним посиланням, але тепер пангеноми стають все більш поширеними. Пангеноми рослин, а не окремі сукупності геномів, відображають генетичний матеріал виду чи родини.
Ними виявляються значущі варіанти генів, в тому числі не включені в еталонну сукупність. Для кількох культур було створено пангеноми, які висвітлюють історію одомашнення та селекції рослин.
Їх поєднання з генетичним відбором ефективне лише частково.
Селекціонери можуть використовувати більшу різноманітність генетичних маркерів, підвищуючи точність прогнозування та вловлюючи всі потенційні зв’язки, об’єднуючи пангеноми в геномну селекцію.
Геномний відбір на основі машинного навчання
Традиційні підходи до геномного відбору мають труднощі у вирішенні неадитивних ефектів, таких як епістаз, геномний імпринтинг і взаємодія генотипу. Моделюючи ці впливи, підходи машинного навчання дають життєздатні відповіді.
Нещодавні дослідження використовували методи машинного навчання для геномного відбору, результати варіюються між наборами даних і культурами.
Алгоритми машинного навчання здатні обробляти складні представлення даних, такі як змішані фенотипи та взаємодії між фенотипами або генотипами.
Наприклад, алгоритми машинного навчання використовувалися для прогнозування продуктивності та якості плодів поліплоїдних культур, таких як полуниця та лохина.
Хоча ці системи мають великий потенціал, розуміння їхньої інтерпретації та коригування гіперпараметрів є критично важливими для ефективного застосування.
Різні методи машинного навчання
У дослідженнях геномного прогнозу використання методів машинного навчання зростає. Ці методи можна розділити на способи навчання під наглядом і без нагляду.
Методи навчання під наглядом особливо корисні, оскільки вони можуть виявити закономірності в позначені дані і передбачити результати.
У той час як різні дослідження вивчали ефективність прогнозування конкретних підходів машинного навчання, досліджень, які б порівнювали різні набори методів, бракує.
Дуже важливо розуміти, які групи методів ефективніші, і зважити їхні переваги та недоліки порівняно зі звичайними методами.
Перспективні методи геномного прогнозування
Лінійні змішані моделі
У геномному прогнозуванні звичайні лінійні змішані моделі виявилися надійними та корисними. Щоб врахувати генетичні варіації в популяції, ці моделі об’єднують як фіксовані, так і випадкові ефекти.
Ці алгоритми можуть точно прогнозувати значення геномного розведення, враховуючи індивідуальну спорідненість.
Лінійні змішані моделі широко використовуються в рослинництві та тваринництві через свою ефективність прогнозування, обчислювальну ефективність і простоту. Вони вимагають менше параметрів налаштування, ніж інші підходи, що робить їх придатними для геномного відбору.
Регуляризована регресія
Для прогнозування генома ефективними інструментами є регуляризовані методи регресії, такі як LASSO (оператор найменшого абсолютного скорочення та вибору) і хребтова регресія.
Ці методи дозволяють вибір змінних і регулярізацію шляхом додавання штрафного терміну до традиційної регресійної моделі.
Ці методи ефективно обробляють багатовимірні дані та підвищують точність передбачення шляхом зменшення менш значущих маркерів до нуля.
Методи регуляризованої регресії є привабливим вибором для геномного відбору як у селекційних дослідженнях рослин, так і тварин, оскільки вони досягають компромісу між простотою та ефективністю.
Випадкові ліси
Техніка ансамблевого навчання, яка називається випадковими лісами, робить прогнози за допомогою дерев рішень. Випадкові ліси можна використовувати для оцінки високовимірних геномних даних у контексті геномного прогнозування.
За допомогою цього методу будується велика кількість дерев рішень, кожне з яких навчено на випадковій підмножині маркерів, а їхні прогнози об’єднуються для отримання єдиного прогнозу.
Випадкові ліси є корисним інструментом для геномного відбору, оскільки вони можуть ідентифікувати складні взаємодії та нелінійні кореляції між характеристиками та маркерами.
Випадкові ліси також стійкі до викидів і можуть вмістити відсутні дані, що підвищує їх цінність для геномного прогнозування.
ANN (штучні нейронні мережі)
Штучний нейронні мережі, які іноді називають ШНМ або нейронними мережами, є обчислювальними моделями, які черпають натхнення з нейронної архітектури людського мозку.
Завдяки своїй здатності розпізнавати складні закономірності та зв’язки в даних ШНМ стають все більш поширеними в генетичному прогнозуванні.
ШНМ можуть записувати нелінійні взаємодії між маркерами та атрибутами через їх багатошарову архітектуру та взаємопов’язані вузли (нейрони). Ці мережі потребують ретельного навчання з використанням величезних наборів даних і суворого налаштування гіперпараметрів.
Виявляючи складні генетичні зв’язки та ідентифікуючи приховані закономірності в геномних даних, ШНМ мають потенціал для підвищення точності геномного прогнозування.
Цільові ознаки та важливість даних
Дослідження показують, що конкретні дані та цільові атрибути, які оцінюються, впливають на ефективність прогнозування та витрати на обчислення підходів машинного навчання.
Як можна помітити, додавання складності до традиційних упорядкованих підходів може призвести до великих витрат на обчислення без обов’язкового підвищення точності прогнозу.
Інвестиції в обчислювальну ефективність
Враховуючи залежність від цільових наборів даних і атрибутів для прогнозної продуктивності та обчислювального навантаження, дуже важливо інвестувати в підвищення обчислювальної ефективності алгоритмів машинного навчання та обчислювальних ресурсів.
Це допоможе підвищити точність і ефективність геномного відбору.
Висновок – що чекає в майбутньому?
Здається, у машинного навчання геномної селекції світле майбутнє. Методи машинного навчання мають потенціал повністю змінити генетичне передбачення в міру того, як розвиваються технології та стають більш доступними комп’ютерні ресурси.
Ці методи дозволяють обробляти багатовимірні геномні дані, відкривати складні закономірності та підвищувати точність прогнозування.
Сприяючи швидшому та точнішому відбору особин із бажаними характеристиками, поєднання алгоритмів машинного навчання з геномним відбором дає можливість покращити програми розведення.
Для вдосконалення цих методів, вирішення обчислювальних проблем і дослідження їх застосування до різних видів рослин і тварин потрібні додаткові дослідження.
Ми очікуємо, що машинне навчання ставатиме все більш важливим у геномній селекції з розвитком технологій, прискорюючи темпи генетичного прогресу та допомагаючи сільськогосподарському сектору.
залишити коментар