Современная генетика разработала мощный метод под названием геномная селекция, который использует данные, содержащиеся в геномах растений и животных, для улучшения селекции.
Геномная селекция позволяет прогнозировать генетический потенциал человека в отношении желаемых качеств, таких как устойчивость к болезням, урожайность или качество, путем изучения различий в последовательностях ДНК у разных людей.
Эти генетические данные помогают принимать более обоснованные решения, ускорять процесс отбора и создавать более эффективные и плодотворные программы разведения.
В этой интересной области генетики обучение с помощью машины творит чудеса и расширяет поле. Давайте углубимся и узнаем о машинном обучении в геномной селекции.
Что такое геномная селекция?
Геномная селекция - это метод, используемый в селекции животных и растений для прогнозирования индивидуальных показателей на основе их генетического состава.
Он включает в себя изучение ДНК людей, чтобы найти определенные маркеры, связанные с желаемыми характеристиками.
Исследователи могут определить генетический потенциал человека по таким характеристикам, как устойчивость к болезням, урожайность или качество, анализируя эти маркеры по всему геному.
Заводчики могут более точно прогнозировать продуктивность потомства благодаря геномной селекции без необходимости трудоемких и дорогостоящих фенотипических оценок.
Позволяя селекционерам выбирать особей с лучшим генетическим потенциалом для селекционных программ, этот метод способствует ускорению процесса селекции, обеспечивая более эффективное и целенаправленное улучшение желаемых признаков в популяциях растений и животных.
Селекция растений с помощью геномной селекции
Селекция растений претерпела революцию благодаря геномной селекции, ускорившей процесс и увеличившей урожайность.
Но для решения надвигающихся проблем, вызванных изменением климата, необходимо дальнейшее развитие.
Чтобы решить эту проблему, исследователи используют пангеномы и передовые подходы машинного обучения в геномной селекции.
Весь геномный материал вида, также известный как пангеном, позволяет получить полное представление о генетической изменчивости.
Мы можем открыть путь для улучшения урожая и смягчить пагубное воздействие изменения климата на сельское хозяйство, рассмотрев примеры из селекции сельскохозяйственных культур, поняв ограничения машинного обучения и подчеркнув перспективность этих методов.
Пангеномы растений: выявление геномного разнообразия
Традиционно в центре внимания геномной селекции были сборки геномов с одной ссылкой, но в настоящее время пангеномы становятся все более распространенными. Пангеномы растений, а не отдельные сборки геномов, отражают генетический материал вида или семейства.
По ним выявляются значимые варианты генов, в том числе не вошедшие в эталонную сборку. Для нескольких сельскохозяйственных культур были созданы пангеномы, освещающие историю одомашнивания и селекции растений.
Их сочетание с генетическим отбором пока эффективно лишь частично.
Селекционеры могут использовать более широкий спектр генетических маркеров, повышая точность прогнозов и фиксируя все потенциальные связи, объединяя пангеномы в геномную селекцию.
Геномная селекция на основе машинного обучения
Традиционные подходы к геномной селекции имеют трудности с устранением неаддитивных эффектов, таких как эпистаз, геномный импринтинг и взаимодействия генотипов. Имитируя эти воздействия, подходы машинного обучения дают жизнеспособные ответы.
В недавних исследованиях использовались методы машинного обучения для геномной селекции, и результаты варьировались между наборами данных и сельскохозяйственными культурами.
Алгоритмы машинного обучения способны обрабатывать сложные представления данных, такие как смешанные фенотипы и взаимодействия между фенотипами или генотипами.
Например, алгоритмы машинного обучения использовались для прогнозирования характеристик продуктивности и качества плодов полиплоидных культур, таких как клубника и черника.
Хотя эти системы обладают большим потенциалом, понимание их интерпретируемости и корректировка гиперпараметров имеют решающее значение для эффективного применения.
Различные методы машинного обучения
В исследованиях геномного прогнозирования все чаще используются методы машинного обучения. Эти методы можно разделить на способы контролируемого и неконтролируемого обучения.
Методы обучения с учителем особенно полезны, поскольку они могут обнаруживать закономерности в помеченные данные и предвидеть результаты.
В то время как в различных исследованиях изучалась эффективность прогнозирования конкретных подходов к машинному обучению, исследования, сравнивающие различные наборы методов, отсутствуют.
Крайне важно понять, какие группы методов работают лучше, и взвесить их преимущества и недостатки по сравнению с обычными способами.
Перспективные методы геномного прогнозирования
Линейные смешанные модели
В геномном прогнозировании традиционные линейные смешанные модели оказались надежными и полезными. Для учета генетической изменчивости в популяции эти модели учитывают как фиксированные, так и случайные эффекты.
Эти алгоритмы могут точно прогнозировать геномную племенную ценность, принимая во внимание индивидуальное родство.
Благодаря своей конкурентоспособной прогностической эффективности, вычислительной эффективности и простоте линейные смешанные модели широко используются в селекции растений и животных. Для них требуется меньше параметров настройки, чем для других подходов, что делает их подходящими для геномной селекции.
Регулярная регрессия
Для прогнозирования генома эффективными инструментами являются методы регуляризованной регрессии, такие как LASSO (оператор наименьшего абсолютного сокращения и выбора) и гребневая регрессия.
Эти методы позволяют выбирать и регуляризировать переменные, добавляя штрафной член к обычной регрессионной модели.
Эти методы эффективно обрабатывают многомерные данные и повышают точность прогнозирования за счет сокращения менее значимых маркеров до нуля.
Методы регуляризованной регрессии являются привлекательным выбором для геномной селекции как в исследованиях по селекции растений, так и животных, поскольку они обеспечивают компромисс между простотой и эффективностью.
Случайные леса
Метод ансамблевого обучения, называемый случайным лесом, делает прогнозы с использованием деревьев решений. Случайные леса можно использовать для оценки многомерных геномных данных в контексте геномного предсказания.
С помощью этого метода строится большое количество деревьев решений, каждое из которых обучается на случайном подмножестве маркеров, а их прогнозы объединяются для получения единого прогноза.
Случайные леса — полезный инструмент для геномной селекции, поскольку они могут идентифицировать сложные взаимодействия и нелинейные корреляции между характеристиками и маркерами.
Случайные леса также устойчивы к выбросам и могут вмещать недостающие данные, что повышает их ценность для предсказания генома.
ИНС (искусственные нейронные сети)
Искусственный нейронные сети, иногда называемые нейронными сетями или нейронными сетями, представляют собой вычислительные модели, вдохновленные нейронной архитектурой человеческого мозга.
Благодаря своей способности распознавать сложные закономерности и отношения в данных ИНС становятся все более и более распространенными в генетическом прогнозировании.
ИНС могут записывать нелинейные взаимодействия между маркерами и атрибутами благодаря своей многослойной архитектуре и взаимосвязанным узлам (нейронам). Эти сети нуждаются в тщательном обучении с использованием обширных наборов данных и тщательной настройки гиперпараметров.
Выявляя сложные генетические связи и выявляя скрытые паттерны в геномных данных, ИНС могут повысить точность предсказания генома.
Целевые характеристики и важность данных
Исследования показывают, что оцениваемые конкретные данные и целевые атрибуты влияют на эффективность прогнозирования и вычислительные затраты подходов машинного обучения.
Как можно заметить, усложнение традиционных регуляризованных подходов может привести к большим вычислительным затратам без обязательного повышения точности прогнозирования.
Инвестиции в вычислительную эффективность
Учитывая зависимость прогнозируемой производительности и вычислительной нагрузки от целевых наборов данных и атрибутов, крайне важно инвестировать в повышение вычислительной эффективности алгоритмов машинного обучения и вычислительных ресурсов.
Это поможет повысить точность и эффективность геномной селекции.
Заключение – что ждет нас в будущем?
У машинного обучения в геномной селекции, похоже, большое будущее. Методы машинного обучения могут полностью изменить генетическое предсказание по мере развития технологий и расширения доступности компьютерных ресурсов.
Эти методы позволяют обрабатывать многомерные геномные данные, обнаруживать сложные закономерности и повышать точность прогнозов.
Способствуя более быстрому и точному отбору особей с желаемыми характеристиками, сочетание алгоритмов машинного обучения с геномной селекцией дает возможность улучшить программы разведения.
Чтобы улучшить эти методы, решить вычислительные проблемы и исследовать их применение к различным видам растений и животных, необходимы дополнительные исследования.
Мы ожидаем, что машинное обучение будет играть все более важную роль в геномной селекции по мере развития технологий, ускоряя скорость генетического прогресса и помогая сельскому хозяйству.
Оставьте комментарий