Исследователи разрабатывают рекомендации для крупномасштабных исследований ассоциаций сложных признаков на основе последовательностей

Точная медицина, в которой используются генетические и молекулярные методы для индивидуального подбора методов лечения и профилактики хронических заболеваний, стала крупным национальным проектом, а в 2015 году президент Обама запустил Инициативу по прецизионной медицине. В исследовании, опубликованном сегодня в Американском журнале генетики человека, группа исследователей из Медицинского колледжа Бейлора и партнерских организаций, в том числе Вашингтонского университета и Института Броуда, подробно описывает свои выводы, полученные в результате секвенирования экзома Национального института сердца, легких и крови. Спроектируйте (ESP) и объясните, как эти результаты могут способствовать развитию точной медицины и последствия для будущего анализа данных всего экзома.

Цели исследования состояли в том, чтобы выявить связи между рядом комплексных черт сердца, легких и крови, связанных с редкими вариантами, и продвинуть цели точной медицины. Для достижения этих целей исследовательская группа изучила образцы от 7034 человек, которые были идентифицированы на основе двух стратегий отбора: выборки крайних количественных признаков и выбор людей, которые были относительно молоды в начале болезни.

"Это исследование интересно, потому что оно помогло нам выявить новые связи и понять, почему определенные люди более склонны к таким проблемам, как сердечные заболевания, и изменило наше понимание генома человека," сказал доктор. Дебора Никерсон, профессор геномных наук Вашингтонского университета. "Мы смогли разработать новый способ анонимного раскрытия данных, чтобы исследователи и учреждения по всей стране могли ими делиться."

Из 7 034 человек, секвенированных, две трети (4 405) группы были американцами европейского происхождения, а одна треть (2954 человека) – афроамериканцами, а остальные 35 человек идентифицировали себя с другой родословной.

В исследовании были изучены двенадцать основных клинических признаков, связанных с заболеванием, в том числе острое повреждение легких, астма, хроническая обструктивная болезнь легких, инфаркт миокарда с ранним началом, ишемический инсульт, диабет 2 типа с ожирением как сопутствующее заболевание и легочная артериальная гипертензия. склероз, а также несколько количественных факторов риска сердечно-сосудистых заболеваний. Также были проанализированы 59 вторичных черт.

Команда провела ассоциативный анализ данных по 71 разному признаку, запустив тесты отдельно для европейско-американских и афроамериканских групп, предоставив элемент разнообразия в наборе выборки и возможность изучить различия в аллельной архитектуре редких варианты между группами.

Когда проект ESP был первоначально разработан в 2009 году, глубокое упорядочение больших наборов данных было очень дорогостоящим и гораздо более ограниченным по своим возможностям. Первоначальные результаты исследования были переведены и проанализированы, и исследовательская группа пришла к выводу, что результаты необходимо проверить на более крупной выборке, потому что сложные черты характера на самом деле встречались реже, чем предполагалось изначально.

"Всегда интересовался анализом редких вариантов," сказала Сюзанна Лил, профессор молекулярной генетики и генетики человека в Медицинском колледже Бейлора. "Хотя для анализа редких вариантов доступно множество методов, в том числе наш комбинированный метод многомерного сворачивания, который был первым методом ассоциации редких вариантов, опубликованным в 2008 году, мы были несколько ограничены отсутствием программного обеспечения для анализа больших наборов данных, поэтому сейчас это интересно. разработали инструменты ассоциации, которые мы можем применить к большому набору данных."

Одним из наиболее удивительных результатов исследования стало открытие взаимосвязи между APOC3 и уровнями триглицеридов. Редкие варианты, присутствующие в APOC3, снижают уровень триглицеридов, что влияет на риск ишемической болезни сердца.

Исследователи отметили, что, хотя многие общие генетические варианты распространены по всему миру, наиболее редкие варианты уникальны для близкородственных популяций. Это говорит о том, что сложность, наблюдаемая во многих чертах, частично связана с недавним взрывным ростом популяции, поэтому тестирование ассоциации для редких вариантов должно проводиться в гораздо большем масштабе, чем те, которые проводятся для общих вариантов.

Это исследование показывает, что, хотя редкие варианты связаны со сложными признаками, необходимо провести дополнительные исследования, чтобы найти связи и выяснить, как выглядит патогенная восприимчивость.

Программа ESP помогла установить передовой опыт по превращению терабайтов необработанных данных о последовательностях в инновационные генетические открытия для сложных признаков и заболеваний и послужила толчком к разработке статистических методов и программного обеспечения для решения как экстремальной выборки признаков, так и тестирования ассоциации редких вариантов.

Поскольку размеры выборки продолжают увеличиваться с уменьшением затрат на секвенирование, процесс генерации данных не будет представлять серьезного технического препятствия для будущих исследований ассоциаций редких вариантов на основе секвенирования, а модель обмена данными ESP и быстрый анализ крупномасштабных данных последовательностей может подражать.

"Будущие исследования будут сосредоточены на данных экзома и данных последовательности всего генома, и очень интересно продемонстрировать, что этот тип анализа больших данных осуществим. Последовательные данные скрывают важные выводы и ассоциации, которые могут иметь огромное влияние на общественное здоровье, и очень интересно играть определенную роль в решении этих головоломок," заключил Лил.

"Этот проект выявил много новых взаимосвязей между наследственными генетическими различиями и риском развития таких заболеваний, как сердечные заболевания и инсульт, и это исследование помогло определить методы, которые "лучшие практики" для масштабных генетических проектов для здоровья человека. Опыт, которым мы делимся в этом документе, помогает подготовить почву для недавно объявленного президентом Обамой "Инициатива точной медицины" и чего можно ожидать от любых исследований, связанных с генетикой," сказал доктор. Поль Ауэр, первый автор и доцент кафедры биостатистики Джозефа Дж. Школа общественного здравоохранения Зильбера при Университете Висконсин-Милуоки.