Гены составляют лишь крошечный процент генома человека. Остальное, которое осталось измеримым, но загадочным, может содержать важные ключи к разгадке генетического происхождения болезни. Используя новую стратегию картирования, совместная группа ученых под руководством исследователей из Института Броуда Массачусетского технологического института и Гарварда, Массачусетской больницы общего профиля (MGH) и Массачусетского технологического института начала приписывать значение регионам, находящимся за пределами наших генов, и показала, как незначительные изменения в этих регионах может быть связано с распространенными заболеваниями. Выводы исследователей опубликованы в предварительном онлайн-выпуске журнала Nature от 23 марта.
Результаты имеют значение для интерпретации полногеномных ассоциативных исследований ?? крупномасштабные исследования сотен или тысяч людей, в которых ученые ищут в геноме единичные "письмо" изменения или SNP (однонуклеотидные полиморфизмы), которые влияют на риск развития определенного заболевания. Большинство SNP, связанных с заболеванием, находятся вне генов, и до сих пор о функциях большинства из них было известно очень мало.
"Наша конечная цель – выяснить, как наш геном определяет нашу биологию," сказал соавтор исследования Манолис Келлис, член-корреспондент Броуд и доцент кафедры информатики Массачусетского технологического института. "Но 98.5 процентов генома не кодирует белок, и эти некодирующие области обычно лишены аннотации."
Срок "эпигеном" относится к слою химической информации поверх генетического кода, который помогает определить, когда и где (и в каких типах клеток) гены будут активны. Этот слой информации состоит из химических модификаций или "хроматиновые метки," которые проявляются в генетическом ландшафте каждой клетки и могут сильно различаться между типами клеток.
В предыдущем исследовании авторы показали, что определенные комбинации этих меток хроматина (известных как "состояния хроматина") можно использовать для аннотирования частей генома ?? а именно для придания биологического значения отрезкам As, Cs, Ts и G, которые составляют нашу ДНК. Однако осталось много вопросов о том, чем эти аннотации различаются между типами клеток и что эти различия могут рассказать о биологии человека.
В текущем исследовании ученые нанесли на карту метки хроматина в девяти различных типах клеток, включая клетки крови, клетки рака печени, клетки кожи и эмбриональные клетки. Посмотрев на химические метки, исследователи смогли создать карты, показывающие расположение ключевых элементов управления в каждом типе клеток. Затем исследователи спросили, как метки хроматина изменяются в разных типах клеток, и искали соответствующие паттерны активности между контролирующими элементами и экспрессией соседних генов.
"Сначала мы аннотировали элементы и выяснили, в каких типах ячеек они активны," сказал соавтор Брэдли Бернстайн, старший научный сотрудник Broad и доцент Гарвардской медицинской школы (HMS) в Массачусетской больнице общего профиля (MGH). "Затем мы могли бы начать связывать элементы и создать регулирующую сеть."
Собрав по кусочкам эти сети, соединяющие некодирующие области генома с генами, которые они контролируют, исследователи могли начать интерпретировать данные исследований болезней. Команда изучила большой сборник полногеномных ассоциативных исследований (GWAS), стремясь охарактеризовать некодирующие SNP, связанные с контрольными областями в определенных типах клеток.
"В 10 ассоциативных исследованиях различных заболеваний человека мы обнаружили поразительное совпадение между ранее не охарактеризованными SNP и аннотациями контрольной области в определенных типах клеток," сказал Келлис. "Это говорит о том, что эти изменения ДНК нарушают важные регуляторные элементы и, таким образом, играют роль в биологии болезни."
Исследователи подтвердили надежность своего подхода, показав, что SNP связаны с соответствующими типами клеток. Например, SNP от аутоиммунных заболеваний, таких как ревматоидный артрит и волчанка, находятся в областях, которые активны только в иммунных клетках, а SNP, связанные с холестерином и метаболическими заболеваниями, находятся в областях, активных в клетках печени. Хотя для подтверждения биологической значимости этих связей потребуются более глубокие и последующие исследования, текущее исследование может помочь направить направление этих исследований.
"GWAS идентифицировал сотни некодирующих областей генома, которые влияют на болезнь человека, но серьезным препятствием на пути к прогрессу является то, что мы остаемся совершенно неосведомленными о функциях этих некодирующих областей," сказал Дэвид Альтшулер, заместитель директора Broad и профессор HMS MGH, который не принимал участия в исследовании. "Этот замечательный и столь необходимый ресурс – важный шаг вперед в помощи исследователям в решении этой проблемы."
SNP в некодирующих областях генома могут иметь более тонкие биологические эффекты, чем их аналоги, возникающие в генах, потому что они могут влиять на количество продуцируемого белка. Исследователи в основном сосредоточились на SNP в областях энхансеров, которые помогают повысить экспрессию гена, и их сетевых связях с регуляторами, которые их контролируют, и генами, на которые они нацелены. Затем последующие усилия могут быть сосредоточены на конкретных частях этой сети, на которые могут быть нацелены лекарства.
Команда, участвовавшая в этом исследовании, надеется расширить свой анализ, включив в него многие другие типы клеток и сопоставив дополнительные метки, чтобы расширить свои сети за пределы регионов-энхансеров. Тем временем исследователи, участвующие в исследованиях ассоциаций на уровне всего генома, смогут использовать карты из этого проекта для анализа некодирующих SNP в новом свете.
"Эти карты могут использоваться, чтобы выдвигать гипотезы о том, как работают сами варианты и какие из них являются причинными," сказал Бернштейн. "Этот ресурс теперь возвращается к сообществу GWAS, которое может использовать карты для создания и тестирования новых функциональных моделей."