Проект ENCODE: исследователи раскрывают информацию о болезни, скрытую в схемах управления геномом

Исследователи из Вашингтонского университета определили, что большинство генетических изменений, связанных с более чем 400 распространенными заболеваниями и клиническими признаками, влияют на регуляторную схему генома. Это области ДНК, которые содержат инструкции, указывающие, когда и где гены включаются или выключаются. Большинство этих изменений затрагивают цепи, которые активны на раннем этапе развития человека, когда ткани тела наиболее уязвимы.

Создав обширные схемы схем управления, исследование также выявило ранее скрытые связи между различными заболеваниями. Эти связи могут объяснить общие клинические особенности, а также предложить новый подход для точного определения конкретных типов клеток и тканей, которые либо вызывают, либо больше всего страдают от конкретного заболевания. Полученные данные представляют собой серьезный сдвиг парадигмы для понимания генетических причин заболеваний и открывают новые возможности для развития диагностики и лечения. Результаты появляются в сентябре. 5 онлайн-выпуск журнала Science.

"Гены занимают лишь крошечную часть генома, и большинство усилий по картированию генетических причин заболевания были сорваны сигналами, указывающими в сторону от генов. Теперь мы знаем, что эти усилия не были напрасными и что сигналы на самом деле указывали на «операционную систему» ​​генома – инструкции для которой спрятаны в миллионах мест по всему геному," сказал доктор. Джон А. Стаматояннопулос, доцент кафедры генома и медицины Университета штата Вашингтон. "Полученные данные дают новый взгляд на роль генетики и функции генома в развитии болезни."

Схема управления геномом человека закодирована в миллионах регуляторных областей – коротких последовательностях ДНК, которые разбросаны по 98 процентам генома, которые не определяют белковый продукт гена. Специализированные белки, называемые регуляторными факторами, распознают определенные последовательности ДНК в этих регуляторных областях, тем самым создавая переключатели, которые включают и выключают гены. Во многих случаях эти переключатели расположены далеко от генов, которые они контролируют. Эти расстояния затрудняют определение взаимосвязи между конкретными переключателями и генами.

Исследователи использовали специальный молекулярный зонд, называемый нуклеазой, чтобы обнаружить все регуляторные области, активные в каждом изучаемом ими типе клеток. Используемая ими специфическая нуклеаза, называемая ДНКаза I, вырезает геном, в котором регуляторные факторы связаны с ДНК. Обрабатывая клетки ДНКазой I и анализируя структуру отрезанных последовательностей ДНК с использованием технологии массового параллельного секвенирования и высокопроизводительных компьютеров, исследователи смогли создать комплексные карты всей регуляторной ДНК во многих различных типах клеток. Затем эти карты были проанализированы с помощью передовых программных алгоритмов для сортировки данных и выявления ранее скрытых связей между генетической изменчивостью, связанной с заболеванием, и конкретными регуляторными регионами.

Регуляторное картирование и анализ были проведены на 349 образцах клеток и тканей. Сюда входили образцы всех основных органов, а также 233 образца тканей на разных стадиях раннего развития человека. В общей сложности было обнаружено около 4 миллионов отдельных регуляторных областей, хотя только около 200000 из них были «активными» в любом конкретном типе клеток.

Чтобы установить связь с общими заболеваниями и клиническими признаками, исследователи проанализировали генетические варианты, которые были прочно связаны с заболеваниями и признаками, с помощью так называемых полногеномных ассоциативных исследований, которые сравнивают генетическую информацию между группами людей с или без определенного заболевания или черта характера. За последнее десятилетие сотни полногеномных ассоциативных исследований с участием сотен тысяч пациентов по всему миру были выполнены в отношении более 400 заболеваний и признаков. Почти в 95% случаев эти исследования выявляли генетические варианты, расположенные за пределами областей, кодирующих белок генов. Сравнение этих данных с планами регуляторной ДНК дало несколько ключевых результатов:

  • 76 процентов вариантов, связанных с заболеванием, в негенных областях на самом деле расположены внутри регуляторной ДНК или тесно связаны с ней. Это говорит о том, что многие заболевания возникают в результате изменений в том, когда, где и как включаются гены, а не в результате изменений самого гена.
  • 88 процентов регуляторных областей, содержащих варианты ДНК, связанные с заболеванием, были активны в раннем развитии плода. Поскольку многие из этих вариантов связаны с распространенными заболеваниями, встречающимися у взрослых, это открытие указывает на то, что факторы, влияющие на регуляторную схему генома на раннем этапе развития, могут влиять на риск развития определенных заболеваний в более позднем возрасте.
  • Изменения ДНК, связанные с конкретными заболеваниями, как правило, происходят в конкретных коротких кодах ДНК, распознаваемых регуляторными белками, участвующими в физиологических процессах, связанных с заболеванием, или органами или клетками, пораженными болезнью. Например, варианты ДНК, связанные с диабетом, как правило, встречаются в кодах, распознаваемых регуляторными белками, которые контролируют различные аспекты метаболизма сахара и секреции инсулина. Точно так же варианты, связанные с нарушениями иммунной системы, такими как рассеянный склероз, астма или волчанка, обнаруживаются в определенных кодах распознавания белков, которые регулируют функцию иммунной системы.
  • Многие, казалось бы, не связанные между собой заболевания имеют общие регуляторные цепи, включая заболевания, влияющие на иммунную систему, различные типы рака и ряд психоневрологических расстройств.
  • Исследование также выявило множество дополнительных связей между генетическими вариантами и заболеванием, которые скрывались в существующих данных полногеномных ассоциативных исследований. Просмотр этих данных через призму регуляторной ДНК выявил тысячи вариантов, которые были очень избирательно локализованы в регуляторной ДНК специфичных для болезни типов клеток. Эти варианты ранее игнорировались, поскольку строгие критерии отбора, использованные в более ранних исследованиях, не учитывали регуляторные регионы.

    Еще одно удивительное открытие заключалось в том, что схемы регуляторных схем можно было использовать для определения типов клеток, которые играют роль в конкретных заболеваниях, без каких-либо предварительных знаний о том, как работает болезнь. Например, было обнаружено, что генетические варианты, связанные с болезнью Крона (распространенным типом воспалительного заболевания кишечника), сконцентрированы в регуляторных областях, отображаемых в двух конкретных подгруппах иммунных клеток – тех же типах клеток, с которыми потребовались десятилетия предшествующих исследований, чтобы связать с ними развитие болезни Крона. Систематическое применение этого подхода позволит исследователям идентифицировать типы клеток, о которых ранее не было известно, что они играют роль в конкретном заболевании, расширяя наше понимание процесса болезни и потенциально приводя к новым методам лечения.