Сравнение данных генома японцев с данными дальних родственников

Банк геномов японского населения может лучше определять редкие генетические варианты и восприимчивость к болезням, добавляя образцы из отдаленных районов страны.

Согласно новому исследованию, опубликованному в BMC Genomics, объединение образцов из разных регионов Японии упрощает поиск редких генетических вариантов в общенациональном масштабе. Важно идентифицировать эти маркеры, поскольку они могут указывать, какие генетические варианты приводят к определенным заболеваниям в популяции.

Генетические вариации или мутации являются обычным явлением, и определение того, какие вариации ответственны за определенные черты или заболевания, является сложной задачей. Один из способов, которым генетики пытаются добиться этого, – это исследования генома, охватывающие всю популяцию, и поиск редких последовательностей, которые не были идентифицированы ранее. Они используют вменение генотипов, статистический метод для идентификации неизвестных генотипов, чтобы искать в больших наборах данных и выбирать группу генов, унаследованных от родителя, называемых гаплотипами, которые содержат кластер вариаций, называемых однонуклеотидными полиморфизмами (SNP).

Ранее в рамках проекта Tohoku Medical Megabank был создан набор данных из 1070 геномов, содержащих информацию о гаплотипах. Проект, запущенный после землетрясения 2011 года, направлен на разработку индивидуальной медицинской диагностики и лечения с использованием генетической информации людей в префектурах Мияги и Иватэ. Данные, известные как справочная панель 1KJPN, были созданы на основе образцов от Miyagi.

В настоящем исследовании группа исследователей из организации Tohoku Medical Megabank при Университете Тохоку изучала, насколько точно образцы Мияги представляют разнообразие геномных вариаций всего населения материковой Японии. Они сравнили панель 1KJPN с 144, 39 и 35 образцами генома из районов Иватэ, Нагахама и Аки, соответственно.

Результаты показали, что, хотя данные Мияги были достаточным представителем всей популяции, объединение набора данных 1KJPN с образцами генома из Иватэ, Нагахамы и Аки повысило эффективность вменения генотипа, особенно при идентификации редких вариантов или SNP в общенациональном масштабе. Объединенные данные также были более точными, чем образцы из Японии в проекте 1000 Genome Project, крупнейшей базе данных генотипов человека, созданной Европейским институтом биоинформатики.

Сравнение образцов генома из четырех областей показывает, почему объединенные данные сильнее. Исследователи обнаружили, что генетические различия усиливаются по мере удаления от Мияги. Например, популяции в соседних регионах Мияги и Иватэ были больше всего похожи друг на друга, чем популяции в Нагахаме и Аки, которые расположены более чем на 700 км (435 миль) и 1000 км (620 миль) к югу, соответственно.

Более глубокий анализ индивидуальных геномов выявил редкие SNP, которые присутствуют у Иватэ, Нагахамы и Аки, но не у Мияги. Больше вариантов было обнаружено в районах, наиболее удаленных от Мияги, что свидетельствует о важности сбора геномных данных из разрозненных районов для выявления широкого диапазона редких вариаций.

Интересно, что команда обнаружила, что образцы Аки сформировали отдельный кластер генома, что указывает на то, что популяция Аки на острове Сикоку генетически отличается от популяций на соседнем острове Хонсю. Это противоречит существующему представлению о том, что генетическая дифференциация минимальна среди популяций на основных четырех островах Японии, которые расположены близко друг к другу и соединены мостами или туннелями. Однако генетические различия между Аки и другими регионами намного меньше, чем генетические различия, обнаруженные между популяциями Японии и населения материкового Китая.

На следующем этапе исследователи надеются сотрудничать с другими группами для получения генетических данных из других частей страны. Объединенный набор данных можно использовать для идентификации конкретных генов, связанных с распространенными заболеваниями.