Исследование, опубликованное по своей природе, Методы, обзоры, классифицируют и описывают достоинства и недостатки больше чем 20 алгоритмов, разработанных независимыми исследовательскими группами.«Несмотря на увеличивающуюся доступность последовательностей генома с высоким разрешением, общее предположение должно рассмотреть ген как единственную единицу», объясняет Адам Годзик, доктор философии, директор Биоинформатики и Структурной Программы Биологии в SBP и ведущего автора исследования. «Однако есть много событий, таких как единственные замены ДНК места и варианты соединения, которые могут произойти в гене – на подгенном уровне. Подгенные алгоритмы обеспечивают представление с высоким разрешением, которое может объяснить, почему различные мутации в том же самом гене могут привести к отличным фенотипам, в зависимости от того, как они влияют на определенные регионы белка.
«Хорошим примером того, как различные подгенные мутации влияют на рак, является ген NOTCH1», говорит Годзик. «Мутации в определенных областях NOTCH1 заставляют его действовать как подавитель опухоли в легком, коже и раковых образованиях в голове и шее. Но мутации в различном регионе могут способствовать хроническому лимфолейкозу и клетке T острая лимфообластная лейкемия.
Таким образом, неправильно предположить, что у мутаций в гене будут те же самые последствия независимо от их местоположения».Исследователи исследования применили каждый подгенный алгоритм к данным The Cancer Genome Atlas (TCGA), крупномасштабный набор данных, который включает данные о геноме из 33 различных типов опухоли больше чем от 11 000 пациентов.«Наша цель не состояла в том, чтобы определить, какой алгоритм работает лучше, чем другой, потому что это зависело бы от вопроса, который задают», говорят Эдуард Порта-Пардо, доктор философии, бывший postdoc в лаборатории Годзика и первом авторе статьи, который является теперь научным сотрудником в барселонском Суперкомпьютерном Центре. «Вместо этого Мы хотим сообщить потенциальным пользователям о том, как различные предположения позади каждого подгенного алгоритма влияют на результаты, и как результаты отличаются от методов, которые работают на целом генном уровне».«Мы нашли две важных вещи», говорит Порта-Пардо. «Сначала, мы нашли, что алгоритмы в состоянии воспроизвести список известных генов рака, установленных исследователями рака – утверждение подгенного подхода и связи между этими генами и раком.
Во-вторых, мы сочли много новых генов водителя рака – гены вовлеченными в процесс oncogenesis – которые были пропущены подходами целого гена.«Нахождение новых генов водителя рака является важной целью анализа генома рака», добавляет Порта-Пардо. «Это исследование должно помочь исследователям понять преимущества, и недостатки подгенных алгоритмов раньше находили новые потенциальные цели препарата лечения рака».