Пациенты, которые, возможно, без ведома их медицинских работников, нуждаются в генетическом тестировании на редкие недиагностированные заболевания, могут быть идентифицированы в массовом порядке на основе стандартной информации в электронных медицинских записях (EHR), сообщила сегодня исследовательская группа в журнале Nature Medicine.
Результаты исследования Медицинского центра Университета Вандербильта показывают, что среди пациентов любой крупной системы здравоохранения есть сотни или тысячи с недиагностированными редкими заболеваниями того типа, когда генетический тест может привести к постановке диагноза.
"Пациенты с редкими генетическими заболеваниями часто сталкиваются с годами диагностической одиссеи, прежде чем пройти генетический тест, если они вообще его получат. Наша работа могла бы способствовать более систематическому и своевременному подходу, предупреждая поставщиков пациентов, которым может быть полезен генетический тест," сказал руководитель исследования, генетик Дуглас Рудерфер, Ph.D., доцент медицины VUMC.
По оценкам, более 70% редких заболеваний имеют генетическое происхождение. По мнению авторов исследования, редкие генетические заболевания могут сильно отличаться от одного пациента к другому и могут оставаться недиагностированными, даже если они хорошо описаны в медицинской литературе.
Использование рутинных данных EHR для непосредственного выявления пациентов с конкретными генетическими заболеваниями на данный момент является довольно сложной задачей: по мнению авторов исследования, текущее состояние знаний о вызывающих заболевания генетических вариациях слишком мало, а генетическое разрешение текущих клинических тестов является недостаточным. слишком низко. Учитывая такое положение дел, команда разработала свою прогностическую модель, чтобы вместо этого выявлять пациентов, которые соответствуют историческим критериям для тестирования в глазах клиницистов.
Для начала команда разработала ряд конкурирующих алгоритмов прогнозирования. Для обучающих данных они использовали EHR пациентов, для которых клиницисты заказали тип генетического теста, называемого хромосомным микрочипом (1818 случаев), и аналогичных пациентов, чьи записи не показали истории генетического тестирования (7326 подобранных контролей). Средний возраст представленных пациентов по тренировочной и тестовой выборкам составил 8 лет.
"Мы действительно стремились создать модель, которая фиксирует и автоматизирует клинические подозрения на генетическое заболевание," сказал Теодор Морли, штатный специалист по данным, который работал в тесном сотрудничестве с Рудерфером над исследованием.
После удаления всех следов генетического тестирования из тестового набора из 2286 записей, алгоритм машинного обучения оказался лучшим исполнителем, правильно классифицируя 87% случаев и 96% контролей.
Также высокую точность продемонстрировали независимые усилия по валидации, проведенные в Бостонской Массачусетской больнице общего профиля и снова в VUMC, с гораздо большим количеством постоянных пациентов, случаи, которые теперь определяются на основе данных в EHR взаимодействия с поставщиком генетических услуг.
Важно отметить, что алгоритм также хорошо показал себя при идентификации пациентов, которые прошли генетические тесты, отличные от хромосомных микрочипов.
Исследование поддерживает гипотезу о том, что в любой популяции EHR пациентов, у которых следует подозревать редкие генетические заболевания, можно различить с помощью вычислений благодаря наличию множества редких признаков и симптомов – фенотипов, на языке исследования – которые подлежат к документации в ЭМК. В алгоритмах прогнозирования команды использовались исключительно диагностические коды EHR (те же коды, которые используются при выставлении счетов за услуги здравоохранения), объединенные для целей прогнозирования в так называемые коды фенотипа.
"После того, как обширная проверка продемонстрировала высокую прогностическую эффективность, мы были действительно заинтересованы в оценке того, как реализация нашей модели может сравниваться с текущим статус-кво в отношении того, кто получает тест, и каковы результаты этих тестов," Рудерфер сказал.
Из набора из 6445 деидентифицированных EHR, соответствующих генотипированным образцам пациентов из BioVU, биобанка ДНК Вандербильта, алгоритм оказался точным в выборе людей с вариациями количества патогенных копий, типом генетической аномалии.
Сопоставляя этот и другие результаты исследования, авторы оценивают более 2000 пациентов в VUMC, у которых есть нераспознанные, потенциально диагностические вариации числа копий, которые могут быть идентифицированы с помощью генетического теста.
Среди пристальных наблюдателей за исследованием – Джош Петерсон, доктор медицины, магистр здравоохранения, директор Центра точной медицины VUMC (где Рудерфер является аффилированным преподавателем).
"Было показано, что прогностическая модель команды легко превосходит текущие клинические показатели, выявляя пациентов, которым требуется тестирование, быстрее и в большем количестве. Важно отметить, что модель также оказалась переносимой для другой системы здравоохранения. Выводы этой статьи очень хорошо согласуются с стремлением VUMC использовать науку о данных для улучшения диагностики геномных синдромов," Петерсон сказал.