Модель искусственного интеллекта может помочь пациентам прогнозировать риск заболевания с помощью электронных медицинских карт

Электронные медицинские карты содержат важную информацию как для медицинских работников, так и для пациентов. Но эти записи также содержат информацию, которая может повлиять на способность алгоритма искусственного интеллекта прогнозировать риск заболевания пациентов в будущем.

Исследователи из Колледжа информационных наук и технологий стремятся устранить часть этого шума – или ненужных данных – с помощью новой модели машинного обучения. Глубокая нейронная сеть, получившая название LSAN, использует двусторонний подход для сканирования данных электронных медицинских карт и выявления информации, которая может предсказать риск развития у пациента целевого заболевания в будущем.

"Допустим, мы хотим предсказать, будет ли пациент страдать диабетом в будущем," сказал Ма. "Мы будем использовать исторические данные пациента, которые в некоторой степени могут быть связаны с диабетом, например, высокое кровяное давление или сердечная недостаточность, и являются факторами риска целевого заболевания."

Он продолжил, "Но есть также некоторые несвязанные диагностические коды или симптомы, и эта шумовая информация для пациента – это то, что мы хотим, чтобы модель удалила, и придаст им меньший вес."

В электронных медицинских картах используется двухуровневая иерархическая структура, позволяющая фиксировать медицинский путь пациента с использованием кодов Международной классификации болезней (МКБ). Иерархия начинается с пациента, за которым следует хронологическая последовательность посещений. Затем во время каждого визита коды МКБ сохраняются с записанными симптомами для этого визита.

LSAN, что означает "Долгосрочные зависимости и краткосрочные корреляции с иерархической сетью внимания для прогнозирования рисков," использует модуль иерархического внимания (HAM), чтобы выделить ранжированный порядок данных электронных медицинских карт и присвоить разные веса кодам МКБ в соответствии с их соответствием целевому заболеванию. Затем модуль временной агрегации (TAM) анализирует долгосрочные зависимости, например, как каждый визит соотносится с другими во всем медицинском путешествии пациента, и краткосрочные корреляции, например, как каждое посещение связано с другими в течение короткого периода времени.

"Пациент, страдающий диабетом, может иногда посещать врача и задавать вопросы о лечении диабета," сказал Фенглонг Ма, доцент информационных наук и технологий и главный исследователь. "Но иногда они могут пойти к врачу из-за простуды. Итак, мы хотим удалить случайность данных шума из электронных данных о состоянии здоровья."

Добавил он, ""Модель может выводить вероятность того, что пациент будет страдать каким-либо заболеванием. У некоторых пациентов в настоящее время могут отсутствовать четкие симптомы, но модель может сделать прогноз."

Исследователи провели эксперименты с тремя реальными наборами данных электронных медицинских карт пациентов с сердечной недостаточностью, заболеванием почек и деменцией и обнаружили, что LSAN превосходит существующие современные поверхностные методы и модели глубокого обучения.