Ключевые результаты
Исследователи разработали модель машинного обучения для прогнозирования риска тромбоэмболии легочной артерии (ТЭЛА) у пациентов с инсультом и тромбозом глубоких вен нижних конечностей (ТГВ). Наиболее эффективной оказалась модель на основе алгоритма Random Forest Classifier (RFC), продемонстрировавшая площадь под ROC-кривой (AUC) = 0,77, точность = 0,721, чувствительность = 0,918, специфичность = 0,750 и F1-показатель = 0,826.
Методология
В ретроспективное исследование были включены 337 пациентов с инсультом, у которых развился тромбоз глубоких вен нижних конечностей, госпитализированных с января 2019 по апрель 2024 года. Из них у 24 пациентов развилась тромбоэмболия легочной артерии.
Для анализа использовали:
- Демографические данные пациентов
- Медицинский анамнез и сопутствующие заболевания
- Клинические признаки
- Лабораторные показатели
- Данные о госпитализации и медикаментозной терапии
Для отбора предикторных переменных применялась LASSO-регрессия, которая выявила 11 значимых предикторов. Для решения проблемы несбалансированности выборки использовался алгоритм SMOTE. Для предотвращения переобучения и оптимизации моделей применялись иерархическая k-кратная валидация, весовые коэффициенты классов, техники случайного поиска и настройка методом самостоятельного шага.
Значимость признаков была количественно определена с использованием метода SHAP (SHapley Additive exPlanations).
Клиническое значение
Выявлено, что ключевыми факторами риска ТЭЛА у пациентов с инсультом и ТГВ (в порядке убывания значимости) являются:
- Парциальное давление кислорода
- Наличие артериальной гипертензии в анамнезе
- Уровень D-димера
- Сывороточный креатинин
- Тяжелая патология легких
- Постельный режим ≥72 часов
- Тип инсульта
- Сердечная недостаточность
- Применение кислотообразующих препаратов
- Боль в груди
- Одышка
Разработанная модель позволит клиницистам быстро выявлять пациентов с высоким риском развития ТЭЛА, что особенно важно, учитывая скрытое начало и высокую смертность при данном осложнении. Это поможет своевременно назначить профилактические меры и целенаправленно применять КТ-ангиографию легочной артерии (КТАПА) для подтверждения диагноза у пациентов из группы высокого риска.
Выводы
Модель машинного обучения на основе алгоритма Random Forest Classifier представляет собой эффективный инструмент для скрининга риска ТЭЛА у пациентов с инсультом и ТГВ нижних конечностей. Данная модель может быть интегрирована в клиническую практику для раннего выявления пациентов, требующих усиленных профилактических и терапевтических мер.
Такой подход особенно актуален, поскольку до 42% пациентов с инсультом подвержены риску развития ТГВ нижних конечностей, который может привести к потенциально фатальной ТЭЛА. Применение предиктивной модели позволит оптимизировать использование ресурсоемкой КТАПА, которая не может рутинно выполняться в качестве скринингового метода, и улучшить прогноз для данной категории пациентов.

