Анализ эффективности прогностических моделей внутригоспитальной летальности у больных инфарктом миокарда с подъемом сегмента ST на основе предикторов в категориальной и непрерывной формах

К.И. Шахгельдян, Н.С. Куксин, И.Г. Домжалов, Б.И. Гельцер

Ключевые слова: прогностические модели; категоризация данных; инфаркт миокарда с подъемом сегмента ST; летальность; факторы риска; метод аддитивного объяснения Шепли.

Цель исследования — оценить эффективность прогностических моделей, разработанных на основе предикторов в непрерывной и категориальной формах, для предсказания вероятности внутригоспитальной летальности (ВГЛ) у больных инфарктом миокарда с подъемом сегмента ST (ИМпST) после чрескожного коронарного вмешательства (ЧКВ).

Материалы и методы. Проведено одноцентровое ретроспективное исследование, в рамках которого анализировали данные 4674 историй болезни пациентов с ИМпST после ЧКВ, находившихся на лечении в Региональном сосудистом центре г. Владивостока. Выделено 2 группы больных: 1-ю составили 318 человек (6,8%), умерших в стационаре; 2-ю — 4356 пациентов (93,2%) с благоприятным исходом лечения. Прогностические модели ВГЛ были разработаны методами многофакторной логистической регрессии (МЛР), случайного леса (СЛ) и стохастического градиентного бустинга (СГБ). Для оценки точности моделей использовали 6 метрик качества. Пороговые значения предикторов ВГЛ определяли методами поиска на сетке оптимальных точек отсечения, расчета центроидов и аддитивного объяснения Шепли. С помощью последнего оценивали степень влияния предикторов на конечную точку.

Результаты. По результатам многоступенчатого анализа показателей клинико-функционального статуса больных ИМпST были выделены и валидированы новые предикторы ВГЛ, дополняющие факторы шкалы GRACE, выполнена их категоризация и разработаны прогностические модели с непрерывными и категориальными переменными на основе МЛР, СЛ и СГБ. Данные модели имели высокую (AUC — от 0,88 до 0,90) и сопоставимую точность прогноза, но их предикторы отличались различной степенью влияния на конечную точку. Сравнительный анализ показал, что метод аддитивного объяснения Шепли имеет преимущества при категоризации предикторов по сравнению с другими методами и позволяет детализировать структуру их взаимосвязей с ВГЛ.

Заключение. Использование современных методов интеллектуального анализа данных, включающих алгоритмы машинного обучения, категоризацию предикторов и оценку степени их влияния на конечную точку, позволяет разрабатывать прогностические модели, обладающие высокой точностью и свойствами объяснения генерируемых заключений.

Введение

На сегодняшний день одним из эффективных методов лечения инфаркта миокарда с подъемом сегмента ST (ИМпST) является реваскуляризация миокарда посредством чрескожного коронарного вмешательства (ЧКВ) [1]. Однако внутригоспитальная летальность (ВГЛ) после выполнения ЧКВ по экстренным показаниям остается высокой и варьирует от 4 до 7%, что актуализирует необходимость прогнозирования неблагоприятных событий [2].

К наиболее востребованным инструментам рискометрии относят шкалу GRACE (Global Registry of Acute Coronary Events), совершенствование которой является целью ряда исследований последних лет [3–6]. В большинстве случаев для разработки прогностических моделей базовые факторы данной шкалы дополняют новыми предикторами. Важным при этом остается корректное выделение их пороговых значений.

В настоящее время для решения данной задачи могут быть использованы методы предиктивной аналитики на основе машинного обучения, которые все шире применяются в различных областях медицины [7–10]. Вместе с тем из-за «непрозрачности» моделей машинного обучения их внедрение в клиническую практику довольно ограничено. Решение этой проблемы возможно с помощью категоризации непрерывных переменных, применяемых в прогностических алгоритмах. Категоризация данных позволяет определять пороговые значения анализируемых показателей, отклонения от которых могут быть использованы для выявления факторов риска и клинического обоснования предсказанной вероятности неблагоприятных событий [11, 12]. Кроме того, при комбинировании факторов риска реализуется возможность характеристики особенностей комплексного воздействия различных признаков на результирующую переменную [13]. Вместе с тем, по мнению ряда авторов, показатели в категориальной, в частности дихотомизированной, форме могут приводить к потере информации, искажению результатов анализа [14–16], увеличению доли ложноположительных [17] и ложноотрицательных [18] заключений. Несмотря на обозначенные недостатки, рекомендации STROBE (Strengthening the reporting of observational studies in epidemiology) подтверждают целесообразность использования категоризации данных при условии указания методов, которыми она проводилась [19].

Цель исследования — оценить эффективность прогностических моделей, разработанных на основе предикторов в непрерывной и категориальной формах, для предсказания вероятности внутригоспитальной летальности у больных инфарктом миокарда с подъемом сегмента ST после чрескожного коронарного вмешательства.

Материалы и методы

Характеристика пациентов. Проведено одноцентровое когортное ретроспективное исследование, в рамках которого проанализированы данные историй болезни 4674 пациентов (3200 мужчин и 1474 женщины) с ИМпST в возрасте от 26 до 93 лет (медиана — 63 года, 95% доверительный интервал (ДИ): 62–63), поступивших в Региональный сосудистый центр «Приморская краевая клиническая больница №1» (Владивосток) с 2015 по 2021 г. [20]. Всем больным выполнено экстренное ЧКВ. Пациенты были разделены на две группы: 1-я — 318 человек (6,8%), умерших в стационаре; 2-я — 4356 пациентов (93,2%) с благоприятным исходом заболевания. Исследование проведено в соответствии с принципами Хельсинкской декларации и одобрено локальным этическим комитетом Дальневосточного федерального университета (протокол №8 от 8.06.2023 г.)

Критерии включения в исследование: больные с подтвержденным ИМпST и выполнением ЧКВ в 1-е сутки стационарного лечения. Критерии невключения: нестабильная стенокардия, инфаркт миокарда без подъема сегмента SТ и отсутствие показаний для ЧКВ.

Клинико-функциональный статус больных оценивали в 1-е сутки стационарного лечения с помощью 136 факторов, основные из которых представлены в табл. 1. Данные включали 5 признаков шкалы GRACE: возраст больных, класс острой сердечной недостаточности (ОСН) по T. Killip, частоту сердечных сокращений (ЧСС), систолическое артериальное давление (САД), концентрацию креатинина в сыворотке крови. Анализировали лабораторные показатели: содержание эритроцитов (RBC), лейкоцитов (WBC), лимфоцитов (LYM), нейтрофилов (NEUT) и эозинофилов (EOS), гемоглобин (Hb), тромбоциты (PLT) и тромбокрит (PCT), международное нормализованное отношение (МНО), тромбиновое время (ТВ), протромбиновый индекс (ПТИ), активированное частичное тромбопластиновое время (АЧТВ), уровни фибриногена и глюкозы в сыворотке крови. Послеоперационное эхокардиографическое исследование включало определение поперечного и продольного размеров левого (LA1 и LA2) и правого (RA1 и RA2) предсердий, конечного систолического (КСР) и диастолического (КДР) размеров левого желудочка (ЛЖ), фракции выброса (ФВ) ЛЖ методом Тейхольца, среднего давления в легочной артерии (СДЛА). Оценивали расчетные показатели: относительный индекс массы миокарда ЛЖ (ОИММ ЛЖ), индекс относительной толщины (ИОТ) задней стенки ЛЖ, индекс массы тела (ИМТ).

Таблица 1. Клинико-функциональная характеристика больных инфарктом миокарда с подъемом сегмента ST

Конечная точка исследования была представлена показателем ВГЛ у больных ИМпST после ЧКВ от всех причин в форме категориального бинарного признака («отсутствие» или «развитие»).

Методы статистического анализа и машинного обучения. Распределение данных по тесту Колмогорова–Смирнова отличалось от нормального, в связи с чем использовали непараметрические методы статистики. Показатели были представлены медианой (Me) и межквартильными интервалами [Q1; Q3]; для межгрупповых сравнений непрерывных переменных применяли тест Манна–Уитни, а для категориальных — ÷². Отношение шансов (ОШ) и их 95% ДИ рассчитывали точным тестом Фишера. Статистически значимыми считали различия при р<0,01.

Модели разрабатывали методами многофакторной логистической регрессии (МЛР), случайного леса (СЛ) и стохастического градиентного бустинга (СГБ). Их качество оценивали по шести метрикам: площадь под ROC-кривой (AUC), чувствительность (Sen), специфичность (Spec), балл F1 (F1-score), предсказательная ценность положительного теста (positive predictive value, PPV), предсказательная ценность отрицательного теста (negative predictive value, NPV).

Для выделения пороговых значений потенциальных предикторов использовали методы оптимизации на сетке с шагом Δ=(max–min)/100: минимизацию p-значения — Min(p), максимизацию ОШ — Max(ОШ) и AUC — Max(AUC), а также метод центроидов и аддитивного объяснения Шепли (SHAP) [21, 22]. Последний применяли также для оценки степени влияния предикторов модели на конечную точку.

Датасет был разделен на 2 выборки: для обучения и кросс-валидации (80%), для итогового тестирования (20%). Процедуру обучения и кросс-валидации выполняли методом стратификации в k-Folders на 10 выборках. Усредненные метрики качества AUC, Sen и Spес использовали для выбора лучшей модели, отбора и валидации предикторов и подбора оптимальных гиперпараметров путем перебора по сетке допустимых значений. Для заключительного тестирования лучшие модели МЛР, СЛ и СГБ с оптимальными параметрами и гиперпараметрами обучали на 80% датасета, а проверяли на подгруппе для итогового тестирования. Для доверительной оценки метрик качества процедуру повторяли 500 раз, выполняя первоначальное разделение случайным образом по методу Монте-Карло. Анализ данных и построение моделей проводили в Python с открытым исходным кодом, версии 3.9.16.

Дизайн исследования включал 4 этапа. На первом из них с помощью тестов межгрупповых сравнений формировался пул потенциальных предикторов ВГЛ (см. табл. 1).

На втором этапе исследования с помощью методов машинного обучения разрабатывали прогностические модели ВГЛ c предикторами в непрерывной форме, включающие 5 базовых факторов шкалы GRACE. Для повышения точности прогноза структуру моделей пошагово дополняли новыми предикторами, выделенными на первом этапе исследования, при условии статистически значимого различия на уровне p<0,01. Прогностическая значимость предиктора подтверждалась, если после его включения в модель значение AUC возрастало. На этом этапе методом SHAP анализировали степень влияния предикторов лучшей модели на конечную точку исследования.

На третьем этапе непрерывные предикторы категоризировали с помощью различных методов для выделения пороговых значений, отклонение от которых позволяет отнести их к факторам риска ВГЛ.

На четвертом этапе исследования разрабатывали прогностические модели ВГЛ на основе категориальных предикторов и оценивали степень их влияния на конечную точку.

Результаты

На первом этапе исследования был проведен межгрупповой анализ клинико-демографических и лабораторных показателей. Большинство из них, в том числе все предикторы шкалы GRACE, имели статистически значимые различия (см. табл. 1). Среди умерших преобладали лица старшего возраста, женского пола и более низкого роста. Кроме того, для пациентов 1-й группы было характерно наличие III и IV класса ОСН по T. Killip; меньшие значения САД, ДАД, ФВ ЛЖ, LYM, ЕОS, ПТИ, RBC, Hb; более высокие уровни ЧСС, СДЛА, КСР ЛЖ, креатинина, NEUT, АЧТВ, МНО, мочевины, глюкозы; увеличение размеров предсердий и показателя ОИММ ЛЖ. У них же чаще фиксировали передний инфаркт миокарда, сахарный диабет 2-го типа (СД 2), фибрилляцию предсердий (ФП) и хроническую болезнь почек (ХБП).

На втором этапе исследования были разработаны прогностические модели ВГЛ, где помимо пяти базовых показателей шкалы GRACE в непрерывной форме использовали новые факторы. Последние были выделены в результате итерационного тестирования пула потенциальных предикторов, полученных на первом этапе. Для выполнения процедур тестирования каждый из потенциальных предикторов поочередно включали в базовую модель шкалы GRACE и оставляли в модели только тот, который обеспечивал максимальное увеличение метрики AUC. На следующих итерациях процедуру повторяли для оставшихся потенциальных предикторов. Таким образом, было выделено 5 новых прогностических факторов, к которым относились показатели ФВ ЛЖ, NEUT, EOS, PCT и глюкоза. Необходимо также отметить, что сопоставление значений AUC модели, разработанной нами ранее [23], на этой же выборке больных с использованием только предикторов шкалы GRACE и модели, дополненной новыми предикторами, демонстрировало более высокую точность последней (AUC — 0,836 vs. 0,9).

Сравнение предсказательной ценности моделей, разработанных методами МЛР, СГБ и СЛ, показало, что они обладают высокой прогностической способностью и имеют близкие значения метрик качества при кросс-валидации и итоговом тестировании (AUC варьировала от 0,884 до 0,900). Это свидетельствует об отсутствии их переобучения и хороших обобщающих свойствах (табл. 2).

Таблица 2. Оценка точности прогностических моделей внутригоспитальной летальности у больных инфарктом миокарда с подъемом сегмента ST после чрескожного коронарного вмешательства с использованием предикторов в непрерывной форме, Me [Q1; Q3]

Оценка степени влияния непрерывных предикторов на конечную точку методом SHAP показала, что наиболее тесную ассоциацию с ВГЛ имеют ФВ ЛЖ и креатинин. Менее заметное воздействие на данную точку оказывали ЧСС, NEUT и глюкоза крови, а наименьшее влияние на конечную точку демонстрировали показатели EOS, САД, возраст больных, PCT и класс ОСН по T. Killip (рис. 1).

Рис. 1. Оценка важности предикторов внутригоспитальной летальности в непрерывной форме в модели многофакторной логистической регрессии

На третьем этапе исследования выполняли категоризацию предикторов ВГЛ в непрерывной форме методами поиска оптимального порога отсечения на сетке, методом SHAP и с помощью расчета центроида. Использование пороговых значений, отклонение от которых ассоциируется с увеличением вероятности ВГЛ, позволяет рассматривать категоризованные данные как факторы риска неблагоприятных событий. Фактор риска кодируется как «1», если значение предиктора превышает порог с постфиксом «+» или не достигает порога с постфиксом «–», в остальных случаях, когда значение предиктора находится в другом диапазоне, фактор риска кодируется как «0».

Результаты исследования показали, что пороговые значения, полученные различными методами, часто отличались между собой. Так, например, порог отсечения для показателя ФВ ЛЖ по версии SHAP составлял <45%, в то время как при максимизации ОШ и AUC точка отсечения фиксировалась на уровне 31 и 51% соответственно (табл. 3). В то же время пороговые значения, определенные алгоритмом SHAP, были ближе всего к критериальным границам, верифицированным методом Min(p). Пороговые значения, полученные методом Max(ОШ), имели экстремальный порог отсечения и позволяли идентифицировать только узкую группу лиц с высокой вероятностью ВГЛ. Необходимо отметить, что метод SHAP дает возможность не только определить пороговые границы, но и оценить интенсивность влияния на ВГЛ показателей, значения которых находятся в «зоне риска». К категориальным факторам, выделенным этим методом, относились следующие признаки: возраст >70 лет, ЧСС >89 в минуту, САД <95 мм рт.ст., класс ОСН по Т. Killip >II, креатинин >166 мкмоль/л, ФВ ЛЖ <45%, NEUT >77%, EOS <0,2%, PCT >0,32%, глюкоза >8,9 ммоль/л (рис. 2). На примере диаграммы ФВ ЛЖ видно, что вероятность ВГЛ последовательно увеличивается в диапазоне значений 44–31% и резко возрастает при уровне данного показателя <30%. Повышение концентрации глюкозы в крови более 8,9 ммоль/л увеличивает риск ВГЛ, но вероятность фатального исхода значительно возрастает при ее уровне более 17 ммоль/л.

Таблица 3. Категоризация непрерывных предикторов внутригоспитальной летальности с помощью различных методов

Рис. 2. Оценка влияния непрерывных показателей и их пороговых значений на конечную точку по методу SHАР

Пунктирная линия обозначает порог отсечения

На четвертом этапе исследования на основе МЛР были разработаны прогностические модели ВГЛ с предикторами в категориальной форме (табл. 4). Сравнительный анализ показал, что большинство моделей обладают высокой предиктивной способностью вне зависимости от метода определения пороговых значений. Исключение составила модель, в которой категоризация предикторов выполнялась методом Max(ОШ), что не обеспечивало приемлемую точность прогноза (AUC — 0,662). Оценка метрик качества моделей с категориальными и непрерывными предикторами демонстрировала отсутствие статистически значимых различий. Например, 95% ДИ для медиан AUC в анализируемых моделях составлял 0,882–0,887 и 0,841–0,959 соответственно при p=0,172, что указывает на их сопоставимую прогностическую точность.

Таблица 4. Оценка точности прогностических моделей внутригоспитальной летальности на основе предикторов в категориальной форме, Me [Q1; Q3]

Анализ влияния категориальных переменных на ВГЛ методом SHAP показал, что наибольшее воздействие на ВГЛ оказывают следующие факторы риска: ЧСС >89 в минуту, креатинин >166 мкмоль/л и содержание нейтрофилов >77% (значения SHAP — 1,28; 1,27 и 1,20 соответственно) (рис. 3). Меньшая ассоциация с конечной точкой наблюдалась у показателей глюкозы >8,9 ммоль/л, ФВ ЛЖ <45%, III и IV класса ОСН по T. Killip, САД <95 мм рт.ст. (SHAP — 1,10; 1,02; 0,98; 0,82 соответственно), а наименее заметное влияние на ВГЛ оказывали возраст >71 год, содержание эозинофилов <0,2% и тромбокрит >0,32% (SHAP — 0,62; 0,58 и 0,14).

Рис. 3. Оценка важности предикторов внутригоспитальной летальности в категориальной форме в модели многофакторной логистической регрессии

Обсуждение

В последние годы на основе методов машинного обучения разрабатываются прогностические модели, структура которых представлена факторами с более высоким предиктивным потенциалом, чем в классических шкалах рискометрии. Перспективными инструментами для их отбора являются алгоритмы объяснимого искусственного интеллекта (ОИИ), к элементам которого относят определение пороговых значений анализируемых факторов и оценку степени их влияния на конечную точку исследования. Концепция ОИИ базируется на возможности обоснования и интерпретации тех или иных решений, полученных в результате моделирования, оценке их значимости и точности генерируемых заключений [24]. Одним из барьеров для реализации указанных принципов является многофакторность и нелинейность прогностических моделей, когда на конечную точку влияет совокупность разнородных данных, ассоциированных с различными причинами фатальных событий. Непрозрачность взаимосвязей различных факторов с ВГЛ может быть частично преодолена за счет их категоризации, что позволяет детализировать соотношения показателей клинико-функционального статуса больных ИМпST с результирующей переменной. По данным литературы, наиболее доступным методом категоризации является дескриптивная статистика с расчетом медиан, квартилей или квантилей [16, 25, 26]. Вместе с тем большая часть критических замечаний по категоризации связана именно с этим подходом, что обусловлено прежде всего зависимостью таких пороговых значений от конкретной выборки, отсутствием взаимосвязи с клиническим контекстом, игнорированием возможных нелинейных отношений и др. Другой подход основан на выделении порогового значения, известного из практики как выход за пределы нормы [26]. Альтернативным методом является поиск оптимальных пороговых значений на основе минимизации или максимизации целевых функций. По нашему мнению, категоризация переменных должна рассматриваться только в рамках решения конкретной клинической задачи, хотя выделенные предикторы могут представлять интерес для реализации других прогностических исследований. Каким бы методом ни определялись их пороговые значения, с одной стороны, они могут приводить к потере информации, а с другой — привносить новые знания. В настоящей работе пороговые значения определяли методами поиска на сетке оптимальных точек отсечения, расчета центроидов и аддитивного объяснения Шепли (SHAP). Отклонение показателей от пороговых значений повышало их предиктивный потенциал и позволяло отнести к факторам риска ВГЛ у больных ИМпST после ЧКВ. Было установлено, что метод аддитивного объяснения Шепли, который рассматривают как технологию ОИИ, является перспективным инструментом категоризации за счет точного определения порогов отсечения и анализа взаимосвязи предикторов в непрерывной и категориальной формах с конечной точкой исследования. Несмотря на сопоставимую точность прогностических моделей ВГЛ с непрерывными и категориальными предикторами, имели место определенные различия в интенсивности их влияния на конечную точку. Так, наибольшую взаимосвязь с фатальным исходом среди непрерывных предикторов демонстрировали показатели ФВ ЛЖ и креатинин, а наименьшую — класс ОСН по T. Killip и возраст больных. Среди категориальных предикторов более заметной была ассоциация ВГЛ с ЧСС >89 в минуту, креатинином >166 мкмоль/л и уровнем нейтрофилов >77%, а минимальная — с тромбокритом >32% и содержанием эозинофилов <0,2%. Эти различия могут объясняться конечной точкой исследования, представленной в форме ВГЛ от всех причин, что не позволяет верифицировать предикторы, связанные с конкретным вариантом неблагоприятного исхода (повторный инфаркт миокарда, фатальные аритмии, кровотечения и др.). Другая причина несовпадения важности предикторов могла быть связана с тем, что в нашем исследовании их категоризация выполнялась с выделением только одного порога отсечения. Наличие единственной критериальной границы ограничивает возможности для оценки нелинейных взаимосвязей ВГЛ со значениями предикторов, находящихся в «зоне риска». Убедительным примером такой ситуации является резкое повышение вероятности ВГЛ при ФВ ЛЖ менее 30% по сравнению с диапазоном ее значений 31–44% (см. рис. 2). В нашем случае предиктор ФВ ЛЖ <45% уступал по важности показателям ЧСС >89 в минуту и креатинину >166 мкмоль/л в прогностической модели ВГЛ с категориальными факторами, при этом данный предиктор указывал, что преодоление выделенной в процессе дихотомизации критериальной границы ассоциируется с возрастающим риском неблагоприятного исхода. В последние годы с целью повышения точности прогноза категоризацию переменных рекомендуют проводить с использованием нескольких порогов отсечения, что конкретизирует нелинейные взаимосвязи предикторов с конечной точкой [19]. Результаты нашего исследования свидетельствуют о том, что несмотря на определенные проблемы, связанные с дихотомизацией непрерывных переменных прогностических моделей, ее проведение является целесообразным, так как расширяет возможности для объяснения и клинической интерпретации генерируемых заключений. При этом очевидна необходимость совершенствования данного подхода за счет применения технологий многоуровневой категоризации.

Ограничения исследования связаны с его ретроспективным характером, использованием для категоризации непрерывных переменных только метода дихотомизации, необходимостью валидации моделей на данных из других лечебных учреждений.

Заключение

В настоящем исследовании были выделены и валидированы новые предикторы внутригоспитальной летальности у больных инфарктом миокарда с подъемом сегмента ST после чрескожного коронарного вмешательства, выполнена их категоризация и разработаны прогностические модели с непрерывными и категориальными переменными на основе методов многофакторной логистической регрессии, случайного леса и стохастического градиентного бустинга. Данные модели имели высокую и сопоставимую точность прогноза, но их предикторы отличались различной степенью влияния на конечную точку. Сравнительный анализ показал, что метод аддитивного объяснения Шепли имеет преимущества при категоризации предикторов и позволяет детализировать структуру их взаимосвязей с внутригоспитальной летальностью. Для совершенствования прогностических моделей с категориальными предикторами целесообразно использование многоуровневых порогов отсечения, повышающих качество и объяснимость генерируемых заключений.

Источник финансирования. Исследование выполнено при финансовой поддержке гранта Российского научного фонда №23-21-00250, https://rscf.ru/project/23-21-00250/.

Конфликт интересов. Авторы декларируют отсутствие явных и потенциальных конфликтов интересов, связанных с публикацией настоящей статьи.

Литература

Ibanez B., James S., Agewall S., Antunes M.J., Bucciarelli-Ducci C., Bueno H., Caforio A.L.P., Crea F., Goudevenos J.A., Halvorsen S., Hindricks G., Kastrati A., Lenzen M.J., Prescott E., Roffi M., Valgimigli M., Varenhorst C., Vranckx P., Widimský P.; ESC Scientific Document Group. 2017 ESC Guidelines for the management of acute myocardial infarction in patients presenting with ST-segment elevation: The Task Force for the management of acute myocardial infarction in patients presenting with ST-segment elevation of the European Society of Cardiology (ESC). Eur Heart J 2018; 39(2): 119–177, https://doi.org/10.1093/eurheartj/ehx393.
Pfuntner A., Wier L.M., Stocks C. Most frequent procedures performed in U.S. hospitals, 2011. In: Healthcare Cost and Utilization Project (HCUP) Statistical Briefs. Rockville (MD): Agency for Healthcare Research and Quality (US); 2014.
Wang J.J., Fan Y., Zhu Y., Zhang J.D., Zhang S.M., Wan Z.F., Su H.L., Jiang N. Biomarkers enhance the long-term predictive ability of the KAMIR risk score in Chinese patients with ST-elevation myocardial infarction. Chin Med J (Engl) 2019; 132(1): 30–41, https://doi.org/10.1097/cm9.0000000000000015.
Liu X.J., Wan Z.F., Zhao N., Zhang Y.P., Mi L., Wang X.H., Zhou D., Wu Y., Yuan Z.Y. Adjustment of the GRACE score by HemoglobinA1c enables a more accurate prediction of long-term major adverse cardiac events in acute coronary syndrome without diabetes undergoing percutaneous coronary intervention. Cardiovasc Diabetol 2015; 14: 110, https://doi.org/10.1186/s12933-015-0274-4.
Chen X., Shao M., Zhang T., Zhang W., Meng Y., Zhang H., Hai H., Li G. Prognostic value of the combination of GRACE risk score and mean platelet volume to lymphocyte count ratio in patients with ST-segment elevation myocardial infarction after percutaneous coronary intervention. Exp Ther Med 2020; 19(6): 3664–3674, https://doi.org/10.3892/etm.2020.8626.
Wenzl F.A., Kraler S., Ambler G., Weston C., Herzog S.A., Räber L., Muller O., Camici G.G., Roffi M., Rickli H., Fox K.A.A., de Belder M., Radovanovic D., Deanfield J., Lüscher T.F. Sex-specific evaluation and redevelopment of the GRACE score in non-ST-segment elevation acute coronary syndromes in populations from the UK and Switzerland: a multinational analysis with external cohort validation. Lancet 2022; 400(10354): 744–756, https://doi.org/10.1016/s0140-6736(22)01483-0.
Li R., Shen L., Ma W., Yan B., Chen W., Zhu J., Li L., Yuan J., Pan C. Use of machine learning models to predict in-hospital mortality in patients with acute coronary syndrome. Clin Cardiol 2023; 46(2): 184–194, https://doi.org/10.1002/clc.23957.
Zack C.J., Senecal C., Kinar Y., Metzger Y., Bar-Sinai Y., Widmer R.J., Lennon R., Singh M., Bell M.R., Lerman A., Gulati R. Leveraging machine learning techniques to forecast patient prognosis after percutaneous coronary intervention. JACC Cardiovasc Interv 2019; 12(14): 1304–1311, https://doi.org/10.1016/j.jcin.2019.02.035.
Du X., Wang H., Wang S., He Y., Zheng J., Zhang H., Hao Z., Chen Y., Xu Z., Lu Z. Machine learning model for predicting risk of in-hospital mortality after surgery in congenital heart disease patients. Rev Cardiovasc Med 2022; 23(11): 376, https://doi.org/10.31083/j.rcm2311376.
Zhao P., Liu C., Zhang C., Hou Y., Zhang X., Zhao J., Sun G., Zhou J. Using machine learning to predict the in-hospital mortality in women with ST-segment elevation myocardial infarction. Rev Cardiovasc Med 2023; 24(5): 126, https://doi.org/10.31083/j.rcm2405126.
MacCallum R.C., Zhang S., Preacher K.J., Rucker D.D. On the practice of dichotomization of quantitative variables. Psychol Meth 2002; 7(1): 19–40, https://doi.org/10.1037/1082-989x.7.1.19.
Gupta R., Day C.N., Tobin W.O., Crowson C.S. Understanding the effect of categorization of a continuous predictor with application to neuro-oncology. Neurooncol Pract 2021; 9(2): 87–90, https://doi.org/10.1093/nop/npab049.
Гельцер Б.И., Шахгельдян К.И., Рублев В.Ю., Домжалов И.Г., Циванюк М.М., Шекунова О.И. Фенотипирование факторов риска и прогнозирование внутригоспитальной летальности у больных ишемической болезнью сердца после коронарного шунтирования на основе методов объяснимого искусственного интеллекта. Российский кардиологический журнал 2023; 28(4): 5302, https://doi.org/10.15829/1560-4071-2023-5302.
Dawson N.V., Weiss R. Dichotomizing continuous variables in statistical analysis: a practice to avoid. Med Decis Making 2012; 32(2): 225–226, https://doi.org/10.1177/0272989x12437605.
Salis Z., Gallego B., Sainsbury A. Researchers in rheumatology should avoid categorization of continuous predictor variables. BMC Med Res Methodol 2023; 23(1): 104, https://doi.org/10.1186/s12874-023-01926-4.
Altman D.G., Royston P. The cost of dichotomising continuous variables. BMJ 2006; 332(7549): 1080, https://doi.org/10.1136/bmj.332.7549.1080.
Austin P.C., Brunner L.J. Inflation of the type I error rate when a continuous confounding variable is categorized in logistic regression analyses. Stat Med 2004; 23(7): 1159–1178, https://doi.org/10.1002/sim.1687.
Streiner D.L. Breaking up is hard to do: the heartbreak of dichotomizing continuous data. Can J Psychiatr 2002; 47(3): 262–266, https://doi.org/10.1177/070674370204700307.
von Elm E., Altman D.G., Egger M., Pocock S.J., Gøtzsche P.C., Vandenbroucke J.P.; STROBE Initiative. The Strengthening the Reporting of Observational Studies Epidemiology (STROBE) statement: guidelines for reporting observational studies. Lancet 2007; 370(9596): 1453–1457, https://doi.org/10.1016/s0140-6736(07)61602-x.
Гельцер Б.И., Шахгельдян К.И., Домжалов И.Г., Куксин Н.С., Кокарев Е.А., Пак Р.Л. Прогностическая оценка клинико-функционального статуса пациентов с инфарктом миокарда с подъемом сегмента ST после чрескожного коронарного вмешательства. Свидетельство о регистрации базы данных 2023622740, 10.08.2023. Заявка №2023622516 от 28.07.2023.
Valente F., Henriques J., Paredes S., Rocha T., de Carvalho P., Morais J. A new approach for interpretability and reliability in clinical risk prediction: acute coronary syndrome scenario. Artif Intell Med 2021; 117: 102113, https://doi.org/10.1016/j.artmed.2021.102113.
Lundberg S.M., Lee S.I. A unified approach to interpreting model predictions. In: Advances in neural information processing systems. arXiv; 2017, https://doi.org/10.48550/arxiv.1705.07874.
Гельцер Б.И., Шахгельдян К.И., Домжалов И.Г., Куксин Н.С., Кокарев Е.А., Котельников В.Н., Рублев В.Ю. Прогнозирование внутригоспитальной летальности у больных острым инфарктом миокарда с подъемом сегмента ST после чрескожного коронарного вмешательства. Российский кардиологический журнал 2023; 28(6): 5414, https://doi.org/10.15829/1560-4071-2023-5414.
Molnar C. Interpretable machine learning. A guide for making black box models explainable. 2023. URL: https://christophm.github.io/interpretable-ml-book/.
Mabikwa O.V., Greenwood D.C., Baxter P.D., Fleming S.J. Assessing the reporting of categorised quantitative variables in observational epidemiological studies. BMC Health Serv Res 2017; 17(1): 201, https://doi.org/10.1186/s12913-017-2137-z.
Turner E.L., Dobson J.E., Pocock S.J. Categorisation of continuous risk factors in epidemiological publications: a survey of current practice. Epidemiol Perspect Innov 2010;7: 9, https://doi.org/10.1186/1742-5573-7-9.