Программный комплекс «киберсердце–диагностика» для автоматического анализа электрокардиограмм с применением методов машинного обучения
Целью работы стало создание в составе программно-аппаратного комплекса «Киберсердце» системы автоматического анализа электрокардиограмм — программного модуля «Киберсердце–Диагностика» — и выбор методов машинного обучения для ее тестирования на основе сравнительного анализа их возможностей.
Материалы и методы. При разработке программного комплекса использовали известные методы машинного обучения, работа которых строится на большой выборке размеченных данных, т.е. на базе ЭКГ с известными заключениями: метод опорных векторов, дерево решений, искусственные нейронные сети, методы квадратичного и линейного дискриминантного анализа, метод случайных подпространств, AdaBoost, случайный лес, логистическая регрессия (модель нейрона Мак-Каллока–Питтса). Для сравнительного анализа и оценки точности полученных результатов программа «Киберсердце–Диагностика» была протестирована на открытых международных базах данных ЭКГ: Arrhythmia Data Set, PhysioNet PTBDB, PhysioNet Competition 2017, а также на материалах собственной базы данных, включающей 1652 записи стандартной 12-канальной ЭКГ покоя. Все ЭКГ были описаны врачами-экспертами с формированием структурированного врачебного заключения, которое принималось как эталонное.
Результаты. В различных классах признаков точность диагностики программы «Киберсердце–Диагностика» составила 83,8–94,5%, при сравнении с заключениями врачей-экспертов — 66,3–95,1%. Таким образом, разработанная программа по качеству анализа электрокардиограмм сравнима с мировыми аналогами.
- Юровский А.Ю., Сухов С.С. Дистанционный анализ ЭКГ и компьютерная электрокардиография ― современные альтернативы классическому «бумажному» решению. Практическая медицина 2017; 2: 14–17.
- Струтынский А.В. Электрокардиограмма: анализ и интерпретация. М: МЕДпресс-информ; 2017; 224 с.
- Воробьев Л.В. ЭКГ анализ сердечной деятельности здорового человека. Международный журнал прикладных и фундаментальных исследований 2016; 10: 549–553.
- Дроздов Д.В., Леванов В.М. Автоматический анализ ЭКГ: проблемы и перспективы. Здравоохранение и медицинская техника 2004; 1: 10.
- Калякулина А.И., Юсипов И.И., Москаленко В.А., Никольский А.В., Козлов А.А., Золотых Н.Ю., Иванченко М.В. Вейвлет-анализ для нахождения точек морфологий волн электрокардиографического сигнала. Известия Вузов. Радиофизика 2018; 61(8): 773–789.
- Duda R.O., Hart P.E., Stork D.G. Pattern classification. Wiley-Interscience; 2000.
- Tin Kam Ho. The random subspace method for constructing decision forests. IEEE Trans Pattern Anal Mach Intell 1998; 20(8): 832–844, https://doi.org/10.1109/34.709601.
- Freund Y., Schapire R.E. A decision-theoretic generalization of on-line learning and an application to boosting. J Comput Syst Sci 1997; 55(1): 119–139, https://doi.org/10.1006/jcss.1997.1504.
- Breiman L. Random forests. Machine Learning 2001; 45(1): 5–32.
- Ioffe S., Szegedy C. Batch normalization: accelerating deep network training by reducing internal covariate shift. 2015. URL: https://arxiv.org/pdf/1502.03167.pdf.
- Brown C.D., Davis H.T. Receiver operating characteristics curves and related decision measures: a tutorial. Chemometr Intell Lab Syst 2006; 80(1): 24–38, https://doi.org/10.1016/j.chemolab.2005.05.004.
- Petrov V., Lebedev S., Pirova A., Vasilyev E., Nikolskiy A., Turlapov V., Meyerov I., Osipov G. CardioModel ― new software for cardiac electrophysiology simulation. In: Voevodin V., Sobolev S. (editors). Supercomputing. RuSCDays 2018. Communications in computer and information science. Vol. 965. Springer, Cham; 2018; p. 195–207, https://doi.org/10.1007/978-3-030-05807-4_17.