Технологии искусственного интеллекта в нейрохирургии: систематический обзор литературы с применением методов тематического моделирования. Часть I: основные направления исследований
В последние годы увеличилось число научных публикаций, посвященных применению технологий искусственного интеллекта (ИИ), в первую очередь — машинного обучения, в нейрохирургии.
Цель исследования — провести систематический обзор литературы для выделения основных направлений и тенденций применения ИИ в нейрохирургии.
Методы. С помощью поисковой машины PubMed были отобраны 327 оригинальных журнальных статей за период c 1996 по июль 2019 г., в которых проанализированы результаты исследований технологий ИИ в нейрохирургии. Ключевые слова, специфические для каждой темы, были выделены с помощью технологий анализа естественного языка из области ИИ — алгоритмов тематического моделирования LDA и ARTM.
Результаты. Определены пять основных разделов нейрохирургии, в которых к настоящему времени ведутся исследования методов ИИ: нейроонкология, функциональная нейрохирургия, сосудистая нейрохирургия, спинальная нейрохирургия и хирургия черепно-мозговой травмы. Выделены основные тематические направления данных исследований.
Заключение. Информация об основных направлениях исследований ИИ в нейрохирургии может быть использована при планировании новых научных проектов.
Введение
Понятие «искусственный интеллект» в настоящее время широко используется в разных сферах деятельности. В сознании общества образ искусственного интеллекта (ИИ) формируется благодаря средствам массовой информации, научной фантастике и научной литературе, однако часто не вполне соответствует действительности [1]. С «узкой» технической точки зрения ИИ — это математическая технология, автоматизирующая решение некоторой интеллектуальной задачи, традиционно решаемой человеком [2]. В то же время этим термином обозначают раздел компьютерных наук, в рамках которого такие решения разрабатываются [3]. В последнем случае под ИИ подразумевают целый спектр математических и программных технологий, в определенной степени имитирующих когнитивные функции человека.
Наиболее распространенные примеры таких технологий: «компьютерное зрение» (идентификация объектов на изображениях), распознавание голоса и речи, анализ текстов на естественном языке, машинный перевод. Во всех приведенных примерах компьютер (ИИ) проявляет способности, присущие человеку: видеть, слушать, читать и понимать информацию. Становится актуальным вопрос: каким образом имитация традиционно человеческих интеллектуальных возможностей может быть полезной в медицине? Потенциал данных технологий — в автоматизации медицинских процессов, в первую очередь — диагностики заболеваний, принятия клинических решений и прогнозирования исхода лечения. Подобно тому, как станки и машины во время промышленной революции XVIII–XIX вв. автоматизировали ручной ремесленный труд человека, компьютер «у постели больного» должен ускорить время принятия клинических решений и повысить их надежность для улучшения качества и безопасности медицинской помощи. Именно с таких гуманистических позиций многими исследователями рассматривается ценность технологий ИИ в медицине [4–7].
Методы классической математической статистики, разработанные в условиях дефицита данных, позволяют по малому числу наблюдений делать научно обоснованные предположения о глобальных закономерностях. Большое число данных потенциально скрывает более сложные закономерности — «цифровые отпечатки» явлений, которые невозможно выявить без применения специальных технологий. Именно такие технологии разрабатываются в области ИИ. Поскольку умение обрабатывать большое количество данных, воспринимаемых с помощью органов чувств, — естественное свойство человеческого мозга, мы интуитивно называем компьютерные программы, способные извлекать и анализировать информацию из визуальных, акустических и тактильных сигналов, искусственным интеллектом.
Как работают технологии ИИ? Математика, заложенная в их основу, позволяет находить и запоминать характерные паттерны в данных, которые не всегда могут быть интерпретированы человеком. Этот процесс называется машинным обучением (МО), которое фактически является математическим поиском наилучших решений систем уравнений. Результатом МО является математическая модель — функция с независимыми переменными (предикторами) и подобранными при МО параметрами. Например, во многих моделях для прогноза исхода лечения в качестве переменных используются возраст пациента и степень тяжести его заболевания, при этом на выходе модели — оценка исхода лечения (в цифровой или категориальной шкале). Параметры таких моделей подбираются при МО на большом количестве репрезентативных данных.
Преимущества технологий ИИ, на которые сейчас возлагают большие надежды, — это возможность использовать максимум доступной информации (даже в неструктурированном виде — изображениях и тексте) и находить в ней сложные и ценные закономерности.
Нейрохирургия — область клинической медицины, порождающая большое количество данных вследствие рутинного использования высокотехнологического медицинского оборудования и медицинских информационных систем. Это обстоятельство обусловливает потенциал применения технологий ИИ в нейрохирургии. Для планирования исследований в данном направлении важно понимать степень востребованности и внедрения данных технологий, а также выявлять перспективные направления использования ИИ. Настоящий обзор литературы ставит целью определение спектра задач применения технологий ИИ в нейрохирургии, а также выявление областей нейрохирургии, в которых они наиболее востребованы.
Методы
Обзор литературы выполнен с использованием рекомендаций PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses) и дополнительным применением тематического моделирования для объективизации выделенных тем публикаций [8, 9].
В анализ были включены статьи из журналов и материалов международных конференций, соответствующие следующим критериям:
1) публикация является оригинальной исследовательской статьей;
2) публикация посвящена патологии и/или методам лечения, непосредственно имеющим отношение к нейрохирургии;
3) в работе анализируется использование технологии ИИ в решении клинической задачи диагностики, лечения, прогноза, реабилитации или профилактики патологии нервной системы;
4) нейрохирургия является потенциальной или фактической областью применения анализируемой в работе технологии ИИ.
Стратегия поиска литературы. Поиск литературы для обзора выполнен с помощью поисковой машины системы PubMed Национальной медицинской библиотеки США (https://www.ncbi.nlm.nih.gov/pubmed/). Запрос для поиска формулировался так, чтобы в поисковую выдачу попадали все документы, для которых в любых полях базы данных одновременно находились термины «neurosurgery» или «neurosurgical procedures» и термины, обозначающие отдельные технологии ИИ (в том числе — анализа больших массивов данных, МО). Точная и полная формулировка запроса к поисковой машине PubMed выглядела следующим образом: “neurosurgical procedures”[MeSH Terms] OR (“neurosurgical”[All Fields] AND “procedures”[All Fields]) OR “neurosurgical procedures”[All Fields] OR “neurosurgery”[All Fields] OR “neurosurgery”[MeSH Terms]) AND (“artificial intelligence”[All Fields] OR “machine learning”[All Fields] OR “natural language processing”[All Fields] OR NLP[All Fields] OR “text mining”[All Fields] OR “fuzzy logic”[All Fields] OR “data mining”[All Fields] OR “big data”[All Fields] OR “topic model”[All Fields].
Результаты поисковой выдачи мы просматривали, отбирая оригинальные статьи, соответствующие критериям включения в систематический обзор. Отобранные статьи классифицировали в соответствии с областью нейрохирургии, в которой были проведены исследования, а также экспертным способом формировали предварительные темы работ и определяли их число.
Тематическое моделирование. Экспертное разделение публикаций на темы объективизировали с помощью технологий тематического моделирования: алгоритма латентного размещения Дирихле (от англ. latent dirichlet allocation, LDA) и алгоритма аддитивной регуляризации тематических моделей (от англ. additive regularization of topic models, ARTM) [10, 11]. С помощью данных методов по текстам резюме отобранных журнальных работ выделяли специфические наборы слов, характеризующих каждую тему исследования из заданного экспертом числа тем. Незначительно варьируя количество тем (параметр тематической модели), подбирали наборы слов, наилучшим образом характеризующие отдельные темы. На завершающем шаге анализа сравнивали работы двух алгоритмов и интерпретировали темы исследований по найденным ключевым словам.
Программное обеспечение для получения и анализа данных. Первичный отбор и статистический анализ данных проведен с помощью специального программного обеспечения, разработанного авторами на языке программирования для статистического анализа R (версия 3.5.0) с помощью интегрированной среды разработки RStudio. Запрос к поисковому сервису PubMed выполняли через программный интерфейс (https://www.ncbi.nlm.nih.gov/books/NBK25501/) из среды R c помощью пакета rentrez (https://cran.r-project.org/web/packages/rentrez/vignettes/rentrez_tutorial.html).
Для получения данных о публикациях и их анализа в среде R с помощью алгоритма LDA также использовали программные пакеты XML, fulltext, tibble, dplyr, stringr, tidyr, tidytext, topicmodels. Модель ARTM разрабатывали с помощью программного языка Python (версия 3.6) в среде Jupyter Notebook.
Результаты
Процесс отбора исследовательских статей для изучения их тем представлен на рис. 1. В результате выполнения поискового запроса 24 июля 2019 г. в базах данных PubMed была идентифицирована 731 работа. В соответствии с критериями включения для экспертного анализа и тематического моделирования отобраны 327 работ, опубликованных в период с 1996 по 2019 г.
Рис. 1. Схема, отражающая процесс отбора работ для систематического обзора в соответствии с международными рекомендациями PRISMA [8] |
Общая характеристика проанализированных публикаций. Распределение числа отобранных работ по годам показано на рис. 2. В 2018 г. и первой половине 2019 г. произошло существенное увеличение числа работ, посвященных технологиям ИИ в нейрохирургии.
Рис. 2. Распределение числа проанализированных работ (n=327) по годам публикации |
Большинство анализируемых исследований было проведено в рамках 5 крупных разделов нейрохирургии и одного смешанного раздела:
1) нейроонкология (n=133; 41%);
2) функциональная нейрохирургия (n=62; 19%);
3) сосудистая нейрохирургия (n=44; 14%);
4) cпинальная нейрохирургия (n=29; 8%);
5) хирургия черепно-мозговой травмы (n=26; 8%);
6) другие и смежные разделы нейрохирургии (n=33; 10%).
Для публикаций из каждых 5 первых вышеуказанных разделов провели тематическое моделирование. Количество тем было первично подобрано с помощью LDA (так, чтобы темы максимально различались по интерпретации ключевых слов) и использовано далее в алгоритме ARTM. Темы, полученные в результате применения методов LDA и ARTM, сопоставляли друг с другом. В случаях, когда алгоритм ARTM создавал две или более схожих, явно не разделяемых темы, их приписывали к одной аналогичной теме по LDA. Результаты тематического моделирования с использованием алгоритмов LDA и ARTM (основные специфичные ключевые слова и интерпретация тем) представлены в таблице. Полный список из 327 проанализированных публикаций представлен в Приложении к статье.
Как видно из таблицы, два алгоритма в целом приводят к схожему разделению тематик публикаций по ключевым словам. Более подробно применение технологий ИИ для каждого раздела нейрохирургии будет описано во второй части данной работы.
Обсуждение
Несмотря на значительное развитие технологий ИИ, машинного обучения и сопряженных методов анализа больших данных в начале XXI в., такие подходы все еще не получили масштабного и систематического применения в нейрохирургии и во многом находятся на стадиях разработки и апробации. Объективным ограничением для быстрого развития данного направления является, безусловно, традиционный для медицины лимит объема качественно собранных данных.
В то же время в результате усиления интереса к этому направлению исследований появляются основания для формирования доказательной базы по эффективности, безопасности и экономической целесообразности методов ИИ в нейрохирургии. Так, в систематическом обзоре J.T. Senders с соавт. [12] описаны 23 исследования, в которых оценивалась эффективность технологий ИИ для решения диагностических и прогностических задач в сравнении с точностью врачебных суждений в нейрохирургии. В 14 из этих работ решалиcь диагностические (классификационные) задачи, преимущественно на данных нейровизуализации и электроэнцефалографии. В 7 публикациях исследовались вопросы предоперационного планирования на основе анализа изображений. В 3 работах прогнозировались исходы нейрохирургического лечения. В обзоре показано, что МО в целом может улучшить результаты решения клинических задач. В 29 из 50 (58%) тестов, проведенных суммарно в 23 исследованиях, результаты МО значительно превосходили точность заключений клинических экспертов (p<0,05); в 18 из 50 (36%) случаев не выявлено существенной разницы между МО и показателями экспертов; в 3 из 50 (6%) клинические эксперты решали задачи лучше, чем МО (p<0,05). В 4 работах, в которых оценивалась производительность МО в дополнение к работе эксперта, такое взаимное дополнение оказалось более результативным по сравнению с производительностью МО или клинициста по отдельности. Данный результат скорее подтверждает гипотезу о потенциале ИИ для практического использовании в нейрохирургии.
В настоящее время не накоплена достаточная доказательная база по оценке эффективности, безопасности и экономической целесообразности методов ИИ в нейрохирургии, поэтому нет оснований считать, что технологии ИИ сегодня способны тотально заменить традиционные, рутинные методы медицины. Однако, учитывая значительный потенциал ИИ, можно говорить с большой очевидностью о необходимости развития и широкой апробации этих методов в научной и практической медицинской деятельности.
В данной работе для выделения ключевых тем публикаций использованы методы тематического моделирования. Эти методы относятся к классу технологий ИИ и применяются для анализа текстов, написанных на естественном языке. С помощью тематического моделирования для каждого раздела нейрохирургии были выделены от 4 до 9 крупных тем — направлений исследований. Подобный подход является основой для автоматического отслеживания публикационных трендов по заданным направлениям исследований и может служить одним из примеров использования ИИ в биомедицинской науке.
Ниже рассмотрим ограничения данной работы, важные для интерпретации ее результатов. Систематический обзор направлен на изучение направлений и тенденций применения ИИ непосредственно в нейрохирургии. В то же время в смежных областях (например, нейровизуализации) круг задач, решаемых с помощью ИИ, может быть гораздо шире и потенциально является актуальным и для нейрохирургии. Данный круг вопросов не освещен в нашей работе.
В рамках настоящего исследования мы не анализировали систематические обзоры других авторов, поскольку большинство таких публикаций по теме ИИ в нейрохирургии были сфокусированы на определенный дизайн оригинальных исследований или на определенную специфическую патологию и поэтому имели узкие критерии включения.
Заключение
Исследования по применению технологий искусственного интеллекта к настоящему времени проведены преимущественно в пяти крупных разделах нейрохирургии: нейроонкологии, функциональной, сосудистой и спинальной нейрохирургии и в разделе черепно-мозговой травмы. С помощью методов тематического моделирования в каждом разделе выделены основные направления исследований. Во второй части данного обзора будет рассмотрен спектр задач, для решения которых в нейрохирургии были использованы технологии искусственного интеллекта.
Вклад авторов: Г.В. Данилов — идея, написание обзора, протокол исследования, программный доступ к PubMed средствами R, отбор статей, тематическое моделирование с использованием алгоритма LDA; А.А. Потапов — рецензирование и корректировка статьи с позиций нейрохирурга; М.А. Шифрин — рецензирование и корректировка статьи с позиций специалиста по медицинской информатике; К.В. Котик — тематическое моделирование с использованием алгоритма ARTM; Ю.Н. Орлов — рецензирование и корректировка статьи с позиций специалиста по искусственному интеллекту; Т.А. Ишанкулов — программный доступ к PubMed средствами Python; А.С. Куликов — рецензирование и корректировка статьи с позиций нейроанестезиолога.
Финансирование. Исследование поддержано грантом Российского фонда фундаментальных исследований 19-29-01174.
Конфликт интересов. У авторов нет конфликта интересов.
Литература
- Ng A. What artificial intelligence can and can’t do right now. Harv Bus Rev 2016.
- Якушев Д.И. Об определении искусственного интеллекта. В кн.: Региональная информатика и информационная безопасность. СПб; 2016; с. 67–69.
- Люгер Дж.Ф. Искусственный интеллект: стратегии и методы решения сложных проблем. М: Издательский дом «Вильямс»; 2003.
- Celtikci E. A systematic review on machine learning in neurosurgery: the future of decision-making in patient care. Turk Neurosurg 2018; 28(2): 167–173, https://doi.org/10.5137/1019-5149.jtn.20059-17.1.
- Brusko G.D., Kolcun J.P.G., Wang M.Y. Machine-learning models: the future of predictive analytics in neurosurgery. Neurosurgery 2018; 83(1): E3–E4, https://doi.org/10.1093/neuros/nyy166.
- Tandel G.S., Biswas M., Kakde O.G., Tiwari A., Suri H.S., Turk M., Laird J.R., Asare C.K., Ankrah A.A., Khanna N.N., Madhusudhan B.K., Saba L., Suri J.S. A review on a deep learning perspective in brain cancer classification. Cancers (Basel) 2019; 11(1), https://doi.org/10.3390/cancers11010111.
- Senders J.T., Zaki M.M., Karhade A.V., Chang B., Gormley W.B., Broekman M.L., Smith T.R., Arnaout O. An introduction and overview of machine learning in neurosurgical care. Acta Neurochir (Wien) 2018; 160(1): 29–38, https://doi.org/10.1007/s00701-017-3385-8.
- Moher D., Shamseer L., Clarke M., Ghersi D., Liberati A., Petticrew M., Shekelle P., Stewart L.A.; PRISMA-P Group. Preferred reporting items for systematic review and meta-analysis protocols (PRISMA-P) 2015 statement. Syst Rev 2015; 4(1), https://doi.org/10.1186/2046-4053-4-1.
- Воронцов К.В. Вероятностное тематическое моделирование: теория, модели и проект BigARTM. 2020. URL: http://www.machinelearning.ru/wiki/images/d /d5/Voron17survey-artm.pdf.
- Blei D.M., Ng A.Y., Jordan M.I. Latent dirichlet allocation. J Mach Learn Res 2003; 3: 3993–1022.
- Воронцов К.В. Аддитивная регуляризация тематических моделей коллекций текстовых документов. Доклады Академии наук 2014; 456(3): 268–271, https://doi.org/10.7868/s0869565214090096.
- Senders J.T., Arnaout O., Karhade A.V., Dasenbrock H.H., Gormley W.B., Broekman M.L., Smith T.R. Natural and artificial intelligence in neurosurgery: a systematic review. Neurosurgery 2018; 83(2): 181–192, https://doi.org/10.1093/neuros/nyx384.