Оптимизированная стратегия биоинформатического анализа данных клинического протеомного исследования ткани эндометрия при хроническом эндометрите
Цель исследования — изучение совокупности белков (протеома) ткани эндометрия и поиск специфических белков-маркеров процессов канцерогенеза.
Материалы и методы. Образцы ткани были получены с помощью пайпель-биопсии эндометрия у женщин с хроническим эндометритом. Данные образцы гомогенизировали и проводили электрофорез белков в полиакриламидном геле в присутствии додецилсульфата натрия по методу Лэмли. Выделенные фракции белков различной молекулярной массы подвергали трипсинолизу по стандартной методике с использованием модифицированного трипсина. Затем полученные триптические пептиды разделяли и идентифицировали с помощью высокоэффективной жидкостной хроматографии, сопряженной с тандемной масс-спектрометрией.
Для анализа тканеспецифической экспрессии применяли базы данных Human Protein Atlas и Tissue-Specific Gene Expression and Regulation.
Функциональное аннотирование белков и анализ методом концентрирования множеств генов выполняли с использованием биоинформатического ресурса The Database for Annotation, Visualization and Integrated Discovery.
Результаты. Из полученных образцов ткани эндометрия методом тандемной масс-спектрометрии идентифицированы 103 белка. Анализ тканеспецифичности показал, что 83 белка экспрессируются в тканях женской репродуктивной системы. Функциональное аннотирование с последующей кластеризацией выявило, что 51 белок (49,5% от идентифицированных) кодируется генами, дифференциально экспрессирующимися в культурах клеток женской репродуктивной системы. При этом выявлено 4 группы белков, характерных как для различных типов опухолевых клеток (серозная аденокарцинома яичника, цистаденома яичника иммортализованная, карцинома яичника), так и для иммортализованного нормального поверхностного эпителия яичника.
Заключение. Проведена идентификация белков ткани эндометрия с применением клинического протеомного исследования. Биоинформатический подход позволил выделить функциональные группы белков исходя из их потенциальной вовлеченности в процессы канцерогенеза. Полученные данные могут служить отправной точкой дальнейших углубленных исследований эндометрия с использованием протеомного подхода, а также других OMICS-технологий. Последующее применение биоинформатических методов анализа позволит выявить молекулярные механизмы взаимосвязи воспалительного процесса и возникновения малигнизации клеток тканей эндометрия.
Введение
Нарушение фертильности женщин, включая привычное невынашивание и бесплодие, а также неудачные попытки экстракорпорального оплодотворения и эмбриотрансфера часто являются следствием хронических воспалительных процессов в матке (хронического эндометрита — частой патологии женщин репродуктивного возраста). Это заболевание протекает скрыто, не имеет специфических симптомов, что не позволяет использовать классические диагностические методы для его обнаружения [1–4]. Гистероскопия и морфологическое исследование ткани являются «золотым стандартом» в оценке структуры полости матки и эндометрия, однако их возможности в диагностике начальных признаков заболевания ограничены тканевым разрешением. Например, гистероскопия, основанная на макроскопической оценке, позволяет обнаружить хронический эндометрит только в 35–40% случаев. В связи с этим клиницисты нуждаются в альтернативных, информативных и безопасных диагностических методах исследования такой чувствительной к внешним воздействиям ткани, как эндометрий [5, 6].
В настоящее время доказана вероятность участия хронического эндометрита в патогенезе рака эндометрия путем метилирования генов-супрессоров опухолевого роста, а также за счет модификации местного иммунного и системного воспалительного ответа, хотя величина этой вероятности в настоящее время точно не определена [7]. Молекулярные и патогенетические механизмы возникновения этой взаимосвязи освещаются в мировой литературе крайне скудно, в основном показан возможный механизм малигнизации за счет формирования очаговой или диффузной пролиферации эпителия и возникновения гиперплазии, которая характеризуется высокой частотой рецидивирования и возможностью малигнизации [8].
Все это обусловливает актуальность изучения различных аспектов патогенеза предрака эндометрия, в том числе и на молекулярном уровне, с целью поиска специфических молекулярных биомаркеров, а также маркеров неоангиогенеза и пролиферации. Это может сыграть важную роль в разработке раннего скринингового исследования тканей эндометрия для выявления первичных признаков малигнизации.
Известно, что воспаление является неотъемлемым сопутствующим признаком рака, способствующим развитию и прогрессированию злокачественных новообразований. В последние годы в литературе встречается все больше доказательств роли местного иммунного ответа и системного воспаления в прогрессировании опухолей и выживании онкологических больных [9, 10]. Становится очевидным, что установление молекулярных взаимосвязей воспалительного процесса и канцерогенеза не только поможет в профилактике и диагностике онкологических заболеваний, но и расширит возможности использования новой таргетной терапии, вовлекающей иммунную систему больного.
Протеомный подход, который основан на идентификации белков методом тандемной масс-спектрометрии, совмещенной с высокоэффективной жидкостной хроматографией (ВЭЖХ–МС/МС), отвечает большинству критериев, предъявляемых к «поисковому» анализу клинических образцов. ВЭЖХ–МС/МС используется для широкомасштабной качественной идентификации белков в биологических образцах и характеризуется мультиплексностью в пределах сотен индивидуальных белков в одном образце, чувствительностью на уровне пико- и фемтомолей отдельного белка и динамическим диапазоном 4–6-го порядков, что примерно соответствует концентрационному диапазону белков в тканях человека. В настоящее время протеомный подход к исследованию эндометрия используется в клинической медицине при изучении не только эндометриоза [11], но и рака эндометрия [12], бесплодия [13] и изменений, индуцированных беременностью [14].
OMICS-технологии отличаются от других молекулярно-биологических методов количественными и качественными особенностями получаемых данных. Как правило, это глобальные (как в случае геномных и транскриптомных исследований) или локальные (типичные для протеомики) совокупности биомакромолекул одной природы (ДНК, мРНК или белков соответственно). Для описания подобного «молекулярного фенотипа» геномные и постгеномные технологии используют компьютерный анализ полученных результатов.
В основе системной оценки OMICS-данных лежит концепция, согласно которой: а) в наборе идентифицированных генов или их продуктов (мРНК, белков) заключена существенная биологическая информация; б) каждый из элементов живой системы выполняет свою функцию во взаимосвязи со специфическим набором других элементов. Соответственно, целью большинства методов интерпретации OMICS-данных является аннотация (т.е. присвоение функциональной характеристики) отдельных биомакромолекул с последующей реконструкцией значимых взаимодействий между ними. Вычислительный инструментарий геномных и постгеномных технологий использует все многообразие имеющейся биологической информации, полученной экспериментальными методами и депонированной в систематизированных публичных базах данных. Следует отметить, что практически всегда интерпретация OMICS-данных носит предсказательный характер и базируется на специально разработанных методах статистического анализа.
Самым распространенным вычислительным подходом в данной области является метод, именуемый концентрированием множеств генов (gene set enrichment analysis, GSEA) [15]. Принцип кластерного анализа совокупностей биомакромолекул, лежащий в основе GSEA, дает возможность адаптировать данный метод к особенностям конкретных OMICS-технологий.
Следует, тем не менее, подчеркнуть, что именно стадия обобщения и анализа данных является на сегодня «узким местом», существенно ограничивающим научную и практическую ценность транскриптомных и протеомных исследований. Вследствие этого оптимизация методов системного анализа и интерпретации данных OMISC-исследований — одна из актуальных задач.
Данная работа является пилотным исследованием, направленным на разведывательный поиск возможных белков-маркеров малигнизации в тканях у женщин с клинически подтвержденным хроническим эндометритом с применением масс-спектрометрической идентификации белков в образцах эндометрия и дальнейшим биоинформатическим анализом. С этой целью использовали различные подходы к оценке тканеспецифичности выявленных белков, а также кластерный анализ с выбором оптимального параметра для метода концентрирования множеств генов.
Материалы и методы
Исследование включало пациенток репродуктивного возраста с гистологически подтвержденным диагнозом «хронический эндометрит». Все они дали свое предварительное информированное согласие. Работа была проведена в соответствии с Хельсинкской декларацией (2013) и одобрена Этическим комитетом Приволжского исследовательского медицинского университета.
Всем пациенткам была выполнена пайпель-биопсия эндометрия с последующим помещением тканей в буферный раствор. Образцы ткани гомогенизировали, после чего проводили электрофорез белков в полиакриламидном геле в присутствии додецилсульфата натрия по методу Лэмли. После электрофоретического разделения полоса геля разрезалась, полученные фракции белков различной молекулярной массы подвергались трипсинолизу в геле по стандартной методике с использованием модифицированного трипсина (Promega, США). Полученные триптические пептиды разделяли и идентифицировали с помощью высокоэффективной жидкостной хроматографии, сопряженной с тандемной масс-спектрометрией на аппарате Orbitrap Velos Pro (Thermo Scientific, США). Анализ полученных масс-спектров выполняли с помощью программы Mascot (Matrix Science, США). Для идентификации белков использовали базу данных Uniprot (release 2014).
Тканеспецифическую экспрессию анализировали с помощью баз данных Human protein atlas [16] и Tissue-specific gene expression and regulation (TiGER) [17].
Функциональное аннотирование белков и анализ методом концентрирования множеств генов проводили с использованием биоинформатического ресурса The database for annotation, visualization and integrated discovery (DAVID v. 6.8) [18, 19].
Результаты
При исследовании гомогенатов тканей эндометрия после электрофоретического разделения фракции белков различной молекулярной массы подвергались трипсинолизу. Исследование триптических фрагментов методом ВЭЖХ–МС/МС и последующий анализ полученных масс-спектров позволили идентифицировать в общей сложности 103 различных белка.
В соответствии с задачами работы для этих белков проведена мануальная оценка их представленности в различных тканях. Согласно информации в базах данных Human protein atlas и TiGER, 83 белка детектируются в тканях женской репродуктивной системы. В числе идентифицированных также представлены белки плазмы крови. Такой результат был ожидаем, поскольку материал биопсии эндометрия неизбежно содержит контаминацию кровью.
Следует, однако, подчеркнуть, что мануальный анализ тканеспецифичности с использованием баз данных не может рассматриваться как оптимальный метод интерпретации результатов клинического протеомного исследования. Ключевым недостатком является невозможность статистической оценки наблюдений. С учетом того, что подавляющее большинство белков представлено в разных тканях в различной концентрации, практическая значимость данного подхода крайне невелика.
На следующем этапе исследования для функционального аннотирования белков, идентифицированных в образцах эндометрия, были использованы возможности биоинформатического ресурса DAVID (v. 6.8). Список белков был проанализирован методом концентрирования множеств генов (GSEA) со стандартными параметрами кластеризации. Полученные результаты, к сожалению, оказались малоинформативными, поскольку белки были объединены в группы с низкой функциональной специфичностью: микрочастицы крови (GO:0072562), белки межклеточного пространства (GO:0005615), сигнальные пептиды. Нам представляется, что такой результат связан с высокой универсальностью ресурса DAVID. Как известно, наиболее широко метод GSEA применяется при исследовании дифференциально экспрессирующихся генов (т.е. в транскриптомном анализе), что нашло отражение в наборе параметров, предлагаемых «по умолчанию». Однако следует учитывать, что транскриптомные и протеомные данные принципиально отличаются, как количественно, так и качественно.
Вследствие этого при изменении параметров кластеризации, оптимальных для анализа результатов масс-спектрометрической идентификации белков (выбор параметра CGAP_SAGE_QUARTILE (The cancer genome anatomy project / serial analysis of gene expression)) (см. таблицу), основным группирующим фактором была выбрана взаимосвязь экспрессии белков с патогенезом онкологических заболеваний женской репродуктивной системы.
|
Результаты функциональной кластеризации белков, идентифицированных в образцах эндометрия |
Установлено, что 51 белок (49,5% от исходного списка) кодируется генами, дифференциально экспрессирующимися в культурах клеток женской репродуктивной системы. При этом выявлено 4 группы белков, характерных для различных типов опухолевых клеток (серозная аденокарцинома яичника, цистаденома яичника иммортализованная, карцинома яичника) и для иммортализованного нормального поверхностного эпителия яичника.
Эти результаты демонстрируют возможную значимость перечисленных белков в развитии физиологических и патологических процессов в клетках женской репродуктивной системы. Будучи пилотным проектом, проведенная работа является серьезной основой дальнейших исследований в данном направлении (например, для оценки клинической релевантности выявленной группы белков).
Заключение
При реализации пилотного проекта клинического протеомного исследования образцов ткани эндометрия проведена идентификация белков этой ткани. Последующее использование биоинформатических методов позволило выделить функциональные группы белков исходя из их потенциальной вовлеченности в процессы канцерогенеза.
Полученные данные могут служить отправной точкой дальнейших углубленных исследований эндометрия с использованием протеомного подхода, а также других OMICS-технологий. Применение биоинформатических методов анализа позволит выявить молекулярные механизмы взаимосвязи воспалительного процесса в эндометрии и возникновения гипер- и неоплазии слизистой оболочки полости матки.
Финансирование исследования. Работа выполнена с использованием оборудования Центра коллективного пользования «Протеом человека» (НИИ биомедицинской химии им. В.Н. Ореховича).
Конфликт интересов. Авторы не заявляли о конфликте интересов.
Литература
- Cicinelli E., Matteo M., Tinelli R., Lepera A., Alfonso R., Indraccolo U., Marrocchella S., Greco P., Resta L. Prevalence of chronic endometritis in repeated unexplained implantation failure and the IVF success rate after antibiotic therapy. Hum Reprod 2015; 30(2): 323–330, https://doi.org/10.1093/humrep/deu292.
- Kitaya K., Matsubayashi H., Yamaguchi K., Nishiyama R., Takaya Y., Ishikawa T., Yasuo T., Yamada H. Chronic endometritis: potential cause of infertility and obstetric and neonatal complications. Am J Reprod Immunol 2016; 75(1): 13–22, https://doi.org/10.1111/aji.12438.
- Kasius J.C., Fatemi H.M., Bourgain C., Sie-Go D.M., Eijkemans R.J., Fauser B.C., Devroey P., Broekmans F.J. The impact of chronic endometritis on reproductive outcome. Fertil Steril 2011; 96(6): 1451–1456, https://doi.org/10.1016/j.fertnstert.2011.09.039.
- Tortorella C., Piazzolla G., Matteo M., Pinto V., Tinelli R., Sabbà C., Fanelli M., Cicinelli E. Interleukin-6, interleukin-1β, and tumor necrosis factor in menstrual effluents as biomarkers of chronic endometritis. Fertil Steril 2014; 101(1): 242–247, https://doi.org/10.1016/j.fertnstert.2013.09.041.
- Viana G.A., Cela V., Ruggiero M., Pluchino N., Genazzani A.R., Tantini C. Endometritis in infertile couples: the role of hysteroscopy and bacterial endotoxin. JBRA Assist Reprod 2015; 19(1): 21–23, https://doi.org/10.5935/1518-0557.20150006.
- Arlas T.R., Wolf C.A., Petrucci B.P., Estanislau J.F., Gregory R.M., Jobim M.I., Mattos R.C. Proteomics of endometrial fluid after dexamethasone treatment in mares susceptible to endometritis. Theriogenology 2015; 84: 617–623, https://doi.org/10.1016/j.theriogenology.2015.04.019.
- Diakos C.I., Charles K.A., McMillan D.C., Clarke S.J. Cancer-related inflammation and treatment effectiveness. Lancet Oncol 2014; 15(11): 493–503, https://doi.org/10.1016/s1470-2045(14)70263-3.
- Lax S.F. Pathology of endometrial carcinoma. Adv Exp Med Biol 2017; 943: 75–96, https://doi.org/10.1007/978-3-319-43139-0_3.
- Nakamura K., Smyth M.J. Targeting cancer-related inflammation in the era of immunotherapy. Immunol Cell Biol 2017; 95(4): 325–332, https://doi.org/10.1038/icb.2016.126.
- Zhang X., Meng X., Chen Y., Leng S.X., Zhang H. The biology of aging and cancer: frailty, inflammation, and immunity. Cancer J 2017; 23(4): 201–205, https://doi.org/10.1097/00130404-201707000-00002.
- Adamyan L.V., Starodubtseva N., Borisova A., Stepanian A.A., Chagovets V., Salimova D., Wang Z., Kononikhin A., Popov I., Bugrova A., Chingin K., Kozachenko A., Chen H., Frankevich V. Direct mass spectrometry differentiation of ectopic and eutopic endometrium in patients with endometriosis. J Minim Invasive Gynecol 2017; 25(3): 426–433, https://doi.org/10.1016/j.jmig.2017.08.658.
- Martinez-Garcia E., Lesur A., Devis L., Cabrera S., Matias-Guiu X., Hirschfeld M., Asberger J., van Oostrum J., Casares de Cal M.L.Á., Gómez-Tato A., Reventos J., Domon B., Colas E., Gil-Moreno A. Targeted proteomics identifies proteomic signatures in liquid biopsies of the endometrium to diagnose endometrial cancer and assist in the prediction of the optimal surgical treatment. Clin Cancer Res 2017; 23(21): 6458–6467, https://doi.org/10.1158/1078-0432.ccr-17-0474.
- Kosteria I., Anagnostopoulos A.K., Kanaka-Gantenbein C., Chrousos G.P., Tsangaris G.T. The use of proteomics in assisted reproduction. In Vivo 2017; 31(3): 267–283, https://doi.org/10.21873/invivo.11056.
- Moza Jalali B., Likszo P., Skarzynski D.J. Proteomic and network analysis of pregnancy-induced changes in the porcine endometrium on day 12 of gestation. Mol Reprod Dev 2016; 83: 827–841, https://doi.org/10.1002/mrd.22733.
- Subramanian A., Tamayo P., Mootha V.K., Mukherjee S., Ebert B.L., Gillette M.A., Paulovich A., Pomeroy S.L., Golub T.R., Lander E.S., Mesirov J.P. Gene set enrichment analysis: a knowledge-based approach for interpreting genome-wide expression profiles. Proc Natl Acad Sci U S A 2005; 102(43): 15545–15550, https://doi.org/10.1073/pnas.0506580102.
- The Human Protein Atlas. URL: https://www.proteinatlas.org/.
- Tissue-Specific Gene Expression and Regulation (TiGER). URL: http://bioinfo.wilmer.jhu.edu/tiger/.
- DAVID 6.8. URL: https://david.ncifcrf.gov/.
- Huang da W., Sherman B.T., Lempicki R.A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nat Protoc 2009; 4(1): 44–57, https://doi.org/10.1038/nprot.2008.211.