Большинство опухолей постоянно теряют клетки; многие умирают, но некоторые выживают, циркулируя по всему организму, оседая в других местах и образуя новые, метастатические опухоли. Чтобы эффективно лечить пациентов с метастатическим раком, врачи должны точно определить, откуда изначально взялись эти клетки, но в трех-пяти процентах случаев стандартное диагностическое обследование не позволяет этого сделать.
В случаях с раком неизвестной первичной стадии (CUP) врачи выбирают методы лечения в соответствии с наиболее вероятной локализацией рака, но они могут сделать неправильный выбор. В качестве альтернативы они могут использовать более широкие методы лечения, которые менее эффективны и имеют больше побочных эффектов по сравнению с целевыми. В результате эти виды рака часто быстро прогрессируют, и продолжительность жизни пациентов составляет всего от шести до 16 месяцев.
Интае Мун, аспирант Массачусетского технологического института (MIT) и Dana-Farber Cancer Institute разрабатывают способ простой диагностики первичного очага рака молочной железы. Секвенирование следующего поколения (NGS) может идентифицировать мутации в опухоли и помочь определить тип рака, но объем полученных данных о мутациях может быть слишком большим, чтобы врач мог разобраться с ними во время первичной диагностики. Поэтому клиницисты обычно используют NGS только после того, как они идентифицируют тип рака, чтобы точно определить специфические мутации для таргетной терапии. NGS также недостаточно изучен для клинической диагностики и прогнозирования CUP. Чтобы решить эту проблему, Мун и его коллеги разработали модель машинного обучения под названием OncoNPC (Oncology NGS-based Primary cancer-type Classifier), позволяющую эффективно анализировать большие объемы сложных данных о мутациях.
В исследовании, опубликованном в журнале Nature Medicine, используется алгоритм под названием XGBoost, который увеличивает масштаб участков ДНК для поиска паттернов генетических мутаций, наиболее связанных с различными типами рака. Используя данные NGS из 36 445 образцов опухолей с известными первичными формами рака, исследователи запустили OncoNPC для поиска генетических мутаций, изменений числа копий и мутационных сигнатур. Модель также включала возраст и биологический пол пациентов из их электронных медицинских карт. Команда обучила модель на основе данных из трех различных онкологических центров по всей территории США, чтобы связать определенные генетические признаки с одним из 22 различных типов рака. После обучения они протестировали OncoNPC на данных, которые они ранее удалили из последовательности обучения.
“OncoNPC удавалось правильно идентифицировать происхождение известных опухолей примерно в 80 процентах случаев”, - сказал Мун в электронном письме. “Когда мы сосредоточились на прогнозах с высокой степенью достоверности, которые составляли около 65 процентов всех случаев, точность модели возросла до впечатляющих 95 процентов”, - говорит он, хотя в случае редких видов рака она была несколько менее точной. Затем исследователи применили OncoNCP к опухолям 971 пациента с CUP, которые проходили лечение в Dana-Farber Cancer Institute. OncoNCP с высокой степенью достоверности классифицировал 41,2% опухолей CUP.
Команда также изучила и определила, какие генетические особенности наиболее важны для идентификации каждого типа рака, - информация, которая является клинически и биологически ценной, учитывая загадочную природу чашевидных опухолей. Поскольку фактическое расположение первичных опухолевых очагов было неизвестно, точность модели определялась путем сопоставления результатов с данными NGS каждого человека, чтобы определить, есть ли у него генетическая предрасположенность к определенному типу рака. Исследователи обнаружили, что предсказания модели полностью соответствуют типу рака, на который наиболее сильно указывают эти унаследованные мутации.
Чтобы понять, увеличит ли лечение пациентов в соответствии с прогнозами OncoNPC их выживаемость, команда ретроспективно изучила 158 пациентов с CUP, которые впервые прошли лечение в Dana-Farber. Сертифицированный онколог вручную просмотрел карты пациентов, чтобы узнать, проводилось ли их лечение в соответствии с прогнозами OncoNPC по типу рака.
Исследователи обнаружили, что пациенты с CUP, чье первое паллиативное лечение, основанное на обоснованном предположении их врача, соответствовало их прогнозу OncoNPC, имели значительно лучшую выживаемость, чем те, кто не получал лечения в соответствии с OncoNPC.
Исследователи надеются расширить модель, чтобы она помогала большему количеству пациентов с онкологическими заболеваниями. “Хотя модель показала неплохие результаты для пациентов других национальностей, мы признаем необходимость проведения более глубоких исследований, чтобы подтвердить ее эффективность для широкого круга пациентов”, - сказал Мун.
Кроме того, модель искала только 22 наиболее распространенных типа рака; если CUP была взята с другого участка, модель не смогла ее идентифицировать. Тем не менее, OncoNPC вскоре может помочь врачам принимать сложные решения о лечении.
“Если в больнице используется метод секвенирования опухоли с помощью NGS, они должны иметь возможность использовать его в качестве дополнительного источника информации для онкологов”, - сказал старший автор исследования Александр Гусев в электронном письме.
“Уникальность этой работы в том, что они использовали данные рутинных тестов, которые используются в клинике”, - сказал Эдвин Куппен, биолог-онколог из Университетского медицинского центра Утрехта, который не принимал участия в этом исследовании. “Это отдельный класс опухолей. Мы не понимаем, что делает эти опухоли атипичными, но мы знаем, что прогноз у таких пациентов, как правило, намного хуже. Таким образом, прогноз для значительной части пациентов - это большой шаг вперед”.