В последние годы инструменты искусственного интеллекта (ИИ) активно исследуются для классификации ультразвуковых исследований щитовидной железы (УЗИ). Однако реальное применение этих разработанных инструментов в качестве предоперационных диагностических средств ограничено. Основные причины включают переобучение моделей, недоверие со стороны врачей и отсутствие золотого стандарта хирургической гистологии в качестве истинной метки класса. Одной из перспективных областей является ИИ в диагностике щитовидной железы. Одна из ключевых проблем в клинической тиреоидологии заключается в принятии хирургических решений по неопределенным узлам щитовидной железы (НУЩ).
ИИ в диагностике НУЩ: доступные альтернативы
Для этой цели использовались классификаторы геномного секвенирования (ГСК). Однако высокие затраты и ограниченная доступность препятствуют их универсальному внедрению. Это создаёт неравенство в доступе к диагностике. В связи с этим была проведена работа. Она была направлена на анализ текущих данных об ИИ в диагностике НУЩ без использования ГСК.
ИИ в диагностике щитовидной железы может предложить менее затратные методы. В рамках систематического обзора были идентифицированы статьи на английском языке, оценивающие диагностическую точность ИИ для НУЩ. Систематически искали информацию в базах данных PubMed, Google Scholar и Scopus с момента их создания до 18 февраля 2025 года. Использовались комплексные стратегии поиска. Они включали термины MeSH и ключевые слова, относящиеся к ИИ, неопределенным узлам щитовидной железы и предоперационной диагностике. Данный систематический обзор и метаанализ проводился в соответствии с методами, рекомендованными Кораном Кохрейна (PROSPERO ID CRD42023438011).
Поиск дал 134 записи после удаления дубликатов.В итоге представили 20 моделей в семи включенных исследованиях. Пять из них были основаны на радиологических данных. Одна использовала обработку естественного языка, а одна сосредоточилась на цитологии. Объединенный мета-анализ включил 16 результатов площади под кривой (AUC), полученных из 15 моделей в трех исследованиях. Это дало комбинированную оценку 0.82 (95% CI: 0.81-0.84). Она указывает на умеренную до хорошую классификационную производительность. В рамках архитектур машинного обучения (МЛ) и глубокого обучения (ГД).
Гетерогенность моделей ИИ в диагностике НУЩ
Тем не менее, было отмечено значительное гетерогенность. Особенно среди моделей ГД (I²=99.7%, объединенная AUC = 0.85, 95% CI: 0.85-0.86). Минимальная гетерогенность наблюдалась среди моделей МЛ (I²=0.7%). С объединенной AUC 0.75 (95% CI: 0.70-0.81). Проведенный мета-регрессионный анализ предполагает наличие потенциального публикационного смещения. Или систематических различий в архитектурах моделей, составе наборов данных и методах валидации.
ИИ в диагностике щитовидной железы показал растущий потенциал ИИ в клинической практике. Особенно в принятии хирургических решений по НУЩ. Однако разработанные модели пока не подходят для клинического применения, основываясь только на производительности в их текущем состоянии. Им также не хватает надёжной независимой внешней валидации. Это указывает на значительную возможность для дальнейшего развития в этой области.
Ключевые слова: искусственный интеллект, рак щитовидной железы, диагностика узлов щитовидной железы, мета-анализ, машинное обучение.
Источник: Frontiers