От сканирования сетчатки к спасению зрения: как нейросети помогают при диабетической ретинопатии

Автор: Денис Аветисян


В статье рассматривается развитие технологий глубокого обучения для автоматической диагностики и скрининга диабетической ретинопатии, от первых экспериментов до современных клинических решений.

🐢

Ищешь ракеты? Это не к нам. У нас тут скучный, медленный, но надёжный, как швейцарские часы, фундаментальный анализ.

Бесплатный Телеграм канал

Обзор эволюции методов глубокого обучения, включая федеративное обучение и обобщение данных, для повышения надежности и воспроизводимости систем искусственного интеллекта в офтальмологии.

Несмотря на значительные успехи в диагностике, диабетическая ретинопатия остается ведущей причиной предотвратимой слепоты. В настоящем обзоре, ‘From Retinal Pixels to Patients: Evolution of Deep Learning Research in Diabetic Retinopathy Screening’, систематизированы достижения в области глубинного обучения для скрининга данной патологии за период 2016-2025 гг., включая решения проблем недостатка данных и различий между базами данных. Анализ более 50 исследований демонстрирует эволюцию от базовых сверточных нейронных сетей к сложным моделям, направленным на повышение доверия и воспроизводимости результатов в клинической практике. Сможет ли интеграция федеративного обучения и нейро-символических подходов обеспечить широкое внедрение ИИ в офтальмологию и снизить распространенность слепоты, связанной с диабетом?


Безмолвная Эпидемия и Пределы Ранней Диагностики

Диабетическая ретинопатия является одной из главных причин предотвратимой слепоты во всем мире, однако своевременное выявление этого заболевания остается серьезной проблемой. Несмотря на доступность методов диагностики, значительное число пациентов обращаются за медицинской помощью уже на поздних стадиях, когда повреждения сетчатки необратимы. Это обусловлено рядом факторов, включая недостаточную осведомленность населения о симптомах, отсутствие регулярных профилактических осмотров, особенно в отдаленных регионах, и ограниченность ресурсов для проведения массовых скринингов. Раннее обнаружение изменений в сетчатке глаза, даже на самых начальных стадиях, критически важно для предотвращения прогрессирования заболевания и сохранения зрения, что подчеркивает необходимость разработки и внедрения эффективных стратегий ранней диагностики и скрининга.

Традиционный ручной скрининг диабетической ретинопатии представляет собой значительную нагрузку на ресурсы здравоохранения и сопряжен с существенными проблемами. Процедура требует квалифицированных специалистов – офтальмологов или специально обученных оптометристов – для оценки большого количества изображений сетчатки, что является трудоемким и дорогостоящим процессом. Более того, субъективность человеческого восприятия неизбежно приводит к расхождениям в интерпретации результатов между разными специалистами, известным как межэкспертная вариабельность. Эти расхождения могут приводить к ложноположительным или ложноотрицательным результатам, задерживая своевременное вмешательство и увеличивая риск прогрессирования заболевания и потери зрения. Таким образом, зависимость от ручного скрининга создает серьезные препятствия для широкого охвата населения программами ранней диагностики и профилактики диабетической ретинопатии.

Изначально, алгоритмы глубокого обучения демонстрировали впечатляющие результаты в обнаружении диабетической ретинопатии, достигая показателей AUC в 99% на закрытых, тщательно отобранных наборах данных, как было показано в исследовании Гульшана и коллег в 2016 году. Однако, при проверке этих же моделей на более строгих, общедоступных наборах данных, таких как те, что использовались в работе Воетса и других в 2019 году, точность существенно снижалась до 85-90% AUC. Это снижение указывает на значительные трудности в обобщении моделей, то есть в их способности эффективно работать с данными, полученными из различных источников и отличающимися по качеству и характеристикам. Проблема обобщения подчеркивает необходимость разработки более устойчивых и надежных алгоритмов, способных адаптироваться к реальным клиническим условиям и обеспечивать точную диагностику вне зависимости от специфики данных.

Преодоление Дефицита Данных и Смещение с Помощью Продвинутых Методов Обучения

Критическим ограничением в скрининге диабетической ретинопатии (ДР) является недостаток размеченных данных, особенно для случаев тяжелой степени. Этот дефицит приводит к значительному дисбалансу в наборах данных, где количество изображений с незначительной или средней ДР существенно превышает количество изображений с тяжелой ДР, включая пролиферативную ДР и макулярный отек. Такой дисбаланс негативно влияет на производительность моделей машинного обучения, приводя к снижению точности диагностики тяжелых форм ДР, что, в свою очередь, увеличивает риск поздней диагностики и потери зрения. Для эффективного обучения моделей, способных надежно выявлять тяжелую ДР, необходимы стратегии, направленные на увеличение объема размеченных данных или на смягчение последствий дисбаланса, например, использование методов взвешивания классов или генерации синтетических данных.

Самообучающееся обучение (Self-Supervised Learning) представляет собой эффективный подход к преодолению дефицита размеченных данных в задачах скрининга диабетической ретинопатии. Вместо традиционного обучения с учителем, требующего больших объемов вручную аннотированных изображений, данный метод использует неразмеченные данные для предварительного обучения моделей. В процессе предварительного обучения модель учится извлекать полезные признаки и представления из неразмеченных изображений путем решения искусственно созданных задач, таких как предсказание повернутых или замаскированных участков изображения. Полученные в результате предварительного обучения модели демонстрируют улучшенную обобщающую способность и требуют значительно меньше размеченных данных для достижения высокой точности, что снижает зависимость от трудоемкой и дорогостоящей ручной разметки.

Федеративное обучение позволяет осуществлять совместное обучение моделей машинного зрения в различных медицинских учреждениях без обмена конфиденциальными данными пациентов. Этот подход решает проблему разрозненности данных (data silos), когда информация о пациентах распределена между отдельными больницами или клиниками и недоступна для централизованного анализа. Вместо передачи данных, алгоритмы обучения передаются в каждое учреждение, где они обучаются на локальных данных. Затем обновленные параметры модели агрегируются и возвращаются для дальнейшей итерации. Такой процесс не только обеспечивает конфиденциальность данных, но и повышает устойчивость модели за счет использования более разнообразного набора данных, полученного из разных источников, что снижает вероятность переобучения и повышает обобщающую способность модели для выявления диабетической ретинопатии.

Строгая Оценка и Калибровка для Надежного Скрининга ДР

Оценка моделей глубокого обучения для диагностики диабетической ретинопатии (ДР) не должна ограничиваться только общей точностью. Традиционные метрики, такие как точность и полнота, могут давать нереалистичную картину клинической производительности, поскольку не учитывают корректность прогнозов для каждого пациента в отдельности. Пер-пациентская оценка (Per-Patient Evaluation) предполагает, что модель должна правильно диагностировать каждого пациента, а не просто демонстрировать высокую среднюю точность по всей выборке. Этот подход позволяет более адекватно оценить, как модель будет работать в реальных клинических условиях, где важно правильно диагностировать каждого пациента, а не только достичь высокой общей точности, особенно при наличии несбалансированных классов или различий в характеристиках пациентов.

Оценка надежности вероятностей, предсказываемых моделями машинного обучения для диагностики диабетической ретинопатии, критически важна для клинического применения. Метрики калибровки, такие как ожидаемая ошибка калибровки (ECE) и оценка Брайера (Brier score), позволяют количественно оценить соответствие между предсказанной вероятностью и фактической частотой событий. ECE измеряет разницу между средней предсказанной вероятностью и фактической частотой положительных результатов в группах с одинаковой предсказанной вероятностью. Оценка Брайера, выраженная формулой $ \frac{1}{N} \sum_{i=1}^{N} (p_i — y_i)^2 $, где $p_i$ – предсказанная вероятность, а $y_i$ – фактическая метка класса, предоставляет единую меру погрешности предсказаний. Хорошо откалиброванная модель обеспечивает достоверные вероятности, что необходимо для принятия обоснованных клинических решений и стратификации пациентов.

Внешняя валидация моделей глубокого обучения для диагностики диабетической ретинопатии (ДР) на различных наборах данных, таких как Messidor, EyePACS, DDR и FGADR, критически важна для оценки их способности к обобщению и снижения влияния смещения домена. Наблюдается значительное снижение производительности при переходе от набора данных APTOS 2019 к DDR: модели, демонстрирующие точность выше 98% на APTOS, показывают падение до приблизительно 80% на DDR. Данный факт подчеркивает необходимость оценки моделей на разнообразных данных, отражающих различные условия съемки и характеристики пациентов, для обеспечения надежности и клинической применимости систем диагностики ДР.

К Объяснимому и Достоверному ИИ для Диабетической Ретинопатии

Механизмы внимания, являющиеся частью подходов объяснимого искусственного интеллекта (XAI), позволяют визуализировать, какие именно области изображения оказывают наибольшее влияние на принятие решения моделью при диагностике диабетической ретинопатии. Данные методы не просто предоставляют итоговый прогноз, но и демонстрируют, на какие признаки – например, микроаневризмы или кровоизлияния – модель обращает внимание при постановке диагноза. Такая прозрачность крайне важна для укрепления доверия со стороны врачей, поскольку позволяет им оценить обоснованность решения модели и избежать слепого принятия результатов. Визуализация «внимания» модели способствует более глубокому пониманию ее работы и, в конечном итоге, повышает эффективность использования искусственного интеллекта в клинической практике, позволяя специалистам совместно с системой ставить более точные диагнозы.

Внедрение нейро-символических моделей в сочетании с глубоким обучением представляет собой перспективный подход к повышению прозрачности и понимания работы алгоритмов диагностики диабетической ретинопатии. В отличие от традиционных “черных ящиков”, нейро-символические системы способны не только выявлять признаки заболевания на изображениях, но и предоставлять логическое обоснование принятых решений, используя правила и знания, сформулированные экспертами-офтальмологами. Такой симбиоз позволяет клиницистам не просто доверять прогнозам искусственного интеллекта, но и понимать ход рассуждений, лежащий в основе диагностики, что критически важно для принятия обоснованных клинических решений и повышения доверия к автоматизированным системам поддержки принятия решений. Это открывает возможности для более глубокого анализа сложных случаев, выявления потенциальных ошибок и, в конечном итоге, улучшения качества медицинской помощи.

В контексте автоматизированной диагностики диабетической ретинопатии, архитектуры Vision Transformer (ViT), несмотря на свою высокую производительность, требуют тщательного анализа при сравнении с традиционными свёрточными нейронными сетями (CNN). Исследования показывают, что ViT эффективно обрабатывают глобальные зависимости в изображениях сетчатки, однако, для достижения оптимальной эффективности в задачах скрининга, необходимо учитывать вычислительные затраты и объём данных для обучения. Совместное использование ViT и CNN, например, в гибридных моделях, позволяет сочетать сильные стороны обеих архитектур: способность CNN извлекать локальные признаки и способность ViT улавливать контекстуальные взаимосвязи. Такой подход способствует повышению точности диагностики и снижению требований к вычислительным ресурсам, что особенно важно для внедрения систем автоматизированного скрининга в клиническую практику.

Будущее Скрининга ДР: Персонализированный и Проактивный Уход

Сочетание передовых моделей искусственного интеллекта с всесторонними данными о пациентах и шкалой тяжести диабетической ретинопатии (ICDR Severity Scale) открывает новые возможности для персонализированной оценки рисков и разработки индивидуальных планов лечения. Такой подход позволяет не просто выявлять наличие заболевания, но и прогнозировать его развитие, учитывая уникальные характеристики каждого пациента – возраст, сопутствующие заболевания, длительность диабета и другие факторы. Алгоритмы машинного обучения анализируют большие объемы данных, выявляя закономерности, которые могут быть незаметны для человеческого глаза, и предсказывая вероятность прогрессирования ретинопатии. Это, в свою очередь, дает возможность врачам назначать наиболее эффективное лечение и проводить профилактические мероприятия, направленные на замедление или предотвращение потери зрения. Использование ICDR Severity Scale в качестве стандартизированной метрики позволяет объективно оценивать тяжесть заболевания и отслеживать динамику лечения, обеспечивая более точную и эффективную помощь пациентам.

Развитие интегрированных диагностических инструментов для различных заболеваний сетчатки становится возможным благодаря расширенному использованию многозаболевых баз данных изображений глазного дна, таких как ODIR. Эти обширные коллекции данных позволяют обучать алгоритмы искусственного интеллекта распознавать не только диабетическую ретинопатию, но и другие патологии, например, возрастную макулярную дегенерацию или глаукому, на одном и том же изображении. Такой подход значительно повышает эффективность скрининга, позволяя выявлять несколько заболеваний одновременно и снижая необходимость в отдельных процедурах диагностики для каждого состояния. Более того, анализ взаимосвязей между различными заболеваниями сетчатки, выявляемый при использовании подобных баз данных, может привести к новым открытиям в понимании патогенеза и разработке более эффективных методов лечения.

Будущее скрининга диабетической ретинопатии (ДР) заключается в переходе к проактивному и профилактическому подходу, где искусственный интеллект играет ключевую роль в выявлении лиц, находящихся в зоне риска. Вместо реактивного лечения уже проявившихся изменений, системы на основе ИИ способны анализировать данные пациентов и предсказывать вероятность развития ДР на ранних стадиях. Особое внимание уделяется выявлению реферабельной ДР – состояний, требующих немедленного вмешательства специалиста для предотвращения необратимой потери зрения. Такой подход позволяет не только сохранить зрение, но и существенно снизить нагрузку на систему здравоохранения за счет ранней диагностики и своевременного лечения, обеспечивая более эффективное использование ресурсов и улучшение качества жизни пациентов.

Исследование эволюции глубокого обучения в скрининге диабетической ретинопатии неизбежно наталкивает на мысль о цикличности технологического прогресса. Разработчики стремятся к созданию универсальных, устойчивых к изменениям данных систем, что, по сути, является вечной погоней за идеалом. Как метко подметила Фэй-Фэй Ли: «Искусственный интеллект должен служить людям, а не наоборот». Ирония в том, что даже самые передовые алгоритмы, основанные на федеративном обучении и обобщении доменов, рано или поздно столкнутся с новыми, непредвиденными проблемами. В конечном итоге, система, стабильно выдающая предсказуемые ошибки, может оказаться более ценной, чем хрупкий шедевр, сломавшийся от первого же дуновения ветра перемен. Это не недостаток технологии, а закономерность.

Что дальше?

Обзор эволюции глубокого обучения в скрининге диабетической ретинопатии неизбежно возвращает к старому вопросу: сколько ещё «революций» потребуется, чтобы получить стабильную, предсказуемую систему? Успехи в области федеративного обучения и обобщения на разные домены, безусловно, впечатляют, однако за красивыми графиками улучшения метрик часто скрывается та же проблема – хрупкость моделей перед реальными данными. Перенос обучения, domain adaptation, и прочие «новые» подходы — лишь переименованные версии тех же самых техник, которые пылились на полках в 2012-м.

Очевидно, что акцент смещается в сторону воспроизводимости и клинической валидации. Если тесты проходят успешно, это, скорее, говорит о недостаточном качестве проверок, чем о реальной надёжности системы. Необходим более строгий контроль над процессом разработки, от сбора данных до развертывания модели, и, что важнее, чёткое понимание границ применимости каждого алгоритма. Успех в этой области будет измеряться не количеством опубликованных статей, а количеством пациентов, которым действительно помогли.

В конечном итоге, каждое «прорывное» решение станет техническим долгом. Производство всегда найдёт способ сломать элегантную теорию. Поэтому, вместо того чтобы гоняться за бесконечной масштабируемостью, стоит сосредоточиться на создании простых, понятных и надёжных систем, которые смогут работать в реальных условиях, а не только в лабораторных.


Оригинал статьи: https://arxiv.org/pdf/2511.11065.pdf

Связаться с автором: https://www.linkedin.com/in/avetisyan/

Смотрите также:

2025-11-18 01:25