Метод класифікації зображень оптичної когерентної томографії на основі структурно-орієнтованої адаптивної нейронної мережі
DOI:
https://doi.org/10.18372/1990-5548.85.20429Ключові слова:
штучний інтелект, класифікація зображень, глибоке навчання, томографія, алгоритмАнотація
В статті запропоновано метод класифікації зображень оптичної когерентної томографії для автоматизованої діагностики діабетичної ретинопатії та діабетичного макулярного набряку Створено інноваційну адаптивну багатозадачну глибоку нейронну мережу. Вона одночасно вирішує задачі класифікації патологій та реконструкцію структурних ознак. Нейронна мережа використовує попередньо навчену модель EfficientNetB7 як енкодер для ефективного екстракції високорівневих ознак. Гілка вивчення структурних ознак (декодер) відповідає за відновлення просторової інформації. Вона збільшує роздільну здатність карт ознак до вихідного розміру 224x224 пікселів з поступовим зменшенням кількості фільтрів та використанням Batch Normalization для стабілізації навчання. Гілка класифікації об’єднує семантичні та структурні ознаки. Вона застосовує механізм канальної уваги для динамічного зважування інформативних каналів. Шари Dropout та Batch Normalization використані для запобігання перенавчанню використані в класифікаційній гілці. Модель оптимізується за допомогою багатозадачної функції втрат. Вона складається з модифікованої функції втрат для класифікації (з ваговими коефіцієнтами класів для балансування дисбалансу даних) та середньоквадратичної помилки для структурної втрати. Навчання відбувається з використанням оптимізатора Adam та функцій зворотного EarlyStopping, ModelCheckpoint і ReduceLROnPlateau. Експеримент проведено на наборі даних OCT Image Classification. Аугментація даних (горизонтальні віддзеркалення) проведена для збільшення кількості зображень. Високі показники точності та функції витрат отримано в результаті навчання. Багатозадачний метод надає можливості енкодеру вивчати деталі та границі сітківки через реконструкцію Canny-країв. Він сприяє покращенню класифікації та забезпечує потужний механізм внутрішньої регуляризації, підвищуючи узагальнюючу здатність моделі.
Посилання
H. Y. Li, D .X. Wang, L. Dong, and W.B. Wei, “Deep learning algorithms for detection of diabetic macular edema in OCT images. A systematic review and meta-analysis,” Eur J Ophthalmol, 2023, no. 33(1), pp. 278–290. https://doi.org/10.1177/11206721221094786
S. Manikandan, R. Raman, R. Rajalakshmi, S. Tamilselvi, and R. J. Surya, “Deep learning-based detection of diabetic macular edema using optical coherence tomography and fundus images: A meta-analysis,” Indian J Ophthalmol, no. 71(5), pp. 1783–1796, 2023. https://doi.org/10.4103/IJO.IJO_2614_22
М. Tan and Q. V. Le, “EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks,” In International Conference on Machine Learning, 2019, pp. 6105–6114.
R. Caruana, “Multitask Learning // Machine Learning,” vol. 28, no. 1, pp. 41–75, 1997. https://doi.org/10.1023/A:1007379606734
S. Li, “Thoracic Disease Classification and Localization Using a Multi-task Deep Learning Framework,” IEEE Journal of Biomedical and Health Informatics, vol. 23, no. 4, pp. 1657–1666. 2019.
C. Chen, “Deep Learning for Lung Nodule Classification and Segmentation: A Survey,”, Journal of Medical Systems, vol. 43, no. 1, p. 25, 2019.
J. Canny, “A Computational Approach to Edge Detection,” IEEE Transactions on Pattern Analysis and Machine Intelligence, vol. 8, no. 6, 1996, pp. 679–698. https://doi.org/10.1109/TPAMI.1986.4767851
S. Xie and Z. Tu, “Holistically-Nested Edge Detection,” Іn Proceedings of the IEEE International Conference on Computer Vision, 2015, pp. 1391–1399. https://doi.org/10.1109/ICCV.2015.164
X. Xavier. “DexiNed: Dense Extreme Inception Network for Edge Detection,” IEEE Access, 2019, vol. 7.
J. Hu, L. Shen, and G. Sun, “Squeeze-and-Excitation Networks,” In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2018, pp. 7132–7141. https://doi.org/10.1109/CVPR.2018.00745
S. Woo, J. Park, J. Lee, and I. S Kweon, “CBAM: Convolutional Block Attention Module,” in Proceedings of the European Conference on Computer Vision (ECCV), 2018, pp. 3–19. https://doi.org/10.1007/978-3-030-01234-2_1
D. V. Prochukhan, “Osoblyvosti konkatenatsii zghortkovykh neironnykh merezh dlia skryninhu diabetychnoi retynopatii,” Systemy obrobky informatsii, no. 1(176), pp. 89–94. 2024. [in Ukrainian] https://doi.org/10.30748/soi.2024.176.11
D. V. Prochukhan, “Syntez zghortkovykh neironnykh merezh ta dovhoi korotkochasnoi pamiati dlia detektuvannia proliferatyvnoi retynopatii,” Visnyk Natsionalnoho tekhnichnoho universytetu “KhPI”. Seriia: Informatyka ta modeliuvannia, vol. 1, no. 1–2 (11–12), pp. 76–86, 2024. [in Ukrainian]. https://doi.org/10.20998/2411-0558.2024.01.06
V. Sheketa, V. Pikh, M. Slabinoha, and Y. Striletskyi, “Metodolohiia optymizatsii neironnoi merezhi z intehratsiieiu pertseptronnykh komponentiv realizovanykh na plis,” Herald of Khmelnytskyi National University. Technical Sciences, no. 351, pp. 415–427, 2025. [in Ukrainian].
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Науковий журнал "Електроніка та системи управління" дотримується принципів відкритого доступу (Open Access) та забезпечує вільний, негайний і постійний доступ до всіх опублікованих матеріалів без фінансових, технічних або юридичних обмежень для читачів.
Усі статті публікуються у відкритому доступі відповідно до ліцензії Creative Commons Attribution 4.0 International (CC BY 4.0).
Авторські права
Автори, які публікують свої роботи в журналі ""Електроніка та системи управління":
-
зберігають за собою авторські права на свої публікації;
-
надають журналу право на перше опублікування статті;
-
погоджуються на поширення матеріалів за ліцензією CC BY 4.0;
-
мають право повторно використовувати, архівувати та поширювати свої роботи (у тому числі в інституційних та тематичних репозитаріях) за умови посилання на первинну публікацію в журналі.




