Мінімальна точність для надійного рейтингу архітектури в баєсівському NAS для виявлення об’єктів

Автор(и)

  • Анатолій Тарасович Кот Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського» https://orcid.org/0000-0002-7490-8834

DOI:

https://doi.org/10.18372/1990-5548.88.20966

Ключові слова:

пошук нейронної архітектури, баєсівська оптимізація, мінімальна точність, проксі-метрики, крива навчання, TPE, Optuna

Анотація

Роботу присвячено проблемі зниження обчислювальних витрат у задачі автоматичного синтезу нейронних мереж (Neural Architecture Search, NAS) для детекції об’єктів. Ключовою невизначеністю low-fidelity підходів є питання: після якої мінімальної кількості epochs ранній навчальний сигнал вже прийнятно ранжує архітектури? В роботі розроблено методологію визначення мінімальної фіделіті на основі out-of-sample оцінки rank correlation: trials розбиваються на калібраційний (70%) та тестовий (30%) набори, composite proxy синтезується на першому і перевіряється на другому. Проведено емпіричне дослідження на 60 архітектурах, навчених по 25 epochs на датасеті детекції об'єктів (6,772 зображень, 6 класів). В результаті встановлено, що rank-ансамбль трьох навчальних метрик (val_loss, train_accuracy, val_accuracy) досягає Spearman ρ = 0.877 out-of-sample на epoch 3, забезпечуючи 88% економію обчислень. Складна 7-компонентна метрика поступається простому ансамблю через overfitting при малій вибірці (ρ_test = 0.70 проти 0.88). Результати є локально валідними у досліджуваному пошуковому просторі та на конкретному датасеті.

Біографія автора

Анатолій Тарасович Кот , Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

Старший викладач

Кафедра штучного інтелекту

Навчально-науковий інститут прикладного системного аналізу 

Посилання

T. Elsken, J. H. Metzen, and F. Hutter, “Neural architecture search: A survey,” JMLR, 2019. https://doi.org/10.1007/978-3-030-05318-5_11

C. Sciuto, K. Yu, M. Jaggi, C. Musat, and M. Salzmann, “Evaluating the search phase of neural architecture search,” ICLR, 2020.

E. Real, A. Aggarwal, Y. Huang, and Q. V. Le, “Regularized evolution for image classifier architecture search,” AAAI, 2019. https://doi.org/10.1609/aaai.v33i01.33014780

H. Liu, K. Simonyan, and Y. Yang, “DARTS: Differentiable architecture search,” ICLR, 2019.

J. Bergstra, R. Bardenet, Y. Bengio, and B. Kégl, “Algorithms for hyper-parameter optimization,” NeurIPS, 2011.

M. S. Abdelfattah, A. Mehrotra, Ł. Dudziak, and N. D. Lane, “Zero-cost proxies for lightweight NAS,” ICLR, 2021.

J. Mellor, J. Turner, A. Storkey, and E. J. Crowley, “Neural architecture search without training,” ICML, 2021.

T. Domhan, J. T. Springenberg, and F. Hutter, “Speeding up automatic hyperparameter optimization of deep neural networks by extrapolation of learning curves,” IJCAI, 2015.

L. Li, K. Jamieson, G. DeSalvo, A. Rostamizadeh, and A. Talwalkar, “Hyperband: A novel bandit-based approach to hyperparameter optimization,” JMLR, 2017.

J. Siems, L. Zimmer, A. Zela, J. Lukasik, M. Keuper, and F. Hutter, “NAS-Bench-301 and the case for surrogate benchmarks for NAS,” NeurIPS (Workshop), 2020.

T. Akiba, S. Sano, T. Yanase, T. Ohta, and M. Koyama, “Optuna: A next-generation hyperparameter optimization framework,” KDD, 2019. https://doi.org/10.1145/3292500.3330701.

##submission.downloads##

Опубліковано

2026-04-18

Як цитувати

Кот , А. Т. (2026). Мінімальна точність для надійного рейтингу архітектури в баєсівському NAS для виявлення об’єктів. Електроніка та системи управління, 2(88), 54–60. https://doi.org/10.18372/1990-5548.88.20966

Номер

Розділ

КОМП’ЮТЕРНІ НАУКИ