Багатокритеріальний метод оптимізації управління ІТ-послугами віртуального провайдера на основі глибокого навчання з підкріпленням
DOI:
https://doi.org/10.18372/1990-5548.88.20971Ключові слова:
постачальник віртуальних послуг, сервісно-ресурсна модель, оптимізація найближчої політики, багатокритеріальна оптимізація, управління ІТ-послугами, інформаційні системиАнотація
У статті вирішується задача оптимізації управління ІТ-послугами для B2B-сегмента в умовах динамічного навантаження та ймовірнісної ненадійності сервісних операторів. Запропоновано архітектуру системи управління віртуального провайдера послуг, що автоматизує процеси обслуговування корпоративних замовників. Основою системи є гібридний модуль трансляції, який математично перетворює абстрактні бізнес-наміри та контекст клієнтів на детерміновану сервісно-ресурсну модель із заданими технічними, фінансовими та часовими обмеженнями. Для ефективної оркестрації сформованих задач розроблено алгоритм багатокритеріальної оптимізації PPO-VSP на основі глибокого навчання з підкріпленням. Використання модуля оцінки репутації дозволило системі ідентифікувати ненадійних суб’єктів надання послуг та уникати їхнього перевантаження. Експериментальні дослідження шляхом імітаційного моделювання підтвердили стабільну математичну збіжність алгоритму. Навчений агент оптимізації забезпечив дотримання угод про рівень послуг (показник QoE) на рівні 95.4% в умовах обмежених ресурсів. Час генерації матриці декомпозиції склав 18 мс, що гарантує швидке прийняття управлінських рішень під час роботи високонавантажених інфраструктур без зупинки системи.
Посилання
A. Araldo, A.D. Stefano, and A.D. Stefano, “Resource allocation for edge computing with multiple tenant configurations,” in Proceedings of the 35th Annual ACM Symposium on Applied Computing, Brno Czech Republic: ACM, Mar. 2020, рр. 1190–1199. https://doi.org/10.1145/3341105.3374026.
A. Clemm, L. Ciavaglia, L.Z. Granville, and J. Tantsura, “Intent-Based Networking – Concepts and Definitions,” Internet Engineering Task Force, Request for Comments RFC 9315, Nov. 2022. https://doi.org/10.17487/RFC9315.
Y. Xu, M. Z. A. Bhuiyan, T. Wang, X. Zhou, and A. K. Singh, “C-FDRL: Context-Aware Privacy-Preserving Offloading Through Federated Deep Reinforcement Learning in Cloud-Enabled IoT,” IEEE Trans. Ind. Inform., vol. 19, no. 2, pp. 1155–1164, Feb. 2023, https://doi.org/10.1109/TII.2022.3149335.
O. I. Rolik and S. D. Zhevakin, “Cost Optimization Method for Informational Infrastructure Deployment in Static Multi-Cloud Environment,” Radio Electron. Comput. Sci. Control, vol. 3, pp. 160–172, Nov. 2024, https://doi.org/10.15588/1607-3274-2024-3-14.
W. Kong, X. Li, L. Hou, J. Yuan, Y. Gao, and S. Yu, “A Reliable and Efficient Task Offloading Strategy Based on Multifeedback Trust Mechanism for IoT Edge Computing,” IEEE Internet Things J., vol. 9, no. 15, pp. 13927–13941, Sер. 2022, https://doi.org/10.1109/JIOT.2022.3143572.
Y. Cai, P. Cheng, Z. Chen, M. Ding, B. Vucetic, and Y. Li, “Deep Reinforcement Learning for Online Resource Allocation in Network Slicing,” IEEE Trans. Mob. Comput., vol. 23, no. 6, pp. 7099–7116, Jun. 2024, https://doi.org/10.1109/TMC.2023.3328950.
G. Wei, A.V. Vasilakos, Y. Zheng, and N. Xiong, “A game-theoretic method of fair resource allocation for cloud computing services,” J. Supercomput., vol. 54, no. 2, pp. 252–269, Nov. 2010, https://doi.org/10.1007/s11227-009-0318-1.
T. Metsch, M. Viktorsson, A. Hoban, M. Vitali, R. Iyer, and E. Elmroth, “Intent-Driven Orchestration: Enforcing Service Level Objectives for Cloud Native Deployments,” SN Comput. Sci., vol. 4, no. 3, pp. 268, Mar. 2023, https://doi.org/10.1007/s42979-023-01698-0.
J. Hu, Y. Li, G. Zhao, B. Xu, Y. Ni, and H. Zhao, “Deep Reinforcement Learning for Task Offloading in Edge Computing Assisted Power IoT,” IEEE Access, vol. 9, pp. 93892–93901, 2021, https://doi.org/10.1109/ACCESS.2021.3092381.
H. Taneja and S. Kaur, “Reputation based novel trust management framework with enhanced availability for cloud,” J. Parallel Distrib. Comput., vol. 178, pp. 43–55, Aug. 2023, https://doi.org/10.1016/j.jpdc.2023.03.010.
K. Arulkumaran, M. P. Deisenroth, M. Brundage, and A. A. Bharath, “Deep Reinforcement Learning: A Brief Survey,” IEEE Signal Process. Mag., vol. 34, no. 6, pp. 26–38, Nov. 2017, https://doi.org/10.1109/MSP.2017.2743240.
M. Iqbal et al., “Twin Delayed Deep Deterministic Policy Gradient for Intelligent Optimization in STAR-RIS-Assisted Wireless Networks,” IEEE Open J. Commun. Soc., vol. 6, pp. 9696–9713, 2025, https://doi.org/10.1109/OJCOMS.2025.3631341.
R. Siyadatzadeh et al., “ReLIEF: A Reinforcement-Learning-Based Real-Time Task Assignment Strategy in Emerging Fault-Tolerant Fog Computing,” IEEE Internet Things J., vol. 10, no. 12, pp. 10752–10763, Jun. 2023, https://doi.org/10.1109/JIOT.2023.3240007
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.
Науковий журнал "Електроніка та системи управління" дотримується принципів відкритого доступу (Open Access) та забезпечує вільний, негайний і постійний доступ до всіх опублікованих матеріалів без фінансових, технічних або юридичних обмежень для читачів.
Усі статті публікуються у відкритому доступі відповідно до ліцензії Creative Commons Attribution 4.0 International (CC BY 4.0).
Авторські права
Автори, які публікують свої роботи в журналі ""Електроніка та системи управління":
-
зберігають за собою авторські права на свої публікації;
-
надають журналу право на перше опублікування статті;
-
погоджуються на поширення матеріалів за ліцензією CC BY 4.0;
-
мають право повторно використовувати, архівувати та поширювати свої роботи (у тому числі в інституційних та тематичних репозитаріях) за умови посилання на первинну публікацію в журналі.




