Hybrid method for anomaly detection in logical clusters of cyber vulnerabilities using an ensemble of machine learning models

Authors

DOI:

https://doi.org/10.18372/2073-4751.86.21284

Keywords:

anomaly detection, cybersecurity, logical clustering, ensemble learning, decision tree, Random Forest, Gradient Boosting

Abstract

The article presents the hybrid anomaly detection method based on logical clustering of vulnerabilities and the application of machine learning techniques. The dataset includes information about software vulnerabilities, including CVSS metrics, severity levels, CWE types, temporal characteristics, and assignment to logical groups formed based on the OWASP Top Ten.
At the first stage, data analysis is performed along with the construction of additional temporal features. Subsequently, logical clustering of vulnerabilities is carried out, allowing the data to be partitioned into semantically homogeneous groups such as Broken Access Control, Injection, Cryptography & Data Protection, Configuration & Design Weaknesses, Authentication and Mishandling Failures, and Software Failures. This approach reduces data heterogeneity and improves the quality of subsequent analysis.
At the second stage, the Isolation Forest anomaly detection method is applied to identify atypical vulnerabilities within each cluster. The obtained results are used as pseudo-labels for training ensemble machine learning models, including Decision Tree, Random Forest, and Gradient Boosting. These models are employed for anomaly classification and for evaluating their predictability based on a feature space that includes CVSS metrics, exploitability score, impact score, and temporal characteristics.
Model performance is evaluated using Accuracy, Precision, Recall, F1-score, and Log Loss metrics. Experimental results show that Gradient Boosting demonstrates the best performance on large datasets, while Random Forest provides more stable results on smaller clusters. Decision Tree offers high interpretability but is prone to overfitting and exhibits weaker generalization capability compared to other models.
The proposed hybrid method improves anomaly detection accuracy through the use of semantically homogeneous clusters and an ensemble of models.
The results of the study can be applied in information security monitoring and incident management systems, as well as in the development of intelligent forecasting systems aimed at detecting anomalous events and modeling the dynamics of vulnerability propagation.

References

Ahmed A.F Osman, Mohammed Awad Mohammed Ataelfadiel. Zero-day attack prediction using ensemble machine learning with threat intelligence data. International Journal of Applied Mathematics, Volume 38No. 10s, 2025, 983-1004. ISSN: 1314-8060 (online version)

Мартовицький, В., Свиридов, А., Авдєєв, О., Гудзинський, І., & Коротецький, О. (2025). Дослідження методів виявлення аномалій у api журналах для забезпечення безпеки та надійності програмних систем. Вісник Херсонського національного технічного університету, 2 (1 (92)), 142-148. DOI: https://doi.org/10.35546/kntu2078-4481.2025.1.2.19

Довженко, Т. П. (2026). Hybrid awred: синергія адаптивної реконструкції та топологічної кластеризації для виявлення аномалій у мультимодальних даних. Зв’язок, (1), 80-88. DOI: https://doi.org/10.31673/2412-9070.2026.017405

Шульга В.П., Іванченко І.С., Рижаков М.М. Математична модель семантичної атрибуції кіберінцидентів у системах виявлення аномалій на основі глибокого навчання. Сучасний захист інформації, 2025, № 3(63), 186-198. DOI: https://doi.org/10.31673/2409-7292.2025.032076

Петляк, Н. (2025). Аналіз моделей виявлення аномалій трафіку в сучасних інформаційно-комунікаційних системах та мережах. Вимірювальна та обчислювальна техніка в технологічних процесах, (1), 180–186. DOI: https://doi.org/10.31891/2219-9365-2025-81-21

Поночовний, П., & Пепа, Ю. (2025). Реалізація системи захисту серверів з урахуванням аномалій в пакетах. Вимірювальна та обчислювальна техніка в технологічних процесах, (1), 44–51. DOI: https://doi.org/10.31891/2219-9365-2025-81-6

Іванченко, Є., Аверічев, І., & Рижаков, М. (2025). Узагальнена модель прогнозування та виявлення кібербезпекових аномалій на основі штучного інтелекту. Електронне фахове наукове видання «Кібербезпека: освіта, наука, техніка», 4(28), 529–546. DOI: https://doi.org/10.28925/2663-4023.2025.28.823

Є. Ю. Глоба, В. Р. Смірнов, М. С. Нараєвський, В. М. Федорченко. Метод виявлення аномалій в корпоративній мережі. Системи управління, навігації та зв'язку. 2025. No 3, 193-198. Режим доступу: https://www.researchgate.net/publication/396481105_METOD_VIAVLENNA_ANOMALIJ_V_KORPORATIVNIJ_MEREZIMETHOD_FOR_DETECTING_ANOMALIES_IN_CORPORATE_NETWORKS

National Vulnerability Database. Режим доступу: https://nvd.nist.gov/developers/vulnerabilities

OWASP Top 10 2025. Режим доступу: https://owasp.org/Top10/2025/A01_2025-Broken_Access_Control/

Published

2026-05-30

How to Cite

Melnychenko, P. (2026). Hybrid method for anomaly detection in logical clusters of cyber vulnerabilities using an ensemble of machine learning models. Problems of Informatization and Control, 2(86), 109–119. https://doi.org/10.18372/2073-4751.86.21284

Issue

Section

Статті