Розвідувальний аналіз та візуалізація набору даних на прикладі підприємства електронної торгівлі
DOI:
https://doi.org/10.18372/2073-4751.79.19385Ключові слова:
розвідувальний аналіз, візуалізація даних, часові ряди, кореляційний аналіз, кластерний аналіз, машинне навчанняАнотація
У цій статті представлений підхід до розвідувального аналізу та візуалізації набору даних на прикладі підприємства електронної торгівлі. В дослідженні розглядаються ключові етапи розвідувального аналізу даних: попередню обробку даних, візуалізацію, видалення аномалій, кореляційний та кластерний аналізи для підготовки даних до вирішення задач машинного навчання у майбутніх дослідженнях. До цих задач входять: оцінка моделі часового ряду, виявлення тренду, сезонних та циклічних складових часового ряду, кластеризація клієнтів, класифікація нових клієнтів, прогнозування кількості проданих одиниць по кластерам клієнтів. Розроблений підхід може бути використаний для аналізу інших наборів даних електронної торгівлі.
Посилання
Пінцак І. Використання машинного навчання та аналізу даних для прогнозування тенденцій у електронній комерції. Information Technology: Computer Science, Software Engineering and Cyber Security. 2024. № 1. С. 80–88. DOI: 10.32782/it/2024-1-10.
Про електронну комерцію: Закон України від 01.01.2024 № 675-VIII. URL: https://zakon.rada.gov.ua/laws/show/675-19#Text (дата звернення: 01.09.2024).
Що чекає на український e-commerce у 2024 році: розбираємо ключові тренди? URL: https://rau.ua/novyni/ukr-e-commerce-2024-trendi/ (дата звернення: 10.09.2024).
12 Best Machine Learning Strategies for E-commerce Businesses. URL: https://www.prefixbox.com/blog/machine-learning-for-ecommerce/ (дата звернення: 24.09.2024).
Apache Superset. The Apache Software Foundation. URL: https://superset.apache.org/ (дата зве-рнення: 01.10.2024).
Chen D., Sain S. L., Guo K. Data mining for the online retail industry: A case study of RFM model-based customer segmentation using data mining. Journal of Database Marketing & Customer Strategy Management. 2012. Vol. 19, no. 3. P. 197–208. URL: https://doi.org/10.1057/dbm.2012.17.
García-Aroca C. et al. An algorithm for automatic selection and combination of forecast models. Expert Systems with Applications. 2024. 121636. DOI: 10.1016/j.eswa.2023.121636.
How Ukrainian eCommerce Survived 2023. Annual Indicators & Forecast 2024. URL: https://www.promodo.com/research/ukrainian-ecommerce-2023#obsyag-ukrayinskogo-rinku-2023 (дата звернення: 11.09.2024).
Syakur M.A. et al. Integration K-Means Clustering Method and Elbow Method For Identification of The Best Customer Profile Cluster. IOP Conference Series: Materials Science and Engineering. 2018. Т. 336. 012017. DOI: 10.1088/1757-899x/336/1/012017.
Looker Studio Overview. URL: https://lookerstudio.google.com/ (дата звернення: 01.10.2024).
Matplotlib – Visualization with Python. URL: https://matplotlib.org/ (дата звернення: 02.10.2024).
NumPy. The fundamental package for scientific computing with Python. URL: https://numpy.org/ (дата звернення: 02.10.2024).
Pandas. Python Data Analysis Library. URL: https://pandas.pydata.org/ (дата звернення: 02.10.2024).
Power BI. Uncover powerful insights and turn them into impact. URL: https://www.microsoft.com/en-us/power-platform/products/power-bi (дата звернення: 01.10.2024).
Scikit-learn: machine learning in Python. URL: https://scikit-learn.org/stable/ (дата звернення: 03.10.2024).
Seaborn: statistical data visualization. URL: https://seaborn.pydata.org/ (дата звернення: 03.10.2024).
Sinaga K. P., Yang M.-S. Unsupervised K-Means Clustering Algorithm. IEEE Access. 2020. Т. 8. С. 80716–80727. DOI: 10.1109/access.2020.2988796.
Tableau: Business Intelligence and Analytics Software. URL: https://www.tableau.com/ (дата звер-нення: 01.10.2024).
Taylor S. J., Letham B. Forecasting at Scale. The American Statistician. 2018. Т. 72, № 1. С. 37–45. DOI: 10.1080/00031305.2017.1380080.
##submission.downloads##
Опубліковано
Як цитувати
Номер
Розділ
Ліцензія
Науковий журнал дотримується принципів відкритого доступу (Open Access) та забезпечує вільний, негайний і постійний доступ до всіх опублікованих матеріалів без фінансових, технічних або юридичних обмежень для читачів.
Усі статті публікуються у відкритому доступі відповідно до ліцензії Creative Commons Attribution 4.0 International (CC BY 4.0).
Авторські права
Автори, які публікують свої роботи в журналі:
-
зберігають за собою авторські права на свої публікації;
-
надають журналу право на перше опублікування статті;
-
погоджуються на поширення матеріалів за ліцензією CC BY 4.0;
-
мають право повторно використовувати, архівувати та поширювати свої роботи (у тому числі в інституційних та тематичних репозитаріях) за умови посилання на первинну публікацію в журналі.




