Использование методов машинного обучения для решения задач прогнозирования спроса на новый товар в интернет-маркетплейсе

434

Аннотация

Работа направлена на исследование возможности применения методов машинного обучения для построения моделей прогнозирования спроса на новые товары в интернет-магазине Ozon.ru. Предлагаются к рассмотрению ранее неиспользуемые в рамках конкретной задачи подходы к решению. В качестве выборки использованы данные об истории продаж и хранении товаров на сайте Ozon.ru. Приводится описание, анализ примерного убытка сайта Ozon.ru, используемых данных, процесса построения базовой модели, а также полученных результатов. Описываются метрики, использованные для оценки результатов прогнозирования, а также проводится сравнительный анализ между результатами предсказания построенной модели и результатами эвристически подобранных значений.

Общая информация

Ключевые слова: прогнозирование спроса, новый товар, энкодинг, градиентный бустинг, регрессия, препроцессинг, обработка данных, машинное обучение

Рубрика издания: Анализ данных

DOI: https://doi.org/10.17759/mda.2020100404

Для цитаты: Осин А.А., Фомин А.К., Сологуб Г.Б., Виноградов В.И. Использование методов машинного обучения для решения задач прогнозирования спроса на новый товар в интернет-маркетплейсе // Моделирование и анализ данных. 2020. Том 10. № 4. С. 41–50. DOI: 10.17759/mda.2020100404

Литература

  1. Bisong E. Introduction to Scikit-learn // Building Machine Learning and Deep Learning Models on Google Cloud Platform 2019. P. 215–229.
  2. Cerda P., Varoquaux G., Kégl B. Similarity encoding for learning with dirty categorical variables // Machine Learning. 2018. P. 1477–1494.
  3. Ke G. et al. Lightgbm: A highly efficient gradient boosting decision tree // Advances in neural information processing systems. 2017. P. 3146–3154.
  4. Redell N. Shapley Decomposition of R-Squared in Machine Learning Models // arXiv preprint arXiv:1908.09718. 2019.
  5. Botchkarev, Alexei. “Performance metrics (error measures) in machine learning regression, forecasting and prognostics: Properties and typology.” // arXiv preprint arXiv:1809.03006.
  6. Al Daoud E. Comparison between XGBoost, LightGBM and CatBoost Using a Home Credit Dataset // International Journal of Computer and Information Engineering. 2019. P. 6–10.

Информация об авторах

Осин Артем Александрович, Московский авиационный институт (национальный исследовательский университет), Москва, Россия, ORCID: https://orcid.org/0000-0002-2664-1370, e-mail: artemosin1@yandex.ru

Фомин Артем Константинович, Московский авиационный институт (национальный исследовательский университет), Москва, Россия, ORCID: https://orcid.org/0000-0003-3545-4435, e-mail: artem.fomin@outlook.com

Сологуб Глеб Борисович, кандидат физико-математических наук, доцент кафедры математической кибернетики института «Информационные технологии и прикладная математика», Московский авиационный институт (национальный исследовательский университет), Москва, Россия, ORCID: https://orcid.org/0000-0002-5657-4826, e-mail: glebsologub@ya.ru

Виноградов Владимир Иванович, кандидат физико-математических наук, доцент кафедры «Математическая кибернетика», Московский авиационный институт (национальный исследовательский университет), Москва, Россия, ORCID: https://orcid.org/0000-0003-3773-9653, e-mail: vvinogradov@inbox.ru

Метрики

Просмотров

Всего: 595
В прошлом месяце: 15
В текущем месяце: 7

Скачиваний

Всего: 434
В прошлом месяце: 25
В текущем месяце: 8