Твоя задача предсказать вероятность совершения покупки клиентом в определенных 8-ми категориях в следующие 7 дней, чтобы под них Банк смог направить релевантный контент (подборки).
Обучающий (transactions_train.csv) и тестовый (transactions_test.csv) датасеты идентичны и содержат информацию по транзакциям 25 000 уникальных клиентов каждый в следующем формате:
Качество вашей рекомендательной системы будет считаться на базе \(averageROC_{AUC}\):
\[averageROC\ = \sum_{i=1}^8 {ROC_{AUCi} \over 8},\] где \(ROC_{AUCi}\) – усредненный \(ROC_{AUC}\) по каждой из 8-ми категорий (т.е. по каждой категории вначале считается \(ROC_{AUC}\) по всем Клиентам, а затем они суммируются и усредняются на кол-во категорий).
Участникам нужно было подготовить файл test.csv, имеющий структуру, идентичную train_target.csv (25 000 Клиентов с client_dk и 8 категорий – итого 9 столбцов), заполнив для каждого клиента вероятности покупки в каждой из указанных выше категорий.