Форум сайта python.su
Есть набор данных с различными признаками, такими как пол , штат, подключенный план итд .Также есть целевая переменная Churn о том уйдет ли клиент или нет . На основе этих данных надо построить модель, основанную на следующих правилах:
Если у пользователя подключен роуминг (International plan) & клиент звонил в тех. поддержку более 3-х раз => клиент уйдет (Churn = True)
Иначе => клиент останется (Churn = False)
Оценить качество данной модели на 5-fold валидации из 5 повторений.
Как можно построить данную модель?
Офлайн
Dobryak999Читаете “набор данных” выделаете необходимые вам признаки “подключен роуминг” и “к-во звонков в тех. поддержку” и дальше просто if ….: Churn = True else: Churn = False по каждому клиенту.
Как можно построить данную модель?
[code python][/code]
Отредактировано PEHDOM (Дек. 7, 2018 09:23:06)
Офлайн
Да, а построить модель для предскзания?
И оценить качество данной модели на 5-fold валидации из 5 повторений.
Офлайн
Dobryak999что в вашем понимании “построить модель”? Есть спец модули для построения и анализа моделей :
построить модель для предскзания?
Dobryak999исходый набор данных разбивается на 5 одинаковых по размеру блоков. Из 4 блоков один оставляется для тестирования модели, а остающиеся 4 блока используются как тренировочный набор. Процесс повторяется 5 раз, и каждый из блоков используется один раз как тестовый набор. Получаются 5 результатов, по одному на каждый блок, они усредняются или комбинируются каким-либо другим способом, и дают одну оценку.
оценить качество данной модели на 5-fold валидации из 5 повторений.
[code python][/code]
Офлайн