DjangoBB LoFi version

Полная версия: Заполнение пустых ячеек в Data Frames

Начало » Python для новичков » Заполнение пустых ячеек в Data Frames

Ascat2015

Дек. 24, 2022 13:33:17

Всем привет!
Есть задача заполнения пустых ячеек в Data Frame (значений ‘NaN’), проблема в том, что корректно преобразовать типы данных для работы метода fillna.groupby, не могу…
Привожу строки своего Data Frames (прилагаемый файл), в моём случае названного ‘games’.
Моя задача, заполнить все доступные пропуски в столбце ‘Rating’ значениями по следующему принципу:
Если для пустого значения в столбце ‘Rating’ и соответствующем ему названием по столбцу ‘Name’, имеется строка с заполненным значением столбца ‘Rating’ и аналогичным значением в столбце "Name', в пустую ячейку вносим значение столбца ‘Rating’.
В столбце ‘Name’ названия продуктов - их тысячи, количество букв - сотни. В столбце ‘Rating’ специальная буквенная оценка, таких оценок всего 8, но есть такие в названиях которых несколько символов.
Не факт, что аналог будет найден, но заполнится должно более половины пропусков. Если аналог не найден - оставляем всё без изменения.

Единственное, что я смог надумать на этот счет, это

games = games.fillna(games.groupby('name'))

(все буквы в коде строчные).
Но в этом случае, как писал, python жалуется на тип данных, которые просто так не меняются…
Какие есть идеи по решению проблемы?

py.user.next

Дек. 25, 2022 01:41:35

Ascat2015
Но в этом случае, как писал, python жалуется на тип данных, которые просто так не меняются…

При чём тут питон? Ты работаешь с pandas, pandas делают ребята, которые к питону не имеют отношения. Всё, что у тебя не получается сделать, у тебя не получается сделать в pandas.

Ascat2015
Какие есть идеи по решению проблемы?

Ну, документацию к pandas изучи сначала. Думаю, там это можно сделать, да, но чтобы сделать это, надо сначала тонны документации прочитать.

В питоне-то это всё просто делается.