DjangoBB LoFi version

Полная версия: Выбор строк с максимальным значением

Начало » Python для новичков » Выбор строк с максимальным значением

shtabs-kapitan

Авг. 17, 2022 22:51:27

Помогите, пожалуйста, как выбрать строки с максимальным Значением по каждой комбинации Код и Город?
Размер датафрейма – несколько миллионов строк, поэтому скорость расчета критична.
Пример, датафрейма прикрепил.

ZerG

Авг. 18, 2022 11:46:50

50 долларов

py.user.next

Авг. 18, 2022 14:08:58

  
>>> import itertools
>>> 
>>> lst = [
...     (1101, 'Москва', 0.5),
...     (1101, 'Москва', 0.2),
...     (1101, 'Москва', 0.1),
...     (1101, 'Владимир', 0.9),
...     (1101, 'Владимир', 0.2),
...     (1101, 'Владимир', 0.1),
...     (1101, 'Калуга', 0.8),
...     (1101, 'Калуга', 0.3),
...     (1101, 'Калуга', 0.2),
...     (1102, 'Москва', 1),
...     (1102, 'Москва', 0.8),
...     (1102, 'Иваново', 1),
...     (1102, 'Иваново', 0.5),
...     (1102, 'Воронеж', 0.9),
...     (1102, 'Воронеж', 0.8),
...     (1104, 'Липецк', 0.5),
...     (1104, 'Липецк', 0.4),
...     (1104, 'Липецк', 0.2),
...     (1104, 'Смоленск', 0.7),
...     (1104, 'Смоленск', 0.6),
...     (1104, 'Смоленск', 0.3),
...     (1104, 'Рязань', 0.4),
...     (1104, 'Рязань', 0.3),
...     (1104, 'Рязань', 0.1)
... ]
>>> 
>>> out = []
>>> it = itertools.groupby(lst, lambda i: (i[0], i[1]))
>>> for i, j in it:
...     out.append(max(j))
... 
>>> out
[(1101, 'Москва', 0.5), (1101, 'Владимир', 0.9), (1101, 'Калуга', 0.8), (1102, 'Москва', 1), (1102, 'Иваново', 1), (1102, 'Воронеж', 0.9), (1104, 'Липецк', 0.5), (1104, 'Смоленск', 0.7), (1104, 'Рязань', 0.4)]
>>>

shtabs-kapitan

Авг. 18, 2022 17:58:46

Спасибо, все получилось!

Пока не пробовал на больших данных, но надеюсь будет разумное количество времени считать.