DjangoBB LoFi version

Полная версия: Подсчет и суммирование дубликатов в файле csv

Начало » Python для новичков » Подсчет и суммирование дубликатов в файле csv

Cover Story

Фев. 23, 2011 10:50:14

Всем доброго!
Имею файл

Примерно такого типа, где первый столбец код товара, второй его количество.
Так вот, как можно подсчитать количество повторяющихся каждого из кодов, а затем просуммировать их.

Studentik

Фев. 23, 2011 11:39:53

считывать строчки файла в словарь {'tovar': kolichestvo} либо в sqlite и запросом “SELECT SUM(kolichestvo) FROM tovary GROUP BY tovar”

Cover Story

Фев. 23, 2011 12:15:45

А если в список запихнуть в виде [,] проблем больше будет?

Cover Story

Фев. 23, 2011 12:43:21

C sqlite вроде понятно, а как можно это сделать со словарем или списком?

Zubchick

Фев. 23, 2011 13:23:36

словарь всех проще.

In [3]: from collections import defaultdict

In [4]: d = defaultdict(int)

In [5]: f = [(2062, 5), (2063, 4), (2062, 3)]

In [6]: for index, num in f:
   ...:     d[index] += num
   ...: 

In [7]: d
Out[7]: defaultdict(<type 'int'>, {2062: 8, 2063: 4})

o7412369815963

Фев. 23, 2011 16:20:29

Zubchick
словарь всех проще.

и быстрее

Cover Story

Фев. 23, 2011 19:02:14

Спасибо буду разбираться

regall

Фев. 23, 2011 19:38:18

Тогда уже collections.Counter, в документации даже пример похожий есть

Cover Story

Фев. 24, 2011 12:12:39

regall collections.Counter помоему в 2.6 нету.

from collections import defaultdict
import csv
reader = csv.DictReader(open('INVENT_R.TXT', "rb"), delimiter="\t", fieldnames=['tovar', 'kolichestvo'])
d = defaultdict(int)
for index, num in reader:
    d[index] += num

И что-то не пойму как теперь вывести результат