Уведомления

Группа в Telegram: @pythonsu

#1 Окт. 12, 2009 11:43:43

Paher
От:
Зарегистрирован: 2009-08-11
Сообщения: 66
Репутация: +  0  -
Профиль   Отправить e-mail  

Работа с регэкспами

Доброго времени суток!

Есть задача: прочитать текстовой файл и записать в файл output.txt все встреченные слова в алфавитном порядке с частотами их встречаемости. Делал так

import re
mas={}
for string in open(raw_input('Введите имя файла: '),'r'):
words=re.split('\W+|[0-9]|_|',string)
for word in words:
word = word.lower()
if mas.has_key(word):
mas[word]+=1
else:
mas[word]=1
f=open('c:\output.txt','w')
for key in sorted(mas.iterkeys()):
string=key+' '+str(mas[key])+"\n"
f.write(string)
print "Done"
так вот, начальный фрагмент файла output.txt

38157
a 3209
aa 1
aaaaa 1

Откуда берется первая строчка? почему подсчитываются пустые строки?



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version