Форум сайта python.su
у найденых словоформ нужн оудилить все комбинацииподряд идущих согласных букв кроме первой позиции например приветствиями - приветиями
я написал как уддалить все двойные а как доработать?
# coding: utf-8 import re f = open('f.txt').read().decode('utf-8') pat = ur'([{0}])[{0}]+'.format(u'bcdfghjklmnpqrstvwxzбвгджзйклмнпрстфхцчшщъь') output = re.sub(pat, r'\1', f, flags=re.I | re.U) open('f_new.txt','w').write(output.encode('utf-8'))
Отредактировано nightvi (Апрель 25, 2013 09:52:47)
Офлайн
а еще над осписок этих слов а не переработанный файл записать в новый
Офлайн