Уведомления

Группа в Telegram: @pythonsu

#1 Апрель 25, 2013 09:49:58

nightvi
Зарегистрирован: 2013-03-12
Сообщения: 21
Репутация: +  0  -
Профиль   Отправить e-mail  

Срочно я на экзамене помогите доработать

у найденых словоформ нужн оудилить все комбинацииподряд идущих согласных букв кроме первой позиции например приветствиями - приветиями

я написал как уддалить все двойные а как доработать?

# coding: utf-8
import re
f = open('f.txt').read().decode('utf-8')
pat = ur'([{0}])[{0}]+'.format(u'bcdfghjklmnpqrstvwxzбвгджзйклмнпрстфхцчшщъь')
output = re.sub(pat, r'\1', f, flags=re.I | re.U)
open('f_new.txt','w').write(output.encode('utf-8'))

Отредактировано nightvi (Апрель 25, 2013 09:52:47)

Офлайн

#2 Апрель 25, 2013 09:51:41

nightvi
Зарегистрирован: 2013-03-12
Сообщения: 21
Репутация: +  0  -
Профиль   Отправить e-mail  

Срочно я на экзамене помогите доработать

а еще над осписок этих слов а не переработанный файл записать в новый

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version