не могли бы вы посмoтреть, будет ли такой код брать слова с утроенной буквой и убирать одну?
file = codecs.open(u'words.txt', 'w', 'utf-8') words = [] for i in triple_letters: if i not in words: triple_letters.append(i) if len(i) > 3: m = re.sub(u'([a-zA-Z])\1\1\1', u'\\1', i) for i in m: s = re.sub(u'\\b(\w)\1\1\1', u'\\1\\1', i) file.write(i + u',' + i + '\n') else: file.write(i + '\n')