umup
Май 7, 2008 13:29:00
каким способом лучше заменить все непечатные символы в Unicode строке их escaped эквивалентами (\n, \t и т.п.), а буквенные символы (кириллицу и т.п.) оставить без изменений ?
.encode('unicode_escape') заменяет на \uXXXХ все подряд, это трудно редактировать/смотреть.
.encode('string_escape') работает только с обычными строками.
bialix
Май 8, 2008 10:13:45
метод translate
In : u = u'123'
In : u.translate?
Type: builtin_function_or_method
Base Class: <type ‘builtin_function_or_method’>
String Form: <built-in method translate of unicode object at 0x008EA5F0>
Namespace: Interactive
Docstring:
S.translate(table) -> unicode
Return a copy of the string S, where all characters have been mapped
through the given translation table, which must be a mapping of
Unicode ordinals to Unicode ordinals, Unicode strings or None.
Unmapped characters are left untouched. Characters mapped to None
are deleted.