Найти - Пользователи
Полная версия: замена служебных символов в unicode
Начало » Python для экспертов » замена служебных символов в unicode
1
umup
каким способом лучше заменить все непечатные символы в Unicode строке их escaped эквивалентами (\n, \t и т.п.), а буквенные символы (кириллицу и т.п.) оставить без изменений ?
.encode('unicode_escape') заменяет на \uXXXХ все подряд, это трудно редактировать/смотреть.
.encode('string_escape') работает только с обычными строками.
bialix
метод translate

In : u = u'123'

In : u.translate?
Type: builtin_function_or_method
Base Class: <type ‘builtin_function_or_method’>
String Form: <built-in method translate of unicode object at 0x008EA5F0>
Namespace: Interactive
Docstring:
S.translate(table) -> unicode

Return a copy of the string S, where all characters have been mapped
through the given translation table, which must be a mapping of
Unicode ordinals to Unicode ordinals, Unicode strings or None.
Unmapped characters are left untouched. Characters mapped to None
are deleted.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB