Найти - Пользователи
Полная версия: Транслит
Начало » Python для экспертов » Транслит
1 2 3
ZZZ
Нужно перевести не-ASCII строку в транслит.
Для русского нашёл PyTils j2a, но мне бы что-нибудь более универсальное, ибо одной кирилицей не-ASCII не исчерпываются.
Может у кого есть что на примете?

P.S. Я понимаю, что без знания, с каким языком работать, хорошего транслита не сделать, но мне бы приблизительно… Просто по общей таблице символов юникода.
evgenyl
кстати говоря :)
print ''.join()
ZZZ
evgenyl, мне очень понравилась ваша находчивость… :-)
Но у меня не KOI-8… У меня UTF-16 из QString…
evgenyl
Я говорю про особенность кодировки koi8-r у нее если номер символа больше 128 то отнимая 128 мы получаем близкую по произношению букву :)
j2a
ZZZ
Может у кого есть что на примете?
есть konwert, умеет транслит, но это не py-библиотека.
ZZZ
evgenyl, да вспомнил я, что если у KOI-8 убрать первый бит, то мы получим вполне себе читаемый семибитный текст… Это разработчики пошутили… :-)

j2a, сейчас глану… Может таблицы оттуда выдеру…

Есть мысль накопать в сети таблиц для разных языков, распарсить их и объединить. Вот такой бред. :-)
evgenyl
Я думаю ктото уже это сделал, главное лапату поглубже воткнуть.
pythonwin
ZZZ
Просто по общей таблице символов юникода.
лучше сделать выбор языка
Rodegast
Я делал перевод в транслит при помощи подбора букв, работает не быстро, но в общих случаях хватает.
j2a
ZZZ
j2a, сейчас глану… Может таблицы оттуда выдеру…
Я смотрел мельком, перед тем как советовать. Там “таблицы” это шелл-скрипты с использованием tr. Оттуда можно выдернуть таблицы, но нужна некоторая ручная работа.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB