Форум сайта python.su
Нужно перевести не-ASCII строку в транслит.
Для русского нашёл PyTils j2a, но мне бы что-нибудь более универсальное, ибо одной кирилицей не-ASCII не исчерпываются.
Может у кого есть что на примете?
P.S. Я понимаю, что без знания, с каким языком работать, хорошего транслита не сделать, но мне бы приблизительно… Просто по общей таблице символов юникода.
Офлайн
кстати говоря :)
print ''.join()
Офлайн
evgenyl, мне очень понравилась ваша находчивость… :-)
Но у меня не KOI-8… У меня UTF-16 из QString…
Офлайн
Я говорю про особенность кодировки koi8-r у нее если номер символа больше 128 то отнимая 128 мы получаем близкую по произношению букву :)
Офлайн
Офлайн
evgenyl, да вспомнил я, что если у KOI-8 убрать первый бит, то мы получим вполне себе читаемый семибитный текст… Это разработчики пошутили… :-)
j2a, сейчас глану… Может таблицы оттуда выдеру…
Есть мысль накопать в сети таблиц для разных языков, распарсить их и объединить. Вот такой бред. :-)
Офлайн
Я думаю ктото уже это сделал, главное лапату поглубже воткнуть.
Офлайн
ZZZлучше сделать выбор языка
Просто по общей таблице символов юникода.
Офлайн
Я делал перевод в транслит при помощи подбора букв, работает не быстро, но в общих случаях хватает.
Офлайн
ZZZЯ смотрел мельком, перед тем как советовать. Там “таблицы” это шелл-скрипты с использованием tr. Оттуда можно выдернуть таблицы, но нужна некоторая ручная работа.
j2a, сейчас глану… Может таблицы оттуда выдеру…
Офлайн