Форум сайта python.su
Приветствую всех. Прочитал недавно на хабре (http://habrahabr.ru/blogs/PyGTK/67668/) как один товарищ делал аплет для панели Gnome. Аплет-переводчик, использующий для перевода google.translate. Захотелось мне его переделать\доделать\видоизменить.
Столкнулся с проблемой (а скорее недопониманием) - почему так получается. Текст переводиться - с этим все нормально, но при выводе результата появляется мусор, а точнее тэги со страницы гугла. Я думаю что проблема в неправильном использовании вышеописанных библиотек. Как быть? Существует ли в природе какая нибудь “заглушка”, чтобы выводился только результат, и как это реализовать?
http://imglink.ru/show-image.php?id=778100d7e6528cc9533b3556481fa32d
Отредактировано (Март 26, 2010 15:30:34)
Офлайн
интересный плагин , только я на сколько помню есть в хроме автопереводчик
Офлайн
в хроме есть) Просто я озадачился вот этим вот вопросом. Хочу разобраться на конкретном примере. Просто не хватает мозгов\перелопачиной информации, для того чтобы решить вопрос.
Офлайн
Красивым Супом очистить теги.
Офлайн
Ferroman
хороший вариант или же попробовать использовать собственные регулярности…(re)
Офлайн
FerromanА я извеняюсь - “красивый суп” - это что?
Красивым Супом очистить теги.
Отредактировано (Март 27, 2010 09:33:19)
Офлайн
Офлайн
спасибо огромное! (пошел читать\пробовать)
Отредактировано (Март 27, 2010 10:51:30)
Офлайн
почитал, попробовал - чегото я походу не допонял.
#Основная функция для перевода текста.
def translate(text):
source_lang, dest_lang=determine_languages(text)
params={“ie”:“utf-8”, “text”:text,
“sl”:source_lang, “tl”:dest_lang}
params=urllib.urlencode(params)
headers={“Content-Length”:“%d” % len(params)}
connection=httplib.HTTPConnection(“translate.google.ru”)
connection.request(“POST”, “/translate_t”, params, headers)
response=connection.getresponse()
answer=response.read()
index=answer.find(“id=result_box”)
if index!=-1:
index+=24
после этого, как я понимаю - нужно вставлять BeautifulSoup???
или где?
Отредактировано (Март 30, 2010 14:59:14)
Офлайн
Перед выводом результата, я полагаю.
Офлайн