Форум сайта python.su
							
  0  
								
								пишу для appengine, lxml не подходит.
без beatefulsoap не получается отконвентерить текст (html) из некоторой кодировки в utf8
beatefulsoap просто при загрузке в себя и выгрузке портит ссылки - удаляет последние слеши.
как его отучить от этого? три версии соап пробовал
Офлайн
							
  36  
								
								html5lib
Офлайн