Форум сайта python.su
Есть страницы вроде http://etuva.ru/
которые большей частью в одной кодировке но из-за невнимательности или ещё чего там появляются строки в других кодировках.
Есть парсер который перекодирует все страницы в utf8 который об такие страницы запинается.
Если кто сталкивался содскажите как если не перекодировать то хотябы избавиться от символов которые перекодировать не удаётся.
Офлайн
посмотри chardet
Офлайн
а encode('utf-8', ‘ignore’)?
Офлайн