Найти - Пользователи
Полная версия: cp1251 + utf-8
Начало » Python для новичков » cp1251 + utf-8
1
alexber220
Есть страницы вроде http://etuva.ru/
которые большей частью в одной кодировке но из-за невнимательности или ещё чего там появляются строки в других кодировках.
Есть парсер который перекодирует все страницы в utf8 который об такие страницы запинается.
Если кто сталкивался содскажите как если не перекодировать то хотябы избавиться от символов которые перекодировать не удаётся.
pythonwin
посмотри chardet
cybergrind
а encode('utf-8', ‘ignore’)?
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB