Читал статьи по юникоду и кодировке, но не знаю , какие методы можно использовать для изменения кодировки в ‘list’
Python v.2.7.9
Вот код:
import requests from bs4 import BeautifulSoup r = requests.get("http://fs.to/video/films/group/film_genre/") responce = r.content r.encoding = 'utf-8' print type(responce) page = BeautifulSoup(responce) for tag in page.findAll('li'): a=tag.find('a') print a.contents print type(a.contents)
type(responce) <type 'str'>
type(a.contents) <type 'list'>
[u'\u0410\u043d\u0438\u043c\u0435'] [u'\u0411\u0438\u043e\u0433\u0440\u0430\u0444\u0438\u044f'] [u'\u0411\u043e\u0435\u0432\u0438\u043a'] [u'\u0412\u0435\u0441\u0442\u0435\u0440\u043d'] [u'\u0412\u043e\u0435\u043d\u043d\u044b\u0439'] [u'\u0414\u0435\u0442\u0435\u043a\u0442\u0438\u0432'] [u'\u0414\u0435\u0442\u0441\u043a\u0438\u0439'] [u'\u0414\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u0430\u043b\u044c\u043d\u044b\u0439'] [u'\u0414\u0440\u0430\u043c\u0430'] [u'\u0418\u0441\u0442\u043e\u0440\u0438\u044f'] [u'\u041a\u043e\u043c\u0435\u0434\u0438\u044f'] [u'\u041a\u043e\u0440\u043e\u0442\u043a\u043e\u043c\u0435\u0442\u0440\u0430\u0436\u043a\u0430'] [u'\u041a\u0440\u0438\u043c\u0438\u043d\u0430\u043b'] [u'\u041c\u0435\u043b\u043e\u0434\u0440\u0430\u043c\u0430'] [u'\u041c\u0438\u0441\u0442\u0438\u043a\u0430'] [u'\u041c\u044e\u0437\u0438\u043a\u043b'] [u'\u041d\u0443\u0430\u0440'] [u'\u041f\u0440\u0438\u043a\u043b\u044e\u0447\u0435\u043d\u0438\u044f'] [u'\u0421\u0435\u043c\u0435\u0439\u043d\u044b\u0439'] [u'\u0422\u0440\u0438\u043b\u043b\u0435\u0440'] [u'\u0423\u0436\u0430\u0441\u044b'] [u'\u0424\u0430\u043d\u0442\u0430\u0441\u0442\u0438\u043a\u0430'] [u'\u0424\u044d\u043d\u0442\u0435\u0437\u0438'] [u'\u042d\u0440\u043e\u0442\u0438\u043a\u0430']
Скажите пожалуйста, как перевести это в кодировку utf-8
Или изначально выводить так, чтобы было видно киррилицу??
