ТЕКСТ:
</div></td><td><span class=“b-yauser”><a href="http://kseniya-smetaneva.ru/“><b>в</b>аша стэлла</a></span></td><td><em>пока !!!!!!!!!!!!!!!!!!!!!!!!!<wbr>!!!!!!!!!!!</em></td><td style=”white-space: nowrap;“>11 января</td><td><i class=”b-gender-n“></i></td></tr>
Мой код:
nickre = re.compile('<b>(.)</b>(.*?)</a>') #врезультате должно получится вот так('в', ‘аша стэлла’), но в результате работает только с англ буквами
try:
request = urllib2.Request(url)
request.add_header(”User-Agent“, ”Crawler")
opener = urllib2.build_opener()
msg = opener.open(request).read()
except:
return
nicklist = nickre.findall(msg)
if len(nicklist) > 0:
nick = …
…
Мне нужно с помощью регулярки выловить текст в <b>в</b>аша стэлла</a> и сохранить его в переменную nick, но для русских имен не получается.