Форум сайта python.su
0
Добрый день ! Не подскажите как выбирать теги <a> из переменой и выводить адрес ссылки на экран?
Python 3.4
Заранее спасибо.
Офлайн
6
http://stackoverflow.com/questions/499345/regular-expression-to-extract-url-from-an-html-link
по аналогии забираем
import re url='<a href="http://www.www.site.local" target="_blank">http://www.site.local</a>' r = re.compile('(?<=href=").*?(?=")') r.findall(url)
Отредактировано sypper-pit (Окт. 23, 2014 13:17:36)
Офлайн
0
sypper-pitА модуль “re” это вить не html5lib
http://stackoverflow.com/questions/499345/regular-expression-to-extract-url-from-an-html-linkпо аналогии забираем
Офлайн
6
нет конечно, это регулярные выражения.
Отредактировано sypper-pit (Окт. 23, 2014 13:31:16)
Офлайн
0
То есть html5lib не нужен?
sypper-pit
нет конечно, это регулярные выражения.
Офлайн
6
Не пойму причём тут вообще html5lib
Egor2010У тебя есть некая переменная
Добрый день ! Не подскажите как выбирать теги <a> из переменой и выводить адрес ссылки на экран?
url='<a href="http://www.www.site.local" target="_blank">http://www.site.local</a>'
Офлайн
6
https://docs.python.org/2/library/re.html
>>> import re >>> url='<a href="http://www.www.site.local" target="_blank">http://www.site.loc al</a>' >>> r = re.compile('(?<=href=").*?(?=")') >>> r.findall(url) ['http://www.www.site.local']
Отредактировано sypper-pit (Окт. 23, 2014 13:45:13)
Офлайн
0
Спасибо код работает!
А если это делается с помощью re то зачем html5lib?
Офлайн
6
https://github.com/html5lib/html5lib-python если ты об этом, то это система парсинга и отделения данных на web-страницах.
Офлайн
0
А как сделать так чтоб ссылка записывалась в массив ?
Офлайн