Найти - Пользователи
Полная версия: Html5lib выборка тегов <a href="">
Начало » Python для новичков » Html5lib выборка тегов <a href="">
1 2
Egor2010
Добрый день ! Не подскажите как выбирать теги <a> из переменой и выводить адрес ссылки на экран?
Python 3.4
Заранее спасибо.
sypper-pit
http://stackoverflow.com/questions/499345/regular-expression-to-extract-url-from-an-html-link
по аналогии забираем

import re
url='<a href="http://www.www.site.local" target="_blank">http://www.site.local</a>'
r = re.compile('(?<=href=").*?(?=")')
r.findall(url)

Правда это для 2.7
Egor2010
sypper-pit
http://stackoverflow.com/questions/499345/regular-expression-to-extract-url-from-an-html-linkпо аналогии забираем
А модуль “re” это вить не html5lib
sypper-pit
нет конечно, это регулярные выражения.
Egor2010
То есть html5lib не нужен?
sypper-pit
нет конечно, это регулярные выражения.
sypper-pit
Не пойму причём тут вообще html5lib
Egor2010
Добрый день ! Не подскажите как выбирать теги <a> из переменой и выводить адрес ссылки на экран?
У тебя есть некая переменная
url='<a href="http://www.www.site.local" target="_blank">http://www.site.local</a>'
Внутри которой ссылка. тебе нужно из неё вытянуть только ссылку. Этот пример это и делает.
sypper-pit
https://docs.python.org/2/library/re.html

>>> import re
>>> url='<a href="http://www.www.site.local" target="_blank">http://www.site.loc
al</a>'
>>> r = re.compile('(?<=href=").*?(?=")')
>>> r.findall(url)
['http://www.www.site.local']
Egor2010
Спасибо код работает!
А если это делается с помощью re то зачем html5lib?
sypper-pit
https://github.com/html5lib/html5lib-python если ты об этом, то это система парсинга и отделения данных на web-страницах.
Egor2010
А как сделать так чтоб ссылка записывалась в массив ?
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB