Уведомления

Группа в Telegram: @pythonsu

#1 Окт. 23, 2014 12:51:42

Egor2010
Зарегистрирован: 2014-10-22
Сообщения: 152
Репутация: +  0  -
Профиль   Отправить e-mail  

Html5lib выборка тегов <a href="">

Добрый день ! Не подскажите как выбирать теги <a> из переменой и выводить адрес ссылки на экран?
Python 3.4
Заранее спасибо.

Офлайн

#2 Окт. 23, 2014 13:16:55

sypper-pit
От: Ulan-Ude(msk)
Зарегистрирован: 2009-01-30
Сообщения: 1102
Репутация: +  6  -
Профиль   Отправить e-mail  

Html5lib выборка тегов <a href="">

http://stackoverflow.com/questions/499345/regular-expression-to-extract-url-from-an-html-link
по аналогии забираем

import re
url='<a href="http://www.www.site.local" target="_blank">http://www.site.local</a>'
r = re.compile('(?<=href=").*?(?=")')
r.findall(url)

Правда это для 2.7

Отредактировано sypper-pit (Окт. 23, 2014 13:17:36)

Офлайн

#3 Окт. 23, 2014 13:28:38

Egor2010
Зарегистрирован: 2014-10-22
Сообщения: 152
Репутация: +  0  -
Профиль   Отправить e-mail  

Html5lib выборка тегов <a href="">

sypper-pit
http://stackoverflow.com/questions/499345/regular-expression-to-extract-url-from-an-html-linkпо аналогии забираем
А модуль “re” это вить не html5lib

Офлайн

#4 Окт. 23, 2014 13:30:38

sypper-pit
От: Ulan-Ude(msk)
Зарегистрирован: 2009-01-30
Сообщения: 1102
Репутация: +  6  -
Профиль   Отправить e-mail  

Html5lib выборка тегов <a href="">

нет конечно, это регулярные выражения.

Отредактировано sypper-pit (Окт. 23, 2014 13:31:16)

Офлайн

#5 Окт. 23, 2014 13:32:41

Egor2010
Зарегистрирован: 2014-10-22
Сообщения: 152
Репутация: +  0  -
Профиль   Отправить e-mail  

Html5lib выборка тегов <a href="">

То есть html5lib не нужен?

sypper-pit
нет конечно, это регулярные выражения.

Офлайн

#6 Окт. 23, 2014 13:41:59

sypper-pit
От: Ulan-Ude(msk)
Зарегистрирован: 2009-01-30
Сообщения: 1102
Репутация: +  6  -
Профиль   Отправить e-mail  

Html5lib выборка тегов <a href="">

Не пойму причём тут вообще html5lib

Egor2010
Добрый день ! Не подскажите как выбирать теги <a> из переменой и выводить адрес ссылки на экран?
У тебя есть некая переменная
url='<a href="http://www.www.site.local" target="_blank">http://www.site.local</a>'
Внутри которой ссылка. тебе нужно из неё вытянуть только ссылку. Этот пример это и делает.

Офлайн

#7 Окт. 23, 2014 13:42:53

sypper-pit
От: Ulan-Ude(msk)
Зарегистрирован: 2009-01-30
Сообщения: 1102
Репутация: +  6  -
Профиль   Отправить e-mail  

Html5lib выборка тегов <a href="">

https://docs.python.org/2/library/re.html

>>> import re
>>> url='<a href="http://www.www.site.local" target="_blank">http://www.site.loc
al</a>'
>>> r = re.compile('(?<=href=").*?(?=")')
>>> r.findall(url)
['http://www.www.site.local']

Отредактировано sypper-pit (Окт. 23, 2014 13:45:13)

Офлайн

#8 Окт. 23, 2014 13:45:06

Egor2010
Зарегистрирован: 2014-10-22
Сообщения: 152
Репутация: +  0  -
Профиль   Отправить e-mail  

Html5lib выборка тегов <a href="">

Спасибо код работает!
А если это делается с помощью re то зачем html5lib?

Офлайн

#9 Окт. 23, 2014 13:46:39

sypper-pit
От: Ulan-Ude(msk)
Зарегистрирован: 2009-01-30
Сообщения: 1102
Репутация: +  6  -
Профиль   Отправить e-mail  

Html5lib выборка тегов <a href="">

https://github.com/html5lib/html5lib-python если ты об этом, то это система парсинга и отделения данных на web-страницах.

Офлайн

#10 Окт. 23, 2014 14:31:19

Egor2010
Зарегистрирован: 2014-10-22
Сообщения: 152
Репутация: +  0  -
Профиль   Отправить e-mail  

Html5lib выборка тегов <a href="">

А как сделать так чтоб ссылка записывалась в массив ?

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version