Уведомления

Группа в Telegram: @pythonsu

#1 Янв. 1, 2012 03:52:59

wghost
От:
Зарегистрирован: 2011-09-02
Сообщения: 18
Репутация: +  0  -
Профиль   Отправить e-mail  

Привести внутренние ссылки к обычному виду

Собираю ссылки регуляркой. “print urls” выводит:

['/link_body.html', 'http://domain.com/link_body.html']
Т.е. часть ссылок внутренние без 'http://domain.com/'. Нужно привести все ссылки к виду: 'http://domain.com/link_body.html', учитывая то, что ‘/link_body.html’ может быть как с слешем, так и без слеша. Иначе получаются неправильные ссылки типа 'http://domain.com//link_body.html'.



Офлайн

#2 Янв. 1, 2012 09:17:41

py.user.next
От:
Зарегистрирован: 2010-04-29
Сообщения: 9730
Репутация: +  843  -
Профиль   Отправить e-mail  

Привести внутренние ссылки к обычному виду

>>> urllib.basejoin('http://abc', '/def')
'http://abc/def'
>>> urllib.basejoin('http://abc', 'def')
'http://abc/def'
>>>
>>> 'http://site'.startswith('http://')
True
>>> '/site'.startswith('http://')
False
>>>



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version