Уведомления

Группа в Telegram: @pythonsu

#1 Янв. 8, 2012 08:54:49

py.webs
От:
Зарегистрирован: 2011-12-27
Сообщения: 8
Репутация: +  0  -
Профиль   Отправить e-mail  

Вырезать доменное имя из ссылки

Как грамотно достать домен второго, третьего уровня из любой ссылки?



Офлайн

#2 Янв. 8, 2012 10:00:30

cutwater
От:
Зарегистрирован: 2009-01-08
Сообщения: 444
Репутация: +  19  -
Профиль   Отправить e-mail  

Вырезать доменное имя из ссылки

import urlparse



Офлайн

#3 Фев. 2, 2012 02:59:35

py.webs
От:
Зарегистрирован: 2011-12-27
Сообщения: 8
Репутация: +  0  -
Профиль   Отправить e-mail  

Вырезать доменное имя из ссылки

Еще такая проблема. urlparse не режет www. у доменов.
Как лучше обрезать?



Офлайн

#4 Фев. 2, 2012 06:16:20

minotavr_x86
От:
Зарегистрирован: 2010-05-21
Сообщения: 69
Репутация: +  0  -
Профиль   Отправить e-mail  

Вырезать доменное имя из ссылки

s = 'www.ya.ru.com'
import re
domain_re = re.compile(r'(?:www\.)*((?:[\w]+\.)+\w+)/*')
print domain_re.findall(s)
или
s = 'www.ya.ru.com'
if s[:3].lower() == 'www':
s = s[4:]



Отредактировано (Фев. 2, 2012 06:21:34)

Офлайн

#5 Фев. 4, 2012 14:49:40

Singularitty
От:
Зарегистрирован: 2012-02-02
Сообщения: 61
Репутация: +  5  -
Профиль   Отправить e-mail  

Вырезать доменное имя из ссылки

>>> httplib.urlsplit("http://python.su/forum/viewtopic.php?id=13469")
SplitResult(scheme='http', netloc='python.su', path='/forum/viewtopic.php', query='id=13469', fragment='')

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version