Форум сайта python.su
0
Как грамотно достать домен второго, третьего уровня из любой ссылки?
Офлайн
19
import urlparse
Офлайн
0
Еще такая проблема. urlparse не режет www. у доменов.
Как лучше обрезать?
Офлайн
0
s = 'www.ya.ru.com'
import re
domain_re = re.compile(r'(?:www\.)*((?:[\w]+\.)+\w+)/*')
print domain_re.findall(s)
s = 'www.ya.ru.com'
if s[:3].lower() == 'www':
s = s[4:]
Отредактировано (Фев. 2, 2012 06:21:34)
Офлайн
5
>>> httplib.urlsplit("http://python.su/forum/viewtopic.php?id=13469")
SplitResult(scheme='http', netloc='python.su', path='/forum/viewtopic.php', query='id=13469', fragment='')
Офлайн