Найти - Пользователи
Полная версия: Google chrome url
Начало » Python для новичков » Google chrome url
1 2
Egor2010
Я скачал страничку с Wikipedia и с помощью re отобрал все ссылки
Потом перехожу по ним и выдает ошибку как от таких ссылок избавится ?
“/ads/1233” полного названия сайта нету
“//bits.wikimedia.org/favicon/wikipedia.ico” здесь тоже ошибка
dimy44
Проверяйте на наличие
'://'
в адресе
Egor2010
Допустим
url="Http://www.facebook.com/"
Как разделить url на основные части ?
Url1="http://"
Url2="www."
Url3="Facebook.com/"
dimy44
url = "Http://www.facebook.com/"
#url = "Http://facebook.com/"
if url.find('://') != -1:
    a, b = url.split('://')
    if b.lower().startswith('www.'):
        result = (a + '://', 'www.', b.split('/', 1)[0][4:] + '/')
    else:
        result = (a + '://', b.split('/', 1)[0] + '/')
    print(result)
else:
    print('Oops!')
не ахти красиво, но понятно
Egor2010
dimy44
можешь дописать если в url нет
http://(то есть ://)
чтобы он добовлял
http://
Egor2010
это сам сделал
else:
url="http://"+url
a, b = url.split('://')
if b.lower().startswith('www.'):
result = (a + '://', 'www.', b.split('/', 1)[0][4:] + '/')
else:
result = (a + '://', b.split('/', 1)[0] + '/')
а вот как сделать чтобы он отбирал все что в конце, после / ?
Egor2010
dimy44
url = "Http://www.facebook.com/"
#url = "Http://facebook.com/"
if url.find('://') != -1:
a, b = url.split('://')
if b.lower().startswith('www.'):
result = (a + '://', 'www.', b.split('/', 1)[0][4:] + '/')
else:
result = (a + '://', b.split('/', 1)[0] + '/')
print(result)
else:
print('Oops!')
Код работает только если url кончается на“/”, как сделать так чтобы работал и без“/” ?
Например
 url="https://www.google.ru/?newwindow=1&q=python"
dimy44
Код работает и без “/” в конце, только, видимо, выдает не то, что вам нужно на данный момент. Покажите, что вы хотите получить, на примере приведенного вами url.
Egor2010
извините код немного до этого изменил
    if (url.find('://')!= -1):
url_a, url_b=url.split('://')
if url_b.lower().startswith('www.'):
result=(url_a+'://', 'www.', url_b.split('/', 1)[0][4:]+'/', url_b.split('/', 1)[1])
else:
result=(url_a+'://', 'www.', url_b.split('/', 1)[0]+'/', url_b.split('/', 1)[1])
else:
url="http://"+url
url_a, url_b=url.split('://')
if url_b.lower().startswith('www.'):
result=(url_a+'://', 'www.', url_b.split('/', 1)[0][4:]+'/', url_b.split('/', 1)[1])
else:
result=(url_a+'://', 'www.', url_b.split('/', 1)[0]+'/', url_b.split('/', 1)[1])
url=result[0]+result[1]+result[2]+result[3]
все заработало!
Спасибо
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB