Форум сайта python.su
0
url_page= "//upload.wikimedia.org/"
if(url_page.startswith('//')):
while url_page.startswith('/'):
url_page = url_page[1:]
print(url_page)
if url_page.find('://') != -1:
a, b = url_page.split('://')
if b.lower().startswith('www.'):
result = (a + '://', 'www.', b.split('/', 1)[0][4:] + '/')
else:
result = (a + '://', 'www.', b.split('/', 1)[0] + '/')
print(url_page)
else:
url_page="http://"+url_page
a, b = url_page.split('://')
if b.lower().startswith('www.'):
result = (a + '://', 'www.', b.split('/', 1)[0][4:] + '/')
else:
result = (a + '://', 'www.', b.split('/', 1)[0] + '/')
print(url_page)
elif(url_page.startswith('/')):
while url_site.endswith('/'):
url_site = url_site[:-1]
print(url_page)
else:
print(url_page)
Отредактировано Egor2010 (Ноя. 9, 2014 08:12:49)
Офлайн
253
Egor2010Почему вы решили что он не работает?
код не работает
Офлайн
0
Все! сам сделал
Офлайн
0
url_a, url_b = url.split('://')
if url_b.lower().startswith('www.'):
result = (url_a + '://', 'www.', url_b.split('/', 1)[0][4:] + '/')
else:
result = (url_a + '://', 'www.', url_b.split('/', 1)[0] + '/')Офлайн
103
url_a, url_b = url.split('://') if url_b.lower().startswith('www.'): result = (url_a + '://', 'www.', url_b.split('/', 1)[0][4:] + '/', url_b.split('/', 1)[1]) else: result = (url_a + '://', 'www.', url_b.split('/', 1)[0] + '/', url_b.split('/', 1)[1])
url_a, url_b = url.split('://') url_b = url_b.split('/', 1) if url_b[0].lower().startswith('www.'): result = (url_a + '://', 'www.', url_b[0][4:] + '/', url_b[1]) else: result = (url_a + '://', 'www.', url_b[0] + '/', url_b[1])
Отредактировано terabayt (Ноя. 9, 2014 16:23:36)
Офлайн
0
А какой врянт лучше?
terabayt
Офлайн
103
url_a = url.split('/', 3) result = (url_a[0] + '//', 'www.', url_a[2][4 * url_a[2].lower().startswith('www.'):] + '/', url_a[3])
Отредактировано terabayt (Ноя. 9, 2014 16:58:25)
Офлайн
0
а какой код лучше для отборки из url только url сайта?
чем?
url_site = '{0}/{1}/{2}/'.format(*url_page.split('/'))url_site = (url_page+'/')[:url_page.find('/', url_page.index('/')+2)]Офлайн