Уведомления

Группа в Telegram: @pythonsu

#1 Июль 6, 2018 18:38:37

DamMercul
Зарегистрирован: 2017-11-26
Сообщения: 325
Репутация: +  13  -
Профиль   Отправить e-mail  

Regex для проверки URL

Никто не знает рабочего регулярного выражения для URL с поддержкой HTTPS/HTTP, и чтобы не ругался на WWW. Устойчивость к неправильным URL типо как точки в середине мне не обязательны. Главное чтобы мог найти ссылку, типо таких:
http://somesite.with.dots.com
http://somesite.org/
https://yandax.ru/somedir/somefile.dat

Буду очень благодарен если regex будет для re модуля из питона, а не как для C где нужны слэши и тд и тп дополнительно.
Спасибо

P.S. Я пытался сделать свой экземпляр много раз, но он не замечал пути после хостнэйма, хотя я его так настраивал, чтобы видел.
UPD. yandax.ru реально существует, лоханулся..



____________________________________________________

 # Life loop
while alive:
    if (fun > boredom) and money:
        pass_day(fun, boredom, money)
        continue
    else: break

Отредактировано DamMercul (Июль 6, 2018 18:39:48)

Офлайн

#2 Июль 6, 2018 23:30:44

py.user.next
От:
Зарегистрирован: 2010-04-29
Сообщения: 10015
Репутация: +  857  -
Профиль   Отправить e-mail  

Regex для проверки URL

URL вообще сложно устроен. Есть RFC, где его полная грамматика записана. Поэтому-то на форумах для публикации URL сделан специальный тег, иначе URL легко приклеивается к соседним символам, так как грамматически его не отсоединишь от них.

Конкретизируй задачу. Зачем тебе распознавать URL?
От этого зависит приемлемый способ распознавания (это не только через regexp может быть сделано, можно и комбинировать разные способы распознавания).



Отредактировано py.user.next (Июль 6, 2018 23:31:57)

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version