Форум сайта python.su
13
Никто не знает рабочего регулярного выражения для URL с поддержкой HTTPS/HTTP, и чтобы не ругался на WWW. Устойчивость к неправильным URL типо как точки в середине мне не обязательны. Главное чтобы мог найти ссылку, типо таких:
http://somesite.with.dots.com
http://somesite.org/
https://yandax.ru/somedir/somefile.dat
Буду очень благодарен если regex будет для re модуля из питона, а не как для C где нужны слэши и тд и тп дополнительно.
Спасибо
P.S. Я пытался сделать свой экземпляр много раз, но он не замечал пути после хостнэйма, хотя я его так настраивал, чтобы видел.
UPD. yandax.ru реально существует, лоханулся..
# Life loop while alive: if (fun > boredom) and money: pass_day(fun, boredom, money) continue else: break
Отредактировано DamMercul (Июль 6, 2018 18:39:48)
Офлайн
857
URL вообще сложно устроен. Есть RFC, где его полная грамматика записана. Поэтому-то на форумах для публикации URL сделан специальный тег, иначе URL легко приклеивается к соседним символам, так как грамматически его не отсоединишь от них.
Конкретизируй задачу. Зачем тебе распознавать URL?
От этого зависит приемлемый способ распознавания (это не только через regexp может быть сделано, можно и комбинировать разные способы распознавания).
Отредактировано py.user.next (Июль 6, 2018 23:31:57)
Офлайн