Найти - Пользователи
Полная версия: Regex для проверки URL
Начало » Python для новичков » Regex для проверки URL
1
DamMercul
Никто не знает рабочего регулярного выражения для URL с поддержкой HTTPS/HTTP, и чтобы не ругался на WWW. Устойчивость к неправильным URL типо как точки в середине мне не обязательны. Главное чтобы мог найти ссылку, типо таких:
http://somesite.with.dots.com
http://somesite.org/
https://yandax.ru/somedir/somefile.dat

Буду очень благодарен если regex будет для re модуля из питона, а не как для C где нужны слэши и тд и тп дополнительно.
Спасибо

P.S. Я пытался сделать свой экземпляр много раз, но он не замечал пути после хостнэйма, хотя я его так настраивал, чтобы видел.
UPD. yandax.ru реально существует, лоханулся..
py.user.next
URL вообще сложно устроен. Есть RFC, где его полная грамматика записана. Поэтому-то на форумах для публикации URL сделан специальный тег, иначе URL легко приклеивается к соседним символам, так как грамматически его не отсоединишь от них.

Конкретизируй задачу. Зачем тебе распознавать URL?
От этого зависит приемлемый способ распознавания (это не только через regexp может быть сделано, можно и комбинировать разные способы распознавания).
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB