Найти - Пользователи
Полная версия: Регулярки
Начало » Python для новичков » Регулярки
1
vlados
Во общем, нужна правильная регулярка…
Для поиска цифр вот в этом тексте
document.writeln('<a href="ht2" class="" target=_blank onclick="javascript: f36093(this);">Форум документального кино</a>'+''); function f36093(a79263) {a79263.href += "570997&pg=httpoy.su/";}
Нужно найти 570997(находится в самом конце)
Я использовал так, но не вышло…
        q = opener.open('http817')
print q.read()
w = re.findall(r'"(.*?)&pg=', str(q))
print w
Но, что странно вот так работает….
        q = opener.open('http://ссылочка.рф')
print q.read()
w = re.findall(r'"(.*?)&pg=', 'function f36093(a79263) {a79263.href += "570997&pg=htsu/";}')
print w
Помогите разобраться!
vlados
Все разобрался!
doza_and
У меня работает
re.findall(r'"(\d+)&pg=', doc)
1 в приведенном вами выражении не подразумевается что вы хотите получить цифры :r'"(.*?)&pg='
2 Какая у вас версия питона? В приведенной строке присутствует русский текст, младшие версии питона могут потребовать явного преобразования в unicod
vlados
Нет, я просто взял и заменил все ', как ни странно все заработало…
У меня версия питона 2.х.х
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB