Найти - Пользователи
Полная версия: urllib2 и размер буфера
Начало » Network » urllib2 и размер буфера
1
anemak
# -*- coding: windows-1251 -*-

import urllib2

source = urllib2.urlopen("http://www.realtypress.ru/ipotechnie-banki/110/")

print source.read()

source.close()
Почему страница загружается не полностью?

мне выдает такой результат: http://pastebin.com/qgF2BhB9

Видно, что страничка загружена не до конца.
pooteen
только что проверил этот код. Загрузилась полностью.
w7 x64, python 2.7
o7412369815963
linux ubuntu 32bit, py 2.7.2
загрузилось полностью
dropnz
arch linux 32bit. python 3.2
загрузилось все.
а может пропробовать readall()?
anemak
Хм, тут проблема несколько в другом.

Вот, например:
page = file.read()

title1 = regexTitle1.search(page)
title2 = regexTitle2.search(page)
title3 = regexTitle3.search(page)
title4 = regexTitle4.search(page)
title5 = regexTitle5.search(page)
title6 = regexTitle6.search(page)
content = regexContent.search(page)
    title1 = regexTitle1.search(file.read())
title2 = regexTitle2.search(file.read())
title3 = regexTitle3.search(file.read())
title4 = regexTitle4.search(file.read())
title5 = regexTitle5.search(file.read())
title6 = regexTitle6.search(file.read())
content = regexContent.search(file.read())
В первом коде страница бы загрузилась полностью, а во втором нет. Я так понимаю это особенность питона, он переменные хранит в памяти. Еще до конца не разобрался, но думаю я на правильном пути.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB