Форум сайта python.su
0
Здравствуйте, занимаюсь самообразованием, подскажите пожалуйста.
Как я понял, через socket работает практически все (или даже все), мне нужно сделать parse веб-страницы используя socket (точнее просто получить всю страничку, чтобы дальше с ней работать), но при реализации столкнулся с трудностями:
import socket, sys s = socket.socket(socket.AF_INET, socket.SOCK_STREAM) s.connect(("diz-cs.ru", 80)) s.send("GET / HTTP/1.0\r\n\r\n") buf = s.recv(100000) sys.stdout.write(buf) s.close()
HTTP/1.1 404 Not Found Server: uServ/3.2.2 Date: Tue, 14 Jul 2015 18:25:05 GMT Content-Type: text/html; charset=UTF-8 Connection: close
Офлайн
88
Чтить HTTP
s.send('GET / HTTP/1.0\r\nHost: diz-cs.ru\r\n\r\n')
Отредактировано Shaman (Июль 14, 2015 22:33:08)
Офлайн
0
ShamanСпасибо за подсказку, а как быть если при отправке запроса, получаем ответ “Please enable cookies” от сайта?
Чтить HTML
Офлайн
88
Обрабатывать Set-Cookie и Cookie.
Офлайн
0
ShamanНе затруднит, пожалуйста показать на примере?
Обрабатывать Set-Cookie и Cookie.
Офлайн
88
Так мы до интерпретации яваскриптов докатимся. Нет, Вам пока полезнее будет лично поразбираться.
Офлайн
0
Shaman
Так мы до интерпретации яваскриптов докатимся. Нет, Вам пока полезнее будет лично поразбираться.
Офлайн
88
В бородатые годы, когда мне нужно было узнать как работать с каким-нибудь интерфейсом, а ни литературы, ни гуров с интернетами под рукой не было, приходилось дизассемблировать чужие екзешники. Вы так тоже сможете.
Офлайн
221
Unnamed001
но вы же самообразованием занимаетесь - посмотрите на спецификацию HTML в частности на заголовки в GET запросе касательно того как показать серверу что вы принимаете куки. Ничего сложного. Просто немного погуглить и почитать.
Офлайн
33
Unnamed001
Не затруднит, пожалуйста показать на примере?
Офлайн