← Сtrl

lorien · Июнь 20, 2013 14:30:30

> P/S/ Чем посоветуете пользоваться для парсинга?

Попробуйте Grab::Spider, тут есть ссылки на статью и на документацию: http://grablib.org/

reclosedev · Июнь 20, 2013 18:59:40

На первой странице нет ссылки на четвертую.

И еще, стартовая страница asdfasdf.ru/russian/ и в экстракторе /russian/4.html

Сейчас проверить не могу, но вроде регексп сравнивается с абсолютной или относительно стартовой страницы (/russian/):

r'http://asdfasdf\.ru/russian/\d+\.html'

или

r'\d+\.html'

Mariarchy · Июнь 21, 2013 08:02:42

проверил - все то же самое

Python-сообщество

Уведомления

#1 Июнь 20, 2013 14:30:30

парсинг со scrapy

#2 Июнь 20, 2013 18:59:40

парсинг со scrapy

#3 Июнь 21, 2013 08:02:42

парсинг со scrapy

Board footer