Уведомления

Группа в Telegram: @pythonsu

#1 Июнь 20, 2013 14:30:30

lorien
От:
Зарегистрирован: 2006-08-20
Сообщения: 755
Репутация: +  37  -
Профиль  

парсинг со scrapy

> P/S/ Чем посоветуете пользоваться для парсинга?

Попробуйте Grab::Spider, тут есть ссылки на статью и на документацию: http://grablib.org/

Офлайн

#2 Июнь 20, 2013 18:59:40

reclosedev
От: Н.Новгород
Зарегистрирован: 2012-03-29
Сообщения: 870
Репутация: +  173  -
Профиль   Отправить e-mail  

парсинг со scrapy

На первой странице нет ссылки на четвертую.

И еще, стартовая страница asdfasdf.ru/russian/ и в экстракторе /russian/4.html

Сейчас проверить не могу, но вроде регексп сравнивается с абсолютной или относительно стартовой страницы (/russian/):

r'http://asdfasdf\.ru/russian/\d+\.html'
или
r'\d+\.html'

Офлайн

#3 Июнь 21, 2013 08:02:42

Mariarchy
Зарегистрирован: 2013-02-06
Сообщения: 17
Репутация: +  0  -
Профиль   Отправить e-mail  

парсинг со scrapy

проверил - все то же самое

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version