Форум сайта python.su
> P/S/ Чем посоветуете пользоваться для парсинга?
Попробуйте Grab::Spider, тут есть ссылки на статью и на документацию: http://grablib.org/
Офлайн
На первой странице нет ссылки на четвертую.
И еще, стартовая страница asdfasdf.ru/russian/ и в экстракторе /russian/4.html
Сейчас проверить не могу, но вроде регексп сравнивается с абсолютной или относительно стартовой страницы (/russian/):
r'http://asdfasdf\.ru/russian/\d+\.html'
r'\d+\.html'
Офлайн
проверил - все то же самое
Офлайн