Форум сайта python.su
0
Есть такая задача:
1. Есть страница сайта. (таких страниц немногим больше 100).
2. На каждой странице список из 30 ссылок с описанием.
3. Каждая ссылка ведет на страницу с таблицей (все таблицы схожи)
4. Нужно каждую таблицу обработать и перенести информацию из таблиц в удобный формат базы данных.
Есть ли примеры каких-то схожишь скриптов на питоне? Насколько я понимаю, это не такая проблематичная задача?
Офлайн
52
Если под таблицами имеется в виду html-таблица, тот тут вам нужен любой html-парсер, например lxml. По абстрактной формулировке задачи сложно посоветовать что-нибудь конкретное. Если приведете пример таблицы, можно будет показать, как её парсить. Или посмотрите самостоятельно примеры.
Офлайн
0
Спасибо.
Вот, собственно, таблица http://www.oaontc.ru/services/registers/lnk/?&page=1
Офлайн
52
Можно еще посоветовать что-нибудь вроде grab, на сайте есть ссылки на статьи с примерами. Там уже есть паук, чтобы бегать по нужным ссылкам на странице.
Офлайн
857
banjoОбработчик Сайта
1. Есть страница сайта. (таких страниц немногим больше 100).
2. На каждой странице список из 30 ссылок с описанием.
3. Каждая ссылка ведет на страницу с таблицей (все таблицы схожи)
4. Нужно каждую таблицу обработать и перенести информацию из таблиц в удобный формат базы данных.
Отредактировано py.user.next (Авг. 16, 2012 07:09:38)
Офлайн