Уведомления

Группа в Telegram: @pythonsu

#1 Май 25, 2009 14:44:41

Newbie
От:
Зарегистрирован: 2009-03-02
Сообщения: 19
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсинг HTML файлов

Доброго времени суток!

У меня такой вопрос: посредством чего стянуть с сайта нужную инфу? На PHP с помощью file_get_contents() беру страницу, а далее уже через позиционную проверку (RegExp) получаю нужную информацию. На Питоне пытался тоже самое сделать - не получается. Через модули urllib2 и re делал. Может вовсе надо с модулем htmllib работать? Как быть?



Офлайн

#2 Май 25, 2009 17:07:51

regall
От: Киев
Зарегистрирован: 2008-07-17
Сообщения: 1583
Репутация: +  3  -
Профиль   Отправить e-mail  

Парсинг HTML файлов

Довольно мрачно описана проблема…
Можна поподробнее, какой-то код, как делал… а то, чесно говоря, не понятно как тебе помочь…



Офлайн

#3 Май 25, 2009 17:53:07

slav0nic
Команда
От: dp.ua
Зарегистрирован: 2006-05-07
Сообщения: 2260
Репутация: +  41  -
Профиль   Отправить e-mail  

Офлайн

#4 Май 25, 2009 18:24:21

Newbie
От:
Зарегистрирован: 2009-03-02
Сообщения: 19
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсинг HTML файлов

regall
Довольно мрачно описана проблема…
Можна поподробнее, какой-то код, как делал… а то, чесно говоря, не понятно как тебе помочь…
Да че тут описывать-то? Берем страницу, выдираем из нее нужную инфу посредством позиционной проверки, вот так: $pattern = ‘/(?<=some_unique_tag).*(?=another_unique_tag)/’, где .* - нужная инфа. Потом подтираем все оставшиеся теги и воуля - только искомая информация. Ну и обрабытываем ее как заблагорассудится… Я таким образом прогноз погоды с одного сайта достаю. На PHP для своего сайта сделал такой вот скрипт, а хочется еще на Питоне такое же проделать. В общем, не получилось…



Офлайн

#5 Май 25, 2009 18:34:38

Newbie
От:
Зарегистрирован: 2009-03-02
Сообщения: 19
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсинг HTML файлов

Кстати, кто-нибудь делал подобную прогу с погодой? Что это за API сервис, который предоставляют некоторые погодные сайты для развития собственных приложений? Если не понятно, взгляните сюда. Не проще ли парсить их сайты своими средствами?



Офлайн

#6 Май 26, 2009 10:38:22

bw
От:
Зарегистрирован: 2007-09-26
Сообщения: 938
Репутация: +  20  -
Профиль   Адрес электронной почты  

Парсинг HTML файлов

> У меня такой вопрос: посредством чего стянуть с сайта нужную инфу?
Посредством поиска по этому форуму. Задача многократно здесь обсуждалась.

> В общем, не получилось…
Мы сейчас пойдем в специальную комноту и начнем медитировать, а кокй-же именно код у уважаемого не работает и в чем же проявляется его не работа.

> Что это за API сервис
Там регистрироваться надо. Такой хоккей нам не нужен!

..bw



Офлайн

#7 Май 26, 2009 10:57:32

Newbie
От:
Зарегистрирован: 2009-03-02
Сообщения: 19
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсинг HTML файлов

Сегодня свою страничку с погодой открыл - ПОГОДА ЗА ПРОШЛЫЙ МЕСЯЦ!!! Блин! Спалили что-ли?



Отредактировано (Май 26, 2009 11:08:12)

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version