Уведомления

Группа в Telegram: @pythonsu

#1 Янв. 11, 2013 10:36:36

anatolyutkin
Зарегистрирован: 2013-01-10
Сообщения: 1
Репутация: +  0  -
Профиль   Отправить e-mail  

Копирование содержимого интернет ресурса?

Задача такая: есть некий сайт, на нем есть страница. На этой странице, помимо прочего содержимого, имеется таблица с числовыми и текстовыми данными. Возможно ли средствами Python скопировать эту таблицу (для дальнейшей обработки содержимого таблицы)? Начало таблицы хотелось бы идентифицировать по названию столбцов.

И более общий вопрос: нет ли библиотеки для Python, которая позволяет работать с html кодом интернет страницы?

Офлайн

#2 Янв. 11, 2013 12:50:54

Skivbard
Зарегистрирован: 2013-01-11
Сообщения: 3
Репутация: +  0  -
Профиль   Отправить e-mail  

Копирование содержимого интернет ресурса?

urllib зайти на страницу, lxml для парсинга(xpath в руки)

Начало таблицы хотелось бы идентифицировать по названию столбцов.
Не самый лучший способ идетифицировать таблицу, если придется стягивать ее регулярно.

Офлайн

#3 Янв. 11, 2013 12:57:03

GaiveR
От:
Зарегистрирован: 2011-08-13
Сообщения: 122
Репутация: +  16  -
Профиль   Отправить e-mail  

Копирование содержимого интернет ресурса?

Посмотрите на Grab



Офлайн

#4 Май 22, 2013 16:45:27

lorien
От:
Зарегистрирован: 2006-08-20
Сообщения: 755
Репутация: +  37  -
Профиль  

Копирование содержимого интернет ресурса?

И более общий вопрос: нет ли библиотеки для Python, которая позволяет работать с html кодом интернет страницы?

http://lxml.de/

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version