Python-сообщество

anatolyutkin · Янв. 11, 2013 10:36:36

Задача такая: есть некий сайт, на нем есть страница. На этой странице, помимо прочего содержимого, имеется таблица с числовыми и текстовыми данными. Возможно ли средствами Python скопировать эту таблицу (для дальнейшей обработки содержимого таблицы)? Начало таблицы хотелось бы идентифицировать по названию столбцов.

И более общий вопрос: нет ли библиотеки для Python, которая позволяет работать с html кодом интернет страницы?

Skivbard · Янв. 11, 2013 12:50:54

urllib зайти на страницу, lxml для парсинга(xpath в руки)

Начало таблицы хотелось бы идентифицировать по названию столбцов.

Не самый лучший способ идетифицировать таблицу, если придется стягивать ее регулярно.

GaiveR · Янв. 11, 2013 12:57:03

Посмотрите на Grab

lorien · Май 22, 2013 16:45:27

И более общий вопрос: нет ли библиотеки для Python, которая позволяет работать с html кодом интернет страницы?

http://lxml.de/

Python-сообщество

Уведомления

#1 Янв. 11, 2013 10:36:36

Копирование содержимого интернет ресурса?

#2 Янв. 11, 2013 12:50:54

Копирование содержимого интернет ресурса?

#3 Янв. 11, 2013 12:57:03

Копирование содержимого интернет ресурса?

#4 Май 22, 2013 16:45:27

Копирование содержимого интернет ресурса?

Board footer