Форум сайта python.su
0
Задача такая: есть некий сайт, на нем есть страница. На этой странице, помимо прочего содержимого, имеется таблица с числовыми и текстовыми данными. Возможно ли средствами Python скопировать эту таблицу (для дальнейшей обработки содержимого таблицы)? Начало таблицы хотелось бы идентифицировать по названию столбцов.
И более общий вопрос: нет ли библиотеки для Python, которая позволяет работать с html кодом интернет страницы?
Офлайн
0
urllib зайти на страницу, lxml для парсинга(xpath в руки)
Начало таблицы хотелось бы идентифицировать по названию столбцов.Не самый лучший способ идетифицировать таблицу, если придется стягивать ее регулярно.
Офлайн
16
Посмотрите на Grab
Офлайн
И более общий вопрос: нет ли библиотеки для Python, которая позволяет работать с html кодом интернет страницы?
Офлайн