Найти - Пользователи
Полная версия: Парсинг html
Начало » Web » Парсинг html
1
Теня
коллеги, всем привет. Я не проф программист на питон. У меня сейчас есть очень срочная задача, не до конца понимаю как решить помогите-направьте! Суть, у меня есть url отдающий htmlку, в ней несколько таблиц, нужно вырезать из кода первую таблицу и сохранить как html файлик. Как я понимаю сие делается методами htmllib - напрвьте меня на примеры, примерно какие методами и как?
Теня
А, мальенькое добавление - ОЧЕНЬ желательно все сделать средствами стандартной библиотеки.
o7412369815963
вот пример - получает по url страницу и выкусывает кусок кода регепсами.
Александр Кошелев
Теня
А, мальенькое добавление - ОЧЕНЬ желательно все сделать средствами стандартной библиотеки.
Откуда такое требование?
Теня
Александр Кошелев
Теня
А, мальенькое добавление - ОЧЕНЬ желательно все сделать средствами стандартной библиотеки.
Откуда такое требование?
Есть страничка которая генерится Nagios, нужно вырезать таблицу и оставить только нужную информацию и показывать это заказчику. Это задача минимум. Так это все ставиться в ну очень энтерпрайзном окружении, будет сложно доставлять дополнительные модули, + мы задачу развертывания часто будем не сами решать. Соотв нужно максимально стандартным средствами и упрошенно сделать. Но это скорее пожелание.
zheromo
Если таблицы не вложенные
>>> body = ' .... <table border="0"> table1 content </table> ..... <table> table
2 content </table> .... '
>>> body[body.index('<table') : body.index('</table>')+8]
'<table border="0"> table1 content </table>'
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB