Найти - Пользователи
Полная версия: парсер-реконструктор php+html
Начало » Python для новичков » парсер-реконструктор php+html
1
viator
Доброго времени суток.
Передо мной поставлена была задача: изменить оформление сайта
Взялся, думая, что как обычно css переписать, да поправить немного кода, но, собственно, не тут то было…
весь сайт свёрстан таблицами… ни комментов ни классов ни малейшего мануала по всему этому бреду…
тысячи строк ужастного кода на php и только таблицы…
за первый день работы я понял, что писали это дело бездарности (ну или по крайней мере крайне не стандартные люди) и я даже за месяц безвылазной работы не управлюсь…

собственно сабж:
нужен парсер-реконструктор который бы парсил эти самые таблицы (которые большей частью своей лежат в ужаснейшем коде php)
анализируя код php на предмет повторения и структур
тоесть если идёт foreach с выводом строк таблицы, то эта часть оборачивается в ul и строки в li
во всех остальных случаях достаточно будет div с классами
на выходе нужен не только сам php файл - аналог исходника по содержанию выводимой информации, но и хотябы какой-то более или менее адекватный css, чтобы расположение элементов не сильно уродовалось… достаточно того, что просто теги table будут меняться на div а tr td на li или div + расположение через css

почему python?
не так давно (неделя) начал изучать python3, оч понравился за свою читабельность и быстроту разработки, знаю только о библиотеке cmath и sys =)
выбор в языке был между питоном и С++, и выбор очевиден, я думаю

можете ли подсказать библиотеки парсинга, приёмы, готовые решения подобных задач??

ps. первая мысль была, кажется, странной, но в том ли я направлении думаю:
сначала искать полный тег ( <table> </table>) - оборачивать, потом рекурсивно брать внутреннее содержание и так встречая конструкции if, foreach выбирать варианты для вставки следующих элементов ( ul li div )… странной потому, что это очень большое количество операций
Dit81
Сам такое ищу, но для простого парсинга и выбора информации со статических страниц и потом публикации в в БД и rss.
alex312
попробуйте суп
Александр Кошелев
alex312
попробуйте суп
Пожалуйста не надо советовать BS. Эта библиотека уже не поддерживается и не отвечает современным требованиям.
PooH
Эх, найти бы хотя бы EBNF для php. Оно вообще в существует в природе? А уж остальное дело техники.
stqs
Александр Кошелев
alex312
попробуйте суп
Пожалуйста не надо советовать BS. Эта библиотека уже не поддерживается и не отвечает современным требованиям.
а шо с ним не так?
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB