Уведомления

Группа в Telegram: @pythonsu

#1 Дек. 9, 2010 04:56:06

viator
От:
Зарегистрирован: 2010-12-09
Сообщения: 1
Репутация: +  0  -
Профиль   Отправить e-mail  

парсер-реконструктор php+html

Доброго времени суток.
Передо мной поставлена была задача: изменить оформление сайта
Взялся, думая, что как обычно css переписать, да поправить немного кода, но, собственно, не тут то было…
весь сайт свёрстан таблицами… ни комментов ни классов ни малейшего мануала по всему этому бреду…
тысячи строк ужастного кода на php и только таблицы…
за первый день работы я понял, что писали это дело бездарности (ну или по крайней мере крайне не стандартные люди) и я даже за месяц безвылазной работы не управлюсь…

собственно сабж:
нужен парсер-реконструктор который бы парсил эти самые таблицы (которые большей частью своей лежат в ужаснейшем коде php)
анализируя код php на предмет повторения и структур
тоесть если идёт foreach с выводом строк таблицы, то эта часть оборачивается в ul и строки в li
во всех остальных случаях достаточно будет div с классами
на выходе нужен не только сам php файл - аналог исходника по содержанию выводимой информации, но и хотябы какой-то более или менее адекватный css, чтобы расположение элементов не сильно уродовалось… достаточно того, что просто теги table будут меняться на div а tr td на li или div + расположение через css

почему python?
не так давно (неделя) начал изучать python3, оч понравился за свою читабельность и быстроту разработки, знаю только о библиотеке cmath и sys =)
выбор в языке был между питоном и С++, и выбор очевиден, я думаю

можете ли подсказать библиотеки парсинга, приёмы, готовые решения подобных задач??

ps. первая мысль была, кажется, странной, но в том ли я направлении думаю:
сначала искать полный тег ( <table> </table>) - оборачивать, потом рекурсивно брать внутреннее содержание и так встречая конструкции if, foreach выбирать варианты для вставки следующих элементов ( ul li div )… странной потому, что это очень большое количество операций



Отредактировано (Дек. 9, 2010 05:08:39)

Офлайн

#2 Дек. 9, 2010 12:06:39

Dit81
От:
Зарегистрирован: 2010-12-09
Сообщения: 5
Репутация: +  0  -
Профиль   Отправить e-mail  

парсер-реконструктор php+html

Сам такое ищу, но для простого парсинга и выбора информации со статических страниц и потом публикации в в БД и rss.



Офлайн

#3 Дек. 9, 2010 14:53:07

alex312
От:
Зарегистрирован: 2009-11-06
Сообщения: 6
Репутация: +  0  -
Профиль   Отправить e-mail  

парсер-реконструктор php+html

попробуйте суп



Офлайн

#4 Дек. 11, 2010 21:15:28

Александр Кошелев
От: Москва
Зарегистрирован: 2007-02-03
Сообщения: 1724
Репутация: +  2  -
Профиль   Отправить e-mail  

парсер-реконструктор php+html

alex312
попробуйте суп
Пожалуйста не надо советовать BS. Эта библиотека уже не поддерживается и не отвечает современным требованиям.



Офлайн

#5 Дек. 12, 2010 10:24:49

PooH
От:
Зарегистрирован: 2006-12-05
Сообщения: 1948
Репутация: +  72  -
Профиль   Отправить e-mail  

парсер-реконструктор php+html

Эх, найти бы хотя бы EBNF для php. Оно вообще в существует в природе? А уж остальное дело техники.



Вот здесь один из первых отарков съел лаборанта. Это был такой умный отарк, что понимал даже теорию относительности. Он разговаривал с лаборантом, а потом бросился на него и загрыз…

Офлайн

#6 Дек. 13, 2010 01:48:56

stqs
От:
Зарегистрирован: 2009-02-04
Сообщения: 16
Репутация: +  0  -
Профиль   Отправить e-mail  

парсер-реконструктор php+html

Александр Кошелев
alex312
попробуйте суп
Пожалуйста не надо советовать BS. Эта библиотека уже не поддерживается и не отвечает современным требованиям.
а шо с ним не так?



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version