Форум сайта python.su
В старых темах code слетел.
Парсер жует все, что между квадратных скобок. Другие форумы выводят незнакомые теги как есть.
Офлайн
в старых темах его не было
по второму это к http://code.google.com/p/postmarkup/issues/list
Офлайн
slav0nicМожет, сам репортнешь?
по второму это к http://code.google.com/p/postmarkup/issues/list
slav0nicА что там было? На Punbb code не юзали?
в старых темах его не было
Офлайн
я уже и не помню, но в поле ббкод почему-то оно не обёрнуто, у нас оно 100 раз менялось (в punbb была xss уязвимость в раскрасчике кода с html, поэтому отключали)
репортнуть там надо не только это =\ но автор подзабил что-то, хотя раз в год фиксит) есть форк, но там коммитят все кому не лень
Офлайн
Кто там на пхп трындел, где кода нет, одни инъекции? А теперь, оказывается, в питоне нет нормального парсера ббкода?
Офлайн
odnochlen
во-первых в рнр в каждом форуме свой парсер, к чему бы это? во-вторых в 90% там используются регекспы - это гавно
если делать как в пхп, то выйдет такой вот ад: https://bitbucket.org/slav0nic/django-bbmarkup/src/eb8c63016125/bbmarkup/__init__.py, но мне облом это саппортить и кроме форума поддерживать ещё и кчу нужных либ
вот чтоб не быть голословным
https://github.com/phpbb/phpbb3/blob/develop/phpBB/includes/message_parser.php
https://github.com/punbb/punbb/blob/master/include/parser.php
в постмаркапе конечно тоже используются регекспы, но не в таком виде + архитектура - небо и земля
с другой стороны, твои претензии имеют место быть :) когда автор пакета бросает его саппортить в полной мере - это печалит)
Отредактировано slav0nic (Авг. 17, 2012 16:48:17)
Офлайн
slav0nicНа самом деле, швабодка же? Никто никому ничего не обязан.
когда автор пакета бросает его саппортить в полной мере - это печалит)
Офлайн
odnochlen
ну, я не знаток рнр, но модули парсинга, те что видел - писаны студентуозусами), так что радости там тоже мало
на тему регекспов, сложности начинаются с уровнями вложенности одного тега в другой + условий аля 1 тег может быть вложен внутри другого, отсюда начинаются знатные костыли
ну если прижмёт, можно попробовать на pyparsing или ply сваять, но я не любитель ваять парсеры/саппортить его/+1 левая зависимость, лучше попробовать скинуть автору патчи
Офлайн
Хотя если обсуждать php - куча багов создается макачностью, т.е. нежеланием разбираться и желанием городить велосипеды. Пример в топе хомякабра. Для критических задач надо юзать только ГСЧ, где в документации написано, что он криптостойкий. Или скули - вроде бы используй параметризированные запросы и они невозможны в принципе, но те, кто пишут движки, о них, видимо, не знают.
Не знаю, как с первым примером у питонистов, но с вбиванием в голову того, что нужно юзать стандартные функции, со вторым должно быть получше.
Офлайн
odnochlen
в рнр проблемы начинаются уже на уровне разрабов этого рнр) особенно в С-шной части (Лердорф сам говорил, что не умеет писать парсеры; + чего стоят смешные багфиксы удаления уязвимостей, добавляющие новые:]), вообще тема довольна флеймовая и бесконечная)
ты смотрю на поправку пошёл :P уже рейтинг + и можно даже общаться
Офлайн