mirak
Июль 21, 2016 15:19:15
Хочу заменить текст в проксируемом HTML документе. Бьюсь над проблемой который день. Попробовал BeautifulSoup, эта штука больше предназначена для парсинга. Чем можно, например, заменить слова в видимом тексте HTML, по регулярному выражению другими словами или добавить после слов которые подходят под regex паттерн сноску, вроде `<sup>1</sup>`?
papuas
Июль 26, 2016 13:08:40
парсинг lxml, а редактирую обычно sed`om.
maks2236
Июль 26, 2016 13:37:24
papuas
Очень странный подход, когда lxml умеет изменять данные.
doza_and
Июль 26, 2016 19:47:57
maks2236
Очень странный подход, когда lxml умеет изменять данные.
Очень даже не странный. Простые разовые правки часто проще вносить без использования lxml (реально кода будет меньше).