Найти - Пользователи
Полная версия: BeautifulSoup удаление элементов
Начало » Python для новичков » BeautifulSoup удаление элементов
1
zipmeat
имеется примерно такой структуры веб-страница
<tbody>
<tr>111</tr>
<tr>111</tr>
<tr><td class="myColor">Text</td></tr>
<tr>222</tr>
<tr>222</tr>
<tr>222</tr>
</tbody>
мне нужно спарсить данные из <tr>111</tr>, с <tr>222</tr> не надо. спарсить их все без проблем, у них структура одинаковая, но все не нужны. количество и тех и других варьируется. единственное, что разделяет их это например <tr><td class=“myColor”>Text</td></tr>.

всяко пытаюсь удалить нижние <tr>222</tr>, не выходит:
soup.find('td',attrs={'class':'myColor'}).findAllNext('tr').extract()
удалить одно поле получается:
soup.find('td',attrs={'class':'myColor'}).findNext('tr').extract()
с for пробовал, не получилось.
не знаю где подвох. может есть ещё способ считать только до нужной мне записи.
dartNNN
С BeautifulSoup не работал, ИМХО вырезал бы регуляркой, а потом уже парсил бы.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB