Найти - Пользователи
Полная версия: Парсинг по содержимому в соседнем теге
Начало » Центр помощи » Парсинг по содержимому в соседнем теге
1
Mvvalerievich
Доброго времени суток. Подскажите пожалуйста, как парсить номер телефона, адрес и почту.
 <li><strong>Почтовый адрес:</strong>
                          <span>Россия, республи......</span>
                      </li>
                     <li>
            <strong>
                            Телефон:
            </strong>        +7 (96*) ********
              
                                    </li>            
                  <li>
            <strong>
                            Телефон:
            </strong>        +7 (9**) ***–10**
              
                                    </li>
                  <li>
            <strong>
                            E-mail:
            </strong>   vi****3@bk.ru
              
                                    </li>
              </ul>
на каждой странице такой код, но … иногда два телефона, иногда один, иногда нет почты
py.user.next
Сначала нужно это привести к промежуточной форме. Надо удалить всякие лишние пробелы, лишние теги. А потом то, что получится в очищенном виде, его и надо разбирать. Не нужно пытаться сразу разобрать это, потому что здесь много лишних данных, которые при разборе нужно учитывать. При этом эти данные никакой роли в структуре вообще не играют, их просто надо удалить ещё до разбора.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB