Уведомления

Группа в Telegram: @pythonsu

#1 Дек. 2, 2021 19:58:15

nan.
Зарегистрирован: 2021-12-02
Сообщения: 10
Репутация: +  0  -
Профиль   Отправить e-mail  

Не работает парсинг

Мой код:

 import requests
from bs4 import BeautifulSoup as bs
r = requests.get("mySite")
soup = bs(r.content, "html.parser")
CaptchaId = soup.select("input[name=Captcha.Id]")[0]["id"]

То, что я пытаюсь получить:
 <input name="Captcha.Id" class="captcha__value" type="hidden" value="73a1b62e-7db8-4252-a59c-548a00065bc5">

Получаю ошибку SelectorSyntaxError

Отредактировано nan. (Дек. 2, 2021 20:03:40)

Офлайн

#2 Дек. 2, 2021 20:10:04

xam1816
Зарегистрирован: 2020-05-11
Сообщения: 1395
Репутация: +  124  -
Профиль   Отправить e-mail  

Не работает парсинг

 "Captcha.Id"
в кавычках

Офлайн

#3 Дек. 2, 2021 20:16:42

nan.
Зарегистрирован: 2021-12-02
Сообщения: 10
Репутация: +  0  -
Профиль   Отправить e-mail  

Не работает парсинг

xam1816
Если так, то выходит ошибка TypeError
 CaptchaId = soup.select(input["name=Captcha.Id"])[0]["id"]

Отредактировано nan. (Дек. 2, 2021 20:17:38)

Офлайн

#4 Дек. 2, 2021 20:27:30

xam1816
Зарегистрирован: 2020-05-11
Сообщения: 1395
Репутация: +  124  -
Профиль   Отправить e-mail  

Не работает парсинг

читайте здесь

 CaptchaId = soup.select('[name="Captcha.Id"]')[0]["id"]

Офлайн

#5 Дек. 2, 2021 20:44:48

nan.
Зарегистрирован: 2021-12-02
Сообщения: 10
Репутация: +  0  -
Профиль   Отправить e-mail  

Не работает парсинг

xam1816
читайте здесь
странно, что именно на не работает, пробовал с - прекрасно работает, а нужно мне именно id

Офлайн

#6 Дек. 2, 2021 21:02:50

xam1816
Зарегистрирован: 2020-05-11
Сообщения: 1395
Репутация: +  124  -
Профиль   Отправить e-mail  

Не работает парсинг

 soup.select('[name="Captcha.Id"]')[0]['value']
Это?

Офлайн

#7 Дек. 2, 2021 21:22:57

nan.
Зарегистрирован: 2021-12-02
Сообщения: 10
Репутация: +  0  -
Профиль   Отправить e-mail  

Не работает парсинг

xam1816
Выдает такую ошибку:

raise SelectorSyntaxError(msg, self.pattern, index)
soupsieve.util.SelectorSyntaxError: Invalid character ‘=’ position 4
line 1:
name=“Captcha.Id”

Офлайн

#8 Дек. 2, 2021 22:36:04

xam1816
Зарегистрирован: 2020-05-11
Сообщения: 1395
Репутация: +  124  -
Профиль   Отправить e-mail  

Не работает парсинг

nan.
Выдает такую ошибку:
 from bs4 import BeautifulSoup as bs
#
html = '<input name="Captcha.Id" class="captcha__value" type="hidden" value="73a1b62e-7db8-4252-a59c-548a00065bc5">'
#
soup = bs(html, "html.parser")
#
CaptchaId = soup.select('[name="Captcha.Id"]')[0]["value"]
#
print(CaptchaId)

вывод
 73a1b62e-7db8-4252-a59c-548a00065bc5
Process finished with exit code 0

Офлайн

#9 Дек. 3, 2021 08:40:08

nan.
Зарегистрирован: 2021-12-02
Сообщения: 10
Репутация: +  0  -
Профиль   Отправить e-mail  

Не работает парсинг

В парсинге строка выглядит так:
<input class=“captcha__value” name=“Captcha.Id” type=“hidden”/>

А при просмотре кодового элемента через браузер, строка выглядит так:
<input name=“Captcha.Id” class=“captcha__value” type=“hidden” value=“73a1b62e-7db8-4252-a59c-548a00065bc5”>
С чем это может быть связано и как это исправить?

Офлайн

#10 Дек. 3, 2021 11:28:47

xam1816
Зарегистрирован: 2020-05-11
Сообщения: 1395
Репутация: +  124  -
Профиль   Отправить e-mail  

Не работает парсинг

nan.
А при просмотре кодового элемента через браузер, строка выглядит так:
Потому что браузер отправляет правильные заголовки серверу,которые дают доступ к ресурсу,например вы там авторизованы с помощью логина и пароля

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version