Найти - Пользователи
Полная версия: Не работает парсинг
Начало » Python для новичков » Не работает парсинг
1 2 3
nan.
Мой код:
 import requests
from bs4 import BeautifulSoup as bs
r = requests.get("mySite")
soup = bs(r.content, "html.parser")
CaptchaId = soup.select("input[name=Captcha.Id]")[0]["id"]

То, что я пытаюсь получить:
 <input name="Captcha.Id" class="captcha__value" type="hidden" value="73a1b62e-7db8-4252-a59c-548a00065bc5">

Получаю ошибку SelectorSyntaxError
xam1816
 "Captcha.Id"
в кавычках
nan.
xam1816
Если так, то выходит ошибка TypeError
 CaptchaId = soup.select(input["name=Captcha.Id"])[0]["id"]
xam1816
читайте здесь

 CaptchaId = soup.select('[name="Captcha.Id"]')[0]["id"]
nan.
xam1816
читайте здесь
странно, что именно на не работает, пробовал с - прекрасно работает, а нужно мне именно id
xam1816
 soup.select('[name="Captcha.Id"]')[0]['value']
Это?
nan.
xam1816
Выдает такую ошибку:

raise SelectorSyntaxError(msg, self.pattern, index)
soupsieve.util.SelectorSyntaxError: Invalid character ‘=’ position 4
line 1:
name=“Captcha.Id”
xam1816
nan.
Выдает такую ошибку:
 from bs4 import BeautifulSoup as bs
#
html = '<input name="Captcha.Id" class="captcha__value" type="hidden" value="73a1b62e-7db8-4252-a59c-548a00065bc5">'
#
soup = bs(html, "html.parser")
#
CaptchaId = soup.select('[name="Captcha.Id"]')[0]["value"]
#
print(CaptchaId)

вывод
 73a1b62e-7db8-4252-a59c-548a00065bc5
Process finished with exit code 0
nan.
В парсинге строка выглядит так:
<input class=“captcha__value” name=“Captcha.Id” type=“hidden”/>

А при просмотре кодового элемента через браузер, строка выглядит так:
<input name=“Captcha.Id” class=“captcha__value” type=“hidden” value=“73a1b62e-7db8-4252-a59c-548a00065bc5”>
С чем это может быть связано и как это исправить?
xam1816
nan.
А при просмотре кодового элемента через браузер, строка выглядит так:
Потому что браузер отправляет правильные заголовки серверу,которые дают доступ к ресурсу,например вы там авторизованы с помощью логина и пароля
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB