Уведомления

Группа в Telegram: @pythonsu

#1 Янв. 18, 2021 16:56:52

satfan
Зарегистрирован: 2019-02-02
Сообщения: 140
Репутация: +  -2  -
Профиль   Отправить e-mail  

Не открывается все ссылки из файла index.html

Win 7, IDLE (Python 3.8 32-bit)
Не открывается все ссылки из файла index.html
Код скрипта:

 from bs4 import BeautifulSoup
links = []
# получаем ссылки из файла
with open('index.html', 'r', encoding='utf-8') as f:
    data = f.read()
    soup = BeautifulSoup(data, "html.parser")
    links = soup.find_all('a')
# выводим их в консоль
for link in links:
    print(link['href'])
# записываем в файл file.txt
with open('file.txt', 'w', encoding='utf-8') as f:
    for link in links:
        f.write(link['href'] + '\n')
В конце есть ошибка:
[code python]Traceback (most recent call last):
File "1.py", line 12, in <module>
print(link['href'])
File "C:\Python38-32\lib\site-packages\bs4\element.py", line 1406, in __getite
m__
return self.attrs[key]
KeyError: 'href'
------------------
(program exited with code: 1)[/code]

Офлайн

#2 Янв. 18, 2021 17:10:51

xam1816
Зарегистрирован: 2020-05-11
Сообщения: 1309
Репутация: +  113  -
Профиль   Отправить e-mail  

Не открывается все ссылки из файла index.html

если не пользуетесь отладчиком,можете каждую переменную выводить print(переменная),тогда будет на каждом этапе видно что хранится в переменной,и есть ли в ней то что вы ищете

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version