Найти - Пользователи
Полная версия: Парсер новостей, проблема с парсингом картинки
Начало » Python для новичков » Парсер новостей, проблема с парсингом картинки
1
grigory.a
Друзья. Всем привет.
Помогите пожалуйста с кодом. Пытаюсь освоить Beautifulsoup и возникла проблема с парсингом картинки.
Весь код взят с одного видеоурока с Youtube.

 news = []
    for item in items:
        news.append({
            'title': item.find('span', class_='list-item__title').get_text(),
            'short_news': item.find('span', class_='list-item__summary').get_text(),
#            'img_link': item.find('span', style_='background-image').get('href'), не знаю как спарсить это:
#
#<span style="background-image: url(&quot;https://user.vse42.ru/files/P_S320x213/Wnone/ui-#6202982a1a7a98.22215153.jpeg&quot;);" class="list-item__preview lazy-adaptive__placeholder" data-#lazyadaptive-src="ui-6202982a1a7a98.22215153.jpeg" data-lazyadaptive-allowed-#widths="100,132,146,160,210,320" data-lazyadaptive-image-ratio="1.50" title="Более 30 тысяч кур #погибли при пожаре на пермской птицефабрике"></span>         
#
#
        })

Не могу выдернуть URL картинки и поместить его в переменную img_link
xam1816
 from bs4 import BeautifulSoup
import re
html = '<span style="background-image: url(&quot;https://user.vse42.ru/files/P_S320x213/Wnone/ui-#6202982a1a7a98.22215153.jpeg&quot;);" class="list-item__preview lazy-adaptive__placeholder" data-#lazyadaptive-src="ui-6202982a1a7a98.22215153.jpeg" data-lazyadaptive-allowed-#widths="100,132,146,160,210,320" data-lazyadaptive-image-ratio="1.50" title="Более 30 тысяч кур #погибли при пожаре на пермской птицефабрике"></span>'
soup = BeautifulSoup(html,'lxml')
math = re.search(r'https:.+jpeg',soup.span['style'])
res = math.group() if math else None
print(res)

https://user.vse42.ru/files/P_S320x213/Wnone/ui-#6202982a1a7a98.22215153.jpeg
grigory.a
xam1816
Спасибо Вам огромное, добрейшей души человек
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB