Уведомления

Группа в Telegram: @pythonsu
  • Начало
  • » Data Mining
  • » Инструменты для парсинга сайтов и анализа данных [RSS Feed]

#1 Июль 9, 2015 17:57:24

pyhton
Зарегистрирован: 2013-12-13
Сообщения: 64
Репутация: +  -2  -
Профиль   Отправить e-mail  

Инструменты для парсинга сайтов и анализа данных

Главный инструмент - это наверно все-таки инспектор и консоль браузера. А питон - это то куда потом вставляешь полученные оттуда селекторы.

Офлайн

#2 Июль 9, 2015 17:58:40

pyhton
Зарегистрирован: 2013-12-13
Сообщения: 64
Репутация: +  -2  -
Профиль   Отправить e-mail  

Инструменты для парсинга сайтов и анализа данных

lorien
Где это может быть важно?
Там где чудаки на букву м не придумали установку бинарных зависимостей, XBMC, например.

Офлайн

#3 Авг. 12, 2015 23:51:24

lorien
От:
Зарегистрирован: 2006-08-20
Сообщения: 755
Репутация: +  37  -
Профиль  

Инструменты для парсинга сайтов и анализа данных

Решил завести на github репозиторий со список web scraping библиотек для разных языков. Для начала перенёс туда список из этого топика.
Репозиторий: https://github.com/lorien/web-scraping
Список для python: https://github.com/lorien/web-scraping/blob/master/python.md

Офлайн

#4 Сен. 8, 2021 14:34:19

pif-paf
Зарегистрирован: 2021-09-08
Сообщения: 1
Репутация: +  0  -
Профиль   Отправить e-mail  

Инструменты для парсинга сайтов и анализа данных

Помогите есть такая проблема как получить данные из www.instagram.com/direct/inbox у выбранного пользователя нужное слово я тут побывал и не могу заставить получить данные с поля сообщения
слово Привет

browser.find_element_by_xpath(
'//*/section/div/div/div/div/div/div/div/div/div/div/div').click()
time.sleep(random.randrange(2,6))

url = browser.find_element_by_xpath('//*/section/div/div/div/div/div')

r = requests.get(url)
soup = BeautifulSoup(r.content, ‘html.parser’)
for x in (soup.find_all(string=re.compile('Привет', flags=re.I))):
print(x)

Прикреплённый файлы:
attachment Безымянный.jpg (18,0 KБ)

Офлайн

#5 Июнь 28, 2022 04:46:15

work2crowd
Зарегистрирован: 2020-12-02
Сообщения: 4
Репутация: +  0  -
Профиль   Отправить e-mail  

Инструменты для парсинга сайтов и анализа данных

Большое спасибо за подборку

Офлайн

#6 Сен. 20, 2024 13:30:21

benchase
Зарегистрирован: 2024-02-24
Сообщения: 15
Репутация: +  0  -
Профиль   Отправить e-mail  

Инструменты для парсинга сайтов и анализа данных

Web scraping and data analysis are powerful techniques in data mining, allowing you to extract valuable insights from vast amounts of online information. Several tools can help with this, including Python libraries like BeautifulSoup, Scrapy, and Selenium for web scraping. BeautifulSoup is great for beginners as it simplifies navigating and extracting HTML data, while Scrapy is more advanced and efficient for large-scale projects. Selenium, on the other hand, is useful when you need to interact with dynamic websites, like clicking buttons or scrolling, before scraping data.

____ _________________________

Офлайн

  • Начало
  • » Data Mining
  • » Инструменты для парсинга сайтов и анализа данных[RSS Feed]

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version