Уведомления

Группа в Telegram: @pythonsu

#1 Ноя. 8, 2023 12:51:41

sergio21124444
Зарегистрирован: 2023-11-08
Сообщения: 7
Репутация: +  0  -
Профиль   Отправить e-mail  

КАк скрапить данные с сайта?

Обычно для это задачи использовал power automate или scrape instant, потом заносил их эксель , которые все расчитывал. недавно зашел в чат жпт он мне сказал учи питон и брось пауэр аутомете. скачал питон и селениум, спросил у жпт код для скрапинга, он открыл страничку без авторизации в моем гугл акканте, вообщем ничего не получилось. куча припонов ничего не понятно.
Подскажите как опытные програмисты, есть ли смысл идти дальше и пытаться? Сайт ati.su , скрапить надо расстояния и цены.
все спасибо заранее

Офлайн

#2 Ноя. 9, 2023 00:17:20

py.user.next
От:
Зарегистрирован: 2010-04-29
Сообщения: 9731
Репутация: +  843  -
Профиль   Отправить e-mail  

КАк скрапить данные с сайта?

sergio21124444
Подскажите как опытные програмисты, есть ли смысл идти дальше и пытаться?
Возьми другой сайт, где авторизация не используется. Там попробуй собрать данные с него. Если и с него собрать данные не сможешь, то авторизацию тем более не пройдёшь. Для авторизации нужно уметь просматривать поля HTTP-заголовков в протоколе передачи гипертекста, потому что вся авторизация на подобных сайтах делается через передачу специальных значений заголовков с секретом в этих значениях.



Отредактировано py.user.next (Ноя. 9, 2023 00:18:55)

Офлайн

#3 Ноя. 9, 2023 08:56:45

sergio21124444
Зарегистрирован: 2023-11-08
Сообщения: 7
Репутация: +  0  -
Профиль   Отправить e-mail  

КАк скрапить данные с сайта?

py.user.next
я бы рад найти другой сайт, но это монополист в России.
на других площадках можно скрапить максимум 200 строчек, и это дает очень неполную картину.

Офлайн

#4 Ноя. 10, 2023 05:32:05

py.user.next
От:
Зарегистрирован: 2010-04-29
Сообщения: 9731
Репутация: +  843  -
Профиль   Отправить e-mail  

КАк скрапить данные с сайта?

sergio21124444
я бы рад найти другой сайт, но это монополист в России.
Я тебе говорю про вообще любой другой сайт. То есть возьми задачу попроще и на ней проверь, ты вообще легкотню какую-нибудь можешь скачать и распарсить. Selenium для этого не нужен.

sergio21124444
есть ли смысл идти дальше и пытаться? Сайт …
Сайт как сайт. Но сможешь ли ты это сделать, вот в чём вопрос. Опыт-то у тебя нулевой.



Офлайн

#5 Ноя. 10, 2023 08:06:26

ZerG
Зарегистрирован: 2012-04-05
Сообщения: 2586
Репутация: +  60  -
Профиль   Отправить e-mail  

КАк скрапить данные с сайта?

Попроси ГПТ чат обучить тебя писать вопросы на человеческом языке
А то мы тут далеко не все “ Я в своем познании настолько преисполнился, что я как будто бы уже
сто триллионов миллиардов лет проживаю на триллионах и
триллионах таких же планет, как эта Земля…”

Ибо если убрать неправильную терминологию то пост выглядит так

Я что-то делал
ИИ сказал делать иначе и что-то открыл
Я что-то сделал
Ничего не работает
Есть ли смысл?


Пока что держи такой ответ: 42



Влодение рускай арфаграфией - это как владение кунг-фу: настаящие мастира не преминяют ево бес ниабхадимости

Офлайн

#6 Ноя. 10, 2023 13:16:16

sergio21124444
Зарегистрирован: 2023-11-08
Сообщения: 7
Репутация: +  0  -
Профиль   Отправить e-mail  

КАк скрапить данные с сайта?

py.user.next
а понял. надо поупражнятся на задаче полегче. я просто думал, что сайт такой, что это невозможно, год будешь код учить и в этоге ничего не получиться… теперь мне проще, тогда буду двигаться дальше в этом направлении. Просто тема скрапинга как то слабо развита, репетитора и курсов не найдешь. Кругом учат вэб девелопингу, а деньги на работе платят за скрапинг и обработку данных. скоро даже грузчики и дворники будут скрапить

Офлайн

#7 Ноя. 10, 2023 13:17:56

sergio21124444
Зарегистрирован: 2023-11-08
Сообщения: 7
Репутация: +  0  -
Профиль   Отправить e-mail  

КАк скрапить данные с сайта?

ZerG
Попроси ГПТ чат обучить тебя писать вопросы на человеческом языке
а функцию print знаю)

Офлайн

#8 Ноя. 10, 2023 13:48:20

sergio21124444
Зарегистрирован: 2023-11-08
Сообщения: 7
Репутация: +  0  -
Профиль   Отправить e-mail  

КАк скрапить данные с сайта?

я раньше, да и сейчас использую классное расширение, называется PageProbe , храни господь того парня кто это сделал, вот если скрестить эксель и pageprobe то было бы супер

Офлайн

#9 Ноя. 11, 2023 02:37:34

py.user.next
От:
Зарегистрирован: 2010-04-29
Сообщения: 9731
Репутация: +  843  -
Профиль   Отправить e-mail  

КАк скрапить данные с сайта?

sergio21124444
Просто тема скрапинга как то слабо развита, репетитора и курсов не найдешь. Кругом учат вэб девелопингу, а деньги на работе платят за скрапинг и обработку данных. скоро даже грузчики и дворники будут скрапить
Ну есть такое направление в деятельности. Но для этого нужно знать что? Основы по Web: протокол HTTP, язык HTML, язык JavaScript, язык XPath, язык RegExp, язык JSON, язык XML. Это всё обычно разработка для Web охватывает. Так что можешь брать уроки по разработке для Web и выбирать только эти компоненты оттуда. Это что касается скачивания данных с сайта.

А вот обработка скачанных данных включает в себя гораздо больше всего другого. Так что потренируйся сначала на всём простом, чтобы понять просто свои возможности. Вдруг ты и простое не сможешь сделать (ни скачать, ни обработать скачанное).



Офлайн

#10 Ноя. 11, 2023 08:46:08

ZerG
Зарегистрирован: 2012-04-05
Сообщения: 2586
Репутация: +  60  -
Профиль   Отправить e-mail  

КАк скрапить данные с сайта?

Для того что бы спарсить данные сайта одного знания питона мало
Питон всего лишь инструмент - например набор ключей
Ими ты можешь открутить колесо в машине или починить кран на кухне
Но если ты хочешь поменять поршни в машине тебе нужно знать строение двигателя
Так же и в твоей ситуации. Как и ответили выше - тебе нужно осилить не только питон или другой язык программирования но и строение того с чем ты собираешься работать

В любом случае сразу хвататься за селениум плохой выбор. Это мощный инструмент но более подходящий когда нужно более плотное взаимодействие с вебом.
Для начала посмотри в сторону BeautifuSoup в большинстве случаев этого достаточно
Но эта библиотека не в коем случае не отменяет необходимость хотябы поверхностного понимания

Основы по Web: протокол HTTP, язык HTML, язык JavaScript, язык XPath, язык RegExp, язык JSON, язык XML



Влодение рускай арфаграфией - это как владение кунг-фу: настаящие мастира не преминяют ево бес ниабхадимости

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version