Найти - Пользователи
Полная версия: Парсинг сайта
Начало » Python для новичков » Парсинг сайта
1
sl0w
Добрый вечер

Хотел бы узнать методы, которыми можно реализовать перенос контента с определенного сайта на мой

Недавно начал изучать библиотеку парсинга urllib и регулярные выражения, для выгрузки определенного контента нескольких сайтов, но встает вопрос относительно загрузки этого контента на “мой” сайт в автоматическом режиме, в качестве пользователя и публикации новости в определенном разделе. (могу авторизоваться на сайте, но каким образом возможно передать информацию из парсера в сообщение пользователя - для меня загадка)

для общего понимания картины можно импользовать этот сайт как пример места, в которое нужно загрузить информацию.

пс.
форум на xenforo

Буду очень признателен за помощь

py.user.next
Вот здесь писал, как провести предварительный анализ. И чтение сайта, и запись на сайт сначала должны быть проанализированы с помощью браузера. Потом просто воспроизводишь основные действия обмена с помощью питона. Раньше можно было Wireshark'ом смотреть, но сегодня все сайты работают через https (зашифрованный http), а Wireshark очень сложно настроить на расшифровку.
sl0w
хм, понял ход мысли

изучил немного литературы, попытался залогиниться на этом сайте с помощью питона

 import requests
from urllib  import urlopen
from bs4 import BeautifulSoup
class Inf(object):
    url  = "https://python.su/"
    def auth(self):
        session = requests.Session()
        url = self.url + "account/signin/"
        params = {
        "csrfmiddlewaretoken":"******************************",
        "email":"********************",
        "password":"**************",
       
       }
  
        r = session.post(url,params)
        print(r.text)
if __name__ == "__main__":
	print("hello world")
	inf = Inf()
	inf.auth()

естественно звездочки нужно заменить на значения свои

пока что не могу понять в чем ошибка, скорее всего в самом пути, который выглядит так: https://python.su/account/signin/ … более адекватные пути не были мной найдены
sl0w
Для разъяснения как такового:
на заинтересован в парсинге этого сайта, но хотел бы разобраться в скрапинге на его примере, к тому же остальным пользователям будет гораздо удобнее смотреть разметку/логирование, на примере этого сайта
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB