Уведомления

Группа в Telegram: @pythonsu

#1 Янв. 28, 2025 17:39:14

Antonio_Pripizduchi
Зарегистрирован: 2025-01-28
Сообщения: 1
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсинг Х(Твитер) аккаунтов

У меня имееться огромный массив с аккаунтами от твитера и мне нужно их отсортировать на существующие и нет. Вот пример кода который у меня сейчас есть:

 import requests
def check_accounts(twitter, telegram):
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36",
        "Accept": "application/json",  # Указываем, что ожидаем JSON-ответ
    }
    # Проверка Twitter аккаунтов
    print("\nПроверяем Twitter аккаунты:")
    for url in twitter:
        try:
            response = requests.get(url, headers=headers)
            if response.status_code == 200:
                # Проверяем наличие текста, который указывает на несуществующий аккаунт
                if "Эта учетная запись не существует" in response.text:
                    print(f"Не существует: {url}")
                else:
                    print(f"Существует: {url}")
            else:
                print(f"Ошибка при проверке {url}: статус код {response.status_code}")
        except Exception as e:
            print(f"Ошибка при проверке {url}: {e}")
    # Проверка Telegram аккаунтов
    print("\nПроверяем Telegram аккаунты:")
    for url in telegram:
        try:    
            response = requests.get(url, headers=headers)
            if "tgme_page_description" in response.text and "tgme_username_link" in response.text:
                print(f"Не существует: {url}")
            else:
                print(f"Существует: {url}")
        except Exception as e:
            print(f"Ошибка при проверке {url}: {e}")
if __name__ == "__main__":
    twitter = [
        'https://x.com/trumpwifhatx',
        'https://x.com/trumpwifhatx222',
        'https://x.com/trumpwifhatx2256',
        'https://x.com/elonmusk',
        'https://x.com/SpaceX'
    ]
    telegram = [
        'https://t.me/k8t1k22222',
        'https://t.me/k8t1k222',
        'https://t.me/k8t1k',
        'https://t.me/truha',
        'https://t.me/topor',
        'https://t.me/chatik'
    ]
    check_accounts(twitter, telegram)
Как результат этого кода я получаю:
Проверяем Twitter аккаунты:
Существует: https://x.com/trumpwifhatx
Существует: https://x.com/trumpwifhatx222
Существует: https://x.com/trumpwifhatx2256
Существует: https://x.com/elonmusk
Существует: https://x.com/SpaceX

Проверяем Telegram аккаунты:
Не существует: https://t.me/k8t1k22222
Не существует: https://t.me/k8t1k222
Существует: https://t.me/k8t1k
Существует: https://t.me/truha
Существует: https://t.me/topor
Существует: https://t.me/chatik
PS C:\Users\Voyager1\Desktop\CoinParserBot>
Хотя по факту существуют только последний два аккаунта в твитере.
Основная проблема что твитер динамически подгружается и постоянно вовращает один и тот же ответ, и через поиск тегов/класов на странице тоже не получаеться. Кто с таким стыкался и знает как сделать?

Офлайн

#2 Янв. 29, 2025 16:11:28

py.user.next
От:
Зарегистрирован: 2010-04-29
Сообщения: 9894
Репутация: +  854  -
Профиль   Отправить e-mail  

Парсинг Х(Твитер) аккаунтов

Antonio_Pripizduchi
Основная проблема что твитер динамически подгружается
У меня он вообще пишет, что мне надо браузер сменить или перенастроить. На всех сайтах всё нормально, один он особенный. YouTube работает, Instagram работает, Twitter пишет “у тебя браузер неправильный”. Не трать время на эту парашу.



Отредактировано py.user.next (Янв. 29, 2025 16:14:03)

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version