Найти - Пользователи
Полная версия: Парсинг Х(Твитер) аккаунтов
Начало » Python для экспертов » Парсинг Х(Твитер) аккаунтов
1
Antonio_Pripizduchi
У меня имееться огромный массив с аккаунтами от твитера и мне нужно их отсортировать на существующие и нет. Вот пример кода который у меня сейчас есть:
 import requests
def check_accounts(twitter, telegram):
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36",
        "Accept": "application/json",  # Указываем, что ожидаем JSON-ответ
    }
    # Проверка Twitter аккаунтов
    print("\nПроверяем Twitter аккаунты:")
    for url in twitter:
        try:
            response = requests.get(url, headers=headers)
            if response.status_code == 200:
                # Проверяем наличие текста, который указывает на несуществующий аккаунт
                if "Эта учетная запись не существует" in response.text:
                    print(f"Не существует: {url}")
                else:
                    print(f"Существует: {url}")
            else:
                print(f"Ошибка при проверке {url}: статус код {response.status_code}")
        except Exception as e:
            print(f"Ошибка при проверке {url}: {e}")
    # Проверка Telegram аккаунтов
    print("\nПроверяем Telegram аккаунты:")
    for url in telegram:
        try:    
            response = requests.get(url, headers=headers)
            if "tgme_page_description" in response.text and "tgme_username_link" in response.text:
                print(f"Не существует: {url}")
            else:
                print(f"Существует: {url}")
        except Exception as e:
            print(f"Ошибка при проверке {url}: {e}")
if __name__ == "__main__":
    twitter = [
        'https://x.com/trumpwifhatx',
        'https://x.com/trumpwifhatx222',
        'https://x.com/trumpwifhatx2256',
        'https://x.com/elonmusk',
        'https://x.com/SpaceX'
    ]
    telegram = [
        'https://t.me/k8t1k22222',
        'https://t.me/k8t1k222',
        'https://t.me/k8t1k',
        'https://t.me/truha',
        'https://t.me/topor',
        'https://t.me/chatik'
    ]
    check_accounts(twitter, telegram)
Как результат этого кода я получаю:
Проверяем Twitter аккаунты:
Существует: https://x.com/trumpwifhatx
Существует: https://x.com/trumpwifhatx222
Существует: https://x.com/trumpwifhatx2256
Существует: https://x.com/elonmusk
Существует: https://x.com/SpaceX

Проверяем Telegram аккаунты:
Не существует: https://t.me/k8t1k22222
Не существует: https://t.me/k8t1k222
Существует: https://t.me/k8t1k
Существует: https://t.me/truha
Существует: https://t.me/topor
Существует: https://t.me/chatik
PS C:\Users\Voyager1\Desktop\CoinParserBot>
Хотя по факту существуют только последний два аккаунта в твитере.
Основная проблема что твитер динамически подгружается и постоянно вовращает один и тот же ответ, и через поиск тегов/класов на странице тоже не получаеться. Кто с таким стыкался и знает как сделать?
py.user.next
Antonio_Pripizduchi
Основная проблема что твитер динамически подгружается
У меня он вообще пишет, что мне надо браузер сменить или перенастроить. На всех сайтах всё нормально, один он особенный. YouTube работает, Instagram работает, Twitter пишет “у тебя браузер неправильный”. Не трать время на эту парашу.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB