Проблема в том, что не могу получить реальный код страницы, для дальнейшей работы с ней.
через Selenium:
from selenium import webdriver driver = webdriver.Chrome() driver.get('http://ffsim.ru/forum/viewforum.php?f=65') html = driver.page_source print(html)
через requests:
import requests def get_html(url, e): r = requests.get(url) r.encoding = e return r.text print(get_html('http://ffsim.ru/forum/viewforum.php?f=65', 'utf-8'))
но получаю, что в первом случае, что и во втором вот-что:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <META HTTP-EQUIV="CACHE-CONTROL" CONTENT="NO-CACHE"> <META HTTP-EQUIV="PRAGMA" CONTENT="NO-CACHE"> <META HTTP-EQUIV="REFRESH" CONTENT="1;"> <title>Browser Check Page</title> </head> <body> <script type="text/javascript"> document.cookie = 'CHECK=0; path=/'; </script> </body> </html>
В какую сторону смотреть, что делать ?