Найти - Пользователи
Полная версия: Парсер ithappens.me
Начало » Python проекты » Парсер ithappens.me
1
Tiberium
Сейчас быстренько форкнул парсер bash.im и переписал под ithappens.me( там почти ничего менять не пришлось, только убрал время, когда добавили историю)
Гитхаб
Парсер парсит(ДАТЫЧО?) истории с их ID'ами в quotes.sqlite3 файлик.
Запускать скрипт(parse.py) - надо так: python parse.py , т.е.
python parse.py 1 500
P.S:Запустил у себя на ВПСке парсинг ВСЕХ страниц,сколько осталось - хз, но файлик уже весит 25мб, когда он закончит парсить, могу скинуть файл , кому надо будет )
UPD:Вот файл базы данных, только нету последних 100 записей Яндекс.Диск
Rodegast
> Парсер парсит(ДАТЫЧО?) истории с их ID'ами в quotes.sqlite3 файлик.

А что такое “(ДАТЫЧО?) история”?
Tiberium
Rodegast
> Парсер парсит(ДАТЫЧО?) истории с их ID'ами в quotes.sqlite3 файлик.А что такое “(ДАТЫЧО?) история”?
Просто то что я написал “Парсер парсит”, что он ещё умеет делать кроме этого? Тавтология крч
Rodegast
Так оно ничего кроме http://ithappens.me/ парсить не умеет? Это не интересно. Такой парсер за полчаса пишется.
ih
Парсер не правильно - надо говорить скрапер, а если обходит все страници то краувлер.
Tiberium
ih
Парсер не правильно - надо говорить скрапер, а если обходит все страници то краувлер.
Синтакси́ческий ана́лиз (жарг. па́рсинг) в лингвистике и информатике — процесс сопоставления линейной последовательности лексем (слов, токенов) естественного или формального языка с его формальной грамматикой.
Всё что угодно, имеющее «синтаксис», поддается автоматическому анализу:
Структурированные данные — данные, языки их описания, оформления и т. д. Например, XML, HTML, CSS, ini-файлы, специализированные конфигурационные файлы и т. п.;
Wikipedia не врёт…
Tiberium
Rodegast
Так оно ничего кроме http://ithappens.me/ парсить не умеет? Это не интересно. Такой парсер за полчаса пишется.
Я новичок, тем более я не сам написал, а лишь изменил там чуть-чуть
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB