Форум сайта python.su
Сейчас быстренько форкнул парсер bash.im и переписал под ithappens.me( там почти ничего менять не пришлось, только убрал время, когда добавили историю)
Гитхаб
Парсер парсит(ДАТЫЧО?) истории с их ID'ами в quotes.sqlite3 файлик.
Запускать скрипт(parse.py) - надо так: python parse.py , т.е.
python parse.py 1 500
P.S:Запустил у себя на ВПСке парсинг ВСЕХ страниц,сколько осталось - хз, но файлик уже весит 25мб, когда он закончит парсить, могу скинуть файл , кому надо будет )
UPD:Вот файл базы данных, только нету последних 100 записей Яндекс.Диск
Отредактировано Tiberium (Июль 1, 2015 15:27:51)
Офлайн
> Парсер парсит(ДАТЫЧО?) истории с их ID'ами в quotes.sqlite3 файлик.
А что такое “(ДАТЫЧО?) история”?
Офлайн
RodegastПросто то что я написал “Парсер парсит”, что он ещё умеет делать кроме этого? Тавтология крч
> Парсер парсит(ДАТЫЧО?) истории с их ID'ами в quotes.sqlite3 файлик.А что такое “(ДАТЫЧО?) история”?
Офлайн
Так оно ничего кроме http://ithappens.me/ парсить не умеет? Это не интересно. Такой парсер за полчаса пишется.
Офлайн
Парсер не правильно - надо говорить скрапер, а если обходит все страници то краувлер.
Офлайн
ihСинтакси́ческий ана́лиз (жарг. па́рсинг) в лингвистике и информатике — процесс сопоставления линейной последовательности лексем (слов, токенов) естественного или формального языка с его формальной грамматикой.
Парсер не правильно - надо говорить скрапер, а если обходит все страници то краувлер.
Отредактировано Tiberium (Июль 1, 2015 20:41:34)
Офлайн
RodegastЯ новичок, тем более я не сам написал, а лишь изменил там чуть-чуть
Так оно ничего кроме http://ithappens.me/ парсить не умеет? Это не интересно. Такой парсер за полчаса пишется.
Офлайн