Уведомления

Группа в Telegram: @pythonsu

#1 Июль 1, 2015 15:14:42

Tiberium
Зарегистрирован: 2015-06-28
Сообщения: 26
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсер ithappens.me

Сейчас быстренько форкнул парсер bash.im и переписал под ithappens.me( там почти ничего менять не пришлось, только убрал время, когда добавили историю)
Гитхаб
Парсер парсит(ДАТЫЧО?) истории с их ID'ами в quotes.sqlite3 файлик.
Запускать скрипт(parse.py) - надо так: python parse.py , т.е.
python parse.py 1 500
P.S:Запустил у себя на ВПСке парсинг ВСЕХ страниц,сколько осталось - хз, но файлик уже весит 25мб, когда он закончит парсить, могу скинуть файл , кому надо будет )
UPD:Вот файл базы данных, только нету последних 100 записей Яндекс.Диск

Отредактировано Tiberium (Июль 1, 2015 15:27:51)

Офлайн

#2 Июль 1, 2015 15:46:43

Rodegast
От: Пятигорск
Зарегистрирован: 2007-12-28
Сообщения: 2731
Репутация: +  183  -
Профиль   Отправить e-mail  

Парсер ithappens.me

> Парсер парсит(ДАТЫЧО?) истории с их ID'ами в quotes.sqlite3 файлик.

А что такое “(ДАТЫЧО?) история”?



С дураками и сектантами не спорю, истину не ищу.
Ели кому-то правда не нравится, то заранее извиняюсь.

Офлайн

#3 Июль 1, 2015 16:19:24

Tiberium
Зарегистрирован: 2015-06-28
Сообщения: 26
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсер ithappens.me

Rodegast
> Парсер парсит(ДАТЫЧО?) истории с их ID'ами в quotes.sqlite3 файлик.А что такое “(ДАТЫЧО?) история”?
Просто то что я написал “Парсер парсит”, что он ещё умеет делать кроме этого? Тавтология крч

Офлайн

#4 Июль 1, 2015 20:08:35

Rodegast
От: Пятигорск
Зарегистрирован: 2007-12-28
Сообщения: 2731
Репутация: +  183  -
Профиль   Отправить e-mail  

Парсер ithappens.me

Так оно ничего кроме http://ithappens.me/ парсить не умеет? Это не интересно. Такой парсер за полчаса пишется.



С дураками и сектантами не спорю, истину не ищу.
Ели кому-то правда не нравится, то заранее извиняюсь.

Офлайн

#5 Июль 1, 2015 20:16:03

ih
Зарегистрирован: 2015-05-31
Сообщения: 31
Репутация: +  -6  -
Профиль   Отправить e-mail  

Парсер ithappens.me

Парсер не правильно - надо говорить скрапер, а если обходит все страници то краувлер.

Офлайн

#6 Июль 1, 2015 20:41:07

Tiberium
Зарегистрирован: 2015-06-28
Сообщения: 26
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсер ithappens.me

ih
Парсер не правильно - надо говорить скрапер, а если обходит все страници то краувлер.
Синтакси́ческий ана́лиз (жарг. па́рсинг) в лингвистике и информатике — процесс сопоставления линейной последовательности лексем (слов, токенов) естественного или формального языка с его формальной грамматикой.
Всё что угодно, имеющее «синтаксис», поддается автоматическому анализу:
Структурированные данные — данные, языки их описания, оформления и т. д. Например, XML, HTML, CSS, ini-файлы, специализированные конфигурационные файлы и т. п.;
Wikipedia не врёт…

Отредактировано Tiberium (Июль 1, 2015 20:41:34)

Офлайн

#7 Июль 1, 2015 20:41:56

Tiberium
Зарегистрирован: 2015-06-28
Сообщения: 26
Репутация: +  0  -
Профиль   Отправить e-mail  

Парсер ithappens.me

Rodegast
Так оно ничего кроме http://ithappens.me/ парсить не умеет? Это не интересно. Такой парсер за полчаса пишется.
Я новичок, тем более я не сам написал, а лишь изменил там чуть-чуть

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version