Найти - Пользователи
Полная версия: Инструменты для парсинга сайтов и анализа данных
Начало » Data Mining » Инструменты для парсинга сайтов и анализа данных
1 2 3
juve
Добрый день. Мне нужен разработчик на питоне удаленно, для доработки парсера сайтов и извлечения инфы определенной с ресурса. Я конечно может не в той ветке отписываюсь, но прошу простить меня. есть желающие помочь за вознаграждение?
lorien
Вообще не в той ветке :) Лучше создайте отдельный топик в этом разделе или в разделе offtopic, а потом я потру сообщения в этой ветке.
slav0nic
https://pypi.python.org/pypi/bleach HTML-sanitizer (не юзал икод не смотрел, но везде его стали тулить)
http://python-rq.org/ легковесная альтернатива celery под redis
Сервисы
http://www.dominoup.com/
http://www.picloud.com/
из эмулей барузера, появился http://splinter.cobrateam.info/ , правда он больше под тесты
lorien
Про splinter я знал, но не стал указывать пока его. Его кто-нить юзал?
dvs
в компанию Параллельная многозадачность просятся gevent и asyncio+aiohttp
lorien
Давайте краткое описание библиотек и я добавлю их в список.
PanovSergey
Есть еще py-dom-xpath
к сожалению про нее не знаю может кто юзал напишите
https://code.google.com/p/py-dom-xpath/
lorien
> Есть еще py-dom-xpath
> к сожалению про нее не знаю может кто юзал напишите

Какой в ней смысл, если можно использовать lxml для xpath?
PanovSergey
lorien
> Есть еще py-dom-xpath> к сожалению про нее не знаю может кто юзал напишитеКакой в ней смысл, если можно использовать lxml для xpath?
Не знаю давно не развивается, однако pure python
lorien
> однако pure python

Где это может быть важно?
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB