Форум сайта python.su
Необходимо собрать информацию об административных единицах и населенных пунктах для конкретной страны из открытых источников, включая Википедию и Google Maps. На каждой странице админ. единицы в Википедии есть блок, где находится информация о названии, населении, высоте над уровнем моря, площади и т.д. – набор данных может отличаться в зависимости от уровня админ. единицы в иерархи админ. деления страны.
Функционал сборщика уже реализован, но должен быть расширен в зависимости от количества свойств в блоке со сводными данными на страницах Википедии. В отдельном документе изложено как адаптировать скрипты под анализ новой страны и сбора данных по ней. Последовательно описаны шаги для удобного подключения новой страны в систему, код парсера описан по методам.
В проекте используются инструменты:
python 3.6
mongodb 3.4
Flask 0.12
Ожидаемый результат – таблица, содержащая структурированныеданные по всем административным единицам страны, приведенные к единому формату (для нетекстовых значений: площадь – в квадратных километрах, высота над уровнем
моря – в метрах и т.п.). Результирующий документ должен включать в себя максимально точные значения (названия без «шума», полную административную структуру страны, дополнительные свойства местоположения и указатели на
источники).
Если вас заинтересовал этот проект, то пожалуйста укажите желаемый уровень оплаты.
Офлайн