Уведомления

Группа в Telegram: @pythonsu

#1 Апрель 4, 2014 19:14:39

PanovSergey
От: Екатеринбург
Зарегистрирован: 2013-12-29
Сообщения: 269
Репутация: +  19  -
Профиль   Адрес электронной почты  

Анализ и разбор данных

Всем привет, если кто делал агрегаторы данных с разных источников прошу отзовитесь и направьте что читать и куда копать. Сам куда не знаю, но есть мало мальское математическое образование буду рад любой помощи заранее спасибо.

Офлайн

#2 Апрель 4, 2014 21:36:41

Singularitty
От:
Зарегистрирован: 2012-02-02
Сообщения: 61
Репутация: +  5  -
Профиль   Отправить e-mail  

Анализ и разбор данных

PanovSergey
а какой источник ? Веб-страницы, rss?
Для сбора данных scrapy или grab, для rss - feedparser мб что-то лучше есть.

Я думаю у тебя тут проблема машинного обучения, а именно кластеризация
Кстати на курсере курс об этом идет (о всем машинном обучении)

https://www.ibm.com/developerworks/ru/library/os-pythonnltk/

Вот еще https://pymorphy2.readthedocs.org/en/latest/ хз в тему он или нет

Офлайн

#3 Апрель 4, 2014 21:39:16

Singularitty
От:
Зарегистрирован: 2012-02-02
Сообщения: 61
Репутация: +  5  -
Профиль   Отправить e-mail  

Офлайн

#4 Апрель 5, 2014 16:44:04

PanovSergey
От: Екатеринбург
Зарегистрирован: 2013-12-29
Сообщения: 269
Репутация: +  19  -
Профиль   Адрес электронной почты  

Анализ и разбор данных

Singularitty
Для сбора данных scrapy или grab, для rss - feedparser мб что-то лучше есть.
Парсить не проблема за ссылки спасибо.

Офлайн

#5 Апрель 5, 2014 18:43:23

Singularitty
От:
Зарегистрирован: 2012-02-02
Сообщения: 61
Репутация: +  5  -
Профиль   Отправить e-mail  

Анализ и разбор данных

PanovSergey
ты про задания подробней расскажи.
Интересно же

Офлайн

#6 Апрель 6, 2014 14:29:51

lorien
От:
Зарегистрирован: 2006-08-20
Сообщения: 755
Репутация: +  37  -
Профиль  

Анализ и разбор данных

> Всем привет, если кто делал агрегаторы данных с разных источников

Что за агрегаторы, что за источники? Я делал агрегаторы, никакой математики не потребовалось :) Опишите подробно какие у вас проблемы, а иначе говорить не о чём.

Офлайн

#7 Апрель 6, 2014 19:11:13

PanovSergey
От: Екатеринбург
Зарегистрирован: 2013-12-29
Сообщения: 269
Репутация: +  19  -
Профиль   Адрес электронной почты  

Анализ и разбор данных

Singularitty
ты про задания подробней расскажи

задача. пусть мы знаем что есть искомые данные, это текст. мы знаем классы к которым они могут относиться, однако данные могут быть представлены произвольно мы хотим определить к какому классу относятся данные и записать их в соответствующую таблицу, мне кажется стандартная задача дата майнинга.

Отредактировано PanovSergey (Апрель 6, 2014 19:12:13)

Офлайн

#8 Апрель 6, 2014 20:45:39

lorien
От:
Зарегистрирован: 2006-08-20
Сообщения: 755
Репутация: +  37  -
Профиль  

Анализ и разбор данных

Могу лишь сказать посмотреть на анализ по Байесу или как-то так, сам я в этой области не работал.
Ещё вот книжка есть хорошая: http://www.books.ru/books/programmiruem-kollektivnyi-razum-586615/ - там даже примеры на питоне

Офлайн

#9 Апрель 6, 2014 23:09:38

py.user.next
От:
Зарегистрирован: 2010-04-29
Сообщения: 9873
Репутация: +  853  -
Профиль   Отправить e-mail  

Анализ и разбор данных

PanovSergey
задача. пусть мы знаем что есть искомые данные, это текст
приведи конкретный пример

lorien
Что за агрегаторы, что за источники? Я делал агрегаторы, никакой математики не потребовалось :)
согласен
возможно, там и не нужна математика вообще

PanovSergey
однако данные могут быть представлены произвольно мы хотим определить к какому классу относятся данные
самое простое - это понять, как ты сам (твой мозг) классифицируешь эти данные
а потом это записать в виде программы



Отредактировано py.user.next (Апрель 6, 2014 23:10:03)

Офлайн

#10 Апрель 8, 2014 14:38:15

lorien
От:
Зарегистрирован: 2006-08-20
Сообщения: 755
Репутация: +  37  -
Профиль  

Анализ и разбор данных

>> задача. пусть мы знаем что есть искомые данные, это текст
> приведи конкретный пример

Так это и есть конкретный пример

> самое простое - это понять, как ты сам (твой мозг) классифицируешь эти данные, а потом это записать в виде программы

Учитывая сложность задачи, ценность подобных советов стремится к нулю.

Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version