Форум сайта python.su
857
PEHDOMЕсть “Big data” и есть “Data mining”, вот не надо их путать.
поэтому Биг Датой тут и не пахнет
Отредактировано py.user.next (Янв. 19, 2019 02:49:38)
Офлайн
4
Aleksandr_PhТогда я бы просто посчитал “вручную”:
Да, верно!
Верно!
# from numpy import zeros from random import random def coord2index(coordinates, bounds): index = [] for x, b in zip(coordinates, bounds): if x<b[0] or x>b[-1]: print('Error. Out of bounds.',x,b) return None for i,value in enumerate(b[1:]): if value>=x: index.append(i) break return tuple(index) bounds = [[0,1,2], [0,1,2,3]] data = [] for i in range(10**3): y = random()*bounds[0][-1] x = random()*bounds[1][-1] data.append((y, x, x+y)) shape = tuple(len(b)-1 for b in bounds) summ = zeros(shape, float) num = zeros(shape, int) mean = zeros(shape, float) for d in data: x = d[:-1] v = d[-1] index_tuple = coord2index(x,bounds) summ[index_tuple] += v num[index_tuple] += 1 mean.flat = [s/n for s,n in zip(summ.flat, num.flat)] print(mean)
num[index_tuple] # вместо ndarray[i][j] можно писать ndarray[(i,j)], т.е. ndarray[tuple]
# y =1.1, x= 1.2 index_tuple = coord2index([y,x], bounds) v = mean[index_tuple]
Офлайн
0
PEHDOMСпасибо!
Отредактировано Aleksandr_Ph (Янв. 21, 2019 09:55:34)
Офлайн
0
А что если натянуть сову на глобус натянуть задачу на скоринговую модель?
“Клиент” - предмет, параметры клиента - объём, вес, “вероятность отдаст/не отдаст” - это моё время? Получить скоринговую модель, а потом по ней уже и получать предполагаемые времена?
Должно же сработать? Если да, то нет ли у кого-нибудь описания решения простого и понятного 
?
Офлайн