Уведомления

Группа в Telegram: @pythonsu

#1 Фев. 19, 2019 01:07:44

trusted_brand
Зарегистрирован: 2019-01-28
Сообщения: 3
Репутация: +  0  -
Профиль   Отправить e-mail  

Generate Synthetic Data

Здравствуйте,

У меня 8 переменных и 1000 строк на каждую. Эти переменные в какой-то степени связаны друг с другом и имеют корреляции.
Как я могу сгенерировать еще 100000 строк этих переменных, используя имеющуюся информацию и при этом учитывая корреляции между переменными?

Спасибо.

Офлайн

#2 Фев. 19, 2019 02:19:30

py.user.next
От:
Зарегистрирован: 2010-04-29
Сообщения: 9897
Репутация: +  855  -
Профиль   Отправить e-mail  

Generate Synthetic Data

Похоже, тебе просто нужно найти корреляции, а потом сгенерировать новые данные таким образом, чтобы корреляции сохранились и для них.

trusted_brand
Эти переменные в какой-то степени связаны друг с другом
Всё в этом мире в какой-то степени связано друг с другом.



Офлайн

#3 Фев. 19, 2019 02:51:54

trusted_brand
Зарегистрирован: 2019-01-28
Сообщения: 3
Репутация: +  0  -
Профиль   Отправить e-mail  

Generate Synthetic Data

py.user.next
Похоже, тебе просто нужно найти корреляции, а потом сгенерировать новые данные таким образом, чтобы корреляции сохранились и для них.
спасибо за ответ.
пока что я cгенерировал нормальное распределение для 1 переменной. Вторая от первой зависит линейно с R^2=0.75 приблизительно.
использовать make regression от sklearn или какие другие варианты?

благодарю.

Офлайн

#4 Фев. 19, 2019 07:26:42

doza_and
От:
Зарегистрирован: 2010-08-15
Сообщения: 4138
Репутация: +  252  -
Профиль   Отправить e-mail  

Generate Synthetic Data

можно найти разложение холесского ковариационной матрицы и при помощи множителя трансформировать вектор нормально распределенных величин с единичной дисперсией.



Офлайн

Board footer

Модераторировать

Powered by DjangoBB

Lo-Fi Version