Найти - Пользователи
Полная версия: Generate Synthetic Data
Начало » Центр помощи » Generate Synthetic Data
1
trusted_brand
Здравствуйте,

У меня 8 переменных и 1000 строк на каждую. Эти переменные в какой-то степени связаны друг с другом и имеют корреляции.
Как я могу сгенерировать еще 100000 строк этих переменных, используя имеющуюся информацию и при этом учитывая корреляции между переменными?

Спасибо.
py.user.next
Похоже, тебе просто нужно найти корреляции, а потом сгенерировать новые данные таким образом, чтобы корреляции сохранились и для них.

trusted_brand
Эти переменные в какой-то степени связаны друг с другом
Всё в этом мире в какой-то степени связано друг с другом.
trusted_brand
py.user.next
Похоже, тебе просто нужно найти корреляции, а потом сгенерировать новые данные таким образом, чтобы корреляции сохранились и для них.
спасибо за ответ.
пока что я cгенерировал нормальное распределение для 1 переменной. Вторая от первой зависит линейно с R^2=0.75 приблизительно.
использовать make regression от sklearn или какие другие варианты?

благодарю.
doza_and
можно найти разложение холесского ковариационной матрицы и при помощи множителя трансформировать вектор нормально распределенных величин с единичной дисперсией.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB