Форум сайта python.su
Коллеги, здравствуйте! Мой вопрос может показаться вам глупым, но я новичок в Питон и пока мало что в этом понимаю.
Сейчас хочу решить для себя одну аналитическую задачку, однако пока не совсем представляю как именно. Пока я буду искать пути ее решения, надеюсь, кто-то из экспертов мне что-нибудь здесь подскажет.
У меня есть ряд чисел- значений по 1000 отдельным людям. То есть в экселе это длинный стоблец из 1000 чисел. И есть еще один- подобный, но с другими числами.
Мне необходимо:
а) Посчитать корреляции между ними
б) Вывести графики их распределений
Использую Питон 3.6 на Винде. Я так понимаю, мне необходимо скачать библиотеки для мат анализа и для графики? И каким-то образом записать эти числа в коде так, чтобы каждое из них было отдельным значением?
Заранее спасибо за помощь!
Офлайн
Это какая-то учебная задача по Питону?
Просто если это прикладная задача и эти числа уже есть в экселе, то там же всё это можно быстро проделать.
Для корелляции Пирсона в Либреофисе есть функция КВПИРСОН, скорее всего в экселе она такая же. Да и графики там легко строить.
Если же всё это требуется именно в Питоне сделать, то можно, например, вот эти формулы запрограммировать: https://statpsy.ru/pearson/raschet-pearson/
Для графиков обычно используется библиотека matplotlib (хотя для эстетов есть ещё куча разных, например, seaborn или Plotly).
Офлайн
StriverДа, это учебная задача: обычно считаю и рисую все в СПСС статистик, но в этот раз нужно именно на Питоне.
Это какая-то учебная задача по Питону?Просто если это прикладная задача и эти числа уже есть в экселе, то там же всё это можно быстро проделать. Для корелляции Пирсона в Либреофисе есть функция КВПИРСОН, скорее всего в экселе она такая же. Да и графики там легко строить.Если же всё это требуется именно в Питоне сделать, то можно, например, вот эти формулы запрограммировать: https://statpsy.ru/pearson/raschet-pearson/Для графиков обычно используется библиотека matplotlib (хотя для эстетов есть ещё куча разных, например, seaborn или Plotly).
Офлайн
Не очень понимаю пока, как перенести стоблик чисел из экселя в код, чтобы можно было по нему что-то рассчитыватьНу, с этим немного проще.
import pandas as pd xlbook = pd.ExcelFile("file1.xls") df = xlbook.parse("Лист1")
list_X = df['X'].tolist()
array_X = df['X'].values
Отредактировано Striver (Авг. 14, 2019 15:23:32)
Офлайн
Для статистики в Питоне существует пакет Statsmodels, но всё, что я про него знаю - это только то, что он существует :) , никогда не пользовался.
Офлайн
StriverБольшое спасибо за помощь!
Офлайн