Найти - Пользователи
Полная версия: Пожалуйста помогите с Титаником
Начало » Python для новичков » Пожалуйста помогите с Титаником
1
Vlad171319
Завис на решении этих вопросов:
1. Правда ли, что молодые выживали чаще (с большей вероятностью), чем старики? Пусть “молодые” - те, кто моложе 30, а “старики” - те, кто старше 60.
2. Правда ли, что женщины выживали чаще мужчин?
3. Какое самое популярное имя среди пассажиров Титаника мужского пола?
4. Сравните распределение стоимости билетов у спасенных и у погибших.


Заранее благодарю!
py.user.next
Vlad171319
1. Правда ли, что молодые выживали чаще (с большей вероятностью), чем старики?
Надо определиться, что значит “выживали чаще”. Наверное, надо брать множество молодых и вычислять процент выживших в пределах этого множества. Потом брать множество старых и вычислять процент выживших в пределах этого множества. А потом сравнить эти проценты выживших.

Vlad171319
4. Сравните распределение стоимости билетов у спасенных и у погибших.
Тоже неясно, что за “распределение стоимости”.

А так, для работы с cvs-форматом есть модуль csv. Есть также пакет pandas, но это сторонний модуль, в нём ещё не так просто разобраться, потому что он и сделан так неинтуитивно, и документация там отличается от классической.
Vlad171319
Надо определиться, что значит “выживали чаще”. Наверное, надо брать множество молодых и вычислять
py.user.next
Надо определиться, что значит “выживали чаще”. Наверное, надо брать множество молодых и вычислять процент выживших в пределах этого множества. Потом брать множество старых и вычислять процент выживших в пределах этого множества. А потом сравнить эти проценты выживших.

Тут как я понимаю вопрос про вычисление вероятности. Просто не очень понимаю, как это кодом написать

py.user.next
Тоже неясно, что за “распределение стоимости”.

А так, для работы с cvs-форматом есть модуль csv. Есть также пакет pandas, но это сторонний модуль, в нём ещё не так просто разобраться, потому что он и сделан так неинтуитивно, и документация там отличается от классической.

Как мне кажется, тут идея в том, чтобы отрисовать график, на котором будет отмечено, что ,например, у погибших больше дешевых билетов, а у спасенных больше дорогих.

py.user.next
Vlad171319
Тут как я понимаю вопрос про вычисление вероятности.
Вероятность можно вычислять для разных множеств. Можно взять всех пассажиров, можно взять только группу определённую. Там разные вероятности получатся.
uf4JaiD5
Vlad171319
4. Сравните распределение стоимости билетов у спасенных и у погибших.
Vlad171319
идея в том, чтобы отрисовать график, на котором будет отмечено, что ,например, у погибших больше дешевых билетов, а у спасенных больше дорогих.
См. распределение случайной величины. Оценить матожидание, дисперсию. Будет видно, есть ли там разница, и какая она. Ну как видно, “на глазок”. Если строго, то, видимо, “гипотеза о нормальном распределении”, “гипотеза о равенстве дисперсий/матожиданий”.

Ну и гистограммы можно нарисовать, для красоты.
Vlad171319
Спасибо, uf4JaiD5, задачу уже решил, но не могу Вас не поблагодарить за полезный совет.
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB