Форум сайта python.su
0
Завис на решении этих вопросов:
1. Правда ли, что молодые выживали чаще (с большей вероятностью), чем старики? Пусть “молодые” - те, кто моложе 30, а “старики” - те, кто старше 60.
2. Правда ли, что женщины выживали чаще мужчин?
3. Какое самое популярное имя среди пассажиров Титаника мужского пола?
4. Сравните распределение стоимости билетов у спасенных и у погибших.
Заранее благодарю!
Прикреплённый файлы:
titanic_train.csv (59,8 KБ)
Офлайн
857
Vlad171319Надо определиться, что значит “выживали чаще”. Наверное, надо брать множество молодых и вычислять процент выживших в пределах этого множества. Потом брать множество старых и вычислять процент выживших в пределах этого множества. А потом сравнить эти проценты выживших.
1. Правда ли, что молодые выживали чаще (с большей вероятностью), чем старики?
Vlad171319Тоже неясно, что за “распределение стоимости”.
4. Сравните распределение стоимости билетов у спасенных и у погибших.
Отредактировано py.user.next (Фев. 11, 2019 09:13:57)
Офлайн
0
Надо определиться, что значит “выживали чаще”. Наверное, надо брать множество молодых и вычислять
py.user.next
Надо определиться, что значит “выживали чаще”. Наверное, надо брать множество молодых и вычислять процент выживших в пределах этого множества. Потом брать множество старых и вычислять процент выживших в пределах этого множества. А потом сравнить эти проценты выживших.
py.user.next
Тоже неясно, что за “распределение стоимости”.
А так, для работы с cvs-форматом есть модуль csv. Есть также пакет pandas, но это сторонний модуль, в нём ещё не так просто разобраться, потому что он и сделан так неинтуитивно, и документация там отличается от классической.
Офлайн
857
Vlad171319Вероятность можно вычислять для разных множеств. Можно взять всех пассажиров, можно взять только группу определённую. Там разные вероятности получатся.
Тут как я понимаю вопрос про вычисление вероятности.
Офлайн
4
Vlad171319
4. Сравните распределение стоимости билетов у спасенных и у погибших.
Vlad171319См. распределение случайной величины. Оценить матожидание, дисперсию. Будет видно, есть ли там разница, и какая она. Ну как видно, “на глазок”. Если строго, то, видимо, “гипотеза о нормальном распределении”, “гипотеза о равенстве дисперсий/матожиданий”.
идея в том, чтобы отрисовать график, на котором будет отмечено, что ,например, у погибших больше дешевых билетов, а у спасенных больше дорогих.
Офлайн
0
Спасибо, uf4JaiD5, задачу уже решил, но не могу Вас не поблагодарить за полезный совет.
Офлайн