Найти - Пользователи
Полная версия: Вычисления с объектами Pandas. Статистические вычисления на основании полученных данных. Построение графиков и диаграмм.
Начало » Центр помощи » Вычисления с объектами Pandas. Статистические вычисления на основании полученных данных. Построение графиков и диаграмм.
1
DimonSev
ПОМОГИТЕ ПОЖАЛУЙСТА!

Цель: продемонстрировать умение импортировать данные из формата JSON и преобразовать их в подходящий объект Pandas.
Описание задания:
С Портала открытых данных Правительства Москвы в разделе Образование выбрать набор данных Результаты ЕГЭ из раздела Образование в формате JSON
https://data.mos.ru/opendata?categoryId=6&IsActual=true
https://op.mos.ru/EHDWSREST/catalog/export/get?id=1077649
Необходимо:
• Превратить файл в таблицу (датафрейм pandas):
• Вывести медианное значение класса для каждого года по с полями PASSES_OVER_220 и PASSES_UNDER_160. Сохранить полученный результат в переменную mark.
• Построить график.

Результатом практического задания является записная книжка Jupyter Notebook с импортированными данными, определёнными данными медианы и отображёнными в виде таблицы и в виде графика.
Инструменты:
• Интерпретатор языка Python
• Командная строка или терминал
• Текстовый редактор Notepad++
• Интегрированная среда разработки, которая включает в себя:
o редактор программного кода с подсветкой синтаксиса
o отладчик языка Python
o инспектор переменных программного кода
xam1816
 import pandas as pd
import matplotlib.pyplot as plt
df = pd.read_json('data.json', encoding='1251')
years = df["YEAR"].unique()
mark = pd.DataFrame(
    {'year': y,
     'over_220_median': df[df['YEAR'] == y]['PASSES_OVER_220'].median(),
     'under_160_median': df[df['YEAR'] == y]['PASSER_UNDER_160'].median()
     } for y in years)
print(mark)
plt.plot(mark['year'], mark['over_220_median'], ':ro', label='over_220_median')
plt.plot(mark['year'], mark['under_160_median'], ':bo', label='under_160_median')
plt.legend()
plt.show()

>>>

        year  over_220_median  under_160_median
0 2016-2017 13.0 37.0
1 2017-2018 19.0 47.0
2 2018-2019 23.0 53.0
3 2019-2020 24.0 53.0

Process finished with exit code 0
DimonSev
Спасибо большое ДРУГ!
DimonSev
ПОМОГИТЕ ПОЖАЛУЙСТА С ЭТИМ ПОСЛЕДНИМ ЗАДАНИЕМ!

Цель: Формирование навыков написания программы на Python, выполняющей анализ и визуализацию данных.
Описание задания:
1. Создайте Jupyter Notebook.
2. Загрузите в DataFrame данные Titanic из файла titanic.csv, который находится в той же папке, что и Jupyter Notebook.
3. Определите, сколько было на Титанике мужчин, женщин и несовершеннолетних детей?
4. В каких портах Титаник брал пассажиров на борт (признак Embarked) и сколько пассажиров взошло на борт в этих портах?
5. Проверьте гипотезу: действительно ли у пассажиров, путешествующих 3-м классам нет номеров кают?
6. Проверьте предположение, что женщин и детей не было среди путешествующих 3-м классом.
7. Посчитайте процент выживших среди пассажиров кают всех классов?
8. Постройте гистограмму возраста пассажиров Титаника по каждому классу.
Результатом выполнения является файл Jupyter Notebook.
Инструменты:
• Интерпретатор языка Python
• Командная строка или терминал
• Текстовый редактор Notepad++
• Интегрированная среда разработки, которая включает в себя:
o редактор программного кода с подсветкой синтаксиса
o отладчик языка Python
o инспектор переменных программного кода
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB