Форум сайта python.su
0
ПОМОГИТЕ ПОЖАЛУЙСТА!
Цель: продемонстрировать умение импортировать данные из формата JSON и преобразовать их в подходящий объект Pandas.
Описание задания:
С Портала открытых данных Правительства Москвы в разделе Образование выбрать набор данных Результаты ЕГЭ из раздела Образование в формате JSON
https://data.mos.ru/opendata?categoryId=6&IsActual=true
https://op.mos.ru/EHDWSREST/catalog/export/get?id=1077649
Необходимо:
• Превратить файл в таблицу (датафрейм pandas):
• Вывести медианное значение класса для каждого года по с полями PASSES_OVER_220 и PASSES_UNDER_160. Сохранить полученный результат в переменную mark.
• Построить график.
Результатом практического задания является записная книжка Jupyter Notebook с импортированными данными, определёнными данными медианы и отображёнными в виде таблицы и в виде графика.
Инструменты:
• Интерпретатор языка Python
• Командная строка или терминал
• Текстовый редактор Notepad++
• Интегрированная среда разработки, которая включает в себя:
o редактор программного кода с подсветкой синтаксиса
o отладчик языка Python
o инспектор переменных программного кода
Офлайн
124
import pandas as pd import matplotlib.pyplot as plt df = pd.read_json('data.json', encoding='1251') years = df["YEAR"].unique() mark = pd.DataFrame( {'year': y, 'over_220_median': df[df['YEAR'] == y]['PASSES_OVER_220'].median(), 'under_160_median': df[df['YEAR'] == y]['PASSER_UNDER_160'].median() } for y in years) print(mark) plt.plot(mark['year'], mark['over_220_median'], ':ro', label='over_220_median') plt.plot(mark['year'], mark['under_160_median'], ':bo', label='under_160_median') plt.legend() plt.show()
year over_220_median under_160_median
0 2016-2017 13.0 37.0
1 2017-2018 19.0 47.0
2 2018-2019 23.0 53.0
3 2019-2020 24.0 53.0
Process finished with exit code 0
Офлайн
0
Спасибо большое ДРУГ!
Офлайн
0
ПОМОГИТЕ ПОЖАЛУЙСТА С ЭТИМ ПОСЛЕДНИМ ЗАДАНИЕМ!
Цель: Формирование навыков написания программы на Python, выполняющей анализ и визуализацию данных.
Описание задания:
1. Создайте Jupyter Notebook.
2. Загрузите в DataFrame данные Titanic из файла titanic.csv, который находится в той же папке, что и Jupyter Notebook.
3. Определите, сколько было на Титанике мужчин, женщин и несовершеннолетних детей?
4. В каких портах Титаник брал пассажиров на борт (признак Embarked) и сколько пассажиров взошло на борт в этих портах?
5. Проверьте гипотезу: действительно ли у пассажиров, путешествующих 3-м классам нет номеров кают?
6. Проверьте предположение, что женщин и детей не было среди путешествующих 3-м классом.
7. Посчитайте процент выживших среди пассажиров кают всех классов?
8. Постройте гистограмму возраста пассажиров Титаника по каждому классу.
Результатом выполнения является файл Jupyter Notebook.
Инструменты:
• Интерпретатор языка Python
• Командная строка или терминал
• Текстовый редактор Notepad++
• Интегрированная среда разработки, которая включает в себя:
o редактор программного кода с подсветкой синтаксиса
o отладчик языка Python
o инспектор переменных программного кода
Прикреплённый файлы:
titanic.csv (58,9 KБ)
Офлайн