


Помоги с решением задачи по Python
Получить Dataset (данные).
Сгенерировать численные данные с помощью генератора случайных чисел. Числа – целые, диапазон: от -10000 до 10000; количество чисел – 1000. Сформировать объект Series.
Рассчитать стандартные числовые характеристики для набора данных Series
- определить минимальное значений
- определить количество повторяющихся значений
- определить максимальное значение
- определить сумму чисел
- определить среднеквадратическое отклонение
Результирующие данные вывести в консоль с пояснениями. При выполнении данного задания можно использовать все стандартные функции Python.
Визуализировать данные с помощью стандартных библиотек по заданным критериям
- построить линейный график
- построить гистограмму (прямоугольную), округлив значения набора данных до сотен. Округление выполнить по математическому правилу.
Сформировать Dataframe из данных Series и добавить к этим данным следующие столбцы
- столбец, содержащий отсортированные значения исходного Series по возрастанию
- столбец, содержащий отсортированные значения исходного Series по убыванию
Визуализировать данные, полученные в результате промежуточного анализа (вычислений)
- на одном plt построить два линейных графика: отсортированных значений по возрастанию и убыванию
Для генерации набора данных Series, состоящего из 1000 случайных целых чисел в диапазоне от -10000 до 10000, можно воспользоваться модулем random в Python. Для этого нужно импортировать модуль random и использовать функцию randint() для генерации случайных целых чисел. Затем создать объект Series из сгенерированных чисел с помощью функции pd.Series() из библиотеки Pandas.
Пример кода для генерации набора данных Series:
import random
import pandas as pd
# Генерация 1000 случайных целых чисел в диапазоне от -10000 до 10000
random_numbers = [random.randint(-10000, 10000) for _ in range(1000)]
# Создание объекта Series из сгенерированных чисел
data_series = pd.Series(random_numbers)
Для расчета стандартных числовых характеристик для набора данных Series можно воспользоваться методами объекта Series из библиотеки Pandas. Например, для определения минимального значения можно использовать метод min(), для определения максимального значения - метод max(), для определения суммы чисел - метод sum(), для определения среднеквадратического отклонения - метод std(). Для определения количества повторяющихся значений можно использовать метод value_counts().
Пример кода для расчета стандартных числовых характеристик:
# Определение минимального значения
min_value = data_series.min()
# Определение максимального значения
max_value = data_series.max()
# Определение суммы чисел
sum_value = data_series.sum()
# Определение среднеквадратического отклонения
std_value = data_series.std()
# Определение количества повторяющихся значений
value_counts = data_series.value_counts()
Для визуализации данных можно воспользоваться библиотеками Matplotlib и Seaborn. Для построения линейного графика можно использовать функцию plot() из библиотеки Matplotlib, для построения гистограммы - функцию hist() из той же библиотеки. Для округления значений набора данных до сотен можно воспользоваться функцией round().
Пример кода для визуализации данных:
import matplotlib.pyplot as plt
import seaborn as sns
# Построение линейного графика
plt.plot(data_series.sort_values().values, label='Отсортированные значения по возрастанию')
plt.plot(data_series.sort_values(ascending=False).values, label='Отсортированные значения по убыванию')
plt.legend()
plt.show()
# Построение гистограммы
sns.histplot(round(data_series, -2), bins=range(-10000, 10001, 100))
plt.show()
Для создания DataFrame из данных Series можно воспользоваться функцией pd.DataFrame(). Для добавления столбцов, содержащих отсортированные значения исходного Series по возрастанию и убыванию, можно использовать методы sort_values() и sort_values(ascending=False) соответственно.
Пример кода для создания DataFrame и добавления столбцов:
# Создание DataFrame из данных Series
data_df = pd.DataFrame(data_series, columns=['Числа'])
# Добавление столбца с отсортированными значениями по возрастанию
data_df['Отсортированные значения по возрастанию'] = data_series.sort_values().values
# Добавление столбца с отсортированными значениями по убыванию
data_df['Отсортированные значения по убыванию'] = data_series.sort_values(ascending=False).values
После этого можно визуализировать данные, полученные в результате промежуточного анализа, с помощью тех же функций plot() и hist() из библиотеки Matplotlib и Seaborn соответственно.