Как создать гистограмму Python в Pandas

Изучая набор данных, вы часто хотите получить быстрое представление о распределении в нем определенных числовых переменных. Стандартный способ визуализации распределения одной числовой переменной — использование гистограммы. Гистограмма делит значения числовой переменной на «ячейки» и подсчитывает несколько наблюдений, попадающих в каждую ячейку.

Визуализируя эти объединенные в бины подсчеты в виде столбцов, мы можем получить очень непосредственное и интуитивное представление о распределении значений внутри переменной. Метод Pandas DataFrame hist() является оболочкой для API-интерфейса matplotlib pyplot.

Что такое функция DataFrame hist() в Pandas?

Pandas DataFrame hist() — это метод-оболочка для API-интерфейса matplotlib pyplot. Метод hist() может быть удобным инструментом для доступа к распределению вероятностей. Функция вызывается для каждой серии в DataFrame, в результате чего получается одна гистограмма на столбец.

Функция hist() используется для создания гистограммы, которая проясняет представление о распределении определенных числовых переменных в наборе данных.

Синтаксис

Параметры

Он имеет следующие параметры.

  1. data: это DataFrame. Это объект Pandas, содержащий данные.
  2. column: принимает строку или последовательности, и, если он передан, он будет использоваться для ограничения данных подмножеством столбцов.
  3. by: Это объект и необязательный параметр. Если пройдено, то используется для формирования гистограмм по отдельным группам.
  4. grid: принимает логические значения и по умолчанию имеет значение True. Параметр grid существует, чтобы указать, показывать ли линии сетки или нет.
  5. xlabelsize: принимает целое число и по умолчанию равно None. Если он указан, он изменяет размер метки по оси x.
  6. xrot: принимает тип данных с плавающей запятой, и по умолчанию это None. Он определяет поворот меток по оси x. Например, значение 90 отображает метки x, повернутые на 90 градусов по часовой стрелке.
  7. ylabelsize: принимает целое число и по умолчанию равно None. Если он указан, он изменяет размер метки по оси Y.
  8. yrot: принимает тип данных с плавающей запятой, и по умолчанию это None. Он определяет поворот меток оси Y. Например, значение 90 отображает метки y, повернутые на 90 градусов по часовой стрелке.
  9. ax: это объект осей Matplotlib. По умолчанию None. Это оси для построения гистограммы.
  10. sharex: принимает логическое значение, и по умолчанию True. Если ax None else False.
  11. sharey: Он также принимает логические значения и по умолчанию имеет значение False. В случае subplots=True он разделяет ось Y и делает некоторые метки оси Y невидимыми.
  12. figsize: требуется кортеж. Размер создаваемой фигуры в дюймах.
  13. layout: это необязательный параметр, который принимает кортеж в качестве входных данных. Кортеж(строки, столбцы) для компоновки гистограмм.
  14. bins: принимает целое число или последовательность, b по умолчанию это 10. Это количество используемых бинов гистограммы. Если задано целое число, вычисляются и возвращаются бины +1 ребро бина.
  15. backend: принимает str, по умолчанию это None. backend для использования вместо backend, указанного в опции plotting.backend.
  16. **kwargs: все остальные аргументы ключевых слов для построения графиков должны быть переданы в matplotlib.pyplot.hist().

Возвращаемое значение

Метод hist() возвращает matplotlib.Axes.Subplot или numpy.ndarray DataFrame.

Пример программы на hist()

Напишите программу, показывающую работу функции hist().

Выход:

Метод Pandas DataFrame hist() в Python

В приведенном выше примере мы создали гистограмму на основе данных, указанных в DataFrame.

Заключение

Pandas DataFrame hist() в Python

Чтобы создать гистограмму, используйте метод Pandas hist(). Вызов метода hist() для Pandas DataFrame вернет гистограммы для всех non-nuisance Series в DataFrame.

Оцените статью

Автор статей и разработчик, делюсь знаниями.

Программирование на Python