Функция Pandas crosstab() в Python и пример кросс-таблицы

Чтобы вычислить кросс-таблицу массивов, используйте метод crosstab() Pandas.

Что такое функция Pandas crosstab()?

Функция Pandas crosstab() используется для вычисления перекрестной таблицы двух или более факторов. Она определена в библиотеке Pandas. По умолчанию он вычисляет таблицу частот всех упомянутых факторов, если только не передан массив или список значений и функций агрегирования.

Синтаксис

Параметры

Метод crosstab() имеет следующие параметры:

  • index: указывает значения для группы в строках. Он принимает массивы, серии, списки или массивы/серии.
  • columns:  сообщает о значениях для группы в столбцах. Он принимает массив, серию, список или массив/серию.
  • values: это массив значений для агрегирования в соответствии с факторами. Требуется указать ggfunc.
  • rownames: Необязательный параметр, он должен соответствовать количеству переданных массивов строк.
  • colnames: Также необязателен,  должен соответствовать количеству переданных массивов столбцов.
  • aggfunc: это необязательная функция. Если эта функция указана, она также требует определения значений.
  • rownames: принимает логические значения и по умолчанию имеет значение False. Он добавляет поля строк/столбцов.
  • margins_name: принимает значения str и по умолчанию установлено значение «All». Это имя строки/столбца, которые будут содержать итоги, когда поля равны True.
  • Dropna: также принимает логическое значение и по умолчанию имеет значение True. Он не включает столбцы, все записи которых являются NaN.
  • normalize: может принимать логическое значение, {all’, ‘index’, ‘columns’} или {0,1}, и по умолчанию его значение равно False. Он нормализуется путем деления значений на сумму значений.
    • Если передано «all» или «True», общие значения будут нормализованы.
    • Если передан «index», он будет нормализоваться для каждой строки.
    • Если переданы «columns», он будет нормализоваться по каждому столбцу.
    • Если для полей задано значение True, это также нормализует значения полей.

Возвращаемое значение

Функция crosstab() возвращает DataFrame, представляющий собой перекрестную таблицу данных.

Функция Pandas crosstab() в Python

Пример программы с pandas.crosstab()

Напишем программу, показывающую работу pandas.crosstab().

Выход:

Здесь, в приведенном выше примере мы выполнили перекрестную таблицу на основе более чем двух факторов.

Оцените статью

Автор статей и разработчик, делюсь знаниями.

Программирование на Python