Pandas concat() в Python: объединение DataFrame с примерами

Чтобы выполнять операции конкатенации в Pandas DataFrame, используйте функцию Pandas concat(), которая выполняет всю тяжелую работу по выполнению операций конкатенации вместе с осью.

Что такое функция concat() в Pandas?

Pandas concat() — это встроенная функция, которая используется в Python для объединения объектов DataFrame вдоль определенной оси с дополнительной логикой набора, которая может быть объединением или пересечением по другим осям. Метод concat() принимает до пяти параметров и возвращает объединенные объекты.

Синтаксис

Параметры

Функция concat() имеет пять следующих параметров.

  • Первый параметр — это objs, представляющий собой последовательность или сопоставление объектов серии, DataFrame или Panel.
  • Второй параметр — это axis(0,1). Это ось, на которой выполняется конкатенация на всем протяжении.
  • Третий параметр — join. Он может иметь 2 значения: «inner» или «outer». По умолчанию это «outer». Это в основном для того, как обрабатывать индексы на других осях.
  • Четвертый параметр — join_axes — перечисляет все объекты индекса.
  • Пятый параметр — ignore_index. Он имеет логический тип, и значение, установленное по умолчанию, равно false. Если для него установлено значение true, то он не использует значения индекса на оси конкатенации. Ось будет помечена как 0,1,2,…,n-1.

Возвращаемое значение

Функция concat() возвращает объект типа objs. Например, когда мы объединяем все ряды, где ось = 0, вместе с индексом, он возвращает ряды.

Примеры программ на Pandas concat()

Метод Pandas concat() в Python

Программа, показывающая работу метода concat() в Python

Выход:

В приведенном выше примере мы видели, что мы создали два фрейма данных, содержащих данные разных студентов, и с помощью concat() мы объединили данные обоих фреймов данных и получили желаемый результат в виде одного DataFrame.

Программа для назначения ключей отдельным фреймам данных после их объединения

Выход:

В приведенном выше примере мы видим, что в одних и тех же данных учащихся мы упомянули ключи как set1 и set2, чтобы пользователи знали, что они являются частью двух разных фреймов данных, и чтобы они поняли, откуда набор данных начинается индивидуально. Индекс результата дублируется; каждый индекс повторяется.

Если результирующий объект должен следовать своей индексации, установите для ignore_index значение True.

Выход:

Обратите внимание, индекс полностью меняется, и ключи также переопределяются.

Если необходимо добавить два объекта по оси = 1, будут добавлены новые столбцы.

Выход:

Вы можете видеть, что мы добавили два фрейма данных со стороны столбца, потому что мы установили ось = 1.

Объединение с помощью df.append()

Чтобы объединить два DataFrame без использования метода concat(), используйте метод DataFrame.append(). Мы можем объединить два DataFrame, используя метод Pandas DataFrame append(). Метод append() используется для добавления строк одного DataFrame в конец другого DataFrame.

Выход:

Полезным ярлыком для concat являются методы добавления экземпляра в Series и DataFrame. Эти методы предшествовали concat. Они объединяются по оси = 0, а именно по индексу. Метод append() также может принимать несколько объектов.

Назначение ключей объединенным индексам DataFrame

Чтобы назначить ключи объединенному фрейму данных, передайте параметр keys при объединении фрейма данных методу concat().

См. следующий код, в котором мы назначаем ключи конкатенированным индексам DataFrame.

Выход:

Вы можете видеть, что мы назначили ключи X и Y объединенному фрейму данных df3.

Игнорирование исходных объектов DataFrame в конкатенации

Чтобы игнорировать исходные объекты DataFrame в concat, передайте параметру ignore_index значение True, и вы получите желаемый результат.

См. следующий код.

Выход:

Метод concat() полезен, когда индексы в исходных объектах не имеют особого смысла. Таким образом, мы можем игнорировать их и назначать индексы по умолчанию для окончательного выходного DataFrame.

Заключение

При объединении DataFrame в Pandas у вас может быть несколько целей. Например, вы можете захотеть «добавить» к ним данные в конец фрейма. Или, может быть, вы хотите добавить больше столбцов, как в нашем случае.

Существует четыре основных способа объединения Pandas DataFrame: конкатенация, объединение, слияние и добавление. В этом руководстве мы рассмотрели метод Pandas concat() для выполнения конкатенации.

Оцените статью

Автор статей и разработчик, делюсь знаниями.

Программирование на Python