Метод Pandas unique() — описание и примеры

Метод Pandas unique() имеет преимущество перед numpy.unique, поскольку здесь мы также можем иметь значения NA, и она сравнительно быстрее. Функция unique() основана на хеш-таблице. Уникальные значения возвращаются в порядке их появления в наборе данных.

Что такое функция Series unique() в Pandas?

Функция Pandas unique() извлекает уникальные данные из набора данных. Метод unique() не принимает никаких параметров и возвращает пустой массив уникальных значений в этом конкретном столбце.

Когда мы много раз анализируем набор данных, и нам нужно, чтобы уникальные данные решали проблемы такого типа, мы используем метод Pandas unique(), который возвращает уникальные данные из заданного набора данных.

Синтаксис

Параметры

Функция unique() не принимает никаких параметров, но ее следует применять к одномерному массиву.

Возвращаемое значение

Функция unique() возвращает массив уникальных значений в этом конкретном столбце.

Возвращаемое значение может быть:

  1. Index: когда вход является индексом.
  2. Categorical: когда вход является категориальным типом.
  3. ndarray: когда в качестве входных данных используется Series/ndarray.

Пример

Метод Pandas.Series.unique в Python

  • Напишем программу, показывающую работу метода unique() в Python.

Выход:

В этом примере мы видим, что мы пытались найти все уникальные элементы столбца «Name». Здесь мы видим, что Arun повторяется в столбце дважды; следовательно, с помощью функции unique() мы извлекли только уникальные имена.

  • Напишем программу, которая использует unique() для элементов списка и возвращает уникальные элементы из этого списка.

В этом примере мы будем использовать серию Pandas и находить уникальные предметы из последовательности.

Выход:

В этом коде мы напечатали все уникальные элементы серии.

Неупорядоченный категориальный список

Если наш ввод является неупорядоченным категориальным типом dtype, мы получим следующий вывод.

Выход:

Упорядоченный категориальный список

Если наш ввод является упорядоченным категориальным типом dtype, мы получим следующий вывод.

Выход:

Массив кортежей

Давайте передадим массив кортежей функции pd.unique() и посмотрим на результат.

Выход:

В этом примере мы передали(‘y’, ‘x’) два раза, но в выводе отображается только один раз. Это означает, что функция pd.unique() отфильтровала повторяющийся кортеж. Помните одну вещь: метод unique() работает только с сериями, а не с DataFrames.

Если вы вызовете метод unique() для DataFrame, он выдаст следующую ошибку.

Объект «DataFrame» не имеет атрибута «уникальный».

Pandas unique() с NaN и None

Метод pd.unique() включает значение NULL, None или NaN в качестве уникального значения.

Если вы еще не установили numpy, установите и импортируйте numpy в файл.

Выход:

В этом примере мы взяли значения np.nan два раза, но на выходе они возвращаются только один раз.

Оцените статью

Автор статей и разработчик, делюсь знаниями.

Программирование на Python