Метод to_numpy в Pandas: преобразование DataFrame в массив Numpy

Pandas Dataframe.to_numpy() — это встроенный метод, который используется для преобразования DataFrame в массив Numpy. DataFrame — это двумерная структура данных, которая может иметь изменяемый размер и представлена в табличной структуре. Чтобы преобразовать эту структуру данных в массив Numpy, мы используем функцию DataFrame.to_numpy().

Тип данных возвращаемого массива будет стандартным типом данных Numpy для всех типов в DataFrame. Например, если тип данных — float32, результирующий тип данных также будет float32.

Синтаксис

Параметры

Функция DataFrame.to_numpy() содержит следующие два параметра:

  1. dtype: используется для указания типа данных, которые мы передаем (пример: строка, целое число).
  2. copy: это логическое значение, и по умолчанию оно принимает False. Гарантирует, что возвращаемое значение не является представлением другого массива.

Возвращаемое значение

Метод to_numpy() возвращает пустой массив.

Функция Pandas DataFrame to_numpy()

Примеры с DataFrame.to_numpy()

Напишем программу, показывающую работу DataFrame.to_numpy().

Пример 1

См. следующий код.

Выход:

В приведенном выше примере мы видим, что мы создали DataFrame с именем data, который содержит данные о годе, месяце и дне. Затем мы преобразовали эти данные в numpy с помощью to_numpy() и получили желаемый результат в виде массива.

Вы можете проверить тип данных массива, используя функцию type().

Выход:

Вы можете видеть, что оба имеют разные типы данных, и функция to_numpy() успешно преобразует DataFrame в массив Numpy.

Пример 2

Напишем программу, показывающую работу DataFrame.to_numpy() с разнородными данными.

См. следующий код.

Выход:

Здесь, в приведенном выше коде, мы видим, что мы создали DataFrame, который содержит отметки о науке и математике. Следует отметить, что оценки науки представлены в целочисленном формате, а оценки математики представлены в десятичном формате. Следовательно, при преобразовании его в массив numpy он принимает значение самого низкого используемого общего типа.

Всегда помните, что при работе с большим количеством данных вы должны сначала очистить данные, чтобы получить высокую точность.

Импорт данных CSV и преобразование их в массив numpy

Чтобы импортировать данные CSV, вы можете использовать метод read_csv(). Он автоматически преобразует данные CSV в DataFrame.

Я импортирую файл show_data.csv. Вы можете назвать его как угодно для вашего удобства. Я назвал его файлом show_data.csv.

В этом примере мы получим данные столбца Title первых пяти строк.

Выход:

Вы можете видеть, что мы получили только название первых пяти шоу в массиве numpy.

Мы также можем передать аргумент dtype в функцию to_numpy().

Выход:

Выходной массив имеет тип данных float.

Итак, для преобразования Pandas DataFrame в массив Numpy полезна функция массива to_numpy().

Оцените статью

Автор статей и разработчик, делюсь знаниями.

Программирование на Python