Pandas read_csv(): как загрузить файлы CSV

Pandas read_csv() — это встроенная функция, которая используется для загрузки данных CSV или файла значений, разделенных запятыми(csv), в DataFrame. Она также поддерживает опциональную итерацию или разбиение файла на части.

Мы можем импортировать pandas как pd в файл программы, а затем использовать его функции для выполнения необходимых операций. Если вы хотите открыть файл CSV в Pandas, вы можете использовать функцию pd.read_csv() и передать путь к файлу в ее параметр.

Шаги для загрузки данных CSV в Pandas

Pandas DataFrame можно создать с помощью функции pd.read_csv(). Для этого вам необходимо выполнить следующие шаги.

Шаг 1: Подготовьте CSV-файл

Давайте создадим файл с именем data.csv и добавим в него следующие данные.

Первая строка файла — это имена столбцов, а во второй строке — данные для каждого столбца.

Шаг 2: Создайте файл программы и импортируйте pandas

Если вы еще не установили Pandas, установите библиотеку, создайте файл с именем app.py и добавьте первую строку ниже.

Теперь мы можем использовать функцию Pandas read_csv() и передать этой функции локальный CSV-файл.

Шаг 3: Используйте функцию read_csv() для загрузки CSV-файла

Функция read_csv() в Pandas принимает много аргументов. Одним из обязательных аргументов является либо локальный путь к файлу, либо URL-адрес пути к файлу. Синтаксис функции следующий.

Теперь давайте напишем функцию read_csv() для загрузки CSV-файла в нашу программу и создания DataFrame.

Файл data.csv и app.py находятся в одном каталоге. Итак, мы просто написали имя файла, а затем функция возвращает DataFrame данных CSV.

Запустите файл и посмотрите результат.

Выбор подмножества столбцов в DataFrame

А что, если вы хотите выбрать подмножество столбцов из CSV-файла? Например, вы хотите выбрать только столбцы ShowName и Seasons.

См. следующий код.

Выход:

Вам нужно будет убедиться, что имена столбцов, указанные в коде, точно совпадают с именами столбцов в CSV-файле. В противном случае вы получите значения NaN.

Загрузка csv, указав «.» как пропущенные значения

См. следующий код.

Выход:

Загрузка CSV в Pandas, пропустив две верхние строки

В этом примере мы пропустим первые две строки при создании DataFrame из CSV-файла.

Выход:

Как загружать CSV данные в Pandasс помощью read_csv()

Итак, вот как вы можете загружать CSV в Pandas с различными вариантами использования.

Оцените статью

Автор статей и разработчик, делюсь знаниями.

Программирование на Python