Метод DataFrame.to_json() в Pandas — фрейм данных в JSON

Метод DataFrame.to_json() в Pandas преобразует фрейм данных в строку JSON. Это может быть полезно, когда вам нужно сохранить или передать свой DataFrame в формате JSON, который является упрощенным форматом обмена данными.

Синтаксис

Параметры

  • path_or_buf: путь к файлу или объект. Результат возвращается в виде строки, если путь не указан. Параметр является необязательным.
  • orient: указание ожидаемого формата строки JSON. Параметр является обязательным.
  • Series
    • по умолчанию ‘index’
    • допустимые значения: {‘split’,’records’,’index’,’table’}
  • DataFrame
    • по умолчанию ‘columns’.
    • допустимые значения: {‘split’,’records’,’index’,’columns’,’values’,’table’}
  • Формат строки JSON
    • ‘split’: словарь типа {‘index’ -> [index], ‘columns’ -> [columns], ‘data’ -> [values]}
    • ‘records’: список типа [{столбец -> значение}, …, {столбец -> значение}]
    • ‘index’: словарь типа {index -> {column -> value}}
    • ‘columns’: словарь типа {column -> {index -> value}}
    • ‘values’: просто массив значений.
    • ‘table’: словарь, подобный {‘schema’: {schema}, ‘data’: {data}}, описывающий данные, а компонент данных, подобный orient=’records’.
  • date_format: единица времени для кодирования управления отметкой времени и точностью ISO8601. Один из ‘s’, ‘ms’, ‘us’, ‘ns’ для секунды, миллисекунды, микросекунды и наносекунды соответственно. Параметр является необязательным.
  • default_handler: обработчик для вызова, если объект не может быть преобразован в подходящий формат для JSON. Должен получить один аргумент, который является объектом для преобразования и возврата сериализуемого объекта. Этот параметр является необязательным.
  • lines: если ‘orient’ — это ‘records’, напишите в формате json с разделителями. Будет показано ValueError, если неправильный ‘orient’, поскольку другие не похожи на списки. Параметр является необязательным.
  • compression: строка, представляющая сжатие в выходном файле, используется только в том случае, если первым аргументом является имя файла. По умолчанию сжатие определяется по имени файла. Этот параметр является необязательным.
  • index: следует ли включать значения индекса в строку JSON? Отсутствие индекса (index=False) поддерживается только в том случае, если orient ‘split’ или ‘table’. Этот параметр является необязательным.

Возвращаемое значение

Если path_or_buf имеет значение None, он возвращает результирующий формат json в виде строки. В противном случае возвращает None.

Примеры программ с методом to_json()

Пример 1: Простой пример кода

Первым шагом будет создание DataFrame.

Выход

Давайте конвертируем DataFrame в JSON, используя функцию to_json().

Выход

Пример 2: orient = ‘columns’

Выход

Пример 3: orient = ’table’

Выход

В зависимости от orient=’table’, если DataFrame с литеральным именем индекса index записывается с помощью to_json(), последующая операция чтения неправильно установит для имени индекса значение None.

Это связано с тем, что DataFrame также использует индекс .to_json() для обозначения отсутствующего имени индекса, и последующая операция read_json() не может их различить. Такое же ограничение встречается с MultiIndex и любыми именами, начинающимися с ‘level_’.

Пример 4: orient = ’values’

Выход

Пример 5: orient = ’index’

Выход

Пример 6: orient = ’records’

См. следующий код.

Выход

Пример 7: orient = ‘split’

См. следующий код.

Выход

Оцените статью

Автор статей и разработчик, делюсь знаниями.

Программирование на Python