Чтение файлов JSON с помощью Pandas
Чтобы прочитать файлы, мы используем функцию read_json() и передаём ей путь к файлу JSON, который хотим прочитать. После этого она возвращает «DataFrame» (таблицу со строками и столбцами), в которой хранятся данные. Если мы хотим прочитать файл, расположенный на удалённых серверах, то вместо локального пути мы передаём ссылку на его расположение. Кроме того, read_json()
функция в Pandas предоставляет различные параметры для настройки процесса чтения
Различные способы чтения JSON с помощью Pandas
Существуют различные способы чтения JSON с помощью pandas или чтения файлов JSON с помощью pandas в виде фрейма данных. Здесь мы рассмотрим некоторые наиболее распространённые способы чтения JSON с помощью pandas или чтения файлов JSON с помощью pandas в виде фрейма данных.
- Используя
pd.read_json()
Метод - Используя
JSON
модуль иpd.json_normalize()
Метод - Используя методы pd.Dataframe()
Создание данных
Здесь код использует библиотеку Pandas для создания фрейма данных из вложенного словаря с именем data
, где ключи «Один» и «Два» соответствуют столбцам. Каждый столбец содержит значения, связанные с числовыми индексами
import pandas as pd
data = {
"One": {
"0": 60,
"1": 60,
"2": 60,
"3": 45,
"4": 45,
"5": 60
},
"Two": {
"0": 110,
"1": 117,
"2": 103,
"3": 109,
"4": 117,
"5": 102
}
}
Читать JSON с помощью Pandas pd.read_json()
Метод
В этом примере кода используется `pd.read_json()` для создания фрейма данных из строки JSON, полученной с помощью `json.dumps()`. Параметр ‘orient’ установлен в значение ‘index’ для правильного выравнивания данных. Наконец, он выводит полученный фрейм данных.
import pandas as pd
df_read_json = pd.read_json(json.dumps(data), orient='index')
print("DataFrame using pd.read_json() method:")
print(df_read_json)
Вывод
DataFrame using pd.read_json() method:
0 1 2 3 4 5
One 60 60 60 45 45 60
Two 110 117 103 109 117 102
Используя JSON
модуль и pd.json_normalize()
Метод
В этом примере кода словарь Python «data» преобразуется в строку JSON, а затем нормализуется в DataFrame с помощью метода `pd.json_normalize()` в Pandas. Наконец, он выводит полученный DataFrame, представляющий вложенную структуру JSON.
import pandas as pd
import json
json_data = json.dumps(data)
df_json_normalize = pd.json_normalize(json.loads(json_data))
print("\nDataFrame using JSON module and pd.json_normalize() method:")
print(df_json_normalize)
Вывод
DataFrame using pd.json_normalize() method:
One.0 One.1 One.2 One.3 One.4 One.5 Two.0 Two.1 Two.2 Two.3 \
0 60 60 60 45 45 60 110 117 103 109
Two.4 Two.5
0 117 102
Pandas считывает файл Json в Dataframe, используя методы ps.Dataframe()
Здесь мы создадим данные JSON, а затем создадим на их основе фрейм данных с помощью методов pd.Dataframe()
import pandas as pd
df = pd.DataFrame(data)
print(df)
Вывод
One Two
0 60 110
1 60 117
2 60 103
3 45 109
4 45 117
5 60 102