Импорт файла Excel с помощью Pandas

Breadcrumbs

Не всегда можно получить набор данных в формате CSV. Поэтому Pandas предоставляет нам функции для преобразования наборов данных в других форматах в фрейм данных. Файл Excel имеет формат «.xlsx».

Прежде чем мы начнем, нам нужно установить несколько библиотек.

pip install pandas
pip install xlrd

Теперь мы можем погрузиться в код.

Пример 1: Прочитайте файл Excel.

import pandas as pd 
  
df = pd.read_excel("sample.xlsx") 
print(df)

Пример 2: Чтобы выбрать конкретный столбец, мы можем передать параметр «index_col».

import pandas as pd 

df = pd.read_excel("sample.xlsx", index_col = 0)   
  
print(df)

Пример 3: Если вам не нравится первоначальное название столбцов, вы можете изменить его на индексы с помощью параметра «заголовок».

import pandas as pd 
  
df = pd.read_excel('sample.xlsx', header = None) 
print(df)

Пример 4: Если вы хотите изменить тип данных конкретного столбца, вы можете сделать это с помощью параметра «dtype».

import pandas as pd 
  
df = pd.read_excel('sample.xlsx', dtype = {"Products": str, "Price":float}) 
print(df)

Пример 5: Если у вас есть неизвестные значения, вы можете обработать их с помощью параметра «na_values». Он преобразует указанные неизвестные значения в «NaN»

import pandas as pd 

df = pd.read_excel('sample.xlsx', na_values =['item1',  'item2']) 
print(df)

Информация о материале: Категория: Data Sciense; Просмотров: 36