Не всегда можно получить набор данных в формате CSV. Поэтому Pandas предоставляет нам функции для преобразования наборов данных в других форматах в фрейм данных. Файл Excel имеет формат «.xlsx».
Прежде чем мы начнем, нам нужно установить несколько библиотек.
pip install pandas
pip install xlrd
Теперь мы можем погрузиться в код.
Пример 1: Прочитайте файл Excel.
import pandas as pd
df = pd.read_excel("sample.xlsx")
print(df)
Пример 2: Чтобы выбрать конкретный столбец, мы можем передать параметр «index_col».
import pandas as pd
df = pd.read_excel("sample.xlsx", index_col = 0)
print(df)
Пример 3: Если вам не нравится первоначальное название столбцов, вы можете изменить его на индексы с помощью параметра «заголовок».
import pandas as pd
df = pd.read_excel('sample.xlsx', header = None)
print(df)
Пример 4: Если вы хотите изменить тип данных конкретного столбца, вы можете сделать это с помощью параметра «dtype».
import pandas as pd
df = pd.read_excel('sample.xlsx', dtype = {"Products": str, "Price":float})
print(df)
Пример 5: Если у вас есть неизвестные значения, вы можете обработать их с помощью параметра «na_values». Он преобразует указанные неизвестные значения в «NaN»
import pandas as pd
df = pd.read_excel('sample.xlsx', na_values =['item1', 'item2'])
print(df)