pandas - read_csv报错:‘utf-8‘/‘gbk‘ codec can‘t decode byte 0xb1 in position 0:invalid start byte

问题描述

桌面上有个Excel文件,转换为csv文件后,导入jupyter notebook,read_csv报错

‘utf-8’/‘gbk’ codec can’t decode byte 0xb1 in position 0: invalid start byte

原因

Excel文件转换为csv文件后,编码格式为 ANSI ,jupyter notebook/python无法读取。

解决方法

将csv文件编码格式改为UTF-8格式。
首先,查看csv文件是什么编码格式,如果不是UTF-8,修改后重新上传读取。

  1. 如何查看csv文件是什么编码格式?
    选中文件,右键——>打开方式——>记事本,右下角显示编码格式
    在这里插入图片描述

在这里插入图片描述

  1. 如果编码格式不是“UTF-8”,如何修改?
    记事本——>文件——>另存为,选择UTF-8格式
    在这里插入图片描述
import pandas as pd
df = pd.read_csv("XXX.csv")
print(df)

最后,重新导入csv文件,就可以读取数据啦~