pd.read_csv 로 아래와 같이 파일을 읽어들이는데 아래와 같은 오류가 떠서 당황.
[입력코드]
cctv_seoul = pd.read_csv('../data/01. 서울시CCTV설치운영현황(자치구)_년도별_210731기준__20210901.csv')
[결과]
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 0: invalid start byte
이는 판다스의 read_csv가 utf-8인코딩을 지원해주지 않아서이므로 encoding 옵션을 cp949로 조절.
하지만 동일한 오류 발생
[입력코드]
cctv_seoul = pd.read_csv('../data/01. 서울시CCTV설치운영현황(자치구)_년도별_210731기준__20210901.csv',encoding='cp949')
[결과]
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbc in position 12: invalid start byte
현재 읽어 들이는 경로를 "../" 로 시작하게끔 되어 있는데 경로를 풀네임으로 바꿔서 encoding = cp949를 넣으니 성공
[입력코드]
cctv_seoul = pd.read_csv('C:/Users/hjk72/Downloads/저장용/data/01. 서울시CCTV설치운영현황(자치구)_년도별_210731기준__20210901.csv',
encoding='cp949')
반응형
댓글