본문 바로가기
python/오류사항

'utf-8' codec can't decode byte 0xbc in position 12: invalid start byte

by GJ999 2022. 1. 29.

pd.read_csv 로 아래와 같이 파일을 읽어들이는데 아래와 같은 오류가 떠서 당황.

 

[입력코드]

cctv_seoul = pd.read_csv('../data/01. 서울시CCTV설치운영현황(자치구)_년도별_210731기준__20210901.csv')

[결과]

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xa1 in position 0: invalid start byte

 

이는 판다스의 read_csvutf-8인코딩을 지원해주지 않아서이므로 encoding 옵션을 cp949로 조절.

하지만 동일한 오류 발생

[입력코드]

cctv_seoul = pd.read_csv('../data/01. 서울시CCTV설치운영현황(자치구)_년도별_210731기준__20210901.csv',encoding='cp949')

[결과]

 

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbc in position 12: invalid start byte

 

현재 읽어 들이는 경로를 "../" 로 시작하게끔 되어 있는데 경로를 풀네임으로 바꿔서 encoding = cp949를 넣으니 성공

[입력코드]

cctv_seoul = pd.read_csv('C:/Users/hjk72/Downloads/저장용/data/01. 서울시CCTV설치운영현황(자치구)_년도별_210731기준__20210901.csv', 
                         encoding='cp949')

 

반응형

댓글