[리눅스] 깨진 utf-8 문자 제거하기

깨진 문자가 있으면, python에서 읽기가 난감하다. 깨진 문자를 제거하기 위해서 다음과 같이 iconv를 이용하면 된다.
cat input.txt | iconv -f utf-8 -t utf-8 -c
참조: How to remove non UTF-8 characters from text file

댓글

이 블로그의 인기 게시물

utf-8과 utf8