[awk] awk, gawk에서 유니코드

참조자료: AWK information

awk는 unicode를 지원하지 않는다.
gawk는 unicode를 지원한다.
gawk에서 utf-8을 처리하기 위해서는 다음과 같이 gawk 앞에 LC_CTYPE=UTF-8을 설정하면 된다.


# 아래는 한글 자모가 포함된 문자열을 출력한다. 

# 입력은 당연히 utf-8 문자열이어야 한다. 
LC_CTYPE=UTF-8  gawk ‘{ if ($0 ~ /[ㄱ~ㅎㅏ-ㅣ]/) print $0; }’

댓글

이 블로그의 인기 게시물

utf-8과 utf8