[awk] awk, gawk에서 유니코드
참조자료: AWK information
awk는 unicode를 지원하지 않는다.
gawk는 unicode를 지원한다.
gawk에서 utf-8을 처리하기 위해서는 다음과 같이 gawk 앞에 LC_CTYPE=UTF-8을 설정하면 된다.
# 아래는 한글 자모가 포함된 문자열을 출력한다.
# 입력은 당연히 utf-8 문자열이어야 한다.
LC_CTYPE=UTF-8 gawk ‘{ if ($0 ~ /[ㄱ~ㅎㅏ-ㅣ]/) print $0; }’
awk는 unicode를 지원하지 않는다.
gawk는 unicode를 지원한다.
gawk에서 utf-8을 처리하기 위해서는 다음과 같이 gawk 앞에 LC_CTYPE=UTF-8을 설정하면 된다.
# 아래는 한글 자모가 포함된 문자열을 출력한다.
# 입력은 당연히 utf-8 문자열이어야 한다.
LC_CTYPE=UTF-8 gawk ‘{ if ($0 ~ /[ㄱ~ㅎㅏ-ㅣ]/) print $0; }’
댓글