번체와 간체

이번에 중국어 관련 작업을 잠시 하게 되었는데, 이놈의 중국 코드체계 때문에 며칠 고생을 했네요. 입력은 거의 안하고, 정리된 자료를 가지고 웹작업 및 그래픽 작업들을 해야 하는데, 생판 알지도 못했던 간체 / 번체, 게다가 코드까지..... 아놔~ 까먹얼까봐 미리 정리해 봅니다.

■ 중국어 코드 체계

중국 본토에서는 GB로 시작하는 문자셋, 인코딩을 사용합니다. GB란 Guo-Biao(国标)를 줄여쓴 말로 국가표준이라는 뜻입니다. 

중국어 한자는 표시형태에 따라 크게 2가지로 분류합니다.

  • 간체(Simplified Chinese) : "나라 국" 자를 줄여서 "" 이렇게 간략하게 표시한 형태를 "간체 (Simplified Chinese)" 라 하고 중국 본토에서 많이 쓰입니다.
  • 번체(Traditional Chinese) : 원래 문자의 획수를 모두 그대로 표시하여(나라 국 : ) 사용하는 형태를 의미하며, 대만/홍콩/싱가폴/한국 등에서 사용되는 형태입니다. 일본은 대부분 번체를 사용하지만 간혹 간체처럼 쓰는 한자도 있는데 그게 중국 본토의 간체랑 모양이 틀릴때도 있어서 일본 한자를 "간체"라고 부르지는 않습니다.

중국의 코드 체계는 아래와 같이 3가지로 나뉩니다.

  • GB2312 - 중국 본토에서 대부분 경우에 사용하는 간체 중국어 문자셋 이다. 이게 약간 버그가 있어서 수정본이 몇개 있지만 그냥 무시하고 GB2312를 많이 사용한다. 많이 사용하는 한자 7400 자 정도가 포함되어 있고 이 한자들의 번체 버전은 GB/T12345 가 있습니다.
  • GB7589 - 마찬가지로 주로 사용하지 않는 좀 드문 한자 7200개 정도의 모임인데 우리처럼 이걸 지원하는 MBCS 인코딩은 없고 단지 유니코드에는 들어가 있습니다.
  • GB18030 - 2000년에 확정되어진 중국에서 사용되는 거의 대부분의 한자를 다 밀어넣은 세계 최대 문자셋이다. (유효 코드 문자수만 따지면 ISO-10646-2가 최대지만..) 게다가 중국은 GB18030을 국가 표준으로 밀고 있어서 2001년 9월부터 중국에서 발매되는 모든 OS 및 프로그램들은 GB18030을 지원해야 한다고 못을 박았습니다. 1~4bytes의 가변길이코드체계이며, GB2312와 완벽하게 호환됩니다.


국내에 들어와 있는 워드프로세서 프로그램(아래한글, MS 한글Word)는 위에서 설명한 모든 형태와 코드를 지원합니다만, 개인적으로 이용해 본 결과 역시 아래한글이 편리합니다. 이외에 보조 프로그램 형태로 여러가지 프로그램이 있으며, 네이버 또는 다음에서도 불편하기는 하지만 중국어 사전을 제공합니다.(간체/번체를 동시에 보여줍니다.)

아래한글에서 기본적으로 입력한 한자는 번체를 기준으로 저장되는데, 이 번체를 간체 글꼴로 바꾸어준다고 해서 간체로 저장되지는 않습니다. 즉, 저장은 번체로 되며 보여주는 글꼴만 간체로 바뀌는 것입니다. 만일 번체를 간체로 바꾸거나 간체를 번체로 바꿀려면 아래한글의 기본기능인 글자바꾸기 기능을 이용하시면 됩니다. (변환할 영역을 블럭으로 잡은 뒤 편집>> 글자바꾸기에서 간체/번체 바꾸기를 선택)

윈도우즈xp 이상에서는 기본적으로 3가지 종류의 중국어 폰트가 이미 포함되어 있습니다. Win98이나 Win2000 에서는 별도로 글꼴을 구해야 하지만, XP는 기본적으로 부수적인 프로그램이나 글꼴이 필요없이 입출력이 가능합니다. 포함되어 있는 글꼴은 아래와 같습니다.

  • Simsun & NSimSun ( simsun.ttc ) : 간체
  • SimHei ( simhei.ttf ) : 간체
  • MingLiU & PMingLiU ( mingliu.ttc ) : 번체


기타 인터넷에서 검색을 해보면 중국관련 내용이 많이 나오지만, 대체적으로 입력기를 어떻게 설치하느랴 등등의 기본적인 내용이 다수이기 때문에 중국관련 웹작업 및 그래픽 작업에 도움이 되는 참조사이트를 정리해 놓습니다. 도움이 되시길..

'ETC > codepage' 카테고리의 다른 글

ISO 3166-1 alpha-2 codes (국가코드)  (1) 2011.01.24
ISO 3166-1 alpha-3 codes (국가코드)  (0) 2011.01.24
ASCII Table, Unicode and HTML  (0) 2011.01.12
중국어 간체자 vs 번체자 대조표  (0) 2011.01.12
한글코드표 EUC-KR (KSC-5601)  (5) 2011.01.12
by sminchoi 2011. 1. 24. 13:07