한중일 호환용 한자

위키백과, 우리 모두의 백과사전.

CJK Compatibility Ideographs
범위U+F900..U+FAFF
(512 코드 포인트)
평면BMP
문자한자
지정 글자 수472 코드 포인트
미사용40 예약 코드 포인트
근거 표준KS X 1001:1998
Big5
IBM 32
KS X 1001:2004
JIS X 0213
ARIB STD-B24
국규 10721-2000
유니코드 버전 역사
1.0.1302 (+302)
3.2361 (+59)
4.1467 (+106)
5.2470 (+3)
6.1472 (+2)
참고: [1][2]

한중일 호환용 한자(CJK Compatibility Ideographs)는 유니코드에서 기존의 한·중·일 문자 집합왕복 변환을 위해 한중일 통합 한자에 집어넣은 중복된 한자들이다. 대표로 KS X 1001의 독음만 다르고 모습은 같은 한자들과 Big5의 버그인 중복된 두 한자가 있다. 최근에는 JIS X 0213, 국규 9566, CNS 11643-1992와 호환을 위한 한자도 추가했다. 열두 글자를 제외한 모든 호환용 한자들은 각각 정규 한자 영역에 있는 한자들과 중복되거나 통합할 수 있는 글자들이다.

예를 들어, KS X 1001의 소리가 다른 중복 한자들은 대표 글자 하나만 정규 한자 영역에 넣고, 나머지 한자들은 호환용 한자 영역에 넣었다. KS X 1001에서 소리가 가장 많은 한자인 樂의 경우 다음과 같이 배당했다.

한중일 호환용 한자 영역이 유니코드에서 차지하는 부분
소리 한자 KS X 1001 유니코드 대표
0xD1E2 U+F914
0xD5A5 U+F95C
0xE4C5 U+6A02 O
樂 0xE8F9 U+F9BF

Big5의 중복된 두 한자는 U+FA0C(兀, 올), U+FA0D(嗀, 혹)에 따로 배당했다.

역사[편집]

  • 1991년, 유니코드 1.0에서 U+F900부터 U+FA2D까지 처음으로 ‘한중일 호환용 한자’ 302글자를 배당했다. (KS X 1001 중복 한자 268글자, Big5 중복 한자 2글자, IBM 32 호환용 한자 32글자)
  • 2001년, 유니코드 3.1에서 U+2F800부터 U+2FA1D까지 ‘한중일 호환용 한자 보충’ 542글자를 배당했다. (모두 CNS 11643-1992 중복 한자)
  • 2002년, 유니코드 3.2에서 U+FA30부터 U+FA6A까지 ‘한중일 호환용 한자’에 59글자를 더 추가했다. (모두 JIS X 0213 호환용 한자)
  • 2005년, 유니코드 4.1에서 U+FA70부터 U+FAD9까지 ‘한중일 호환용 한자’에 106글자를 더 추가했다. (모두 국규 10721 호환용 한자)
  • 2009년, 유니코드 5.2에서 U+FA6B부터 U+FA6D까지 ‘한중일 호환용 한자’에 3글자를 더 추가했다. (모두 일본 ARIB STD-B24 호환용 한자)
  • 2012년, 유니코드 6.1에서 U+FA2E(郞)와 U+FA2F(隷) 두 자를 '한중일 호환용 한자'에 추가했다. (모두 KS X 1001:2004 중복 한자 2글자)

문자표[편집]

한중일 호환용 한자
(CJK Compatibility Ideographs)
유니코드 공식 문자표
U+ 0 1 2 3 4 5 6 7 8 9 A B C D E F
F90X
F91X
F92X
F93X 錄
F94X
F95X
F96X
F97X 勵
F98X
F99X
F9AX
F9BX 樂
F9CX
F9DX
F9EX
F9FX 刺
FA0X
FA1X
FA2X
FA3X 憎
FA4X
FA5X
FA6X
FA7X 奔
FA8X
FA9X
FAAX
FABX 謹
FACX
FADX
FAEX
FAFX

개별 문자에 대한 정보[편집]

12개의 한중일 통합 한자[편집]

호환용 한자 블록의 12개 통합 한자
유니코드 문자
U+FA0E
U+FA0F
U+FA11
U+FA13
U+FA14
U+FA1F
U+FA21
U+FA23
U+FA24
U+FA27
U+FA28
U+FA29

IBM 32에서 추가된 호환용 한자 중 12개는 한중일 통합 한자 영역에 대응되는 쌍이 없는 한자로, 이에 따라 실제로는 한중일 통합 한자로 간주된다.

U+FAD4[편집]

U+FAD4(䀹)는 ⿰目㚒의 자형을 가지고 있으나, U+9FC3(鿃, 섬)이 아닌, ⿰目夾의 자형을 가진 U+4039(䀹, 협)과 동일한 호환용 한자로 정의되어 있다. 이는 U+4039가 ⿰目夾의 자형을 가진 한자와 ⿰目㚒의 자형을 가진 한자를 동시에 가리킬 적에, U+FAD4가 ⿰目㚒만을 가리킬 용도로 추가되었기 때문이다. 이후 ⿰目夾과 ⿰目㚒이 서로 다른 글자라는 것이 알려져서 U+4039의 분리가 승인되어 유니코드 5.1에서 ⿰目㚒이 U+9FC3으로 분리되었으나, 유니코드에서 한 번 정의된 글자는 그 정의를 변경할 수 없는데다가, 호환용 한자의 특성 상 U+FAD4의 정의를 변경하지 못하는 것이 큰 문제를 일으키지도 않기 때문에, U+FAD4는 U+4039의 분리 이후로도 여전히 U+9FC3이 아닌 U+4039를 가리키고 있다.[3]

같이 보기[편집]

각주[편집]