한중일 통합 한자

위키백과, 우리 모두의 백과사전.
(한중일월 통합 한자에서 넘어옴)
이동: 둘러보기, 검색
유니코드
부호화 형식
UCS
양방향 텍스트
BOM
한중일 통합 한자
유니코드 범위 목록
유니코드 정규화
유니코드와 HTML
유니코드와 전자 우편
유니코드 글꼴
v  d  e  h

한중일 통합 한자(韓中日統合漢字)는 유니코드에 담겨 있는 한자들의 집합으로, 현재 총 80,388개이며 한국, 중국, 일본에서 쓰이는 한자를 묶은 것이기 때문에 머리 글자를 따서 한중일 통합 한자라고 불린다. 최근에는 베트남에서 쓰이는 한자도 추가되었기에 한월중일 통합 한자(CJKV)라고 부르기도 한다. 그러나 20세기 들어서 베트남의 한자는 라틴문자로 대체되었기 때문에 거의 쓰이지 않는다.

처음에 유니코드에는 65,536(=216)자만 들어갈 수 있었기 때문에, 가장 많은 문자가 배당되는 한자를 위해서 한국, 중국, 일본에서 사용하는 한자 중에 모양이 유사하며 그 뜻이 같은 글자를 같은 코드로 통합했다. 따라서 문자 코드만으로 그 한자가 사용되는 언어를 알아 낼 수 없는데, 다만 중국의 간체자나 번체자, 일본의 구자체신자체 등 분명하게 모양이 다른 글자는 별도의 부호를 할당하고 있다. 이런 문자 할당 정책에 반발하여 TRON과 같은 인코딩이 만들어지기도 했으나, 실제로 통합된 한자의 차이가 별로 크지 않기 때문에 문제가 되지 않는다는 의견도 있다.

한중일 통합 한자 영역[편집]

한중일 통합 한자[편집]

한중일 통합 한자 영역(4E00–9FFF)에는 U+4E00부터 U+9FD5까지 20,950개의 한자가 수록되었다.

목록[편집]

4E00-62FF, 6300-77FF, 7800-8CFF, 8D00-9FFF.

출처[편집]

Country Code Standard Character count Total
중국 G0 GB 2312-80 6763 20913
G1 GB 12345-90 2202
G3 GB 7589-87 traditional form 4834
G5 GB 7590-87 traditional form 2841
G7 Modern Chinese general character chart 42
G8 GB8565-88 290
G9 GB18030-2000 8
GE GB16500-95 3779
GH GB/T 15564-1995 59
GHZ Hanyu Da Zidian 1
GK GB 12052-89 89
GKX Kangxi Dictionary 2
GFC Modern Chinese Standard Dictionary (现代汉语规范词典) 2
GGFZ General Chinese Standard Dictionary (通用规范汉字字典) 1
홍콩 H Hong Kong Supplementary Character Set 2292 15353
HB0 Computer Chinese Glyph and Character Code Mapping Table, Technical Report C-26
(電腦用中文字型與字碼對照表, 技術通報C-26)
10
HB1 Big-5, Level 1 5401
HB2 Big-5, Level 2 7650
일본 J0 JIS X 0208-1990 6356 12563
J1 JIS X 0212-1990 3058
J3 JIS X 0213-2004 Level 3 1132
J3A JIS X 0213-2004 Level 3 addendum 9
J4 JIS X 0213-2004 Level 4 2005
JARIB ARIB STD-B24 3
대한민국 K0 KS C 5601-87 (now KS X 1001:2004) 4620 15391
K1 KS C 5657-91 (now KS X 1002:2004) 2856
K2 PKS C 5700-1:1994 7911
K4 PKS 5700-3:1998 4
대만 T1 CNS 11643-1992 plane 1 5413 18370
T2 CNS 11643-1992 plane 2 7650
T3 CNS 11643-1992 plane 3 4144
T4 CNS 11643-1992 plane 4 894
T5 CNS 11643-1992 plane 5 63
T6 CNS 11643-1992 plane 6 31
T7 CNS 11643-1992 plane 7 16
TC CNS 11643-1992 plane 12 1
TF CNS 11643-1992 plane 15 158
베트남 V0 TCVN 5773-1993 593 4757
V1 TCVN 6056-1995 3310
V2 VHN 01-1998 763
V3 VHN 02-1998 91
Unicode UTC UTC UTC sources 13 13

유니코드 4.1에서, HKSCS-2004 한자 14개 와 GB 18030 한자 8개가 U+9FA6과 U+9FBB 사이에 추가되었다.

한중일 통합 한자 확장 A[편집]

유니코드 3.0(1999)에서 한중일 통합 한자 확장 A(3400–4DBF)에는 U+3400 부터 U+4DB5 까지 6,582개의 한자가 수록되었다.

목록[편집]

3400-4DBF.

출처[편집]

중국
코드 기준
GE GB 16500-95
GS Singapore CJK ideographs
타이완
코드 기준 비고
T3 CNS 11643-1992 plane 3
T4 CNS 11643-1992 plane 4
T5 CNS 11643-1992 plane 5
T6 CNS 11643-1992 plane 6
T7 CNS 11643-1992 plane 7
TF CNS 11643-1992 plane 15
일본
코드 기준 비고
JA Unified Japanese IT Vendors Contemporary Ideographs, 1993
한국
코드 기준 비고
K3 PKS C 5700-2:1994(현 KS X 1027-2:2011)
K4 PKS 5700-3:1998(현 KS X 1027-3:2011)
베트남
코드 기준 비고
V0 TCVN 5773:1993
V1 TCVN 6056:1995

한중일 통합 한자 확장 B[편집]

유니코드 3.1(2001)에서 한중일 통합 한자 확장 B(20000–2A6DF)에는 U+20000 부터 U+2A6D6 까지 42,711개의 한자가 수록되었다.

목록[편집]

20000-215FF, 21600-230FF, 23100-245FF, 24600-260FF, 26100-275FF, 27600-290FF, 29100-2A6DF.

출처[편집]

한중일 통합 한자 확장 C[편집]

유니코드 5.2(2009)에서 한중일 통합 한자 확장 C 영역(2A700–2B73F)에는 U+2A700 부터 U+2B734 까지 4,149개의 한자가 수록되었다.

목록[편집]

2A700-2B73F.

출처[편집]

중국
일본
  • Japanese KOKUJI Collection
한국
북한
  • KPS 10721:2003
베트남
  • 쯔놈 사전 (喃字典), Nguyễn Quang Hồng, 2006
  • Từ điển chữ Nôm Tày, Hoàng Triều Ân, 2003
  • Bảng tra chữ Nôm miền Nam, Vũ Văn Kính, 1994
기타
  • Unicode UTC
  • ABC Chinese-English Dictionary, John DeFrancis (德范克), et al., eds., 2nd edition. (1998) Honolulu: University of Hawaii Press
  • The Church of Jesus Christ of Latter-day Saints Hong Kong division
  • Mathews' Chinese-English Dictionary, Robert H. Mathews (1975) Cambridge; Harvard University Press
  • 광운
  • Chinese bird system index (中國鳥類系統檢索), Zheng Zhuoxin (鄭作新), et al. (2000), Beijing, 科學出版社 (www.sciencep.com)
  • Annotated Shuowen Jiezi, Duan Yucai

한중일 통합 한자 확장 D[편집]

유니코드 6.0(2010)에서 한중일 통합 한자 확장 D 영역(2B740–2B81F)에는 U+2B740 부터 U+2B81D 까지 222개의 한자가 수록되었다.

목록[편집]

2B740-2B81F.

한중일 통합 한자 확장 E[편집]

유니코드 8.0(2015)에서 한중일 통합 한자 확장 E 영역(2B820-2CEAF)에는 U+2B820 부터 U+2CEAF 까지 5762개의 한자가 수록되었다.

목록[편집]

2B820-2CEAF.

한중일 호환용 한자[편집]

한중일 호환용 한자 영역(F900–FAFF)에는 오직 12개의 한중일 통합 한자가 존재하며 나머지는 통합 한자와 관련이 없다.

목록[편집]

유니코드 버전 이력[편집]

유니코드 버전별 한중일 통합 한자
유니코드 버전 내용 위치 개수 누계
1.0 한중일 통합 한자 기본 다국어 평면(BMP, U+4E00부터 U+9FA5) 20,902 20,902
한중일 호환용 한자에 있지만 실제로는 중복되지 않는 한자 기본 다국어 평면 12 20,914
3.0 한중일 통합 한자 확장 A 기본 다국어 평면(U+3400부터 U+4DB5) 6,582 27,496
3.1 한중일 통합 한자 확장 B 보조 상형 문자 평면(SIP, U+20000부터 U+2A6D6) 42,711 70,207
4.1 HKSCS-2004GB 18030-2000에 없었던 ISO 10646 한자 기본 다국어 평면(HKSCS에서: U+9FA6부터 U+9FB3, GB 18030에서: U+9FB4부터 U+9FBB) 22 70,229
5.1 일본 한자(U+9FBC~U+9FC2), U+4039의 분리(U+9FC3) 기본 다국어 평면 8 70,237
5.2 한중일 통합 한자 확장 C 보조 상형 문자 평면(SIP, U+2A700부터 U+2B734) 4,149 74,386
6.0 한중일 통합 한자 확장 D 보조 상형 문자 평면(SIP, U+2B740부터 U+2B81F) 222 74,616
6.1 1개 한자 기본 다국어 평면 1 74,617
8.0 한중일 통합 한자 확장 E 보조 상형 문자 평면(SIP, U+2B820부터 U+2CEAF) 5,771 80,388

참조[편집]

같이 보기[편집]

바깥 고리[편집]