한중일 통합 한자
| 유니코드 |
|---|
| 부호화 형식 |
| UCS |
| 양방향 텍스트 |
| BOM |
| 한중일 통합 한자 |
| 유니코드 범위 목록 |
| 유니코드 정규화 |
| 유니코드와 HTML |
| 유니코드와 전자 우편 |
| 유니코드 글꼴 |
한중일 통합 한자는 유니코드에 담겨 있는 한자들의 집합으로, 현재 총 74,617개[1] 이며 한국, 중국, 일본에서 쓰이는 한자를 묶은 것이기 때문에 머리 글자를 따서 한중일 통합 한자라고 불린다. 최근에는 베트남에서 쓰이는 한자도 추가되었기에 한중일월 통합 한자(CJKV)라고 부르기도 한다. 그러나 20세기 들어서 베트남의 한자는 라틴문자로 대체되었기 때문에 거의 쓰이지 않는다.
처음에 유니코드에는 65,536(=216)자만 들어갈 수 있었기 때문에, 가장 많은 문자가 배당되는 한자를 위해서 한국, 중국, 일본에서 사용하는 한자 중에 모양이 유사하며 그 뜻이 같은 글자를 같은 코드로 통합했다. 따라서 문자 코드만으로 그 한자가 사용되는 언어를 알아 낼 수 없는데, 다만 중국의 간체자나 번체자, 일본의 구자체나 신자체 등 분명하게 모양이 다른 글자는 별도의 부호를 할당하고 있다. 이런 문자 할당 정책에 반발하여 TRON과 같은 인코딩이 만들어지기도 했으나, 실제로 통합된 한자의 차이가 별로 크지 않기 때문에 문제가 되지 않는다는 의견도 있다.
목차 |
한중일 통합 한자 영역 [편집]
한중일 통합 한자 [편집]
한중일 통합 한자 영역(4E00–9FFF)에는 U+4E00 부터 U+9FCC 까지 20,941개의 한자가 수록되었다.
목록 [편집]
4E00-62FF, 6300-77FF, 7800-8CFF, 8D00-9FFF.
출처 [편집]
- 중국
| 코드 | 기준 | 개수 | 비고 |
|---|---|---|---|
| G0 | GB 2312-80 | 6763 | |
| G1 | GB 12345-90 | 2352 | |
| G3 | GB 7589-87 unsimplified form | 7237 | |
| G5 | GB 7590-87 unsimplified form | 7039 | |
| G7 | Modern Chinese general character chart | 42 | |
| G8 | GB 8565-89 | 290 |
- 타이완
| 코드 | 기준 | 개수 | 비고 |
|---|---|---|---|
| T1 | CNS 11643-1986 plane 1 | 5401+9 | |
| T2 | CNS 11643-1986 plane 2 | 7650 | |
| TE | CNS 11643-1986 plane 14 | 6319+239+10 | 239 from CCIII, 10 from XCCS |
- 일본
| 코드 | 기준 | 개수 | 비고 |
|---|---|---|---|
| J0 | JIS X 0208-90 | 6335+1 | |
| J1 | JIS X 0212-90 | 5801 |
- 한국
| 코드 | 기준 | 개수 | 비고 |
|---|---|---|---|
| K0 | KS X 1001:2004 | 4888 | 중복한자 268개 포함 |
| K1 | KS X 1002:2004 | 2856 | |
| K2 | KS X 1027-1:2011 | 7911 | |
| K4 | KS X 1027-3:2011 | 4 | 통합 한자 확장 A에 2자/통합 한자 확장 B에 166자 |
- 기타
- ANSI Z39.64-1989
- Big5
- CCCII plane 1
- GB 12052-89
- JEF
- Chinese telegraph code
- Taiwan telegraph code
- Xerox Chinese
유니코드 4.1에서, HKSCS-2004 한자 14개 와 GB 18030 한자 8개가 U+9FA6 과 U+9FBB 사이에 추가되었다.
한중일 통합 한자 확장 A [편집]
유니코드 3.0(1999)에서 한중일 통합 한자 확장 A(3400–4DBF)에는 U+3400 부터 U+4DB5 까지 6,582개의 한자가 수록되었다.
목록 [편집]
출처 [편집]
- 중국
| 코드 | 기준 |
|---|---|
| GE | GB 16500-95 |
| GS | Singapore CJK ideographs |
- 타이완
| 코드 | 기준 | 비고 |
|---|---|---|
| T3 | CNS 11643-1992 plane 3 | |
| T4 | CNS 11643-1992 plane 4 | |
| T5 | CNS 11643-1992 plane 5 | |
| T6 | CNS 11643-1992 plane 6 | |
| T7 | CNS 11643-1992 plane 7 | |
| TF | CNS 11643-1992 plane 15 |
- 일본
| 코드 | 기준 | 비고 |
|---|---|---|
| JA | Unified Japanese IT Vendors Contemporary Ideographs, 1993 |
- 한국
| 코드 | 기준 | 비고 |
|---|---|---|
| K3 | KS X 1027-2:2011 | |
| K4 | KS X 1027-3:2011 |
- 베트남
| 코드 | 기준 | 비고 |
|---|---|---|
| V0 | TCVN 5773:1993 | |
| V1 | TCVN 6056:1995 |
한중일 통합 한자 확장 B [편집]
유니코드 3.1(2001)에서 한중일 통합 한자 확장 B(20000–2A6DF)에는 U+20000 부터 U+2A6D6 까지 42,711개의 한자가 수록되었다.
목록 [편집]
20000-215FF, 21600-230FF, 23100-245FF, 24600-260FF, 26100-275FF, 27600-290FF, 29100-2A6DF.
출처 [편집]
- 강희자전
- 한어대자전
- Ciyuan
- Cihai
- 한어대사전
- 중국대백과전서
- 베이징 대학 Founder DTP
- 사고전서
- HKSCS
- JIS X 0213 제3평면과 제4평면
- KS X 1027-3:2011, KS X 1027-4:2011
- KPS 9566-97, KPS 10721-2000
- CNS 11643 planes 4-7, 15
- TCVN, VHN 01:1998, VHN 02:1998
한중일 통합 한자 확장 C [편집]
유니코드 5.2(2009)에서 한중일 통합 한자 확장 C 영역(2A700–2B73F)에는 U+2A700 부터 U+2B734 까지 4,149개의 한자가 수록되었다.
목록 [편집]
출처 [편집]
- 중국
- 중국대백과전서
- Beijing University Founder DTP
- 한어대자전
- 한어대사전
- Old hanyu word dictionary
- Commercial Press Ideographs
- 현대한어사전
- Cihai
- 강희자전
- Chinese Academy of Surveying & Mapping
- 한어방언대사전
- Yanzhou jinwen jicheng yinde (殷周金文集成引得)
- 일본
- Japanese KOKUJI Collection
- 한국
- Korean IRG Hanja Character Set 5th Edition: 2001 (KS X 1027-5:2011)
- 북한
- KPS 10721:2003
- 베트남
- 쯔놈 사전 (喃字典), Nguyễn Quang Hồng, 2006
- Từ điển chữ Nôm Tày, Hoàng Triều Ân, 2003
- Bảng tra chữ Nôm miền Nam, Vũ Văn Kính, 1994
- 기타
- Unicode UTC
- ABC Chinese-English Dictionary, John DeFrancis (德范克), et al., eds., 2nd edition. (1998) Honolulu: University of Hawaii Press
- The Church of Jesus Christ of Latter-day Saints Hong Kong division
- Mathews' Chinese-English Dictionary, Robert H. Mathews (1975) Cambridge; Harvard University Press
- 광운
- Chinese bird system index (中国鸟类系统检索), Zheng Zhuoxin (郑作新), et al. (2000), Beijing, 科学出版社 (www.sciencep.com)
- Annotated Shuowen Jiezi, Duan Yucai
한중일 통합 한자 확장 D [편집]
유니코드 6.0(2010)에서 한중일 통합 한자 확장 D 영역(2B740–2B81F)에는 U+2B740 부터 U+2B81D 까지 222개의 한자가 수록되었다.
목록 [편집]
한중일 통합 한자 확장 E (예정) [편집]
한중일 통합 한자 확장 E 영역은 원래 확장 D 영역에 포함될 예정이었다.
한중일 E 영역은 본래 한중일 C 영역에 포함되지 않은 나머지 16,000여 자의 한자를 포함할 예정이었으나, 2007년 5월에 중화민국(타이완)에서 사용되지 않는 것으로 간주된 인명용 6,545 자의 등록을 철회함으로,[2] 한중일 E 영역에는 10,000여 자만이 등록될 예정이다.
등록될 예정인 한자는 이 문서에서 확인할 수 있다.
한중일 호환용 한자 [편집]
한중일 호환용 한자 영역(F900–FAFF)에는 오직 12개의 한중일 통합 한자가 존재하며 나머지는 통합 한자와 관련이 없다.
목록 [편집]
- 유니코드 차트 한중일 호환용 한자(F900-FAFF)
- 유니코드 차트 한중일 호환용 한자 보충(2F800-2FA1F)
유니코드 버전 이력 [편집]
| 유니코드 버전별 한중일 통합 한자 | ||||
|---|---|---|---|---|
| 유니코드 버전 | 내용 | 위치 | 개수 | 누계 |
| 1.0 | 한중일 통합 한자 | 기본 다국어 평면(BMP, U+4E00부터 U+9FA5) | 20,902 | 20,902 |
| 한중일 호환용 한자에 있지만 실제로는 중복되지 않는 한자 | 기본 다국어 평면 | 12 | 20,914 | |
| 3.0 | 한중일 통합 한자 확장 A | 기본 다국어 평면(U+3400부터 U+4DB5) | 6,582 | 27,496 |
| 3.1 | 한중일 통합 한자 확장 B | 보조 상형 문자 평면(SIP, U+20000부터 U+2A6D6) | 42,711 | 70,207 |
| 4.1 | HKSCS-2004와 GB 18030-2000에 없었던 ISO 10646 한자 | 기본 다국어 평면(HKSCS에서: U+9FA6부터 U+9FB3, GB 18030에서: U+9FB4부터 U+9FBB) | 22 | 70,229 |
| 5.1 | 일본 한자(U+9FBC~U+9FC2), U+4039의 분리(U+9FC3) | 기본 다국어 평면 | 8 | 70,237 |
| 5.2 | 한중일 통합 한자 확장 C | 보조 상형 문자 평면(SIP, U+2A700부터 U+2B734) | 4,149 | 74,386 |
| 6.0 | 한중일 통합 한자 확장 D | 보조 상형 문자 평면(SIP, U+2B740부터 U+2B81F) | 222 | 74,616 |
| 6.1 | 1개 한자 | 기본 다국어 평면 | 1 | 74,617 |
참조 [편집]
같이 보기 [편집]
바깥 고리 [편집]
- 유니코드 표준
- 한자를 유니코드로 통합 - Otfried Cheong 저
- 유니코드 속의 한중일 문자
- 한중일 코드
|
유니코드의 한중일 통합 한자 * |
|||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
|||||||||||||
|
* 유니코드 6.1 기준
|