한중일 호환용 한자
CJK Compatibility Ideographs | |
---|---|
범위 | U+F900..U+FAFF (512 코드 포인트) |
평면 | BMP |
문자 | 한자 |
지정 글자 수 | 472 코드 포인트 |
미사용 | 40 예약 코드 포인트 |
근거 표준 | KS X 1001:1998 Big5 IBM 32 KS X 1001:2004 JIS X 0213 ARIB STD-B24 국규 10721-2000 |
유니코드 버전 역사 | |
1.0.1 | 302 (+302) |
3.2 | 361 (+59) |
4.1 | 467 (+106) |
5.2 | 470 (+3) |
6.1 | 472 (+2) |
참고: [1][2] |
한중일 호환용 한자(CJK Compatibility Ideographs)는 유니코드에서 기존의 한·중·일 문자 집합과 왕복 변환을 위해 한중일 통합 한자에 집어넣은 중복된 한자들이다. 대표로 KS X 1001의 독음만 다르고 모습은 같은 한자들과 Big5의 버그인 중복된 두 한자가 있다. 최근에는 JIS X 0213, 국규 9566, CNS 11643-1992와 호환을 위한 한자도 추가했다. 열두 글자를 제외한 모든 호환용 한자들은 각각 정규 한자 영역에 있는 한자들과 중복되거나 통합할 수 있는 글자들이다.
예를 들어, KS X 1001의 소리가 다른 중복 한자들은 대표 글자 하나만 정규 한자 영역에 넣고, 나머지 한자들은 호환용 한자 영역에 넣었다. KS X 1001에서 소리가 가장 많은 한자인 樂의 경우 다음과 같이 배당했다.
소리 | 한자 | KS X 1001 | 유니코드 | 대표 |
---|---|---|---|---|
낙 | 樂 | 0xD1E2 | U+F914 | |
락 | 樂 | 0xD5A5 | U+F95C | |
악 | 樂 | 0xE4C5 | U+6A02 | O |
요 | 樂 | 0xE8F9 | U+F9BF |
Big5의 중복된 두 한자는 U+FA0C(兀, 올), U+FA0D(嗀, 혹)에 따로 배당했다.
역사[편집]
- 1991년, 유니코드 1.0에서 U+F900부터 U+FA2D까지 처음으로 ‘한중일 호환용 한자’ 302글자를 배당했다. (KS X 1001 중복 한자 268글자, Big5 중복 한자 2글자, IBM 32 호환용 한자 32글자)
- 2001년, 유니코드 3.1에서 U+2F800부터 U+2FA1D까지 ‘한중일 호환용 한자 보충’ 542글자를 배당했다. (모두 CNS 11643-1992 중복 한자)
- 2002년, 유니코드 3.2에서 U+FA30부터 U+FA6A까지 ‘한중일 호환용 한자’에 59글자를 더 추가했다. (모두 JIS X 0213 호환용 한자)
- 2005년, 유니코드 4.1에서 U+FA70부터 U+FAD9까지 ‘한중일 호환용 한자’에 106글자를 더 추가했다. (모두 국규 10721 호환용 한자)
- 2009년, 유니코드 5.2에서 U+FA6B부터 U+FA6D까지 ‘한중일 호환용 한자’에 3글자를 더 추가했다. (모두 일본 ARIB STD-B24 호환용 한자)
- 2012년, 유니코드 6.1에서 U+FA2E(郞)와 U+FA2F(隷) 두 자를 '한중일 호환용 한자'에 추가했다. (모두 KS X 1001:2004 중복 한자 2글자)
문자표[편집]
한중일 호환용 한자 (CJK Compatibility Ideographs) 유니코드 공식 문자표 | ||||||||||||||||
U+ | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | A | B | C | D | E | F |
F90X | 豈 | 更 | 車 | 賈 | 滑 | 串 | 句 | 龜 | 龜 | 契 | 金 | 喇 | 奈 | 懶 | 癩 | 羅 |
F91X | 蘿 | 螺 | 裸 | 邏 | 樂 | 洛 | 烙 | 珞 | 落 | 酪 | 駱 | 亂 | 卵 | 欄 | 爛 | 蘭 |
F92X | 鸞 | 嵐 | 濫 | 藍 | 襤 | 拉 | 臘 | 蠟 | 廊 | 朗 | 浪 | 狼 | 郎 | 來 | 冷 | 勞 |
F93X | 擄 | 櫓 | 爐 | 盧 | 老 | 蘆 | 虜 | 路 | 露 | 魯 | 鷺 | 碌 | 祿 | 綠 | 菉 | 錄 |
F94X | 鹿 | 論 | 壟 | 弄 | 籠 | 聾 | 牢 | 磊 | 賂 | 雷 | 壘 | 屢 | 樓 | 淚 | 漏 | 累 |
F95X | 縷 | 陋 | 勒 | 肋 | 凜 | 凌 | 稜 | 綾 | 菱 | 陵 | 讀 | 拏 | 樂 | 諾 | 丹 | 寧 |
F96X | 怒 | 率 | 異 | 北 | 磻 | 便 | 復 | 不 | 泌 | 數 | 索 | 參 | 塞 | 省 | 葉 | 說 |
F97X | 殺 | 辰 | 沈 | 拾 | 若 | 掠 | 略 | 亮 | 兩 | 凉 | 梁 | 糧 | 良 | 諒 | 量 | 勵 |
F98X | 呂 | 女 | 廬 | 旅 | 濾 | 礪 | 閭 | 驪 | 麗 | 黎 | 力 | 曆 | 歷 | 轢 | 年 | 憐 |
F99X | 戀 | 撚 | 漣 | 煉 | 璉 | 秊 | 練 | 聯 | 輦 | 蓮 | 連 | 鍊 | 列 | 劣 | 咽 | 烈 |
F9AX | 裂 | 說 | 廉 | 念 | 捻 | 殮 | 簾 | 獵 | 令 | 囹 | 寧 | 嶺 | 怜 | 玲 | 瑩 | 羚 |
F9BX | 聆 | 鈴 | 零 | 靈 | 領 | 例 | 禮 | 醴 | 隸 | 惡 | 了 | 僚 | 寮 | 尿 | 料 | 樂 |
F9CX | 燎 | 療 | 蓼 | 遼 | 龍 | 暈 | 阮 | 劉 | 杻 | 柳 | 流 | 溜 | 琉 | 留 | 硫 | 紐 |
F9DX | 類 | 六 | 戮 | 陸 | 倫 | 崙 | 淪 | 輪 | 律 | 慄 | 栗 | 率 | 隆 | 利 | 吏 | 履 |
F9EX | 易 | 李 | 梨 | 泥 | 理 | 痢 | 罹 | 裏 | 裡 | 里 | 離 | 匿 | 溺 | 吝 | 燐 | 璘 |
F9FX | 藺 | 隣 | 鱗 | 麟 | 林 | 淋 | 臨 | 立 | 笠 | 粒 | 狀 | 炙 | 識 | 什 | 茶 | 刺 |
FA0X | 切 | 度 | 拓 | 糖 | 宅 | 洞 | 暴 | 輻 | 行 | 降 | 見 | 廓 | 兀 | 嗀 | 﨎 | 﨏 |
FA1X | 塚 | 﨑 | 晴 | 﨓 | 﨔 | 凞 | 猪 | 益 | 礼 | 神 | 祥 | 福 | 靖 | 精 | 羽 | 﨟 |
FA2X | 蘒 | 﨡 | 諸 | 﨣 | 﨤 | 逸 | 都 | 﨧 | 﨨 | 﨩 | 飯 | 飼 | 館 | 鶴 | 郞 | 隷 |
FA3X | 侮 | 僧 | 免 | 勉 | 勤 | 卑 | 喝 | 嘆 | 器 | 塀 | 墨 | 層 | 屮 | 悔 | 慨 | 憎 |
FA4X | 懲 | 敏 | 既 | 暑 | 梅 | 海 | 渚 | 漢 | 煮 | 爫 | 琢 | 碑 | 社 | 祉 | 祈 | 祐 |
FA5X | 祖 | 祝 | 禍 | 禎 | 穀 | 突 | 節 | 練 | 縉 | 繁 | 署 | 者 | 臭 | 艹 | 艹 | 著 |
FA6X | 褐 | 視 | 謁 | 謹 | 賓 | 贈 | 辶 | 逸 | 難 | 響 | 頻 | 恵 | 𤋮 | 舘 | ||
FA7X | 並 | 况 | 全 | 侀 | 充 | 冀 | 勇 | 勺 | 喝 | 啕 | 喙 | 嗢 | 塚 | 墳 | 奄 | 奔 |
FA8X | 婢 | 嬨 | 廒 | 廙 | 彩 | 徭 | 惘 | 慎 | 愈 | 憎 | 慠 | 懲 | 戴 | 揄 | 搜 | 摒 |
FA9X | 敖 | 晴 | 朗 | 望 | 杖 | 歹 | 殺 | 流 | 滛 | 滋 | 漢 | 瀞 | 煮 | 瞧 | 爵 | 犯 |
FAAX | 猪 | 瑱 | 甆 | 画 | 瘝 | 瘟 | 益 | 盛 | 直 | 睊 | 着 | 磌 | 窱 | 節 | 类 | 絛 |
FABX | 練 | 缾 | 者 | 荒 | 華 | 蝹 | 襁 | 覆 | 視 | 調 | 諸 | 請 | 謁 | 諾 | 諭 | 謹 |
FACX | 變 | 贈 | 輸 | 遲 | 醙 | 鉶 | 陼 | 難 | 靖 | 韛 | 響 | 頋 | 頻 | 鬒 | 龜 | 𢡊 |
FADX | 𢡄 | 𣏕 | 㮝 | 䀘 | 䀹 | 𥉉 | 𥳐 | 𧻓 | 齃 | 龎 | ||||||
FAEX | ||||||||||||||||
FAFX |
개별 문자에 대한 정보[편집]
12개의 한중일 통합 한자[편집]
유니코드 | 문자 |
---|---|
U+FA0E | 﨎 |
U+FA0F | 﨏 |
U+FA11 | 﨑 |
U+FA13 | 﨓 |
U+FA14 | 﨔 |
U+FA1F | 﨟 |
U+FA21 | 﨡 |
U+FA23 | 﨣 |
U+FA24 | 﨤 |
U+FA27 | 﨧 |
U+FA28 | 﨨 |
U+FA29 | 﨩 |
IBM 32에서 추가된 호환용 한자 중 12개는 한중일 통합 한자 영역에 대응되는 쌍이 없는 한자로, 이에 따라 실제로는 한중일 통합 한자로 간주된다.
U+FAD4[편집]
U+FAD4(䀹)는 ⿰目㚒의 자형을 가지고 있으나, U+9FC3(鿃, 섬)이 아닌, ⿰目夾의 자형을 가진 U+4039(䀹, 협)과 동일한 호환용 한자로 정의되어 있다. 이는 U+4039가 ⿰目夾의 자형을 가진 한자와 ⿰目㚒의 자형을 가진 한자를 동시에 가리킬 적에, U+FAD4가 ⿰目㚒만을 가리킬 용도로 추가되었기 때문이다. 이후 ⿰目夾과 ⿰目㚒이 서로 다른 글자라는 것이 알려져서 U+4039의 분리가 승인되어 유니코드 5.1에서 ⿰目㚒이 U+9FC3으로 분리되었으나, 유니코드에서 한 번 정의된 글자는 그 정의를 변경할 수 없는데다가, 호환용 한자의 특성 상 U+FAD4의 정의를 변경하지 못하는 것이 큰 문제를 일으키지도 않기 때문에, U+FAD4는 U+4039의 분리 이후로도 여전히 U+9FC3이 아닌 U+4039를 가리키고 있다.[3]
같이 보기[편집]
각주[편집]
- ↑ “Unicode character database”. 《The Unicode Standard》.
- ↑ “Enumerated Versions of The Unicode Standard”. 《The Unicode Standard》.
- ↑ Andrew West and John Jenkins, proposal of disunification of U+4039