국제 문자 세트

국제 문자 세트
Universal Coded Character Set
다른 이름	UCS, 유니코드
언어	국제
표준	ISO 10646
인코딩 포맷	UTF-8, UTF-16, GB18030; 덜 일반적: UTF-32, BOCU, SCSU, UTF-7
이전 인코딩	ISO 8859, ISO 2022 등
	v; t; e;

유니코드
부호화 형식 UTF-7 UTF-8 CESU-8 UTF-16 UTF-32 UTF-EBCDIC SCSU 퓨니코드 GB18030
UCS
양방향 텍스트
BOM
한중일 통합 한자
유니코드 범위 목록
유니코드 등가성
유니코드와 HTML
유니코드와 전자 우편
유니코드 글꼴
v • d • e • h

국제 문자 세트(UCS, Universal Character Set, 범용 문자 집합)는 ISO 10646으로 정의된 문자 인코딩의 국제 표준이다.

1991년부터, 유니코드 컨소시엄에서는 유니코드 표준과 ISO/IEC 10646을 발전시키기 위해 ISO와 공동 작업을 해 왔다. 분류와, 문자명과 유니코드 표준 2.0 버전의 코드들은 ISO/IEC 10646-1:1993과 첫 수정판과 동일하다. 2000년 3월 유니코드 3.0이 발표된 이후, 새롭게 추가된 문자들이 ISO/IEC 10646-1:2000을 통해 UCS에 포함되었다.

UCS는 110만 개 이상의 코드가 있지만, 일반적으로 첫 65536개 (BMP, Basic Multilingual Plane, 기본 다국어 평면) 만이 사용된다. 나머지는 고대 이집트 상형문자나 쓰임이 적은 한자같은 문자를 표현하기 위해 남겨져 있다. 많은 코드영역, 심지어 BMP 영역에서도 서로 다른 인코딩 형태와 미래의 확장성을 고려하여, 일부러 문자를 할당하지 않았다.

UCS의 인코딩 폼[편집]

UCS용 인코딩 방법으로 ISO 10646가 정의되어 있다. 간단히 축약하여 UCS-2 라고도 하는데, 각 글자들을 0 ~ 65535(0xFFFF) 사이의 코드 값으로 매겨놓고, 각 값들을 16비트로 표현한다. 그것으로서 UCS-2는 BMP의 코드 영역을 표현할 수 있고, BMP 밖의 영역은 표현이 불가능하다. UCS-2를 확장하여 BMP 밖의 영역도 표시가 가능하게 한 인코딩으로 UTF-16이 있다.

UTF-32^[1]는 0xFFFFFFFF 까지의 단일 코드 즉 32비트로 한 글자를 표현한다. 그러므로 UCS-4는 UCS-2보다 더 많은 수의 글자를 표현할 수 있으나, UCS-2에 비해 2배의 저장공간을 필요로 한다.

대응되는 유니코드[편집]

ISO/IEC 10646-1:1993 ≈ Unicode 1.1
ISO/IEC 10646-1:2000 ≈ Unicode 3.0
ISO/IEC 10646-2:2001 ≈ Unicode 3.2
ISO/IEC 10646-3:2003 ≈ Unicode 4.0

각주[편집]

↑ UCS-4

외부 링크[편집]

[1] UCS-4

[1]

v t e ISO 표준
목록: ISO 표준 목록 ISO 로마자 표기법 목록 IEC 표준 목록 분류: 분류:ISO 표준 분류:OSI 프로토콜
1 ~ 9999	1 2 3 4 5 6 7 9 16 31 -0 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 -13 128 216 217 226 228 233 259 269 302 306 428 518 519 639 -1 -2 -3 -5 -6 646 690 732 764 843 898 965 1000 1004 1007 1073-1 1413 1538 1745 1989 2014 2015 2022 2047 2108 2145 2146 2240 2281 2709 2711 2788 2848 2852 3029 3103 3166 -1 -2 -3 3297 3307 3602 3864 3901 3977 4031 4157 4217 4909 5218 5428 5775 5776 5800 5964 6166 6344 6346 6385 6425 6429 6438 6523 6709 7001 7002 7098 7185 7200 7498 7736 7810 7811 7812 7813 7816 8000 8178 8217 8571 8583 8601 8632 8652 8691 8807 8820-5 8859 -1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 -13 -14 -15 -16 8879 9000 9075 9126 9241 9293 9362 9407 9506 9529 9564 9594 9660 9897 9945 9984 9985 9995
10000 ~ 19999	10005 10006 10007 10116 10118-3 10160 10161 10165 10179 10206 10218 10303 -11 -21 -22 -28 -238 10383 10487 10585 10589 10646 10664 10746 10861 10957 10962 10967 11073 11170 11179 11404 11544 11783 11784 11785 11801 11898 11940 11941 11941 (TR) 11992 12006 12182:1998 12207 12234-2 13211 -1 -2 13216 13250 13399 13406-2 13407 13450 13485 13490 13567 13568 13584 13616 14000 14031 14224 14289 14396 14443 14496 -10 1-14 14644 -1 -2 -3 -4 -5 -6 -7 -8 -9 14649 14651 14698 14698-2 14750 14882 14971 15022 15189 15288 15291 15292 15408 15444 15445 15438 15504 15511 15686 15693 15706 15706-2 15707 15897 15919 15924 15926 15926 WIP 15930 16023 16262 16750 17024 17025 17369 17799 18000 18004 18014 18245 18629 18916 19005 19011 19092-1 19092-2 19114 19115 19125 19136 19439 19501:2005 19752 19757 19770 19775-1 19794-5
20000+	20000 20022 21000 21047 21827:2002 22000 23008-2 23270 23360 24613 24707 25178 26000 26300 26324 27000 관련 27000 27001 27002 27003 27004 27005 27006 27007 27729 27799 28000 29110 29199-2 29500 31000 32000 38500 42010 80000
같이 보기: "ISO"로 시작하는 전체 문서

UCS의 인코딩 폼[편집]

대응되는 유니코드[편집]

관련 ISO[편집]

각주[편집]

외부 링크[편집]