유니코드

위키백과, 우리 모두의 백과사전.
이동: 둘러보기, 검색
유니코드
부호화 형식
UCS
양방향 텍스트
BOM
한중일 통합 한자
유니코드 범위 목록
유니코드 정규화
유니코드와 HTML
유니코드와 전자 우편
유니코드 글꼴
v  d  e  h

유니코드(Unicode)는 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준이며, 유니코드 협회(Unicode Consortium)가 제정한다. 이 표준에는 ISO 10646 문자 집합, 문자 인코딩, 문자 정보 데이터베이스, 문자들을 다루기 위한 알고리즘 등을 포함하고 있다.

유니코드의 목적은 현존하는 문자 인코딩 방법들을 모두 유니코드로 교체하려는 것이다. 기존의 인코딩들은 그 규모나 범위 면에서 한정되어 있고, 다국어 환경에서는 서로 호환되지 않는 문제점이 있었다. 유니코드가 다양한 문자 집합들을 통합하는 데 성공하면서 유니코드는 컴퓨터 소프트웨어국제화지역화에 널리 사용되게 되었으며, 비교적 최근의 기술인 XML, 자바, 그리고 최신 운영 체제 등에서도 지원하고 있다.

유니코드에서 한국어 발음을 나타날 때는 예일 로마자 표기법의 변형인 ISO/TR 11941을 사용하고 있다.

버전[편집]

유니코드 버전
버전 날짜 대응하는 ISO/IEC 10646 버전 문자 집합 수 글자들
전체[1] 주요 추가 사항
1.0.0 1991년 10월 ISBN 0-201-56788-1 (Vol.1) 24 7,161 가타카나, 구르무키 문자, 구자라트 문자, 그리스 문자, 데바나가리, 라오 문자, 라틴 문자, 말라얄람 문자, 벵골 문자, 아랍 문자, 아르메니아 문자, 오리야 문자, 조지아 문자, 주음부호, 칸나다 문자, 키릴 문자, 타밀 문자, 타이 문자, 텔루구 문자, 티베트 문자, 한글, 히라가나, 히브리 문자[2]
1.0.1 1992년 6월 ISBN 0-201-60845-6 (Vol.2) 25 28,359 20,902자의 한중일 통합 한자가 지정됨.[3]
1.1 1993년 6월 ISO/IEC 10646-1:1993 24 34,233 기존 2,350자의 한글에 4,306자가 더 추가됨. 티베트 문자 삭제.[4]
2.0 1996년 7월 ISBN 0-201-48345-9 ISO/IEC 10646-1:1993과 개정 5, 6, 7 25 38,950 기존의 한글 완성자를 삭제하고, 11,172자의 새 한글 완성자 영역을 새로 지정함. 티베트 문자 새 위치에 추가. 서러게이트 영역을 지정하였고, 제15, 제16평면을 사용자 정의 영역으로 지정함.[5]
2.1 1998년 5월 ISO/IEC 10646-1:1993과 개정 5, 6, 7, 18 25 38,952 유로 기호 추가.[6]
3.0 1999년 9월 ISBN 0-201-61633-5 ISO/IEC 10646-1:2000 38 49,259 룬 문자, 몽골 문자, 버마 문자, 시리아 문자, 싱할라 문자, 에티오피아 문자, 오검, 이 문자, 점자, 체로키 문자, 캐나다 원주민 음절 문자, 크메르 문자, 타나 문자[7]
3.1 2001년 3월 ISO/IEC 10646-1:2000

ISO/IEC 10646-2:2001

41 94,205 고대 이탈리아 문자, 고트 문자, 데저렛 문자음악 기호, 42,711자의 한중일 통합 한자.[8]
3.2 2002년 3월 ISO/IEC 10646-1:2000과 개정 1

ISO/IEC 10646-2:2001

45 95,221 필리핀 문자 4종류[9]
4.0 2003년 4월 ISBN 0-321-18578-1 ISO/IEC 10646:2003 52 96,447 문자 7종류와 64괘[10]
4.1 2005년 3월 31일 ISO/IEC 10646:2003과 개정 1 59 97,720 문자 7종류 추가, 콥트 문자가 그리스 문자에서 분리. 고대 그리스 숫자와 고대 그리스 음악 기호 추가. [11]
5.0 2006년 7월 18일 ISBN 0-321-48091-0 ISO/IEC 10646:2003과 개정 1, 2, 그리고 개정 3의 문자 4개 64 99,089 문자 5종류[12]
5.1 2008년 4월 4일 ISO/IEC 10646:2003과 개정 1, 2, 3, 4 75 100,713 문자 11종류 추가, 마작 타일과 도미노 타일 추가, 대문자 ß 추가.[13]
5.2 2009년 10월 1일 ISO/IEC 10646:2003과 개정 1, 2, 3, 4, 5, 6 90 107,361 문자 15종류 추가, 4,149자의 한중일 통합 한자 (CJK-C), 옛한글 확장 자모 추가[14]
6.0 2010년 10월 11일 ISO/IEC 10646:2010과 인도 루피 기호 93 109,449 문자 3종류 추가, 플레잉카드 기호, 교통 및 지도 기호, 연금술 기호, 이모티콘에모지. 222자의 한중일 통합 한자 (CJK-D) 추가.[15]
6.1 2012년 1월 31일 ISO/IEC 10646:2012 100 110,181 문자 7종류[16]
6.2 2012년 9월 27일 ISO/IEC 10646:2012와 터키 리라 기호 100 110,182 터키 리라 기호[17]
6.3 2013년 9월 30일 ISO/IEC 10646:2012와 여섯 문자 100 110,187 좌서/우서 형식 문자 5자[18]
7.0 2014년 6월 16일 ISO/IEC 10646:2012와 개정 1, 2, 루블 기호 123 113,021 문자 23종류와 딩뱃[19]

유니코드 목록[편집]

유니코드 목록 (범위)v  d  e  h
기본 다국어 평면
BMP
보조 다국어 평면
SMP
보조 상형 문자 평면
SIP
3차 상형 문자 평면
TIP
보조 특수 목적 평면
SSP
0000~0FFF
1000~1FFF
2000~2FFF
3000~3FFF
4000~4FFF
5000~5FFF
6000~6FFF
7000~7FFF
8000~8FFF
9000~9FFF
A000~AFFF
B000~BFFF
C000~CFFF
D000~DFFF
E000~EFFF
F000~FFFF
10000~10FFF
11000~11FFF
12000~12FFF
13000~13FFF
14000~14FFF
15000~15FFF
16000~16FFF
17000~17FFF
18000~18FFF
19000~19FFF
1A000~1AFFF
1B000~1BFFF
1C000~1CFFF
1D000~1DFFF
1E000~1EFFF
1F000~1FFFF
20000~20FFF
21000~21FFF
22000~22FFF
23000~23FFF
24000~24FFF
25000~25FFF
26000~26FFF
27000~27FFF
28000~28FFF
29000~29FFF
2A000~2AFFF
2B000~2BFFF
2C000~2CFFF
2D000~2DFFF
2E000~2EFFF
2F000~2FFFF
문자 없음 E0000~E0FFF







각주[편집]

  1. 각 버전의 글자의 수는 지정되어 있는 모든 문자를 포함한 것이며, 사용자 정의 영역 문자와 서러게이트 영역은 제외한다.
  2. Unicode Data 1.0.0. 2010년 3월 16일에 확인.
  3. Unicode Data 1.0.1. 2010년 3월 16일에 확인.
  4. Unicode Data 1995. 2010년 3월 16일에 확인.
  5. Unicode Data-2.0.14. 2010년 3월 16일에 확인.
  6. Unicode Data-2.1.2. 2010년 3월 16일에 확인.
  7. Unicode Data-3.0.0. 2010년 3월 16일에 확인.
  8. Unicode Data-3.1.0. 2010년 3월 16일에 확인.
  9. Unicode Data-3.2.0. 2010년 3월 16일에 확인.
  10. Unicode Data-4.0.0. 2010년 3월 16일에 확인.
  11. Unicode Data. 2010년 3월 16일에 확인.
  12. Unicode Data 5.0.0. 2010년 3월 17일에 확인.
  13. Unicode Data 5.1.0. 2010년 3월 17일에 확인.
  14. Unicode Data 5.2.0. 2010년 3월 17일에 확인.
  15. Unicode Data 6.0.0. 2010년 10월 11일에 확인.
  16. Unicode Data 6.1.0. 2012년 1월 31일에 확인.
  17. Unicode Data 6.2.0. 2012년 9월 26일에 확인.
  18. Unicode Data 6.3.0. 2013년 9월 30일에 확인.
  19. Unicode Data 7.0.0. 2014년 6월 15일에 확인.

바깥 고리[편집]