ISO/IEC 8859: 두 판 사이의 차이
잔글 로봇이 더함: uk:ISO 8859 |
잔글 로봇이 바꿈: ru:ISO 8859 |
||
399번째 줄: | 399번째 줄: | ||
[[pl:ISO 8859]] |
[[pl:ISO 8859]] |
||
[[pt:ISO 8859]] |
[[pt:ISO 8859]] |
||
[[ru:ISO |
[[ru:ISO 8859]] |
||
[[sv:ISO/IEC 8859]] |
[[sv:ISO/IEC 8859]] |
||
[[tr:ISO 8859]] |
[[tr:ISO 8859]] |
2009년 8월 6일 (목) 07:27 판
ISO/IEC 8859는 컴퓨터에서 8비트로 문자를 나타내기 위한 ISO와 IEC의 공동 표준이다. ISO/IEC 8859-1, ISO/IEC 8859-2 등의 세부 표준이 제안되어 있다.
소개
ASCII에 포함된 95자의 인쇄 영역은 현대 영어로 정보를 표현하는 데 충분하다. 하지만 로마 문자를 쓰는 다른 언어에는 ASCII로 처리할 수 없는 추가적인 기호를 포함하고 있다. 예를 들면 ß(독일어), ñ(에스파냐어), å(스웨덴어와 북유럽 언어) 등이다. ISO 8859는 8비트로 구성된 바이트의 8번째 비트를 이용하여 128자의 추가적인 문자를 할당하여 이 문제를 처리하기 위해 제안되었다. 하지만 한 종류의 문자 집합만으로는 필요로 하는 모든 문자를 처리할 수 없어 여러 가지 매핑이 개발되었다.
ISO 8859-n 부호화는 인쇄 가능한 문자만을 포함한다. 문자가 대응되지 않은 곳은 제어 문자로 활용된다. IANA는 ISO/IEC 646에 정의된 C0 영역(0-31)과 ISO 6429에 정의된 C1 영역(127-159)을 제어 문자로 사용한다. 이 문자 집합 이름은 MIME 이름으로도 활용된다.
구성
ISO/IEC 8859는 다음 문자 집합으로 이루어져 있다.
ISO/IEC 8859-1 | 라틴-1 서유럽 |
가장 널리 쓰이며 대부분의 서유럽 언어를 지원한다. 네덜란드어(일부[1]), 노르웨이어, 덴마크어, 독일어, 로망슈어, 스웨덴어 스코틀랜드 게일어, 아이슬란드어, 아일랜드어, 에스파냐어, 영어, 이탈리아어, 페로어, 포르투갈어, 프랑스어(일부[2]), 핀란드어(일부[2]), 동유럽의 알바니아어, 아프라카의 스와힐리어, 아프리칸스어. 유로 기호(€)와 대문자 "Ÿ"는 개정판인 ISO 8859-15에 추가되었다. IANA의 문자 집합 ISO-8859-1에 대응하며, HTML 문서의 기본 인코딩이다. |
---|---|---|
ISO/IEC 8859-2 | 라틴-2 중앙유럽 |
로마 문자를 쓰는 중앙유럽과 동유럽의 언어를 지원한다. 보스니아어, 슬로바키아어, 슬로베니아어, 체코어, |
ISO/IEC 8859-3 | 라틴-3 남유럽 |
몰타어, 터키어, 에스페란토. 터키어는 ISO 8859-9, 에스파란토는 유니코드로 대체되어가고 있다. |
ISO/IEC 8859-4 | 라틴-4 북유럽 |
에스토니아어, 라트비아어, 리투아니아어, 그린란드어, 사미어. |
ISO/IEC 8859-5 | 라틴/키릴 | 키릴 문자를 쓰는 대부분의 슬라브어를 지원한다. 러시아어, 마케도니아어, 벨라루스어, 불가리아어, |
ISO/IEC 8859-6 | 라틴/아랍 | 아랍어를 지원한다. 아랍 문자를 쓰는 다른 언어는 지원하지 않는다. 표시를 위해서는 양방향 문자와 문자 결합을 처리해줘야 한다. |
ISO/IEC 8859-7 | 라틴/그리스 | 현대 그리스어를 지원한다. 문자 개혁 이전의 고전 그리스어(polytonic orthography)는 유니코드에서 지원한다. |
ISO/IEC 8859-8 | 라틴/히브리 | 이스라엘에서 쓰이는 현대 히브리어를 지원한다. 좌에서 우, 또는 우에서 좌 두가지 방향의 인코딩이 모두 존재한다. |
ISO/IEC 8859-9 | 라틴-5 터키 |
ISO 8859-1와 거의 비슷하다. 거이 쓰이지 않는 아이슬란드어 문자 대신 터키어 문자를 추가했다. 크루드어 표기에도 사용된다. |
ISO/IEC 8859-10 | 라틴-6 노르딕 |
라틴-4의 문자를 재배열했다. 노르딕 언어의 표기에 더 적합하다. 발트 언어에게는 라틴-4가 더 편리하다. |
ISO/IEC 8859-11 | 라틴/타이 | 타이어에서 쓰이는 여러 문자를 추가했다.TIS 620과 동일하다. |
라틴/데바나가리 | 데바나가리 문자를 위한 ISO의 작업은 1997년 공식적으로 폐기되었다. 데바나가리 문자는 ISCII와 유니코드가 지원한다. | |
ISO/IEC 8859-13 | 라틴-7 발트 해 연안 |
라틴-4와 라틴-6에 빠진 발트 언어의 문자를 추가했다. |
ISO/IEC 8859-14 | 라틴-8 켈트 |
스코틀란드게일어나 브르타뉴어 등의 켈트어를 지원한다. |
ISO/IEC 8859-15 | 라틴-9 | 8859-1에서 쓰이지 않는 기호를 제거하고, 유로 기호€와 Š, š, Ž, ž, Œ, œ, Ÿ 문자를 추가했다. 프랑스어, 핀란드어, 에스토니아어를 완전하게 지원한다. |
ISO/IEC 8859-16 | 라틴-10 남동유럽 |
루마니아어, 슬로베니아어, 알바니아어, 이탈리아어, 크로아티아어, 폴란드어, 헝가리어를 비롯 독일어, 아일랜드어(신철자법), 프랑스어, 핀란드어를 지원한다. 기호보다는 문자에 초점이 맞춰져 있으며, 여러 통화 기호가 빠지고 유로 기호가 추가되었다. |
틀:Ref 1—네덜란드어에서 쓰이는 IJ/ij 문자가 빠졌으며, 로마 문자 IJ로 사용된다.
틀:Ref 2—빠진 글자는 ISO 8859-15에 추가되었다.
틀:Ref 3—1991년 우크라이나어에 재도입된 Ґ/ґ 문자가 빠져있다.
표
Bin | Oct | Dec | Hex | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 13 | 14 | 15 | 16 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
10100000 | 240 | 160 | A0 | Non-breaking space (NBSP) | |||||||||||||||
10100001 | 241 | 161 | A1 | ¡ | Ą | Ħ | Ą | Ё | ‘ | ¡ | Ą | ก | ” | Ḃ | ¡ | Ą | |||
10100010 | 242 | 162 | A2 | ¢ | ˘ | ĸ | Ђ | ’ | ¢ | ¢ | Ē | ข | ¢ | ḃ | ¢ | ą | |||
10100011 | 243 | 163 | A3 | £ | Ł | £ | Ŗ | Ѓ | £ | Ģ | ฃ | £ | Ł | ||||||
10100100 | 244 | 164 | A4 | ¤ | Є | ¤ | € | ¤ | Ī | ค | ¤ | Ċ | € | ||||||
10100101 | 245 | 165 | A5 | ¥ | Ľ | Ĩ | Ѕ | ₯ | ¥ | Ĩ | ฅ | „ | ċ | ¥ | „ | ||||
10100110 | 246 | 166 | A6 | ¦ | Ś | Ĥ | Ļ | І | ¦ | Ķ | ฆ | ¦ | Ḋ | Š | |||||
10100111 | 247 | 167 | A7 | § | Ї | § | ง | § | |||||||||||
10101000 | 250 | 168 | A8 | ¨ | Ј | ¨ | Ļ | จ | Ø | Ẁ | š | ||||||||
10101001 | 251 | 169 | A9 | © | Š | İ | Š | Љ | © | Đ | ฉ | © | |||||||
10101010 | 252 | 170 | AA | ª | Ş | Ē | Њ | ͺ | × | ª | Š | ช | Ŗ | Ẃ | ª | Ș | |||
10101011 | 253 | 171 | AB | « | Ť | Ğ | Ģ | Ћ | « | Ŧ | ซ | « | ḋ | « | |||||
10101100 | 254 | 172 | AC | ¬ | Ź | Ĵ | Ŧ | Ќ | ، | ¬ | Ž | ฌ | ¬ | Ỳ | ¬ | Ź | |||
10101101 | 255 | 173 | AD | soft hyphen (SHY) | ญ | SHY | |||||||||||||
10101110 | 256 | 174 | AE | ® | Ž | Ž | Ў | ® | Ū | ฎ | ® | ź | |||||||
10101111 | 257 | 175 | AF | ¯ | Ż | ¯ | Џ | ― | ¯ | Ŋ | ฏ | Æ | Ÿ | ¯ | Ż | ||||
10110000 | 260 | 176 | B0 | ° | А | ° | ฐ | ° | Ḟ | ° | |||||||||
10110001 | 261 | 177 | B1 | ± | ą | ħ | ą | Б | ± | ą | ฑ | ± | ḟ | ± | |||||
10110010 | 262 | 178 | B2 | ² | ˛ | ² | ˛ | В | ² | ē | ฒ | ² | Ġ | ² | Č | ||||
10110011 | 263 | 179 | B3 | ³ | ł | ³ | ŗ | Г | ³ | ģ | ณ | ³ | ġ | ³ | ł | ||||
10110100 | 264 | 180 | B4 | ´ | Д | ΄ | ´ | ī | ด | “ | Ṁ | Ž | |||||||
10110101 | 265 | 181 | B5 | µ | ľ | µ | ĩ | Е | ΅ | µ | ĩ | ต | µ | ṁ | µ | ” | |||
10110110 | 266 | 182 | B6 | ¶ | ś | ĥ | ļ | Ж | Ά | ¶ | ķ | ถ | ¶ | ||||||
10110111 | 267 | 183 | B7 | · | ˇ | · | ˇ | З | · | ท | · | Ṗ | · | ||||||
10111000 | 270 | 184 | B8 | ¸ | И | Έ | ¸ | ļ | ธ | ø | ẁ | ž | |||||||
10111001 | 271 | 185 | B9 | ¹ | š | ı | š | Й | Ή | ¹ | đ | น | ¹ | ṗ | ¹ | č | |||
10111010 | 272 | 186 | BA | º | ş | ē | К | Ί | ÷ | º | š | บ | ŗ | ẃ | º | ș | |||
10111011 | 273 | 187 | BB | » | ť | ğ | ģ | Л | ؛ | » | ŧ | ป | » | Ṡ | » | ||||
10111100 | 274 | 188 | BC | ¼ | ź | ĵ | ŧ | М | Ό | ¼ | ž | ผ | ¼ | ỳ | Œ | ||||
10111101 | 275 | 189 | BD | ½ | ˝ | ½ | Ŋ | Н | ½ | ― | ฝ | ½ | Ẅ | œ | |||||
10111110 | 276 | 190 | BE | ¾ | ž | ž | О | Ύ | ¾ | ū | พ | ¾ | ẅ | Ÿ | |||||
10111111 | 277 | 191 | BF | ¿ | ż | ŋ | П | ؟ | Ώ | ¿ | ŋ | ฟ | æ | ṡ | ¿ | ż | |||
11000000 | 300 | 192 | C0 | À | Ŕ | À | Ā | Р | ΐ | À | Ā | ภ | Ą | À | |||||
11000001 | 301 | 193 | C1 | Á | С | ء | Α | Á | ม | Į | Á | ||||||||
11000010 | 302 | 194 | C2 | Â | Т | آ | Β | Â | ย | Ā | Â | ||||||||
11000011 | 303 | 195 | C3 | Ã | Ă | Ã | У | أ | Γ | Ã | ร | Ć | Ã | Ă | |||||
11000100 | 304 | 196 | C4 | Ä | Ф | ؤ | Δ | Ä | ฤ | Ä | |||||||||
11000101 | 305 | 197 | C5 | Å | Ĺ | Ċ | Å | Х | إ | Ε | Å | ล | Å | Ć | |||||
11000110 | 306 | 198 | C6 | Æ | Ć | Ĉ | Æ | Ц | ئ | Ζ | Æ | ฦ | Ę | Æ | |||||
11000111 | 307 | 199 | C7 | Ç | Į | Ч | ا | Η | Ç | Į | ว | Ē | Ç | ||||||
11001000 | 310 | 200 | C8 | È | Č | È | Č | Ш | ب | Θ | È | Č | ศ | Č | È | ||||
11001001 | 311 | 201 | C9 | É | Щ | ة | Ι | É | ษ | É | |||||||||
11001010 | 312 | 202 | CA | Ê | Ę | Ê | Ę | Ъ | ت | Κ | Ê | Ę | ส | Ź | Ê | ||||
11001011 | 313 | 203 | CB | Ë | Ы | ث | Λ | Ë | ห | Ė | Ë | ||||||||
11001100 | 314 | 204 | CC | Ì | Ě | Ì | Ė | Ь | ج | Μ | Ì | Ė | ฬ | Ģ | Ì | ||||
11001101 | 315 | 205 | CD | Í | Э | ح | Ν | Í | อ | Ķ | Í | ||||||||
11001110 | 316 | 206 | CE | Î | Ю | خ | Ξ | Î | ฮ | Ī | Î | ||||||||
11001111 | 317 | 207 | CF | Ï | Ď | Ï | Ī | Я | د | Ο | Ï | ฯ | Ļ | Ï | |||||
11010000 | 320 | 208 | D0 | Ð | Đ | Đ | а | ذ | Π | Ğ | Ð | ะ | Š | Ŵ | Ð | ||||
11010001 | 321 | 209 | D1 | Ñ | Ń | Ñ | Ņ | б | ر | Ρ | Ñ | Ņ | ั | Ń | Ñ | Ń | |||
11010010 | 322 | 210 | D2 | Ò | Ň | Ò | Ō | в | ز | Ò | Ō | า | Ņ | Ò | |||||
11010011 | 323 | 211 | D3 | Ó | Ķ | г | س | Σ | Ó | ำ | Ó | ||||||||
11010100 | 324 | 212 | D4 | Ô | д | ش | Τ | Ô | ิ | Ō | Ô | ||||||||
11010101 | 325 | 213 | D5 | Ő | Ġ | Õ | е | ص | Υ | Õ | ี | Ő | |||||||
11010110 | 326 | 214 | D6 | Ö | ж | ض | Φ | Ö | ึ | Ö | |||||||||
11010111 | 327 | 215 | D7 | × | з | ط | Χ | × | Ũ | ื | × | Ṫ | × | Ś | |||||
11011000 | 330 | 216 | D8 | Ø | Ř | Ĝ | Ø | и | ظ | Ψ | Ø | ุ | Ų | Ø | Ű | ||||
11011001 | 331 | 217 | D9 | Ù | Ů | Ù | Ų | й | ع | Ω | Ù | Ų | ู | Ł | Ù | ||||
11011010 | 332 | 218 | DA | Ú | к | غ | Ϊ | Ú | ฺ | Ś | Ú | ||||||||
11011011 | 333 | 219 | DB | Û | Ű | Û | л | Ϋ | Û | Ū | Û | ||||||||
11011100 | 334 | 220 | DC | Ü | м | ά | Ü | Ü | |||||||||||
11011101 | 335 | 221 | DD | Ý | Ŭ | Ũ | н | έ | İ | Ý | Ż | Ý | Ę | ||||||
11011110 | 336 | 222 | DE | Þ | Ţ | Ŝ | Ū | о | ή | Ş | Þ | Ž | Ŷ | Þ | Ț | ||||
11011111 | 337 | 223 | DF | ß | п | ί | ‗ | ß | ฿ | ß | |||||||||
11100000 | 340 | 224 | E0 | à | ŕ | à | ā | р | ـ | ΰ | א | à | ā | เ | ą | à | |||
11100001 | 341 | 225 | E1 | á | с | ف | α | ב | á | แ | į | á | |||||||
11100010 | 342 | 226 | E2 | â | т | ق | β | ג | â | โ | ā | â | |||||||
11100011 | 343 | 227 | E3 | ã | ă | ã | у | ك | γ | ד | ã | ใ | ć | ã | ă | ||||
11100100 | 344 | 228 | E4 | ä | ф | ل | δ | ה | ä | ไ | ä | ||||||||
11100101 | 345 | 229 | E5 | å | ĺ | ċ | å | х | م | ε | ו | å | ๅ | å | ć | ||||
11100110 | 346 | 230 | E6 | æ | ć | ĉ | æ | ц | ن | ζ | ז | æ | ๆ | ę | æ | ||||
11100111 | 347 | 231 | E7 | Ç | į | ч | ه | η | ח | Ç | į | ็ | ē | Ç | |||||
11101000 | 350 | 232 | E8 | È | č | È | č | ш | و | θ | ט | È | č | ่ | č | È | |||
11101001 | 351 | 233 | E9 | É | щ | ى | ι | י | É | ้ | É | ||||||||
11101010 | 352 | 234 | EA | Ê | ę | Ê | ę | ъ | ي | κ | ך | Ê | ę | ๊ | ź | Ê | |||
11101011 | 353 | 235 | EB | Ë | ы | ً | λ | כ | Ë | ๋ | ė | Ë | |||||||
11101100 | 354 | 236 | EC | Ì | ě | Ì | ė | ь | ٌ | μ | ל | Ì | ė | ์ | ģ | Ì | |||
11101101 | 355 | 237 | ED | Í | э | ٍ | ν | ם | Í | ํ | ķ | Í | |||||||
11101110 | 356 | 238 | EE | î | ю | َ | ξ | מ | î | ๎ | ī | î | |||||||
11101111 | 357 | 239 | EF | ï | ď | ï | ī | я | ُ | ο | ן | ï | ๏ | ļ | ï | ||||
11110000 | 360 | 240 | F0 | ð | đ | đ | ȑ | ِ | π | נ | ğ | ð | ๐ | š | ŵ | ð | đ | ||
11110001 | 361 | 241 | F1 | ñ | ń | ñ | ņ | ё | ّ | ρ | ס | ñ | ņ | ๑ | ń | ñ | ń | ||
11110010 | 362 | 242 | F2 | ò | ň | ò | ō | ђ | ْ | ς | ע | ò | ō | ๒ | ņ | ò | |||
11110011 | 363 | 243 | F3 | ó | ķ | ѓ | σ | ף | ó | ๓ | ó | ||||||||
11110100 | 364 | 244 | F4 | ô | є | τ | פ | ô | ๔ | ō | ô | ||||||||
11110101 | 365 | 245 | F5 | ő | ġ | õ | ѕ | υ | ץ | õ | ๕ | ő | |||||||
11110110 | 366 | 246 | F6 | ö | і | φ | צ | ö | ๖ | ö | |||||||||
11110111 | 367 | 247 | F7 | ÷ | ї | χ | ק | ÷ | ũ | ๗ | ÷ | ṫ | ÷ | ś | |||||
11111000 | 370 | 248 | F8 | ø | ř | ĝ | ø | ј | ψ | ר | ø | ๘ | ų | ø | ű | ||||
11111001 | 371 | 249 | F9 | ù | ů | ù | ų | љ | ω | ש | ù | ų | ๙ | ł | ù | ||||
11111010 | 372 | 250 | FA | ú | њ | ϊ | ת | ú | ๚ | ś | ú | ||||||||
11111011 | 373 | 251 | FB | û | ű | û | ћ | ϋ | û | ๛ | ū | û | |||||||
11111100 | 374 | 252 | FC | ü | ќ | ό | ü | ü | |||||||||||
11111101 | 375 | 253 | FD | ý | ŭ | ũ | § | ύ | LRM | ı | ý | ż | ý | ę | |||||
11111110 | 376 | 254 | FE | þ | ţ | ŝ | ū | ў | ώ | RLM | ş | þ | ž | ŷ | þ | ț | |||
11111111 | 377 | 255 | FF | ÿ | ˙ | џ | ÿ | ĸ | ’ | ÿ |
0xA0위치에는 NBSP(non breaking space) 문자가, 0xAD에는 대개 소프트 하이픈 문자가 놓여있다. 다른 빈 자리는 할당되지 않은 영역이거나 현재 사용자 시스템이 표시할 수 없는 글자이다.
ISO/IEC 8859-7:2003과 ISO/IEC 8859-8:1999에서 새로 추가된 영역이 있다. LRM은 좌에서 우표시(U+200E), RLM은 우에서 좌 표시(U+200F)에 대응한다.
이 글은 컴퓨터에 관한 토막글입니다. 여러분의 지식으로 알차게 문서를 완성해 갑시다. |