ISO 8859-1

ISO 8859-1

ISO/IEC 8859-1 (также известная как ISO 8859-1 и Latin-1) — кодовая страница, предназначенная для западноевропейских языков; она базируется на символьном наборе популярных в прошлом терминалов VT220. Кодовые позиции 0—31 (0x0—0x1F) и 127—159 (0x7F—0x9F) не определены. По образцу ISO 8859-1 сделаны все остальные кодировки серии ISO 8859.

ISO-8859-1 — кодировка, зарегистрированная IANA в 1992 г. В отличие от ISO/IEC 8859-1, кодовые позиции 0—31 и 127—159 здесь заполнены управляющими символами (большинство из которых, впрочем, всё равно никто не использует). В HTML ISO-8859-1 является кодировкой по умолчанию (в XHTML, однако, кодировкой по умолчанию является UTF-8).

IANA разрешает использовать следующие варианты названия: ISO_8859-1:1987, ISO_8859-1, ISO-8859-1, iso-ir-100, sISOLatin1, latin1, l1, IBM819, CP819.

В Юникоде первые 256 кодовых позиций совпадают с ISO-8859-1.

В Microsoft Windows для западноевропейских языков используется кодировка Windows-1252, которая отличается от ISO-8859-1 тем, что позиции 128—159 здесь заняты разными полезными типографскими символами. Большинство браузеров не различают ISO-8859-1 и Windows-1252 — фактически, и в том, и в другом случае они отображают текст как Windows-1252.

Такая путаница между этими двумя кодировками привела к тому, что многие программы, генерирующие файлы HTML, ошибочно обозначали символы их кодами из Windows−1252 вместо кодов Юникода (исходя из того, что номер символа в ISO-8859-1 равен его номеру в Юникоде): например, тире (—) обозначалось — вместо правильного —, многоточие обозначалось … вместо правильного … и т. д.; из-за распространённости этого явления современные браузеры продолжают показывать, например, — как тире, хотя на самом деле — — это управляющий символ «end of guarded area», применение которого в HTML бессмысленно.

В проекте стандарта HTML 5 предписывается показывать ISO-8859-1 как Windows-1252.[1]

Содержание

Таблицы

Нижняя часть (0—127) таблиц кодировки не показана, поскольку полностью соответствует обычному ASCII. Числа под буквами обозначают шестнадцатеричный код буквы в Юникоде.

ISO-8859-1

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
 
8.
 
PAD
80
HOP
81
BPH
82
NBH
83
IND
84
NEL
85
SSA
86
ESA
87
HTS
88
HTJ
89
VTS
8A
PLD
8B
PLU
8C
RI
8D
SS2
8E
SS3
8F
 
9.
 
DCS
90
PU1
91
PU2
92
STS
93
CCH
94
MW
95
SPA
96
EPA
97
SOS
98
SGCI
99
SCI
9A
CSI
9B
ST
9C
OSC
9D
PM
9E
APC
9F
 
A.
 
 
A0
¡
A1
¢
A2
£
A3
¤
A4
¥
A5
¦
A6
§
A7
¨
A8
©
A9
ª
AA
«
AB
¬
AC
­
AD
®
AE
¯
AF
 
B.
 
°
B0
±
B1
²
B2
³
B3
´
B4
µ
B5

B6
·
B7
¸
B8
¹
B9
º
BA
»
BB
¼
BC
½
BD
¾
BE
¿
BF
 
C.
 
À
C0
Á
C1
Â
C2
Ã
C3
Ä
C4
Å
C5
Æ
C6
Ç
C7
È
C8
É
C9
Ê
CA
Ë
CB
Ì
CC
Í
CD
Î
CE
Ï
CF
 
D.
 
Ð
D0
Ñ
D1
Ò
D2
Ó
D3
Ô
D4
Õ
D5
Ö
D6
×
D7
Ø
D8
Ù
D9
Ú
DA
Û
DB
Ü
DC
Ý
DD
Þ
DE
ß
DF
 
E.
 
à
E0
á
E1
â
E2
ã
E3
ä
E4
å
E5
æ
E6
ç
E7
è
E8
é
E9
ê
EA
ë
EB
ì
EC
í
ED
î
EE
ï
EF
 
F.
 
ð
F0
ñ
F1
ò
F2
ó
F3
ô
F4
õ
F5
ö
F6
÷
F7
ø
F8
ù
F9
ú
FA
û
FB
ü
FC
ý
FD
þ
FE
ÿ
FF

Интересно расположение символов × и ÷ посреди букв: первоначально там планировалось разместить лигатуру Œœ, но в конечном итоге было решено, что она не нужна, и освободившиеся два места были заполнены небуквенными символами.[2]

Windows−1252

В первоначальной версии этой кодировки отсутствовали символы: (0x80), ˆ (0x88), ˜ (0x98), Ž (0x8E), ž (0x9E).

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
 
8.
 

20AC
 
201A
ƒ
192

201E

2026

2020

2021
ˆ
2C6

2030
Š
160

2039
Œ
152
  Ž
17D
 
 
9.
 
 
2018

2019

201C

201D

2022

2013

2014
˜
2DC

2122
š
161

203A
œ
153
  ž
17E
Ÿ
178
 
A.
 
 
A0
¡
A1
¢
A2
£
A3
¤
A4
¥
A5
¦
A6
§
A7
¨
A8
©
A9
ª
AA
«
AB
¬
AC
­
AD
®
AE
¯
AF
 
B.
 
°
B0
±
B1
²
B2
³
B3
´
B4
µ
B5

B6
·
B7
¸
B8
¹
B9
º
BA
»
BB
¼
BC
½
BD
¾
BE
¿
BF
 
C.
 
À
C0
Á
C1
Â
C2
Ã
C3
Ä
C4
Å
C5
Æ
C6
Ç
C7
È
C8
É
C9
Ê
CA
Ë
CB
Ì
CC
Í
CD
Î
CE
Ï
CF
 
D.
 
Ð
D0
Ñ
D1
Ò
D2
Ó
D3
Ô
D4
Õ
D5
Ö
D6
×
D7
Ø
D8
Ù
D9
Ú
DA
Û
DB
Ü
DC
Ý
DD
Þ
DE
ß
DF
 
E.
 
à
E0
á
E1
â
E2
ã
E3
ä
E4
å
E5
æ
E6
ç
E7
è
E8
é
E9
ê
EA
ë
EB
ì
EC
í
ED
î
EE
ï
EF
 
F.
 
ð
F0
ñ
F1
ò
F2
ó
F3
ô
F4
õ
F5
ö
F6
÷
F7
ø
F8
ù
F9
ú
FA
û
FB
ü
FC
ý
FD
þ
FE
ÿ
FF

Ссылки

Примечания



Кодовые таблицы символов в Windows
1250 | 1251 | 1252 | 1253 | 1254 | 1255 | 1256 | 1257 | 1258


Кодировки символов
Основы → алфавиттекстфайлданные ) • набор символов • конверсия
Исторические кодировки → Докомп.: семафорная (Макарова)МорзеБодоМТК-2 Комп.: 6 битУППRADIX-50EBCDICДКОИ-8 ) • КОИ-7ISO 646
совре-
менное
8-битное
представ-
ление
символы ASCIIуправляющиепечатные ) не-ASCII ( псевдографика )
8бит. код.стр. Разные →   Кириллица: КОИ-8ГОСТ 19768-87MacCyrillic
ISO 8859 → 1(лат.) 2 3 4 5(кир.) 6 7 8 9 10 11 12 13 14 15(€) 16
Windows → 1250 1251(кир.) 1252 1253 1254 1255 1256 1257 1258 | WGL4
IBM&DOS → 437850852855866 «альт.» • ( МИК ) • ( НИИ ЭВМ )
Много-
байтные
Традиционные → DBCSGB2312 ) • HTML
Unicode → UTF-16UTF-8список символовкириллица )
Связанные
темы →
интерфейс пользователяраскладка клавиатурылокальперевод строкишрифткракозябрытранслитнестандартные шрифты • текст как изображение Утилиты: iconvrecode

Wikimedia Foundation. 2010.

Игры ⚽ Нужна курсовая?

Полезное


Смотреть что такое "ISO 8859-1" в других словарях:

  • ISO 8859 — ISO 8859, également appelée plus formellement ISO/CEI 8859, est une norme commune de l ISO et de la CEI de codage de caractères sur 8 bits pour le traitement informatique du texte. Le standard est divisé en parties numérotées publiées séparément …   Wikipédia en Français

  • Iso 8859 — ISO 8859, également appelée plus formellement ISO/CEI 8859, est une norme commune de l ISO et de la CEI de codage de caractères sur 8 bits pour le traitement informatique du texte. Le standard est divisé en parties numérotées publiées séparément …   Wikipédia en Français

  • ISO-8859-1 — Latin 1, Westeuropäisch 2 Latin 2, Mitteleuropäisch 3 Latin 3, Südeuropäisch 4 Latin 4, Baltisch 5 Kyrillisch 6 Arabisch 7 Griechisch 8 …   Deutsch Wikipedia

  • ISO 8859-1 —  Latin 1, Westeuropäisch 2  Latin 2, Mitteleuropäisch 3  Latin 3, Südeuropäisch 4  Latin 4, Nordeuropäisch 5  Kyrillisch 6  Arabisch 7  Griechisch …   Deutsch Wikipedia

  • ISO-8859-1 — Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD (compatibilité) Propriétés et algorithmes ISO 15924 …   Wikipédia en Français

  • Iso 8859-1 — Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD (compatibilité) Propriétés et algorithmes ISO 15924 …   Wikipédia en Français

  • ISO 8859 — семейство ASCII совместимых кодовых страниц, разработанное совместными усилиями ISO и IEC. По состоянию на 2006 год это семейство состояло из 15 ти кодовых страниц. Общая информация Поскольку кодировки ISO 8859 разрабатывались как средства для… …   Википедия

  • ISO-8859-15 — ISO 8859 1 Latin 1, Westeuropäisch 2 Latin 2, Mitteleuropäisch 3 Latin 3, Südeuropäisch 4 Latin 4, Baltisch 5 Kyrillisch 6 Arabisch 7 Griechisch 8 …   Deutsch Wikipedia

  • ISO-8859 — семейство кодовых страниц, разработанное совместными усилиями IEC. По состоянию на 2006 г. это семейство состоит из 15 кодовых страниц. Общая информация Поскольку кодировки ISO 8859 разрабатывались как средства для обмена информацией, а не как… …   Википедия

  • ISO-8859-13 — ISO 8859 1 Latin 1, Westeuropäisch 2 Latin 2, Mitteleuropäisch 3 Latin 3, Südeuropäisch 4 Latin 4, Baltisch 5 Kyrillisch 6 Arabisch 7 Griechisch 8 …   Deutsch Wikipedia


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»