Управляющие символы

Управляющие символы

Управля́ющие си́мволы — элементы данной кодировки, которым не приписано графическое представление, но которые используются для управления устройствами, организации передачи данных и других целей.

Сейчас для этих целей применяются форматы файлов, языки управления устройствами (такие как Postscript) и сетевые протоколы. Поэтому многие управляющие символы сейчас или не используются вообще, или используются не по назначению.

Стандарт POSIX требует обязательного наличия лишь восьми управляющих символов — \0, \a, \b, \t, \n, \v, \f, \r (см. переносимый набор символов).

Управляющие символы ASCII

Номер Английское название Русское название Соче-
тание
кла-
виш
Escape
после-
дова-
тель-
ность
Назначение
00 NULL пустой символ \0 Этот символ ничего не делает. Некоторые терминалы изображают его как пробел, но это неправильно. Часто NULL используют для обозначения конца цепочки символов (например, в языке C).
01 START OF HEADING начало заголовка ^A В настоящее время используется в консоли маршрутизаторов Cisco.
02 START OF TEXT начало текста ^B В настоящее время используется в консоли маршрутизаторов Cisco.
03 END OF TEXT конец текста ^C При вводе на терминале обычно интерпретируется как сигнал прерывания.
04 END OF TRANSMISSION конец передачи ^D При вводе на терминале в UNIX-системах интерпретируется как конец вводимых данных. Если текущая программа брала данные с терминала, то она завершается, как только обработает всё, что было до символа ^D.
05 ENQUIRY запрос ^E Использовался в телетайпной связи. В ответ предполагалось получить идентификационную строку удалённого аппарата.
06 ACKNOWLEDGE подтверждение ^F Использовался в телетайпной связи.
07 BELL звуковой сигнал ^G \a Если этот символ послать на принтер или на терминал, то ничего не напечатается, но послышится звуковой сигнал.
08 BACKSPACE возврат на шаг ^H \b Перемещает позицию печати на один символ назад. На принтерах может использоваться для наложения одного символа на другой, например a BS ^ = â. При вводе с терминала иногда используется для стирания предшествующего символа («забой»).
09 CHARACTER TABULATION (horizontal tabulation) горизонтальная табуляция ^I \t Перемещает позицию печати к следующей позиции горизонтальной табуляции.
0A LINE FEED перевод строки ^J \n Перемещает позицию печати на одну строку вниз. В текстовых файлах в Unix разделяет строки.
0B LINE TABULATION (vertical tabulation) вертикальная табуляция ^K \v Перемещает позицию печати к следующей позиции вертикальной табуляции. На терминалах этот символ обычно эквивалентен переводу строки.
0C FORM FEED прогон страницы, смена страницы ^L \f Выбрасывает текущую страницу и начинает печать со следующей. На терминалах этот символ обычно эквивалентен переводу строки (хотя в принципе можно было бы его использовать для очистки экрана).
0D CARRIAGE RETURN возврат каретки ^M \r Перемещает позицию печати в крайнее левое положение. В текстовых файлах в Mac OS (но не Mac OS X) разделяет строки. В CP/M, MS-DOS и Microsoft Windows для разделения строк в текстовых файлах используется сочетание символов \r\n.
0E SHIFT OUT (locking-shift one) режим национальных символов ^N В КОИ-7 включает русский режим. На некоторых принтерах включает режим символов двойной ширины.
0F SHIFT IN (locking-shift zero) режим обычного ASCII ^O В КОИ-7 включает латинский режим. На некоторых принтерах включает режим узких символов.
10 DATA LINK ESCAPE освобождение канала данных ^P Означает, что следующий за ним управляющий символ должен восприниматься как данные, а не как управляющий символ.
11 DEVICE CONTROL ONE 1-й код управления устройством ^Q На терминалах разрешает продолжить вывод данных.
12 DEVICE CONTROL TWO 2-й код управления устройством ^R
13 DEVICE CONTROL THREE 3-й код управления устройством ^S На терминалах временно прерывает (приостанавливает) вывод данных.
14 DEVICE CONTROL FOUR 4-й код управления устройством ^T
15 NEGATIVE ACKNOWLEDGE отрицательное подтверждение ^U Использовался в телетайпной связи.
16 SYNCHRONOUS IDLE пустой символ для синхронного режима передачи ^V Некоторые линии связи устроены так, что требуют непрерывной передачи данных. Если передавать нечего, то передают этот символ.
17 END TRANSMISSION BLOCK конец блока передаваемых данных ^W
18 CANCEL отмена ^X Данные, которые идут перед ним, некорректны. (Обычно речь идёт об одной строке.)
19 END OF MEDIUM конец носителя ^Y Использовался, напр., если закончилась перфолента и т.п.
1A SUBSTITUTE символ замены ^Z Ставится на месте символов, значения которых были потеряны при передаче. В CP/M и MS-DOS использовался для обозначения конца текстовых файлов и конца вводимых с консоли данных (хотя для этого были предназначены символы ^C и ^D). Некоторые текстовые редакторы под DOS автоматически добавляли в конце файла ^Z.
1B ESCAPE Альтернативный регистр №2 (АР2) ^[ Означает, что следующие за ним символы имеют какое-то другое значение, отличное от того, которое определено в ASCII. Обычно начинает управляющие последовательности.
1C INFORMATION SEPARATOR FOUR (file separator) разделитель данных № 4 (разделитель файлов) ^\
1D INFORMATION SEPARATOR THREE (group separator) разделитель данных № 3 (разделитель групп) ^]
1E INFORMATION SEPARATOR TWO (record separator) разделитель данных № 2 (разделитель записей) ^^ Видимо, предназначался для разделения записей в базах данных, но практически никогда не используется для этого.
1F INFORMATION SEPARATOR ONE (unit separator) разделитель данных № 1 (разделитель полей) ^_ Видимо, предназначался для разделения полей в базах данных, но практически никогда не используется для этого.
7F DELETE удаление ^? Предназначен для забивания ошибочно пробитых символов на семидорожечных перфолентах (поскольку обозначается пробитием дырочек во всех дорожках), поэтому там он эквивалентен пустому символу (\0). На терминалах может генерироваться нажатием либо кнопки Backspace, либо кнопки Delete.

Управляющие символы ISO 8859

80, PADDING CHARACTER, символ-заполнитель.

81, HIGH OCTET PRESET, ???.

82, BREAK PERMITTED HERE, здесь разрешён разрыв строки.

83, NO BREAK HERE, здесь не разрешён разрыв строки.

84, INDEX, ???.

85, NEXT LINE, следующая строка. Одновременно переводит строку и возвращает позицию печати к началу строки (эквивалентно \r\n).

86, START OF SELECTED AREA, начало выделенной области.

87, END OF SELECTED AREA, конец выделенной области.

88, CHARACTER TABULATION SET, установка позиций горизонтальной табуляции.

89, CHARACTER TABULATION WITH JUSTIFICATION, установка позиций и выравнивания горизонтальной табуляции.

8A, LINE TABULATION SET, установка позиций вертикальной табуляции.

8B, PARTIAL LINE FORWARD, частичный перевод строки вперёд.

, PARTIAL LINE BACKWARD, частичный перевод строки назад.

8D, REVERSE LINE FEED, обратный перевод строки.

8E, SINGLE SHIFT TWO, 2-e значение для следующего символа.

8F, SINGLE SHIFT THREE, 3-e значение для следующего символа.

90, DEVICE CONTROL STRING, строка управления устройством.

91, PRIVATE USE ONE, пользовательский символ № 1.

92, PRIVATE USE TWO, пользовательский символ № 2.

93, SET TRANSMIT STATE, установка режима передачи.

94, CANCEL CHARACTER, символ отмены.

95, MESSAGE WAITING, есть сообщение.

96, START OF GUARDED AREA, начало защищённой области.

97, END OF GUARDED AREA, конец защищённой области.

98, START OF STRING, начало строки.

99, SINGLE GRAPHIC CHARACTER INTRODUCER, следующий символ интерпретируется как специальный графический.

9A, SINGLE CHARACTER INTRODUCER, следующий символ интерпретируется как управляющий.

9B, CONTROL SEQUENCE INTRODUCER, начало управляющей последовательности. Обычно этот символ эквивалентен Escape+[.

9C, STRING TERMINATOR, окончание строки.

9D, OPERATING SYSTEM COMMAND, команда операционной системы.

9E, PRIVACY MESSAGE, секретное сообщение.

9F, APPLICATION PROGRAM COMMAND, команда прикладной программы.

Управляющие символы Unicode

034F, COMBINING GRAPHEME JOINER. Объединить символы, стоящие слева и справа (создать лигатуру).

200B, ZERO-WIDTH SPACE, пробел нулевой ширины. При выравнивании по ширине может расширяться.

200C, ZERO WIDTH NON-JOINER. Запрещает образование лигатур.

200D, ZERO WIDTH JOINER. Разрешает образование лигатур.

200E, LEFT-TO-RIGHT MARK. Писать слева направо.

200F, RIGHT-TO-LEFT MARK. Писать справа налево.

2028, LINE SEPARATOR, разделитель строк. Разделяет строки текста, но не абзацы.

2029, PARAGRAPH SEPARATOR, разделитель абзацев. Разделяет абзацы текста.

202A, LEFT-TO-RIGHT EMBEDDING. Начало текста, написанного слева направо, внутри текста, написанного справа налево.

202B, RIGHT-TO-LEFT EMBEDDING. Начало текста, написанного справа налево, внутри текста, написанного слева направо.

202C, POP DIRECTIONAL FORMATTING. Конец вставленного текста с другим направлением.

202D, LEFT-TO-RIGHT OVERRIDE. Заменить текст, написанный слева направа, текстом, написанным справа налево.

202E, RIGHT-TO-LEFT OVERRIDE. Заменить текст, написанный справа налево, текстом, написанным слева направо.

2060, WORD JOINER, соединитель слов.

FE01FE0F, VARIATION SELECTOR-1…16, выбор варианта начертания № 1 … № 16.

FEFF, ZERO WIDTH NO-BREAK SPACE / BYTE ORDER MARK, неразрывный пробел нулевой ширины / индикатор порядка байтов. Этот символ используется для указания того, что данный файл записан в UTF-16 или UTF-32 с определённым порядком байтов (поскольку символа FFFE нет, а в UTF-8 байты FE и FF не используются). Использование этого символа в качестве неразрывного пробела нулевой ширины не рекомендуется; для этого есть символ U+2060 (word joiner).

FFFD, REPLACEMENT CHARACTER, заменяющий символ. Используется, когда значение символа неизвестно или не может быть выражено в Уникоде (см. также символ 1A).

E0100E01EF, VARIATION SELECTOR-17…256, выбор варианта начертания № 17 … № 256.

Кодировки символов
Основы → алфавиттекстфайлданные ) • набор символов • конверсия
Исторические кодировки → Докомп.: семафорная (Макарова)МорзеБодоМТК-2 Комп.: 6 битУППRADIX-50EBCDICДКОИ-8 ) • КОИ-7ISO 646
совре-
менное
8-битное
представ-
ление
символы ASCIIуправляющиепечатные ) не-ASCII ( псевдографика )
8бит. код.стр. Разные →   Кириллица: КОИ-8ГОСТ 19768-87MacCyrillic
ISO 8859 → 1(лат.) 2 3 4 5(кир.) 6 7 8 9 10 11 12 13 14 15(€) 16
Windows → 1250 1251(кир.) 1252 1253 1254 1255 1256 1257 1258 | WGL4
IBM&DOS → 437850852855866 «альт.» • ( МИК ) • ( НИИ ЭВМ )
Много-
байтные
Традиционные → DBCSGB2312 ) • HTML
Unicode → UTF-16UTF-8список символовкириллица )
Связанные
темы →
интерфейс пользователяраскладка клавиатурылокальперевод строкишрифткракозябрытранслитнестандартные шрифты • текст как изображение Утилиты: iconvrecode

Wikimedia Foundation. 2010.

Игры ⚽ Поможем решить контрольную работу

Полезное


Смотреть что такое "Управляющие символы" в других словарях:

  • управляющие символы — В коммуникациях любые дополнительные символы, используемые для управления передачей или ее облегчения (например, символы, связанные с опросом, кадрированием, синхронизацией, контролем ошибок и т.п.).  [http://www.lexikon.ru/dict/net/index.html]… …   Справочник технического переводчика

  • управляющие символы ФОРТРАНа — — [http://slovarionline.ru/anglo russkiy slovar neftegazovoy promyishlennosti/] Тематики нефтегазовая промышленность EN Fortran control characters …   Справочник технического переводчика

  • Управляющие последовательности ANSI — У этого термина существуют и другие значения, см. ANSI (значения). Управляющие символы ANSI (англ. ANSI escape code)  символы, встраиваемые в текс …   Википедия

  • Управляющие знаки — Управляющие символы элементы данной кодировки, которым не приписано графическое представление, но которые используются для управления устройствами, организации передачи данных и других целей. Сейчас для этих целей применяются форматы файлов,… …   Википедия

  • Символы, представленные в Юникоде — В Юникоде зарезервировано 1 112 064 (= 220 + 216 − 211) позиций символов, из которых сейчас используется свыше 100 000. Первые 256 знакомест совпадают с кодовой таблицей ISO 8859 1 («Латиница 1»). Кодовое… …   Википедия

  • Представленные в Юникоде Символы — В Юникоде зарезервировано 1 114 112 (= 220 + 216) позиций символов, из которых сейчас используется свыше 100 000. Первые 256 знакомест совпадают с кодовой таблицей ISO 8859 1 («Латиница 1»). Кодовое пространство разделено на 17 «плоскостей» по… …   Википедия

  • ГОСТ Р ИСО 22742-2006: Автоматическая идентификация. Кодирование штриховое. Символы линейного штрихового кода и двумерные символы на упаковке продукции — Терминология ГОСТ Р ИСО 22742 2006: Автоматическая идентификация. Кодирование штриховое. Символы линейного штрихового кода и двумерные символы на упаковке продукции оригинал документа: 3.8 Data Matrix : Двумерная матричная символика с коррекцией… …   Словарь-справочник терминов нормативно-технической документации

  • Печатные символы — Печатные символы  элементы набора символов, имеющие графическое представление, например в виде значка на бумаге или определённого рисунка на экране. Примерами печатных символов являются буквы, цифры, знаки препинания и псевдографические… …   Википедия

  • Псевдографические символы — Псевдографика общее название символов, которые предназначены не для записи текста на каком либо языке, а для графического оформления интерфейса пользователя например, для рисования рамочек и таблиц. Псевдографика широко используется программами… …   Википедия

  • ASCII — У этого термина существуют и другие значения, см. ASCII (значения). ASCII ASCII (англ. American Standard Code for Information …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»