Другая распространенная кодировка носит название КОИ-8 (код обмена информацией, восьмизначный) — ее происхождение относится ко времени действий Совета Экономической Взаимопомощи государств Восточной Европы. Сегодня кодировка КОИ-8 имеет широкое распространение в компьютерных сетях на территории России и в российском секторе Интернета.
Международный стандарт, в котором предусмотрена кодировка символов русского алфавита, носит название ISO (International Standard Organization — Международный институт стандартизации). На практике данная кодировка используется редко.
На компьютерах, работающих под операционной системой MS-DOS, могут действовать еще две кодировки (кодировка ГОСТ и кодировка ГОСТ альтернативная). Первая из них считалась устаревшей даже в первые годы появления персональной вычислительной техники, но вторая используется и по сей день.
В связи с изобилием систем кодировки текстовых данных, действующих в России возникает задача межсистемного преобразования данных — это одна из распространенных задач информатики.
Подводя некоторый итог, можно сказать, что текстовый файл — это файл, в котором каждый байт интерпретируется как изображаемый символ в некоторой системе кодировки. Кроме кодов изображаемых символов, текстовые файлы включают также ряд управляющих кодов, например, код возврата каретки, перевода строки, конца файла.
Универсальная система кодирования текстовых данных
Если проанализировать организационные трудности, связанные с созданием единой системы кодирования текстовых данных, то можно прийти к выводу, что они вызваны ограниченным набором кодов (256). В то время, очевидно, что если, например, кодировать символы не восьмиразрядными двоичными числами, а числами с большим количеством разрядов, то и диапазон возможных значений кодов станет намного больше. Такая система, основанная на 16-разрядном кодировании символов, получила название универсальной Unicode. Шестнадцать разрядов позволяют обеспечить уникальные коды для 65536 различных символов — этого поля достаточно для размещения в одной таблице символов большинства языков планеты.
Несмотря на тривиальную очевидность такого подхода, простой механический переход на данную систему долгое время сдерживался из-за недостаточных ресурсов средств вычислительной техники (в системе кодирования UNICODE все тестовые документы автоматически становятся вдвое длиннее). Во второй половине 90-х годов технические средства достигли необходимого уровня обеспеченности ресурсами, и сегодня наблюдается постепенный переход документов и программных средств на универсальную систему кодирования.
Кодировка Unicode
В системе Unicode (другое название ISO — International Standard Organization) для представления любого символа используется уже не один, а два байта. Поскольку в этом случае число возможных символов равно 216
или 65536, то могут удовлетворяться практически любые потребности всех национальных языков. В настоящее время система Unicode стала "de facto" мировым стандартом. Тем не менее, вряд ли на этом все и остановится. Несмотря на огромное количество возможных кодов (символов), система Unicode все же не способна удовлетворить всем типографским требованиям. Так что, процесс пошел, но "еще не вечер…"ASCII-кодировка, однако, не умерла. Она осталась как базовый формат для представления текстовой информации. Тексты, созданные в этом формате:
• не имеют различных начертаний шрифта;
• нет ни курсива, ни полужирного, ни подчеркнутого шрифта — он единый на все случаи жизни;
• отсутствуют понятия отступов, кеглей и гарнитур;
• каждая строка представляет собой самостоятельный абзац.
Тем не менее, у ASCII-формата имеется одно очень важное достоинство — он является стандартным, и его понимают абсолютно все программы, работающие с текстами.
Лекция 5
Текстовые редакторы и процессоры
Во многих видах человеческой деятельности требуется уметь обрабатывать текстовую информацию: писать, компоновать результирующий текст из различных источников, переписывать текст, удалять и вставлять фрагменты текста, делать несколько копий одного и тог же текста и т. д. Для облегчения такого традиционного труда для людей различных специальностей были созданы специальные компьютерные программы: текстовые редакторы и текстовые процессоры.
Первоначально появились текстовые редакторы с очень ограниченным количеством функций. Сами же редакторы делились на две категории:
• Командные редакторы очень сложны для неподготовленного пользователя и сейчас практически не находят применения.