§ 1.2.3
Кодирование информации с помощью знаковых систем
Знаковые системы
Кодирование информации
Виды знаковых систем
Естественные языки
Формальные языки
Двоичная знаковая система
Генетический алфавит
В процессе восприятия, передачи и хранения информации живыми организмами, человеком и техни-ческими устройствами происходит кодирование информации.
- Кодирование информации - процесс формирования опреде-лённого представления инфор-мации .
- Способ кодирования зависит от цели, ради которой оно осуществляется: сокращение запи-си, засекречивание (шифровка) информации, удобство обработки и т.д.
Способы кодирования информации:
- Графический – с помощью специальных рисунков или графических значков.
Числовой – с помощью чисел.
Символьный – с помощью символов того же алфавита, что и исходный текст.
Основные атрибуты кодирования - код, знак, язык, с помощью которых информация фиксируется и передается в пространстве и времени.
Полный набор символов, используемый для кодирования, называется алфавитом или азбукой.
Можно закодировать информацию, заменяя каждую букву исходного текста, например, следующей после нее буквой в алфавите. Такой код называют ШИФРОМ замены. замены
В этом случае исходное сообщение:
АЛ ЦВЕТ МИЛ НА ВЕСЬ СВЕТ
примет вид:
БМ ЧГЁУ НКМ ОБ ГЁТЭ ТГЁУ
2
Результатом кодирования является последовательность символов данной знаковой системы , то есть информационный код.
Количество знаков в коде называется длиной кода .
Пример:
- Длина кода текста учебника
информатики 8 класса –
300 000 тысяч знаков.
- Генетический код человека – 3 миллиарда знаков генетического алфавита.
- В процессе обмена информацией между людьми приходится переходить от одной формы информации к другой.
- В процессе преобразования информации из одной формы представления (знаковой системы) в другую происходит перекодирование информации.
- Перекодирование – это процесс преобразования знаков из одной знаковой системы в знаки другой знаковой системы.
- Средством перекодирования служит таблица соответствия знаковых систем (кодировочная таблица), которая устанавливает соответствие между знаками различных знаковых систем.
Упражнения :
№ 1
Помогите прочитать капитану корабля следующий текст:
№ 2
Дана кодовая таблица азбуки Морзе.
Расшифруйте (декодируйте), что здесь написано (буквы отделены друг от друга пробелами)?
- - - - - ● - ● ● - - - - ●● - ● - ● - ● - -
Стандарты кодировок:
- КОИ - 8 - UNIX
- CP1251 ( « CP » означает « Code Page ») - Microsoft Windows
- CP 866 - MS-DOS
- Mac - Macintosh
- ISO 8859 – 5
К сожалению, в настоящее время существует 5 различных кодовых таблиц для русских букв, поэтому тексты созданные в одной кодировке, не будут правильно отображаться в другой.
Хронологически одним из первых стандартов кодирования русских букв на компьютерах был код КОИ – 8 («Код обмена информационный – 8 битный»). Эта кодировка применяется в компьютерах с операционной системой UNIX.
Задание: Закодируйте свое имя на основе кодировочных таблиц КОИ8, СР1251, ISO -8859-5.
КОИ8
("Код обмена информацией, 8-битный").
13
Наиболее распространенная кодировка – это стандартная кириллистическая кодировка, Microsoft Windows обозначаемая сокращением CP1251 ( « CP » означает « Code Page »). Все Windows – приложения, работающие с русским языком, поддерживают эту кодировку.
CP1251 ("CP" означает "Code Page", "кодовая страница").
13
Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка кодировку под названием ISO 8859-5.
13
При двоичном кодировании текстовой информации каждому символу ставится в соответствие своя уникальная последовательность из восьми нулей и единиц, свой уникальный код от 00000000 до 11111111 (десятичный код от 0 до 255)
Коды с 128 по 255 являются национальными, т.е. в национальных кодировках одному и тому же коду соответствуют различные символы
Для работы в среде операционной системы MS-DOS используется «альтернативная» кодировка, в терминологии фирмы Microsoft – кодировка CP 866 .
Фирма Apple разработала для компьютеров Macintosh свою собственную кодировку русских букв (Mac)
Стандартная кодировка ASCII
Автор: Доронина Екатерина Валерьевна, МКОУ СОШ № 1, Г. Коркино
Самостоятельная работа
Используя кодировочную таблицу ASCII
(American Standard Code for Information Interchang)
А) Закодируйте слова:
1. Windows 2. D e l e t e 3
Б) Декодируйте в слова:
1. 84 111 114 110 97 100 111
2. 69 110 116 101 114
E nd
О Т В Е Т Ы:
А)
- 87 105 110 100 111 119 115
- 68 101 108 101 116 101
- 69 110 100
Б)
Проверка задания: Закодируйте свое имя на основе кодировочных таблиц КОИ8-Р, СР1251, ISO
ПРИМЕР:Последовательности десятичных кодов слова «ЭВМ» в различных кодировках:
Э
В
М
247
237
КОИ8-Р
252
194
204
221
СР1251
ISO 8859-5
205
178
188
Домашнее задание