Тема урока:
- Кодирование текстовой информации
Цель урока:
- Повторить понятия: код, кодирование.
- Познакомиться с кодированием текстовой информации в компьютере.
Рассматриваемые вопросы
- Исторический экскурс
- Двоичное кодирование текстовой информации
- Расчет количества текстовой информации
Кодирование представление информации с помощью некоторого кода или процесс создания кода. Код (фр. code, лат. codex - свод законов) – система условных знаков для передачи, обработки и хранения различной информации.
Примеры кодирования текстовой информации
Сурдожесты - язык жестов, используемый людьми с нарушениями слуха
Азбука Морзе или неравномерный телеграфный код, в котором каждая буква или знак представлены своей комбинацией коротких элементарных посылок электрического тока (точек) и элементарных посылок утроенной продолжительности (тире)
Криптография - это тайнопись, система изменения письма с целью сделать текст непонятным для непосвященных лиц
Вопрос: Какие примеры кодирования текстовой информации можно привести еще?
Код Цезаря
Этот метод основан на замене каждой буквы шифруемого текста на другую, путем смещения в алфавите от исходной буквы на фиксированное количество символов, причем алфавит читается по кругу, т.е. после Я рассматривается А.
Юлий Цезарь
( I век до н.э.)
Код Цезаря
Замени каждую букву шифруемого текста на другую путем смещения в алфавите от исходной буквы на фиксированное количество символов !
Закодируем Б А Й Т – сместим на 2 символа вправо
Юлий Цезарь
( I век до н.э.)
Получим:
Г
В
Л
Ф
А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я1
Задание:
Расшифруйте фразу персидского поэта Джалаледдина Руми «кгнусм ёогкг фесл тцфхя фзужщз фхгрзх ёогксп», закодированную с помощью шифра Цезаря. Известно, что каждая буква исходного текста заменяется третьей после нее буквой.
Руми
1207-1273
Ответ: Закрой глаза свои пусть сердце станет глазом
Начиная с 60-х годов, компьютеры все больше стали использовать для обработки текстовой информации и в настоящее время большая часть ПК в мире занято обработкой именно текстовой информации.
Информация, выраженная с помощью естественных и формальных языков в письменной форме, называется текстовой информацией.
Двоичное кодирование текстовой информации
Для представления текстовой информации достаточно 256 знаков. По формуле N = 2 I 256= 2 8 , следовательно для кодирования одного символа используется количество информации равное 1 байту.
Двоичное кодирование текстовой информации
Двоичное кодирование текстовой информации
Для кодирования 1 символа используется
1 байт информации.
1 байт
256 символов
66 букв
русского
алфавита
52 буквы
английско-
го
алфавита
0-9
цифры
Двоичное кодирование текстовой информации
Кодирование заключается в том, что каждому символу ставиться в соответствие уникальный двоичный код от 00000000 до 11111111 (или десятичный код от 0 до 255).
Различные кодировки знаков
Важно, что присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется кодовой таблицей.
Для разных типов ЭВМ используются различные кодировки
Таблица кодировки ASCII
С распространением IBM PC международным стандартом стала таблица кодировки ASCII ( American Standart Code for Information Interchange ) – Американский стандартный код для информационного обмена.
Стандартной в этой таблице является только первая половина, т.е. символы с номерами от 0 (00000000) до 127 (0111111). Сюда входят буква латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы.
Остальные 128 кодов используются в разных вариантах. В русских кодировках размещаются символы русского алфавита
Таблица кодировки ASCII
- Таблица расширенного кода ASCII Кодировка Windows-1251 (CP1251)
Таблицы кодировки русскоязычных символов
КОИ8-Р
Таблицы кодировки русскоязычных символов
CP1251
Таблицы кодировки русскоязычных символов
CP866
Mac
ISO
В настоящее время существует 5 разных кодовых таблиц для русских букв (КОИ8, СР1251 , СР866, Mac, ISO ).
Широкое распространение получил новый международный стандарт Unicode , который отводит на каждый символ два байта., что позволяет читать буквы любой страны на любом компьютере.
Кодовые таблицы для русских букв
Кодировка Unicode
1 символ - 2 байта (16 бит), которыми можно закодировать
?
символов
Кодировка Unicode обозначение
UCS-2 (используется 2 байта, для кодирования)
UCS- 4 (используется 4 байта для кодирования)
Сегодня очень многие люди для подготовки писем, документов, статей, книг и пр. используют компьютерные текстовые редакторы . Компьютерные редакторы, в основном, работают с алфавитом размером 256 символов .
В этом случае легко подсчитать объем информации в тексте. Если 1 символ алфавита несет 1 байт информации , то надо просто сосчитать количество символов; полученное число даст информационный объем текста в байтах.
Информационный объем текста
I=K×i , где
I -информационный объем сообщения
K- количество символов в тексте
i- информационный вес одного символа
2 i = N
N- мощность алфавита
Формулы для расчета информационного объема текста
Расчет количества текстовой информации
Ученье – атаман, а неученье – комар.
Вопрос: Сколько символов?
Вопрос: Каков информационный объем файла?
Решение задач
- Задача №1. Условие: Считая, что каждый символ кодируется 1 байтом, оцените информационный объем следующего предложения:
«Мой дядя самых честных правил, Когда не в шутку занемог, Он уважать себя заставил и лучше выдумать не мог».
Решение задач
- Задача №2. Условие: Лазерный принтер Canon LBP печатает со скоростью в среднем 6,3 Кбит в секунду. Сколько времени понадобится для распечатки 8-ми страничного документа, если известно, что на одной странице в среднем по 45 строк, в строке 70 символов (1 символ – 1 байт)
Вспомним основные понятия:
- В чем заключается кодирование текстовой информации в компьютере?
- Закодируйте с помощью ASCII -кода свою фамилию, имя, номер класса.
- Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинского четверостишия:
Певец-Давид был ростом мал, Но повалил же Голиафа!
Вопросы и задания:
Оцените сегодняшний урок: 0- нет, 1-да
- Вам было интересно на уроке?
- Вы узнали что-то новое на уроке?
- Был ли доступен изучавшийся материал?
- Вы его поняли?
- Готовы ли вы на следующих уроках применить его на практике?
Домашнее задание
- §2.1 ст. 49 -52
- Задача 2.1
- Записи в тетрадях
Спасибо за внимание!
Задание 1
- Мощность алфавита равна 256. Сколько Кбайт памяти потребуется для сохранения 160 страниц текста, содержащего в среднем 192 символа на каждой странице?
Задание 1 ’
- Мощность алфавита равна 64. Сколько Кбайт памяти потребуется, чтобы сохранить 128 страниц текста, содержащего в среднем 256 символов на каждой странице?
Задание 2
- Объем сообщения – 7,5 Кбайт. Известно, что данное сообщение содержит 7680 символов. Какова мощность алфавита?
Задание 2’
- Объем сообщения равен 11 Кбайт. Сообщение содержит 11264 символа. Какова мощность алфавита?
Задание 3
Племя Мумбу-Юмбу использует алфавит из букв: α β γ δ ε ζ η θ λ μ ξ σ φ ψ , точки и для разделения слов используется пробел.
Сколько информации несет свод законов племени, если в нем 12 строк и в каждой строке по 20 символов?
Задание 3’
- Для кодирования секретного сообщения используются 12 специальных значков-символов. При этом символы кодируются одним и тем же минимально возможным количеством бит. Чему равен информационный объем сообщения длиной в 256 символов ?