Кодирование текстовой информации
Начиная с 60-х годов, компьютеры все больше стали использовать для обработки текстовой информации и в настоящее время большая часть ПК в мире занято обработкой именно текстовой информации.
Традиционно для кодирования одного символа используется количество информации = 1 байту
(1 байт = 8 битов).
Что нужно знать :
- все символы кодируются одинаковым числом бит (алфавитный подход)
- чаще всего используют кодировки, в которых на символ отводится 8 бит (8-битные) или 16 бит (16-битные)
- при измерении количества информации принимается, что в одном байте 8 бит, а в одном килобайте (1 кбайт) – 1024 байта, в мегабайте (1Мбайт) – 1024 Кбайта
1 символ – 1 байт (8 бит)
Для кодирования одного символа требуется один байт информации.
Учитывая, что каждый бит принимает значение 1 или 0, получаем, что с помощью 1 байта можно закодировать 256 различных символов.
2 8 =256
Двоичное кодирование текстовой информации
Кодирование заключается в том, что каждому символу ставится в соответствие уникальный двоичный код от 00000000 до 11111111 (или десятичный код от 0 до 255).
Важно, что присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется кодовой таблицей.
Таблица кодировки
Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера (коды), называется таблицей кодировки .
Для разных типов ЭВМ используются различные кодировки. С распространением IBM PC международным стандартом стала таблица кодировки ASCII ( A merican S tandart C ode for I nformation I nterchange ) – Американский стандартный код для информационного обмена.
- Таблица расширенного кода ASCII Кодировка Windows-1251 (CP1251)
Информационный объем текста
- чтобы найти информационный объем текста L (P=2 I ) , нужно умножить количество символов ( N) на число бит на 1 символ ( K) : L = N * K
- мощность алфавита – это количество символов в этом алфавите.
Задача
1
Определите информационный объем текста Бамбарбия! Кергуду! 1) 38 бит 2) 144 бита 3) 152 бита 4) 19 бит
Решение :
1) в этом тексте 19 символов (обязательно считать пробелы и знаки препинания)
2) если нет дополнительной информации, считаем, что используется 8-битная кодировка (чаще всего явно указано, что кодировка 8- или 16-битная)
3) поэтому в сообщении 19*8 = 152 бита информации
Ответ 3.
Автоматическое устройство осуществило перекодировку информационного сообщения на
русском языке, первоначально записанного в
16-битном коде Unicode, в 8-битную кодировку
КОИ-8. При этом информационное сообщение уменьшилось на 480 бит. Какова длина сообщения в символах?
1) 30 2) 60 3) 120 4) 480
Задача
2
Решение :
обозначим количество символов через N
при 16-битной кодировке объем сообщения – 16* N бит
когда его перекодировали в 8-битный код, его объем стал равен– 8* N бит, таким образом, сообщение уменьшилось
на 16* N – 8* N = 8* N = 480 бит , отсюда
находим N = 480/8 = 60 символов
Ответ 2.
В велокроссе участвуют 119 спортсменов. Специальное устройство регистрирует прохождение каждым из участников промежуточного финиша, записывая его номер с использованием минимально возможного количества бит, одинакового для каждого спортсмена. Каков информационный объем сообщения, записанного устройством, после того как промежуточный финиш прошли 70 велосипедистов?
1) 70 бит 2) 70 байт 3) 490 бит 4) 119 байт
Задача
3
Решение :
1) велосипедистов было 119, у них 119 разных номеров, то есть, нам нужно закодировать 119 вариантов
2) по таблице степеней двойки находим, что для этого нужно минимум 7 бит (при этом можно закодировать 128 вариантов, то есть, еще есть запас); итак, 7 бит на один отсчет
3) когда 70 велосипедистов прошли промежуточный финиш, в память устройства записано 70 отсчетов
поэтому в сообщении
70*7 = 490 бит информации.
Ответ 3.
Задача
4
Объем сообщения, содержащего 4096 символов,
равен 1/512 части Мбайта.
Какова мощность алфавита, с помощью которого записано это сообщение?
1) 8 2) 16 3) 4096 4) 16384
Решение.
1) объем сообщения
1 /512 Мбайт = 1024 /512 кбайт = 2 кбайт = 2048 байт
2) на 1 символ приходится 2048 байт / 4096 = 1/2 байта = 4 бита
3) 4 бита на символ позволяют закодировать 2 4 = 16 разных символов
4) поэтому мощность алфавита – 16 символов
Ответ 2.
1. Сравните количество информации:
а) 200 байт и 0,25 Кбайта;
б) 3 байта и 24 бита;
в) 1536 бит и 1,5 Кбайта;
г) 1000 бит и 1 Кбайт.
2. Подсчитать в Кбайтах количество информации в тексте, если текст состоит из 800 символов, а мощность используемого алфавита – 128 символов.
3. Сколько символов в тексте, если мощность алфавита – 64 символа, а объем информации, содержащийся в нем – 1,5 Кбайта?
Источники информации:
- http://kpolyakov.narod.ru - задания
- http :// pedsovet . su - идея
- www.photoshop-master.ru - рамка
- http:// www.giftube.ru - кошка
- www.gifpark.ru - анимация
5 ) Демонстрационные варианты ЕГЭ 2004-2009 гг.
6 ) Угринович Н.Д. Информатика и информационные технологии – М.: Бином: Лаборатория знаний, 2005 г.
7) Воронкова О.Б. «Информатика. Пособие для подготовки к ЕГЭ». Ростов-на-Дону, Феникс, 2010г.