Алфавитный подход к измерению информации
Цель: научить рассчитывать количество информации, переданное в тексте.
Алфавитный подход к измерению информации позволяет определить количество информации, заключенной в тексте. Алфавитный подход является объективным, т.е. он не зависит от субъекта (человека), воспринимающего текст.
Множество символов, используемых при записи текста, называется алфавитом. Полное количество символов в алфавите называется мощностью (размером) алфавита. Если допустить, что все символы алфавита встречаются в тексте с одинаковой частотой (равновероятно), то количество информации, которое несет каждый символ, вычисляется по формуле:
i = log2N,
где N — мощность алфавита. Следовательно, в 2-х символьном алфавите каждый символ «весит» 1 бит (log22 = 1); в 4-х символьном алфавите каждый символ несет 2 бита информации (log24 = 2); в 8-ми символьном — 3 бита (log28 = 3) и т.д.
Один символ из алфавита мощностью 256 (28) несет в тексте 8 бит информации. Такое количество информации называется байт. Алфавит из 256 символов используется для представления текстов в компьютере.
1 байт = 8 бит.
Если весь текст состоит из К символов, то при алфавитном подходе размер содержащейся в нем информации равен:
I = К * i,
где i — информационный вес одного символа в используемом алфавите.
Для измерения информации используются и более крупные
единицы:
1 Кбайт (килобайт) = 210 байт = 1024 байта 1 Мбайт (мегабайт) = 210 Кбайт = 1024 Кбайта 1 Гбайт (гигабайт) — 210 Мбайт - 1024 Мбайта
Пример 1. Книга, набранная с помощью компьютера, содержит 150 страниц; на каждой странице — 40 строк, в каждой строке — 60 символов. Каков объем информации в книге?
Решение. Мощность компьютерного алфавита равна 256. Один символ несет 1 байт информации. Значит, страница содержит 40 х 60 = 2400 байт информации. Объем всей информации в книге (в разных единицах):
2400 х 150 = 360 000 байт. - ..
360000/1024 = 351,5625 Кбайт.
351,5625/1024 = 0,34332275 Мбайт.
Задачи
Алфавит племени Мульти состоит из 8 букв. Какое количество информации несет одна буква этого алфавита? (3 бит)
2. Сообщение, записанное буквами из 64-х символьного алфавита, содержит 20 символов. Какой объем информации оно несет? (120 бит)
3. Племя Мульти имеет 32-х символьный алфавит. Племя Пульти использует 64-х символьный алфавит. Вожди племен обменялись письмами. Письмо племени Мульти содержало 80 символов, а письмо племени Пульти — 70 символов. Сравните объемы информации, содержащейся в письмах. (400 и 420 бит)
4. Информационное сообщение объемом 1,5 Кбайт содержит 3072 символа. Сколько символов содержит алфавит, при помощи которого было записано это сообщение? (16 символов)
5. Объем сообщения, содержащего 2048 символов, составил I 1/512 часть Мбайта. Каков размер алфавита, с помощью которого записано сообщение? (256 символов)
6. Сколько символов содержит сообщение, записанное с помощью 16-ти символьного алфавита, если объем его составил 1/16 часть Мбайта? (131072 символа)
7. Сколько килобайтов составляет сообщение, содержащее 12288 битов? (1,5 Кбайт)
8. Сколько килобайтов составит сообщение из 384 символов 16-ти символьного алфавита? (0,1875 Кбайт)
9. Для записи текста использовался 256-символьный алфавит. Каждая страница содержит 30 строк по 70 символов в строке. Какой объем информации содержат 5 страниц текста? (10500 байт)
10. Сообщение занимает 3 страницы по 25 строк. В каждой строке записано по 60 символов. Сколько символов в использованном алфавите, если все сообщение содержит 1125 байтов? (4 символа)
11. Для записи сообщения использовался 64-х символьный алфавит. Каждая страница содержит 30 строк. Все сообщение содержит 8775 байтов информации и занимает 6 страниц. Сколько символов в строке? (65 символов)
12. Сообщение занимает 2 страницы и содержит 1/16 Кбайта информации. На каждой станице записано 256 символов. Какова мощность использованного алфавита? (2 символа)
13. Два сообщения содержат одинаковое количество символов. Количество информации в первом тексте в 1,5 раза больше, чем во втором. Сколько символов содержат алфавиты, с помощью которых записаны сообщения, если известно, что число символов в каждом алфавите не превышает 10 и на каждый символ приходится целое число битов? (3 и 2 символа)
14. Два сообщения содержат одинаковое количество информации. Количество символов в первом тексте в 2,5 раза меньше, чем во втором. Сколько символов содержат алфавиты, с помощью которых записаны сообщения, если известно, что размер каждого алфавита не превышает 32 символов и на каждый символ приходится целое число битов? (32 и 4 символа)
15. ДНК человека (генетический код) можно представить себе как некоторое слово в четырехбуквенном алфавите, где каждой буквой помечается звено цепи ДНК, или нуклеотид. Сколько информации (в битах) содержит ДНК человека, содержащий примерно 1,5 х 1023 нуклеотидов? (31023 бит)
16. Выяснить, сколько бит информации несет каждое двухзначное число (отвлекаясь от его конкретного числового значения). (6,67 бит)