Измерение информации. Алфавитный подход
10 класс
Автор: Приходько М.С.
Гимназия РУТ(МИИТ)
Объем информации
Алфавитный подход к измерению информации применяется в цифровых (компьютерных) системах хранения и передачи информации.
Система кодирования: двоичная ( 0 и 1 )
Формула:
N=2 i
N-мощность алфавита
i = 2 , можно построить 4 двухразрядные комбинации из нулей и единиц, т. е. закодировать 4 символа .
При i = 3 существует 8 трехразрядных комбинаций нулей и единиц (кодируется 8 символов)
i=2
00
i=3
01
000
10
001
11
010
011
100
101
110
111
Пример:
Английский алфавит содержит 26 букв.
Расширенный алфавит = 32 символа.
32=2 5
Итог:
Все символы можно закодировать всевозможными пятиразрядными двоичными кодами от 00000 до 11111.
Пятиразрядный код использовался в телеграфных аппаратах, появившихся еще в XIX веке.
Телеграфный аппарат при вводе переводил английский текст в двоичный код, длина которого в 5 раз больше, чем длина исходного текста.
В двоичном коде каждая двоичная цифра несет одну единицу информации, которая называется 1 бит .
Бит является основной единицей измерения информации
Длина двоичного кода, с помощью которого кодируется символ алфавита, называется информационным весом символа .
Информационный объем текста складывается из информационных весов всех составляющих текст символов .
Информационный объем
i — информационный вес символа алфавита, а К — количество символов в тексте, записанном с помощью этого алфавита, то информационный объем I текста выражается формулой:
I = К x i (битов)
Для определения информационного веса символа полезно знать ряд целых степеней двойки. Вот как он выглядит в диапазоне от 2 1 до 2 10 :
Соответствующее значение i в первой строке будет равно информационному весу символа .
Более крупной, чем бит, единицей измерения информации является байт:
1 байт = 8 битов
Информационный объем текста в памяти компьютера измеряется в байтах.
Он равен количеству символов в записи текста .
Единица измерения информации
1 Кб (килобайт) = 2 10 байтов = 1024 байта;
1 Мб (мегабайт) = 2 10 Кб = 1024 Кб;
1 Гб (гигабайт) = 2 10 Мб = 1024 Мб;
1 Тб (терабайт) = 2 10 Гб = 1024 Гб.
В компьютере любые виды информации: тексты, числа, изображения, звуки — представляются в форме двоичного кода.
Объем информации любого вида, выраженный в битах, равен длине двоичного кода, в котором эта информация представлена.
Задание
Возьмите страницу текста из данного учебника и подсчитайте информационные объемы текста, получаемые при кодировании его семиразрядным и восьмиразрядным кодами.
Результаты выразите в килобайтах и мегабайтах.