Равномерное кодирование информации
Задача 1. ОГЭ
Как измерять количество информации?
- Один из способов — алфавитный. Этот подход позволяет определить количество информации в текстовом сообщении, составленном из символов некоторого алфавита.
- Алфавит — упорядоченный набор отличных друг от друга символов, которые используются в языке. Их количество в алфавите называется мощностью.
- Чему равна мощность двоичного алфавита?
Мощность алфавита
- Катя с Петей пишут друг другу записки на секретном языке. В нём
12 иероглифов и 6 специальных знаков
(пробел, точка, запятая, тире, восклицательный и вопросительный знаки).
- Вычисли мощность алфавита.
18
Мощность алфавита
- Профессор хочет скрыть свои секретные разработки от конкурентов, поэтому он создал шифрованный язык для записей. В нём используются
15 специальных символов, а также знаки пунктуации: точка, запятая, двоеточие, точка с запятой, тире, скобки (2 символа), восклицательный и вопросительный знаки.
- Вычисли мощность алфавита.
24
Сообщение
- Последовательность символов алфавита называется сообщением.
- Длина сообщения — это число символов в нём.
- Запомни! Знаки препинания и пробелы — это тоже символы.
- Чему равна длина сообщения ниже?
Я — умница, у меня всё получится.
33
Единицы измерения информации
- При наборе текста компьютер кодирует каждый символ, сохраняя его в памяти.
- Минимальная единица информации — бит, который представляет один знак двоичного кода.
- Он занимает всего одну ячейку памяти компьютера. Там может храниться 1 или 0.
- Сколько бит будет занимать двоичный код 10 010 11?
7
Единицы измерения информации
- Чем длиннее сообщение, тем больше бит требуется на кодировку. Чтобы считать количество информации было проще, нужно использовать дополнительные единицы её измерения.
- Вспомни названия для единиц измерения информации.
Перевод единиц измерения
- Переведи единицы измерения из одних в другие с помощью схемы.
Перевод единиц измерения
- Соедини величины из правого столбика с равными величинами из левого:
Информационный объём
- Информационный объём текста — это количество памяти, которое он занимает.
- Количество информации в сообщении складывается из информационных весов знаков, которые его составляют.
Вес символа
- Чтобы определить объём памяти на один символ, есть формула:
- Пример: алфавит содержит 16 символов.
- Сколько нужно бит, чтобы закодировать один символ алфавита мощностью 64 символа?
Как измерить объём текста?
Для этого нужно знать:
1. Сколько символов в тексте 2. Сколько бит используется для кодирования одного символа
Вычисли информационный объём сообщения «Привет, мир!» в битах, если каждый символ кодируется 8 битами.
Решение
1. Посчитай количество символов в сообщении. Учитывай знаки препинания и пробелы. Кавычки вокруг сообщения считать не надо.
2. В условии задачи найди информацию о том, сколько бит используется для кодирования одного символа:
3. Вычисли объём сообщения по формуле I = k ∙ i:
Информационный объём
Реши задачу по формуле.
Сколько байт памяти нужно для хранения текста из 1124 символов, если каждый из них кодируется 4 битами?
Кодирование текстовой информации
- Для кодирования текста используются специальные кодовые таблицы.
- Выбор стандарта кодировки зависит от того, как и для чего будет использован код.
- Информацию о том, сколько бит или байт используется для кодирования одного символа, ищи в условии задачи.
Котики
- Если ответ нужно получить в байтах, лучше сразу перевести вес одного символа из бит в байты.
Например:
- Сколько байт займёт слово «Котики» в кодировке UTF-8, где каждый символ кодируется 16 битами?
Oбъём памяти
- Катя написала текст без лишних пробелов:
Коты — мастера алгоритмов сна и еды.
- Какой объём памяти в байтах он займёт, если использовать кодировку Windows-1251, в которой на каждый символ приходится по 8 бит?
- Посчитай количество символов в предложении, учитывая, что между словами по одному пробелу, тире отделяется с двух сторон пробелами, а знаки препинания печатаются слитно с предыдущим словом.
Oбъём памяти
- В одной из кодировок Unicode каждый символ кодируется 16 битами.
- Определи размер предложения в байтах в этой кодировке:
Информатика — мой любимый предмет!
Удалили слово
- В кодировке КОИ-8 каждый символ кодируется 8 битами. Катя напечатала в ней текст без лишних пробелов:
ЮАР, Чили, Литва, Россия, Венгрия, Беларусь, Аргентина — страны.
- Она удалила из списка название одной из стран, запятую и пробел после него. Размер такого предложения стал на 11 байт меньше размера исходного.
- Выясним количество символов каждой страны:
- Напиши в ответе удалённое название страны.
Написали слово 2 раза
- В кодировке ASCII каждый символ кодируется 8 битами. Катя хотела напечатать в ней такой текст без лишних пробелов:
Моцарт, Бах, Шопен, Чайковский, Рахманинов, Вивальди, Лист — известные композиторы.
- Имя одного композитора ученица по случайности написала два раза подряд через пробел. Размер такого предложения стал на 6 байт больше размера исходного.
- Напиши в ответе имя, которое Катя напечатала дважды.
Удалили слово
- В кодировке UTF-32 каждый символ кодируется 32 битами. Петя напечатал в ней текст без лишних пробелов:
Лук, тыква, фасоль, артишок, патиссон, лагенария — овощи.
- Мальчик удалил из списка название одного из овощей, запятую и пробел после него. Размер такого предложения стал на 28 байт меньше размера исходного.
- Напиши в ответе удалённое название овоща.
Удалили слово
- В одной из кодировок Unicode каждый символ кодируется 2 байтами. Петя напечатал в ней текст без лишних пробелов:
Конфеты, шоколад, мармелад, зефир, печенье, пряники.
- Затем Петя удалил слова «зефир», «шоколад», запятые и пробелы после них.
- На сколько бит уменьшился при этом информационный объём текста? Напиши в ответе целое количество бит (единицы измерения указывать не нужно).
Удалили слово
- В кодировке UTF-16 каждый символ кодируется 16 битами. Ученик напечатал в ней текст без лишних пробелов:
Яблоко, груша, апельсин, персик, банан, киви.
- Затем ученик удалил слова «персик», «киви», запятые и пробелы после них.
- На сколько бит уменьшился при этом информационный объём текста? Напиши в ответе целое количество бит (единицы измерения указывать не нужно).
Заменили и удалили слово
- В кодировке UTF-8 каждый символ кодируется 16 битами. Ученик напечатал в ней текст без лишних пробелов:
Математика, физика, информатика, история, биология, география, химия, литература.
- Ученик заменил третье слово на «английский» и удалил пятое и седьмое слова, а также запятые и пробелы после них.
- На сколько байт изменился информационный объём сообщения? (Единицы измерения в ответе указывать не нужно).
Информационный объём
- Статья содержит 20 страниц. На каждой странице 40 строк, в каждой строке 48 символов.
- Определи информационный объём статьи в Кбайтах в кодировке Unicode, каждый символ в которой кодируется двумя байтами.
Информационный объём
- Текст располагается на 8 страницах, на каждой — 32 строки, в каждой строке 80 символов.
- Найди информационный объём текста в Кбайтах в кодировке Unicode, каждый символ в которой кодируется 8 битами.