Сохраните летнее настроение в новом учебном году! –90% на доступ к материалами по вашему предмету или классу

СДЕЛАЙТЕ СВОИ УРОКИ ЕЩЁ ЭФФЕКТИВНЕЕ, А ЖИЗНЬ СВОБОДНЕЕ

Благодаря готовым учебным материалам для работы в классе и дистанционно

Выбрать материалы

Скидки до 50 % на комплекты
только до

Готовые ключевые этапы урока всегда будут у вас под рукой

Организационный момент

Проверка знаний

Объяснение материала

Закрепление изученного

Итоги урока

Была в сети 07.07.2025 14:21

ТЕМИРОВА ЗАЛИНА АЛИКОВНА

Учитель информатики

125 лет

2 446

25 574

Подписчики

Подписки

Местоположение

Россия, с. Чикола

Специализация

Информатика

Математика

Обо мне Блог Файлы Тесты Галерея Активность Награды

Количество информации. Единицы измерения информации.

Категория: Информатика

29.09.2016 20:20

Цель урока: познакомить с единицами измерения информации, выяснить, что такое количество информации, узнать о существующих способах кодировки информации.

Просмотр содержимого документа
«Количество информации. Единицы измерения информации.»

Количество информации, единицы измерения информации

Мы постоянно что-то измеряем — время, длину, скорость, массу. И для каждой величины есть своя единица измерения, а зачастую несколько. Метры и километры, килограммы и тонны, секунды и часы — все это нам знакомо. А как же измерить информацию? Для информации тоже придумали единицу измерения и назвали ее бит.

В информатике используются различные подходы к измерению информации:

Содержательный подход к измерению информации. Сообщение – информативный поток, который в процессе передачи информации поступает к приемнику. Сообщение несет информацию для человека, если содержащиеся в нем сведения являются для него новыми и понятными Информация - знания человека ? сообщение должно быть информативно. Если сообщение не информативно, то количество информации с точки зрения человека = 0. (Пример: вузовский учебник по высшей математике содержит знания, но они не доступны 1-класснику)

Алфавитный подход к измерению информации не связывает кол-во информации с содержанием сообщения. Алфавитный подход - объективный подход к измерению информации. Он удобен при использовании технических средств работы с информацией, т.к. не зависит от содержания сообщения. Кол-во информации зависит от объема текста и мощности алфавита. Ограничений на max мощность алфавита нет, но есть достаточный алфавит мощностью 256 символов. Этот алфавит используется для представления текстов в компьютере. Поскольку 256=2⁸, то 1символ несет в тексте 8 бит информации.

Вероятностный подход к измерения информации. Все события происходят с различной вероятностью, но зависимость между вероятностью событий и количеством информации, полученной при совершении того или иного события можно выразить формулой которую в 1948 году предложил Шеннон.

Представление информации происходит в различных формах в процессе восприятия окружающей среды живыми организмами и человеком, в процессах обмена информацией между человеком и человеком, человеком и компьютером, компьютером и компьютером и так далее.

Кодирование — преобразование информации из одной формы представления (знаковой системы) в другую.

Декодирование - обратный процесс, когда из компьютерного кода знак преобразуется в его графическое изображение.

В процессе обмена информацией часто приходится производить операции кодирования и декодирования информации. При вводе знака алфавита в компьютер путем нажатия соответствующей клавиши на клавиатуре происходит кодирование знака, то есть преобразование его в компьютерный код.

Информация в компьютере представлена в двоичном коде, алфавит которого состоит из двух цифр (0 и 1). Т.о. все виды информации (слова, числа, рисунки, звуки, программы) в компьютере кодируются на машинном языке, в виде логических последовательностей нулей и единиц.

По этой причине в вычислительной технике для двоичных знаков 0 и 1 принят специальный термин - бит.

Бит — bit (от английского binary digit — двоичный знак).

Каждая цифра машинного двоичного кода несет количество информации, равное одному биту.

Количество информации - это мера уменьшения неопределенности.

1 БИТ – такое кол-во информации, которое содержит сообщение, уменьшающее неопределенность знаний в два раза. БИТ- это наименьшая единица измерения информации. Единицы измерения информации: 1байт = 8 бит

Единицы количества информации

Измерения в байтах
Десятичная приставка			Двоичная приставка
Название	Символ	Степень	Название	Символ				Степень
					МЭК		ГОСТ
байт	B	10⁰	байт	B		байт		2⁰= 8 бит
килобайт	kB	10³	кибибайт	KiB		Кбайт		2¹⁰= 1024 байта
мегабайт	MB	10⁶	мебибайт	MiB		Мбайт		2²⁰= 1024 Кбайта
гигабайт	GB	10⁹	гибибайт	GiB		Гбайт		2³⁰= 1024 Мбайта
терабайт	TB	10¹²	тебибайт	TiB		Тбайт		2⁴⁰= 1024 Гбайта
петабайт	PB	10¹⁵	пебибайт	PiB		Пбайт		2⁵⁰
эксабайт	EB	10¹⁸	эксбибайт	EiB		Эбайт		2⁶⁰
зеттабайт	ZB	10²¹	зебибайт	ZiB		Збайт		2⁷⁰
йоттабайт	YB	10²⁴	йобибайт	YiB		Йбайт		2⁸⁰

Формула Шеннона

I - количество информации

N – количество возможных событий

p_i – вероятности отдельных событий

Задача1: Какое количество информации будет содержать зрительное сообщение о цвете вынутого шарика, если в непрозрачном мешочке находится 50 белых, 25красных, 25 синих шариков

1) всего шаров 50+25+25=100

2) вероятности шаров 50/100=1/2, 25/100=1/4, 25/100=1/4

3)I= -(1/2 log₂1/2 + 1/4 log₂1/4 + 1/4 log₂1/4) = -(1/2(0-1) +1/4(0-2) +1/4(0-2)) = 1,5 бит

Количество информации достигает max значения, если события равновероятны, поэтому количество информации можно расcчитать по формуле

Задача2 : В корзине лежит 16 шаров разного цвета. Сколько информации несет сообщение, что достали белый шар?

т.к. N = 16 шаров, то I = log₂ N = log₂ 16 = 4 бит.

При вводе в компьютер текстовой и числовой информации происходит ее двоичное кодирование, изображение символа преобразуется в его двоичный код.

Пользователь нажимает на клавиатуре клавишу с символом, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код символа). Код символа хранится в оперативной памяти компьютера, где занимает один байт.

Например, слово «МАМА» кодируется 32-разрядным двоичным числом:

МАМА ® 11101101 11100001 11101101 11100001

Важно, что присвоение символу конкретного кода — это вопрос соглашения, которое фиксируется в кодовой таблице.

Средством кодирования служит таблица соответствия знаковых систем, которая устанавливает взаимно однозначное соответствие между знаками или группами знаков двух различных знаковых систем.

Пользователь не должен заботиться о перекодировках текстовых документов, так как это делают специальные программы-конверторы.

Кодирование информации в ПК заключается в том, что каждому символу ставится в соответствие уникальный двоичный код. Таким образом, человек различает символы по их начертаниям, а компьютер — по их кодам.

1 символ - 1 байт = 8 битов

ПРИМЕР 1.

Считая, что каждый символ кодируется одним байтом, оцените информационный объем сообщения: Без труда не вытащишь рыбку из пруда!

РЕШЕНИЕ:

Считаем количество символов в сообщении с учетом пробелов и знаков препинания. Получаем N=35. Т.к. один символ кодируется 1 байтом, то всё сообщение будет занимать в памяти компьютера 35 байт.

В настоящее время широкое распространение получил новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, поэтому с его помощью можно закодировать не 256 символов, а N = 2¹⁶ = 65536 различных символов. Эту кодировку поддерживают последние версии платформы Microsoft Windows&Office (начиная с 1997 года).

ПРИМЕР 2.

Сколько места в памяти надо выделить для хранение предложения в UNICODE: Привет, Вася!

РЕШЕНИЕ:

Считаем все символы, включая знаки препинания (здесь 13 символов). В кодировке UNICODE 1 символ занимает 2 байта. Ответ: 26 байт или 208 бит

ПРИМЕР 3.

Определить информационный объем книги из 150 страниц (каждая страница содержит 40 строк, 60 символов в каждой строке).

РЕШЕНИЕ:

40 * 60 * 150 = 360 000 байт / 1024 = 351,5625 Кбайт / 1024 = 0,34332275 Мбайт

Длина фразы составляет примерно 40 символов. Следовательно, ее объем можно приблизительно оценить в 40 х 2 = 80 байт. Такого варианта ответа нет, попробуем перевести результат в биты: 80 байт х 8 = 640 бит. Наиболее близкое значение из предложенных — 592 бита. Заметим, что разница между 640 и 592 составляет всего 48/16 = 3 символа в заданной кодировке и его можно считать несущественным по сравнению с длиной строки.

Замечание: Подсчетом символов в строке можно убедиться, что их ровно 37 (включая точку и пробелы), поэтому оценка 592 бита = 74 байта, что соответствует ровно 37 символам в двухбайтовой кодировке, является точной.

Алфавит – это набор букв, символов препинания, цифр, пробел и т.п.

Полное число символов в алфавите называют мощностью алфавита

Например, мощность алфавита из русских букв = 33 буквы + 10 цифр + 11 знаков препинания, скобки, пробел = 54 символа

ПРИМЕР 4.

Два текста содержат одинаковое количество символов. Первый текст составлен в алфавите мощностью 16 символов. Второй текст в алфавите мощностью 256 символов. Во сколько раз количество информации во втором тексте больше, чем в первом?

РЕШЕНИЕ:

Если первый текст составлен в алфавите мощностью (К) 16 символов, то количество информации, которое несет 1 символ (1) в этом тексте, можно определить из соотношения: N = 2', таким образом, из 16 = 2' получим 1 = 4 бита. Мощность второго алфавита - 256 символов, из 256 = 2' получим 1 = 8 бит. Т.к. оба текста содержат одинаковое количество символов, количество информации во втором тексте больше, чем в первом, в 2 раза.