Представление информации
План:
- Форма и язык представления информации
- Кодирование информации
- Представление информации в компьютере
1. Форма и язык представления информации
Информацию можно представить в различной форме:
- знаковой письменной, состоящей из различных знаков, среди которых принято выделять:
- символьную в виде текста, чисел, специальных символов (текст учебника)
- графическую (географическая карта)
- табличную (таблица записи хода физического эксперимента)
Инт формацию можно предст авит ь в различной форме:
- в виде жестов или сигналов (сигналы регулировщика дорожного движения)
- устной словесной (разговор)
- Основу любого языка составляет алфавит – конечный набор знаков (символов) любой природы, из которых формируется сообщение.
Языки делятся :
- естественные (разговорные)
- формальные – встречаются в специальных областях человеческой деятельности (математике, физике, химии и т.д.)
2. Кодирование информации
Представление информации с помощью какого – либо языка часто называют кодированием.
- Код – набор символов (условных обозначений) для представления информации
- Кодирование – процесс представления информации в виде кода
3. Представление информации в компьютере
- ЕДИНИЦЫ ИЗМЕРЕНИЯ ОБЪЕМА ИНФОРМАЦИИ В КОМПЬЮТЕРЕ
Бит – наименьшая единица измерения объема информации.
Объем информации в сообщении определяется количеством битов
Единицы измерения объема информации
Перевести:
- 2048 байт ………… Кб
- 3 Гб …………… Мб
- 52 Кб ……………………. бит
- 3000 бит ………… Кбит
Для преобразования информации в двоичные коды и обратно в компьютере должно быть организованно:
- Кодирование – преобразование входной информации в машинную форму, то есть двоичный код
- Декодировани е – преобразование двоичного кода в форму, понятную человеку
- Кодирование обеспечивается устройствами ввода , а декодирование – устройствами вывода
Кодирование числовой информации
Числа в компьютере представляются в двоичной системе счисления
Кодирование текстовой информации
ASCII (для кодирование одного символа выделяется 1 байт = 8 бит)
Unicode (для кодирования одного символа выделяется 2 байта = 16 бит)
I. Представление текстовой информации
Для обработки текстовой информации компьютер использует двоичную систему счисления, состоящую из двух цифр: 0 и 1.
В компьютере используется байтовый принцип организации памяти : к аждая клеточка – бит памяти.
Бит – это наименьшая единица измерения количества информации, принимающая значение 1 или 0.
Восемь подряд расположенных битов образуют байт.
Порядковый номер байта является его адресом. По этим адресам процессор обращается к данным, читая и записывая их в память.
В популярных системах кодировки (ASCII и др.) каждый символ заменяется на 8-разрядное целое положительное двоичное число, т.е. 1 символ компьютерного алфавита «весит» 8 битов.
Согласно формуле информатики 2 i = N можно закодировать: 2 8 = 256 символов.
Присвоение символу конкретного кода определено таблицей кодировки ASCII. Таблица кодов ASCII делится на две части. Международным стандартом является лишь первая половина таблицы, т.е. символы с номерами от 0 (00000000), до 127 (01111111). Сюда входят буква латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы.
Остальные 128 кодов используются в разных вариантах. В русских кодировках размещаются символы русского алфавита.
Первая половина таблицы кодов ASCII
Вторая половина таблицы кодов ASCII
В настоящее время получил широкое распространение новый международный стандарт Unicode, который отводит на каждый символ 2 байта. С его помощью можно закодировать (2 16 = 65536) различных символов.
Пример представления текста в памяти компьютера:
Кодирование текстовой информации
Кодирование – преобразование входной информации в машинную форму (в двоичный код).
Декодирование – преобразование двоичного кода в форму, понятную человеку.
Число символов алфавита ( мощность алфавита ) : N = 2 i
Информационный объем текста: I = i *К
где i - информационный вес одного символа;
i – информационный вес одного символа ( количество бит на кодирование одного символа );
К - число символов в тексте.
Объём данных при передаче: I = V * t,
где t — время передачи данных,
V — скорость передачи данных.
Справочная таблица единиц измерения объема информации:
Название
Соотношение с другими единицами
Бит
Двоичная цифра (0 или 1)
Байт
8 бит
Килобайт
1 Кб = 2 10 байт=1024 байт
Мегабайт
1 Мб = 2 10 Кб = 2 20 байт
Гигабайт
1 Гб = 2 10 Мб = 2 20 Кб = 2 30 байт
Терабайт
1 Тб = 2 10 Гб = 2 20 Мб = 2 30 Кб = 2 40 байт
Задача 1 .
В одном из вариантов кодировки Unicode каждый символ кодируется двумя байтами. Определите количество символов в сообщении, если информационный объём сообщения в этой кодировке равен 480 бит.
1) 60 2) 40 3) 240 4) 30
Решение.
1). Количество символов: К = I / i = 480 / 16 = 30
Ответ : 4) 30
Задача 2.
Информационное сообщение объёмом 5 Кбайт содержит 8192 символа. Сколько символов содержит алфавит, при помощи которого было записано это сообщение?
Решение:
1). I = i * k
Объем сообщения: I = 5 Кб =5120 байт =40960 бит
2). Сообщение содержит 8192 символа, следовательно:
i = I / k i = 40960 : 8192 = 5 бит (вес одного символа).
3). N = 2^5 = 32
Ответ : 32
Задачи
Перепишите задания в тетрадь и самостоятельно решите их.
- Расположите величины в порядке убывания: 1024 бита, 1000 байт, 1 бит, 1 байт, 1 Кбайт.
2 . Информационные объем одного сообщения составляет 0,5 Кбайт, а другого – 500 байтов. На сколько битов информационный объем первого сообщения больше объема второго сообщения?
- Для записи текста использовался 64-символьный алфавит. Какой объем информации в байтах содержит 10 страниц текста, если на каждой странице расположено 32 строки по 64 символа в строке?
3. Информационное сообщение объемом 375 байтов состоит из 500 символов. Каков информационный вес каждого символа этого сообщения? Какова мощность алфавита, с помощью которого было записано это сообщение?
4. Сколько Килобайт информации содержат сообщения следующего объема: 216 битов, 216 байтов, ¼ Мегабайта?
5. Реферат учащегося по информатике имеет объем 20 Килобайт. Каждая страница реферата содержит 32 строки по 64 символа в строке, мощность алфавита – 256 символов. Сколько страниц в реферате?
6. Скорость передачи данных по некоторому каналу равна 64 000 бит/сек. Передача файла по этому каналу связи заняла 16 сек. Определите размер файла в килобайтах.
II. Представление графической информации
Кодирование графической информации
Растровое изображение - это совокупность точек, используемых для отображения рисунка на экране монитора.
Глубина цвета – это количество битов для кодирования одного цвета
Векторное изображение – это графический объект, состоящий из графических примитивов.
Аналоговый и дискретный способы представления изображений и звука
Графическая и звуковая информация может быть представлена в аналоговой или дискретной форме.
- При аналоговом представлении физическая величина принимает бесконечное множество значений, которые изменяются непрерывно.
- При дискретном представлении физическая величина принимает конечное множество значений.
Дискретизация – это преобразование непрерывных изображений и звука в набор дискретных значений в форме двоичных кодов .
Графическая информация
Вся графическая информация в компьютере представлена в виде растровой и векторной графики.
В растровой графике точечный рисунок состоит из пикселей.
Графические редакторы растрового типа в основном ориентированы не для создания изображений, а на их обработку.
Достоинство растровой графики – эффективное представление изображений фотографического качества.
Недостаток – большой объем памяти, искажение изображения при его масштабировании.
Растровые графические файлы имеют форматы
JPEG , BMP , TIFF и др.
Графическая информация
В векторной графике графическая информация – это графические примитивы, составляющие рисунок: прямые, дуги, прямоугольники и пр.
Рисунок представляются в системе экранных координат. Достоинство векторной графики – небольшой объем памяти и масштабирование изображений без потери качества.
Векторные графические редакторы предназначены для создания оформительских, чертежных и проектно-конструкторских работ.
Векторные графические файлы имеют форматы WMF , CGM .
Все графические данные, помещаемые в видеопамять и выводимые на экран, имеют растровый формат.
Растровое кодирование по шагам:
Шаг 1. Дискретизация: разбивка на пиксели .
Шаг 2. Для каждого пикселя определяется единый цвет .
Пиксель – это наименьший элемент рисунка, для которого можно установить цвет.
Растровое кодирование (True Color)
Шаг 3. От цвета – к числам: модель RGB
цвет = R + G + B
red
красный
0..255
green
зеленый
0..255
blue
синий
0..255
R = 218 G = 164 B = 32
R = 135 G = 206 B = 250
Шаг 4 . Числа – в двоичную систему.
Каждый цвет ( красный, зеленый и синий) имеет 256 уровней интенсивности. Поэтому можно закодировать:
256 · 256 · 256 = 256 3 = 16 777 216 цветов
Количество памяти для хранения цвета 1 ( точки) пикселя?
R : 256 = 2 8 вариантов, нужно 8 бит = 1 байт R G B: 256 3 = 2 24 вариантов, нужно 24 бита = 3 байта
Двоичное кодирование графической информации
В современных компьютерах используются 3 разрешающие способности экрана: 800х600 , 1024х768 и 1280х1024 точки.
- Для черно-белого изображения, без градаций серого цвета, каждая точка экрана может иметь одно из двух состояний – « черная » или « белая », то есть для хранения ее состояния необходим 1 бит.
- Цветные изображения формируются в соответствии с двоичным кодом цвета каждой точки ( глубиной цвета ), хранящимся в видеопамяти.
Двоичное кодирование графической информации
Глубина цвета ( i ) – это количество битов, которое используется для кодирования цвета одной точки.
Глубина цвета одной точки
( i )
Количество отображаемых цветов
( N )
3 бита
2 3 = 8 цветов
4 бита
2 4 = 16 цветов
8 битов
2 8 = 256 цветов
16 битов
2 16 = 65536 цветов
24 бита
2 24 = 16777216 цветов
32 бита
2 32 = 4294967296 цветов
Двоичное кодирование графической информации
Количество цветов на экране:
N = 2 i
Объем видеопамяти:
где i - глубина цвета одной точки,
I = K·i
N - количество цветов.
где i глубина цвета точки,
K = X * Y , где X , Y – размеры экрана по горизонтали и по вертикали
Задача 1. Рассчитать необходимый объем видеопамяти для графического режима с разрешением 800х600 точек и глубиной цвета 24 бита на одну точку.
Решение:
1). Всего точек на экране: К =800∙600=480000.
2). Необходимый объем памяти: I = 24 бит∙480000 =
11520000бит = 1440000 байт = 1406,25 Кб = 1,37 Мб.
Ответ : 1,37 Мб.
Задача 2:
Сколько секунд потребуется для передачи сообщения со скоростью V= 14400 бит/сек, чтобы передать цветное изображение размером
800 х 600 пикселей, при условии, что в палитре N =65536 цветов?
Решение:
1) . При N = 65536 , i = 2 байта = 16 битов.
2). Общее количество пикселей в изображении: К= 800 х 600 =480000.
3). Вычислим объем памяти для 480000 пикселей:
I = K * i = 480 000* 2 = 960 000 байт * 8 = 7 680 000 бит .
4) Найдем время передачи сообщения: t = I / V =
7 680 000 / 14 400 533 секунд.
Ответ: 533 секунды.
III. Представление звуковой информации
Двоичное кодирование звуковой информации
Звук представляет собой непрерывный сигнал — звуковую волну с меняющейся амплитудой и частотой.
Чем больше амплитуда сигнала, тем он громче для человека.
Чем больше частота сигнала, тем выше тон.
Частота звуковой волны выражается числом колебаний в секунду и измеряется в герцах (Гц).
Двоичное кодирование звуковой информации
Ввод звука в компьютер производится с помощью звукового устройства (микрофон и др.), выход которого подключается к порту звуковой карты.
Звуковая карта производит измерения уровня звукового сигнала (преобразованного в электрические колебания) и результаты записывает в память компьютера в виде последовательности электрических импульсов (двоичных нулей и единиц). Этот процесс называется оцифровкой звука .
Промежуток времени между двумя измерениями называется периодом измерений (сек).
Обратная величина К=1/ (герц) называется частотой дискретизации.
Двоичное кодирование звуковой информации
Оцифровка ( перевод в цифровую форму ) :
цифровой сигнал
1011010110101010011
аналоговый сигнал
аналоговый сигнал
Дискретизация по уровню звука:
У всех точек в одной полосе одинаковый код!
8 бит = 2 8 =256 уровней
16 бит = 2 16 = 65536 уровней
2 4 бита = 2 2 4 уровней
4
3
2
1
0
0
T
2 T
«Глубина» кодирования
( разрядность звуковой карты )
48
Двоичное кодирование звуковой информации
Частота дискретизации ( К ) — это количество измерений уровней сигнала за 1секунду .
Количество бит, отводимое на один звуковой сигнал, называют глубиной кодирования звука ( i ).
Современные звуковые карты обеспечивают 16-, 32- или 64-битную глубину кодирования звука.
Качество двоичного кодирования звука определяется глубиной кодирования звука ( i ) и частотой дискретизации ( К ) .
Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Чем выше качество цифрового звука, тем больше информационный объем звукового файла.
Глубина кодирования звука ( i )
16 бит
Частота дискретизации (К)
32 бита
от 8 до 48 кГц.
(от 8000 до 48000 Гц. в сек)
64 бита
Двоичное кодирование звуковой информации
Количество уровней звука: N = 2i
Информационный объём аудиофайла I = t∙К∙ i t = I / (K ∙ i)
где
i - глубина звука (бит),
где t - время звучания (секунд ),
К - частота дискретизации (Гц),
i - глубина кодирования (бит).
Задача 1: Оценить информационный объем стерео - аудиофайла длительностью звучания 1 секунда при высоком качестве звука
( i = 16 битов, K = 48кГц = 48000 Гц).
Решение: Для этого количество выборок в 1 секунду умножить на количество битов, приходящихся на одну выборку и умножить на 2 (стерео):
I = t∙К∙ i = 48000∙16∙2 бит = 1536000 бит/ 8 =
192000 байт = 187,5 Кбайт.
Ответ : 187,5 Кбайт.
Задача 2:
Производится двухканальная (стерео) звукозапись с частотой дискретизации K =48 кГц и i =32-битным разрешением, результаты записываются в файл, сжатие данных не используется. Размер файла с записью не может превышать I =16 Мбайт.
Какая из приведённых ниже величин наиболее близка к максимально возможной продолжительности записи?
1) 17 секунд 2) 44 секунды 3) 65 секунд 4) 177 секунд
Решение:
1). Частота дискретизации К =48 кГц = 48 000 значений сигнала за секунду.
2). Глубина кодирования i = 32 бит = 4 байта.
3) Поскольку запись двухканальная, объём памяти, необходимый для хранения данных одного канала, умножается на 2, поэтому, так как размер файла I = 16 Мб, один канал занимает 8 Мб = 8·2 20 байт.
4). Продолжительность записи t = ( 8·2 20 ) / (48000*4) 43,69 сек.
Ответ : 2) 44 секунды
Задача 3:
Проводилась (моно) звукозапись с частотой дискретизации К=16 кГц = 16000 Гц и i = 32 бита. В результате был получен файл размером
I = 20 Мбайт.
Какая из приведенных ниже величин наиболее близка к времени, в течение которого проводилась запись?
1) 1 мин 2) 2 мин 3) 5 мин 4) 10 мин
Решение.
- Глубина кодирования : i = 32 бита = 4 байта,
- Размер файла: I = 20 Мб = 20*1024*1024 = 20 971 520 байт.
- Время записи: t = I / ( K ∙ i ) = 20971520 / (16000 * 4) =
328 секунд / 60 = 5,5 минут, что близко к 5 минутам.
Ответ : 3) 5 мин
Домашние задачи:
- Сколько килобайтов составляет сообщение, содержащее 12288 битов?
- С помощью модема (скорость 64 Кб/с) скачали сообщение за 5 секунд. Определите информационный объем и количество символов в сообщение, если он закодированы в кодах ASCII и Unicode .