Представление текстовой, графической и звуковой информации
Представление текстовой информации
Для обработки текстовой информации компьютер использует двоичную систему счисления, состоящую из двух цифр: 0 и 1.
В компьютере используется байтовый принцип организации памяти : каждая клеточка – бит памяти.
Бит – это наименьшая единица измерения количества информации, принимающая значение 1 или 0.
Восемь подряд расположенных битов образуют байт.
Порядковый номер байта является его адресом. По этим адресам процессор обращается к данным, читая и записывая их в память.
В популярных системах кодировки (ASCII и др.) каждый символ заменяется на 8-разрядное целое положительное двоичное число, т.е. 1 символ компьютерного алфавита «весит» 8 битов.
Согласно формуле информатики 2 i =N можно закодировать: 2 8 = 256 символов.
Присвоение символу конкретного кода определено таблицей кодировки ASCII. Таблица кодов ASCII делится на две части. Международным стандартом является лишь первая половина таблицы, т.е. символы с номерами от 0 (00000000), до 127 (01111111). Сюда входят буква латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы.
Остальные 128 кодов используются в разных вариантах. В русских кодировках размещаются символы русского алфавита.
Первая половина таблицы кодов ASCII
Вторая половина таблицы кодов ASCII
В настоящее время получил широкое распространение новый международный стандарт Unicode, который отводит на каждый символ 2 байта. С его помощью можно закодировать (2 16 = 65536) различных символов.
Пример представления текста в памяти компьютера:
Кодирование текстовой информации
Кодирование – преобразование входной информации в машинную форму (в двоичный код).
Декодирование – преобразование двоичного кода в форму, понятную человеку.
Число символов алфавита (мощность алфавита) : N= 2 i
Информационный объем текста: I = i*К
где i - информационный вес одного символа;
i – информационный вес одного символа ( количество бит на кодирование одного символа );
Объём данных при передаче: I = V * t,
К - число символов в тексте.
где t — время передачи данных,
V — cкорость передачи данных.
Справочная таблица единиц измерения объема информации:
Название
Соотношение с другими единицами
Бит
Двоичная цифра (0 или 1)
Байт
8 бит
Килобайт
1 Кб = 2 10 байт=1024 байт
Мегабайт
1 Мб = 2 10 Кб = 2 20 байт
Гигабайт
1 Гб = 2 10 Мб = 2 20 Кб = 2 30 байт
Терабайт
1 Тб = 2 10 Гб = 2 20 Мб = 2 30 Кб = 2 40 байт
Задача 1.
В одном из вариантов кодировки Unicode каждый символ кодируется двумя байтами. Определите количество символов в сообщении, если информационный объём сообщения в этой кодировке равен 480 бит.
1) 60 2) 40 3) 240 4) 30
Решение.
1). Количество символов: К = I / i = 480 / 16 = 30
Ответ : 4) 30
Задача 2.
Информационное сообщение объёмом 5 Кбайт содержит 8192 символа. Сколько символов содержит алфавит, при помощи которого было записано это сообщение?
Решение:
1). I = i * k
Объем сообщения: I =5 Кб =5120 байт =40960 бит
2). Сообщение содержит 8192 символа, следовательно:
i = I / k i = 40960:8192 = 5 бит (вес одного символа).
3). N = 25 = 32
Ответ : 32
Представление графической информации
Аналоговый и дискретный способы представления изображений и звука
Графическая и звуковая информация может быть представлена в аналоговой или дискретной форме.
- При аналоговом представлении физическая величина принимает бесконечное множество значений, которые изменяются непрерывно.
- При дискретном представлении физическая величина принимает конечное множество значений.
Дискретизация – это преобразование непрерывных изображений и звука в набор дискретных значений в форме двоичных кодов .
Графическая информация
Вся графическая информация в компьютере представлена в виде растровой и векторной графики.
В растровой графике точечный рисунок состоит из пикселей.
Графические редакторы растрового типа в основном ориентированы не для создания изображений, а на их обработку.
Достоинство растровой графики – эффективное представление изображений фотографического качества.
Недостаток – большой объем памяти, искажение изображения при его масштабировании.
Растровые графические файлы имеют форматы
JPEG, BMP, TIFF и др.
Графическая информация
В векторной графике графическая информация – это графические примитивы, составляющие рисунок: прямые, дуги, прямоугольники и пр.
Рисунок представляются в системе экранных координат. Достоинство векторной графики – небольшой объем памяти и масштабирование изображений без потери качества.
Векторные графические редакторы предназначены для создания оформительских, чертежных и проектно-конструкторских работ.
Векторные графические файлы имеют форматы WMF, CGM.
Все графические данные, помещаемые в видеопамять и выводимые на экран, имеют растровый формат.
Растровое кодирование по шагам:
Шаг 1. Дискретизация: разбивка на пиксели .
Шаг 2. Для каждого пикселя определяется единый цвет .
Пиксель – это наименьший элемент рисунка, для которого можно установить цвет.
Растровое кодирование (True Color)
Шаг 3. От цвета – к числам: модель RGB
цвет = R + G + B
red
красный
0..255
green
зеленый
0..255
blue
синий
0..255
R = 218 G = 164 B = 32
R = 135 G = 206 B = 250
Шаг 4. Числа – в двоичную систему.
Каждый цвет ( красный, зеленый и синий) имеет 256 уровней интенсивности. Поэтому можно закодировать:
256 · 256 · 256 = 256 3 = 16 777 216 цветов
Количество памяти для хранения цвета 1 (точки) пикселя?
R : 256 = 2 8 вариантов, нужно 8 бит = 1 байт R G B: 256 3 = 2 24 вариантов, нужно 24 бита = 3 байта
Двоичное кодирование графической информации
В современных компьютерах используются 3 разрешающие способности экрана: 800х600 , 1024х768 и 1280х1024 точки.
- Для черно-белого изображения, без градаций серого цвета, каждая точка экрана может иметь одно из двух состояний – « черная » или « белая », то есть для хранения ее состояния необходим 1 бит.
- Цветные изображения формируются в соответствии с двоичным кодом цвета каждой точки ( глубиной цвета ), хранящимся в видеопамяти.
Двоичное кодирование графической информации
Глубина цвета (i) – это количество битов, которое используется для кодирования цвета одной точки.
Глубина цвета одной точки
( i )
Количество отображаемых цветов
3 бита
( N )
2 3 = 8 цветов
4 бита
2 4 = 16 цветов
8 битов
2 8 = 256 цветов
16 битов
2 16 = 65536 цветов
24 бита
2 24 = 16777216 цветов
32 бита
2 32 = 4294967296 цветов
Двоичное кодирование графической информации
Количество цветов на экране:
N = 2 i
Объем видеопамяти:
где i - глубина цвета одной точки,
I = K·i
N - количество цветов.
где i глубина цвета точки,
K = X*Y, где X, Y – размеры экрана по горизонтали и по вертикали
Задача 1. Рассчитать необходимый объем видеопамяти для графического режима с разрешением 800х600 точек и глубиной цвета 24 бита на одну точку.
Решение:
1). Всего точек на экране: К =800∙600=480000.
2). Необходимый объем памяти: I = 24 бит∙480000 =
11520000бит = 1440000 байт = 1406,25 Кб = 1,37 Мб.
Ответ : 1,37 Мб.
Задача 2:
Сколько секунд потребуется для передачи сообщения со скоростью V=14400 бит/сек, чтобы передать цветное изображение размером
800 х 600 пикселей, при условии, что в палитре N=65536 цветов?
Решение:
1). При N = 65536, i = 2 байта = 16 битов.
2). Общее количество пикселей в изображении: К= 800 х 600 =480000.
3). Вычислим объем памяти для 480000 пикселей:
I = K * i = 480 000*2= 960 000 байт * 8 = 7 680 000 бит.
4) Найдем время передачи сообщения: t = I / V =
7 680 000 / 14 400 533 секунд.
Ответ: 533 секунды.
Представление звуковой информации
Двоичное кодирование звуковой информации
Звук представляет собой непрерывный сигнал — звуковую волну с меняющейся амплитудой и частотой.
Чем больше амплитуда сигнала, тем он громче для человека.
Чем больше частота сигнала, тем выше тон.
Частота звуковой волны выражается числом колебаний в секунду и измеряется в герцах (Гц).
Двоичное кодирование звуковой информации
Ввод звука в компьютер производится с помощью звукового устройства (микрофон и др.), выход которого подключается к порту звуковой карты.
Звуковая карта производит измерения уровня звукового сигнала (преобразованного в электрические колебания) и результаты записывает в память компьютера в виде последовательности электрических импульсов (двоичных нулей и единиц). Этот процесс называется оцифровкой звука .
Промежуток времени между двумя измерениями называется периодом измерений (сек).
Обратная величина К=1/ (герц) называется частотой дискретизации.
Двоичное кодирование звуковой информации
Оцифровка (перевод в цифровую форму):
цифровой сигнал
1011010110101010011
аналоговый сигнал
аналоговый сигнал
Дискретизация по уровню звука:
У всех точек в одной полосе одинаковый код!
8 бит = 2 8 =256 уровней
16 бит = 2 16 = 65536 уровней
24 бита = 2 24 уровней
4
3
2
1
0
0
T
2T
«Глубина» кодирования
(разрядность звуковой карты)
23
Двоичное кодирование звуковой информации
Частота дискретизации ( К ) — это количество измерений уровней сигнала за 1секунду .
Количество бит, отводимое на один звуковой сигнал, называют глубиной кодирования звука ( i ).
Современные звуковые карты обеспечивают 16-, 32- или 64-битную глубину кодирования звука.
Качество двоичного кодирования звука определяется глубиной кодирования звука ( i ) и частотой дискретизации ( К ) .
Чем больше частота и глубина дискретизации звука, тем более качественным будет звучание оцифрованного звука. Чем выше качество цифрового звука, тем больше информационный объем звукового файла.
Глубина кодирования звука (i)
16 бит
Частота дискретизации (К)
32 бита
от 8 до 48 кГц.
64 бита
(от 8000 до 48000 Гц. в сек)
Двоичное кодирование звуковой информации
Количество уровней звука: N = 2i
Информационный объём аудиофайла I = t∙К∙i t = I / (K∙i)
где
i - глубина звука (бит),
где t - время звучания (секунд),
К - частота дискретизации (Гц),
i - глубина кодирования (бит).
Задача 1: Оценить информационный объем стерео-аудиофайла длительностью звучания 1 секунда при высоком качестве звука
( i =16 битов, K = 48кГц = 48000 Гц).
Решение: Для этого количество выборок в 1 секунду умножить на количество битов, приходящихся на одну выборку и умножить на 2 (стерео):
I = t∙К∙i = 48000∙16∙2 бит = 1536000 бит/ 8 =
192000 байт = 187,5 Кбайт.
Ответ : 187,5 Кбайт.
Задача 2:
Производится двухканальная (стерео) звукозапись с частотой дискретизации K =48 кГц и i =32-битным разрешением, результаты записываются в файл, сжатие данных не используется. Размер файла с записью не может превышать I =16 Мбайт.
Какая из приведённых ниже величин наиболее близка к максимально возможной продолжительности записи?
1) 17 секунд 2) 44 секунды 3) 65 секунд 4) 177 секунд
Решение:
1). Частота дискретизации К =48 кГц = 48 000 значений сигнала за секунду.
2). Глубина кодирования i =32 бит =4 байта.
3) Поскольку запись двухканальная, объём памяти, необходимый для хранения данных одного канала, умножается на 2, поэтому, так как размер файла I =16 Мб, один канал занимает 8 Мб =8·2 20 байт.
4). Продолжительность записи t = (8·2 20 ) / (48000*4) 43,69 сек.
Ответ : 2) 44 секунды
Задача 3:
Проводилась (моно) звукозапись с частотой дискретизации К=16 кГц = 16000 Гц и i = 32 бита. В результате был получен файл размером
I = 20 Мбайт.
Какая из приведенных ниже величин наиболее близка к времени, в течение которого проводилась запись?
1) 1 мин 2) 2 мин 3) 5 мин 4) 10 мин
Решение.
- Глубина кодирования : i = 32 бита = 4 байта,
- Размер файла: I = 20 Мб = 20*1024*1024 = 20 971 520 байт.
- Время записи: t = I / (K∙i) = 20971520 / (16000 * 4) =
328 секунд / 60 = 5,5 минут, что близко к 5 минутам.
Ответ : 3) 5 мин