СДЕЛАЙТЕ СВОИ УРОКИ ЕЩЁ ЭФФЕКТИВНЕЕ, А ЖИЗНЬ СВОБОДНЕЕ

Благодаря готовым учебным материалам для работы в классе и дистанционно

Скидки до 50 % на комплекты
только до

Готовые ключевые этапы урока всегда будут у вас под рукой

Организационный момент

Проверка знаний

Объяснение материала

Закрепление изученного

Итоги урока

Кодирование звуков

Категория: Информатика

Нажмите, чтобы узнать подробности

Традиционным способом решения этой проблемы является нотная запись музыкального произведения. Обозначения нот и их длительностей, длительностей пауз, знаков усиления и снижения громкости звука, музыкального ударения и другие знаки нотной азбуки, образуют алфавит, с помощью которого можно смоделировать любую музыкальную мелодию.

Однако ясно, что очень многое из того, что мыслил и чувствовал автор произведения, вообще не укладывается в эту модель. В целом все исполнительское искусство построено на интерпретации этого способа записи. 

Просмотр содержимого документа
«Кодирование звуков»

256



КОДИРОВАНИЕ ЗВУКОВ

ПОНЯТЬ


ПРИМЕР 1

Большинство людей охотно слушает музыку. Но звук музыкальных инструментов - вещь трудно передаваемая другими средствами, а человек хочет не только "остановить мгновение", но и запомнить его, передать другим.

Традиционным способом решения этой проблемы является нотная запись музыкального произведения. Обозначения нот и их длительностей, длительностей пауз, знаков усиления и снижения громкости звука, музыкального ударения и другие знаки нотной азбуки, образуют алфавит, с помощью которого можно смоделировать любую музыкальную мелодию.

Однако ясно, что очень многое из того, что мыслил и чувствовал автор произведения, вообще не укладывается в эту модель. В целом все исполнительское искусство построено на интерпретации этого способа записи.


Из курса физики вам известно, что звук - это колебания воздуха. По своей природе звук является непрерывным сигналом. Если преобразовать звук в электрический сигнал (например, с помощью микрофона), мы увидим плавно изменяющееся с течением времени напряжение.


Рис. Регистрация звука как непрерывного сигнала.


Мы можем записать электрический сигнал на магнитную ленту и превратить его вновь в звук при помощи динамика, который работает как "микрофон наоборот": перемещает воздух в соответствии с изменениями напряжения. Соответственно, сохраняется и упомянутая непрерывность сигнала.

Несмотря на то, что аналоговый электрический сигнал исправно служит человечеству на протяжении десятилетий, со временем стало ясно, что аналоговые сигнал и магнитная запись - не лучшие способы передачи и хранения звуковой информации, поскольку и при передаче и при хранении происходят неизбежные потери, то есть ухудшение звука. В то же время, передачу и хранение данных в компьютерах, оперирующих исключительно цифровыми данными, возможно производить без каких-либо потерь. Вопрос только в том, как перевести аналоговый звук в цифровой и обратно.

Для компьютерной обработки аналоговый сигнал нужно каким-то образом преобразовать в последовательность двоичных чисел - дискретизировать его (англ. discrete - раздельный, состоящий из отдельных частей) и оцифровать.


Можно поступить следующим образом: измерять амплитуду сигнала через равные промежутки времени и записывать полученные числовые значения в память компьютера.


Устройство, выполняющее процесс дискретизации и оцифровки аналоговых сигналов называется аналого-цифровым преобразователем (АЦП).


Рис.



Рис. Схема дискретизации непрерывного сигнала


Как видно из рисунка, результат измерений не является точным аналогом непрерывного электрического сигнала. Насколько все же соответствует цифровой звук аналоговому? Очевидно, что это соответствие будет тем полнее, чем чаще происходят измерения и чем они точнее. Частота, с которой производятся измерения, называется частотой дискретизации. А на точность измерений амплитуды указывает число бит, использующихся для представления результата измерений. Этот параметр называют разрядностью.


Итак, преобразование аналогового сигнала в цифровой состоит из двух этапов: дискретизации по времени и квантования по амплитуде.

Дискретизация по времени означает, что сигнал представляется рядом своих отсчетов (семплов), взятых через равные промежутки времени. Чем выше частота дискретизации и чем больше разрядов отводится для каждого отсчета, тем точнее будет представлен и затем воспроизведен звук.


ПРИМЕР

Когда мы говорим, что частота дискретизации 44,1 кГц, то это значит, что сигнал измеряется 44100 раз в течении секунды.


Основной вопрос на первом этапе преобразования аналогового сигнала в цифровой (оцифровки) состоит в выборе частоты дискретизации аналогового сигнала. Как уже было сказано, чем больше частота - тем точнее соответствует цифровой сигнал аналоговому. Однако, пропорционально увеличению частоты возрастают:

а) интенсивность потока цифровых данных, а пропускные возможности интерфейсов не безграничны, особенно если записывается/воспроизводится одновременно несколько каналов;

б) вычислительная нагрузка на процессоры, а их возможности также ограничены;

в) объем памяти, необходимой для хранения цифрового сигнала.


Поэтому, в зависимости от характера звука и требований, предъявляемых к его качеству и объему занимаемой памяти, выбирают некоторые компромиссные значения.


ПРИМЕР 2

При записи на компакт-диски используются 16-битное кодирование при частоте дискретизации 44,032 кГц. При работе же только с речевыми сигналами достаточно 8-битного кодирования при частоте 8 кГц.


Считается, что диапазон частот, которые слышит человек, составляет от 20 Гц до 20000 кГц. Согласно теореме Найквиста-Котельникова, для того, чтобы аналоговый (непрерывный по времени) сигнал можно было точно восстановить по его отсчетам, частота дискретизации должна быть как минимум вдвое больше максимальной звуковой частоты. Таким образом, если реальный аналоговый сигнал, который мы собираемся преобразовать в цифровую форму, содержит частотные компоненты от 0 Гц до 20 кГц, то частота дискретизации такого сигнала должна быть не меньше, чем 40 кГц. Сегодня самыми распространенными частотами дискретизации являются 44,1 кГц и 48 кГц. В последнее время выяснено, что обертоны, расположенные свыше 20 кГц, вносят немалый вклад в звучание и в результате появляются преобразователи, использующие частоты дискретизации 96 кГц и 192 кГц, а в недалеком будущем ожидается появление и систем с частотой 384 кГц.


Как вы знаете, практически любая передача сигналов осложняется наличием помех (шумов). Справедливо это и для передачи звуковых сигналов. Поток цифровых данных, представляющих аналоговый сигнал, включает как полезные, так и нежелательные высокочастотные компоненты и помехи.



Рис. Пример появления помех в звуковом сигнале


Чтобы устранить по возможности воздействие помех, в АЦП встроены специальные цифровые фильтры, убирающие полностью или “сглаживающие” значения, резко отличающиеся от соседних.


Второй этап преобразования аналогового сигнала в цифровой поток данных - это квантование амплитуды дискретных отсчетов, полученных на первом этапе. (В действительности этот процесс идет одновременно с дискретизацией).

Представим себе, что отсчет представляет собой некий столбик или полоску, наподобие той, что мы видим на индикаторе уровня сигнала музыкальных центров. Длина этой полоски и есть амплитуда сигнала в данном отсчете. Процесс квантования амплитуды тогда можно представить как измерение длины полоски с помощью линейки. Чем чаще идут метки на линейке, тем точнее мы можем измерить длину полоски (амплитуду) и тем меньше будут ошибки измерений (шумы квантования). Однако, чем чаще расположены метки на линейке - тем больше цифр (бит) нам потребуется для записи числа, соответствующего измеренной нами длине полоски (амплитуде сигнала в отсчете).




ПРИМЕР

Если на линейке 32 метки, то для представления длины полоски (амплитуды) в виде числа понадобится максимум 5 бит (32=25). В данном случае 5 бит и будет разрядностью АЦП.

Если значение амплитуды отсчета представляется 8-разрядным кодом, то максимальное число уровней квантования составит 28 = 256. Для 16-разрядного представления, соответственно, получим 216 = 65536.


Для того чтобы воспроизвести закодированный таким образом звук, нужно выполнить обратное преобразование. Для него служит цифро-аналоговый преобразователь - ЦАП.

Цифро-аналоговое преобразование в общем случае проходит два этапа. На первом из потока входных данных с помощью ЦАП выделяют отсчеты сигнала. На втором этапе из дискретных отсчетов путем “сглаживания” получившегося прерывистого (ступенчатого) сигнала формируется непрерывный аналоговый сигнал.


Для записи и хранения звукового сигнала в цифровой форме требуется большой объем дискового пространства. Чем выше требования к качеству записываемого звука, тем больше должна быть емкость носителя.


ПРИМЕР

Стереофонический звуковой сигнал длительностью 60 с, оцифрованный с частотой дискретизации 44,1 кГц, при 16-разрядном квантовании для хранения потребует на около 10 Мб:

2 (стереофонический) х 60 (с) х 44100 (ед/с) х 2 (байта) = 10 584 000 байт = 10 336 Кб = 10,094 Мб


Кроме того, при записи высококачественного звукового сигнала в реальном времени возникают дополнительные требования к пропускной способности канала звукозаписи - все устройства, формирующие этот канал, должны успевать обрабатывать поток данных, поступающих на его вход.


Существенно снизить объем цифровых данных, необходимых для представления звукового сигнала с заданным качеством, можно с помощью компрессии, то есть путем уменьшения количества отсчетов и уровней квантования. главная задача методов компрессии - достижение максимального сжатия звукового сигнала при минимальных субъективно слышимых искажениях восстановленного сигнала. При этом используются довольно сложные кодирующие устройства и программы сжатия - кодеки (от кодирование-декодирование).


Заметим, что существование строгих формальных правил для записи звука позволяет использовать ЭВМ не только для записи и хранения в цифровом виде речи и мелодий, но и для создания музыкальных произведений (синтеза звука) и их обработки. О качестве музыкальных произведений, создаваемых машинами, спорят, но тем не менее многие из современных композиторов признают и широко используют возможности компьютеров.



ЗНАТЬ


Звук - это колебания воздуха и по своей природе является непрерывным сигналом.


Для компьютерной обработки непрерывный (аналоговый) сигнал нужно преобразовать в последовательность двоичных чисел. Это преобразование включает в себя два этапа: дискретизацию и оцифровку.


Устройство, выполняющее процесс дискретизации и оцифровки аналоговых сигналов называется аналого-цифровым преобразователем (АЦП).

Устройство, выполняющее обратное преобразование - воспроизведение закодированного звука - называется цифро-аналоговым преобразователем (ЦАП).

Рис. Схема преобразования звукового сигнала


Существование строгих формальных правил для записи звука позволяет использовать ЭВМ не только для хранения в цифровом виде речи и музыки, но и для синтеза звука и его обработки.


Создание (синтез) звука направлен на:

  • имитацию различных естественных звуков и акустических музыкальных инстpументов;

  • получение пpинципиально новых звуков, не встpечающихся в пpиpоде.


Обpаботка звука напpавлена на получение новых звуков из уже существующих, либо пpидание им дополнительных качеств или устpанение существующих.


Каждый из методов синтеза и обpаботки звука имеет свою математическую и алгоpитмическую модель.


Обработка речи, как особого вида звука, включает в себя синтез речи и автоматическое распознавание речи.


УМЕТЬ


ЗАДАНИЕ 1

Ответьте на вопросы.

Какие существуют два способа кодирования музыки? Назовите их преимущества и недостатки. Есть ли аналогия с двумя способами представления изображений? Какая?


ЗАДАНИЕ 2

Подсчитайте, какой объем памяти (в Кб) займет 1 минута речи при использовании 8-битного кодирования при частоте дискретизации 8 кГц.


ЗАДАНИЕ 3

Если на вашем компьютере установлен музыкальный редактор, то определите:

  • какими способами пользователь может закодировать мелодию (имитация реального инструмента, нотный стан и пр.);

  • существует ли возможность синтезировать произвольные (необычные) звуки;

  • какие методы обработки звуковой информации вам доступны.


ЗАДАНИЕ 4

По материалам компьютерной периодики подготовьте доклад о возможностях и пользовательском интерфейсе какого-либо музыкального редактора, либо о возможностях и принципах работы какой-либо программы автоматизированного распознавания речи.


ЗАДАНИЕ 5

Многие языки программирования имеют встроенные функции для работы со звуком. Так, в языке Pascal для этого используется процедура SOUND.

Если вы работали со средой КуМир, то знаете, что для работы со звуком используется функция НОТА(с, d), где с, d - числовые параметры, причем с - реальная физическая частота звука в герцах, d - долгота ноты, выраженная целым числом, равным знаменателю соответствующей доли.


Определите, какие операторы известного вам языка программирования позволяют воспроизведение звуков. Какой способ кодирования звука они используют.