Тема: Кодирование звуковой информации
Из курса физики вам всем известно, что звук — это непрерывная волна с изменяющейся амплитудой и частотой.
Звуковые колебания (волны) – механические колебания, частота которых лежит в пределах от 20 до 20 000 Гц.
Звук – это волны, распространяющиеся в твердых телах, жидкостях и газах, вызванные колебаниями частиц среды. Изменения давления акустической волны на препятствия, позволяет слуховому аппарату человека регистрировать звук.
Основными характеристиками любой волны являются частота и амплитуда. Амплитуда акустического сигнала характеризует громкость звука, а частота – его тон.
ХАРАКТЕРИСТИКИ ЗВУКА
Единица громкости звука - децибел (дБ) (десятая часть бела). Названа в честь Александра Грэхема Белла, изобретателя телефона.
| Источник звука | Уровень (дБ) |
| Спокойное дыхание | Не воспринимается |
| Шёпот | 10 |
| Шелест листьев | 17 |
| Перелистывание газет | 20 |
| Обычный шум в доме | 40 |
| Прибой на берегу | 40 |
| Разговор средней громкости | 50 |
| Громкий разговор | 70 |
| Работающий пылесос | 80 |
| Поезд в метро | 80 |
| Концерт рок-музыки | 100 |
| Раскат грома | 110 |
| Реактивный двигатель | 110 |
| Выстрел из орудия | 120 |
| Болевой порог | 120 |
громкость звука – зависит от амплитуды колебаний. Чем больше амплитуда колебаний, тем громче звук.
высота звука – определяется частотой колебаний воздуха.
скорость звука – скорость распространения волн в среде.
тембр звука – окраска звука, зависящая от источника звука (скрипка, рояль, гитара и т.д.).
Акустическая волна является непрерывной, поэтому для обработки на компьютере ее необходимо преобразовать в цифровую форму. В ходе кодирования звуковая информация подвергается временной дискретизации и квантованию, т.е. превращен в последовательность электрических импульсов (двоичных нулей и единиц).
Для оцифровки звука (преобразования аналогового сигнала в цифровой) используются специальные устройства: аналого-цифровой преобразователь (АЦП) и цифро-аналоговый преобразователь (ЦАП).
Для того, чтобы компьютер мог обрабатывать непрерывный звуковой сигнал, он должен быть дискретизирован, т. е. превращен в последовательность электрических импульсов (двоичных нулей и единиц).
Для этого звуковая волна разбивается на отдельные временные участки.
Гладкая кривая заменяется последовательностью «ступенек». Процесс временной дискретизации заключается в регистрации параметров звука через определённые очень короткие промежутки времени, в пределах которых сигнал считается неизменным (см. рис. 1).
Каждой «ступеньке» присваивается значение громкости звука. Чем больше количество уровней громкости, тем больше количество информации будет нести значение каждого уровня и более качественным будет звучание. Причем, чем больше будет количество измерений уровня звукового сигнала в единицу времени, тем качественнее будет звучание.
Частоту измерения сигнала называют частотой дискретизации. Данная характеристика измеряется в Гц.
В течение временной дискретизации непрерывный диапазон значений амплитуды звуковой волны квантуется путем разбиения на дискретную последовательность значений амплитудных уровней (см. рис. 2).
Временная дискретизация звука
При этом на каждое измерение выделяется одинаковое количество бит. Количество бит, отводимых для записи номеров уровней называется глубиной кодирования звука.
Глубина кодирования звука связана с количеством уровней квантования по формуле Хартли:
N = 2i
где N – количество уровней разбиения амплитуды сигнала,
i – число бит (глубина кодирования), отводимых для кодирования уровней амплитуды сигнала
Чем выше частота дискретизации и глубина кодирования звука, тем точнее цифровое представление оригинального непрерывного звукового сигнала.
Таким образом, чтобы подсчитать вес звуковой волны достаточно перемножить частоту дискретизации, глубины кодирования и времени звучания такого звука.
Рассматривая современное звучание, количество звуковых волн может быть различное, например, для стереозвука — это 2, а для квадрозвука — 4.
Для расчета информационного объема звукового файла используется следующая формула:
L = i * ν * t * k
где i – глубина кодирования
ν – частота дискретизации
t - время звучания файла,
k – коэффициент, количество звуковых волн
Повышая частоту дискретизации и глубину кодирования звука, можно более точно сохранить, а затем восстановить форму оригинального звукового сигнала. Необходимо заметить, что в этом случае увеличивается объем сохраняемого файла. В различных ситуациях при цифровой записи звука используют разные значения частоты дискретизации и глубины кодирования звука.
Редактирование звука - это любое это преобразование.
Звуковые редакторы позволяют изменять качество цифрового звука и объем звукового файла путем изменения частоты дискретизации и глубины кодирования.
Оцифрованный звук можно сохранять без сжатия в звуковых файлах в универсальном формате WAV или в формате со сжатием МР3.
При сохранении звука в форматах со сжатием отбрасываются "избыточные" для человеческого восприятия звуковые частоты с малой интенсивностью, совпадающие по времени со звуковыми частотами с большой интенсивностью. Применение такого формата позволяет сжимать звуковые файлы в десятки раз, однако приводит к необратимой потере информации (файлы не могут быть восстановлены в первоначальном виде).
Форматы звуковых файлов
РСМ
РСМ расшифровывается как pulse code modulation, что и является в переводе как импульсно-кодовая. Файлы именно с таким расширением встречаются довольно редко. Но РСМ является основополагающей для всех звуковых файлов.
WAV
Самое простое хранилище дискретных данных. Один из типов файлов семейства RIFF. Помимо обычных дискретных значений, битности, количества каналов и значений уровней громкости, в wav может быть указано еще множество параметров, о которых Вы, скорее всего, и не подозревали - это: метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, а также есть место для того, чтобы Вы смогли разместить там текстовую информацию.
RIFF
Resource Interchange File Format. Уникальная система хранения любых структурированных данных.
IFF
Эта технология хранения данных проистекает от Amiga-систем. Interchange File Format. Почти то же, что и RIFF, только имеются некоторые нюансы. Начнем с того, что система Amiga - одна из первых, в которой стали задумываться о программно-сэмплерной эмуляции музыкальных инструментов. В результате, в данном файле звук делится на две части: то, что должно звучать вначале и элемент того, что идет за началом. В результате, звучит начало один раз, за тем повторяется второй кусок столько раз, сколько Вам нужно и нота может звучать бесконечно долго.
MOD
Файл хранит в себе короткий образец звука, который потом можно использовать в качестве шаблона для инструмента.
AIFили AIFF
Audio Interchange File Format. Данный формат распространен в системах Apple Macintosh и Silicon Graphics. Заключает в себе сочетание MOD и WAV.
MID
Файл, хранящий в себе сообщения MIDI-системе, установленной на Вашем компьютере или в устройстве.
МР3
Самый скандальный формат за последнее время. Многие для объяснения параметров сжатия, которые в нем применяют, сравнивают его с jpeg для изображений. Там очень много наворотов в вычислениях, чего и не перечислишь, но коэффициент сжатия в 10-12 раз сказали о себе сами. Специалисты говорят о контурности звука как о самом большом недостатке данного формата. Действительно, если сравнивать музыку с изображением, то смысл остался, а мелкие нюансы ушли. Качество МР3 до сих пор вызывает много споров, но для "обычных немузыкальных" людей потери не ощутимы явно.
VQF
Хорошая альтернатива МР3, разве что менее распространенная. Есть и свои недостатки. Закодировать файл в VQF - процесс гораздо более долгий. К тому же, очень мало бесплатных программ, позволяющих работать с данным форматом файлов, что, собственно, и сказалось на его распространении.
RA
Real Audio или потоковая передача аудиоданных. Довольно распространенная система передачи звука в реальном времени через Интернет. Скорость передачи порядка 1 Кб в секунду. Полученный звук обладает следующими параметрами: 8 или 16 бит и 8 или 11 кГц.