Определить количество уровней сигнала 24-битной звуковой карты

Обновлено: 24.02.2026

В этой статье описывается структура входного и выходного усиления аудиоустройств.

Аудиокомпоненты обычно оцениваются по входной чувствительности и/или максимальному выходному напряжению. В этой статье объясняется, как согласовать выходное напряжение аудиоустройства с диапазоном входного напряжения следующего устройства в сигнальной цепочке и как отрегулировать входную чувствительность, чтобы приспособиться к различным напряжениям от разных устройств-источников.

дБ, дБн, дБВ, дБFS и дБ-УЗД

В качестве основы для обсуждения важно понять значение и различия между некоторыми распространенными единицами измерения децибел: дБ, дБн, дБВ, дБFS и дБ-УЗД. Некоторая предыстория представлена в качестве прелюдии к статье.

Децибел (дБ) – это логарифмическое отношение двух величин. Децибел — это «безразмерное» значение, означающее, что это просто число, а не единица измерения. Хотя децибелы чаще всего ассоциируются со звуковыми сигналами, они не обязательно должны быть такими. Когда они используются для описания уровней аудиосигнала, они часто используются для сравнения амплитуды двух аудиосигналов. Если эти два сигнала имеют одинаковую амплитуду, то говорят, что они разнесены на 0 дБ. Если один сигнал в два раза превышает амплитуду другого сигнала, то он выше на 6 дБ. Если кто-то говорит вам «убавить сигнал на 6 дБ», то вас просят уменьшить амплитуду этого сигнала наполовину.

Децибелы полезны, поскольку люди воспринимают уровни звука логарифмически. Логарифмическая шкала не является линейной. Если вы увеличите амплитуду сигнала на 6 дБ, она будет в два раза больше первоначальной амплитуды. Если вы увеличите его еще на 6 дБ, это будет в четыре раза больше исходной амплитуды. Еще 6 дБ означали бы восьмикратное увеличение исходной амплитуды. Цифры растут очень быстро: если усилить сигнал на 60 дБ, его амплитуда будет в 1000 раз превышать первоначальную амплитуду!

dBu и dBV — это децибелы, специально предназначенные для измерения напряжения. В отличие от дБ, они фактически являются единицами, потому что их можно преобразовать в фактическое значение напряжения. dBu – это дБ относительно 0,775 вольта; таким образом, что 0dBu = 0,775 вольт. dBV – дБ относительно 1,0 вольта; таким образом, что 0dBV = 1,0 вольт. Чтобы быстро преобразовать dBu в dBV, обратите внимание, что dBu всегда равно dBV плюс 2,21. Буква V в dBV пишется с заглавной буквы, чтобы обеспечить ясность между V и u при записи.

дБ-УЗД – это мера уровня звукового давления в атмосфере, которая используется для измерения амплитуды звуков (волн звукового давления), распространяющихся по воздуху. 0dB-SPL соответствует уровню звукового давления, который едва слышен обычному человеку. дБ-УЗД также является единицей измерения, поскольку его можно преобразовать в другие единицы измерения давления, например в паскали.

dBFS или децибелы относительно полной шкалы используются для измерения уровней цифрового аудиосигнала. dBFS — еще одна безразмерная величина, потому что это просто число и его нельзя преобразовать в другую единицу. В цифровой аудиосистеме 0dBFS относится к максимально возможному уровню сигнала, также известному как точка клиппинга. Поэтому значения dBFS всегда меньше или равны нулю. -10dBFS соответствует сигналу, который на 10 дБ ниже точки ограничения системы.

Полная шкала

0dBFS (полная шкала) — это точка ограничения сигнала в цифровом аудиоустройстве. Цифровые сигналы измеряются (или привязаны) не от минимального уровня шума вверх, а от точки ограничения или полной шкалы вниз. Сигнал 0dBFS (полная шкала) содержит максимальное количество цифровой информации, которая может использоваться для представления определяемого сигнала.

В любом цифровом процессоре выход, управляемый сигналом 0dBFS, должен обеспечивать полный выходной потенциал устройства, все, что выше этого уровня, будет обрезать выходной сигнал. Цифровая точка отсечки Biamp на уровне +28dBu (пик). Таким образом, +28dBu = 0dBFS на измерителе Biamp. Это может быть не так для устройств других производителей, если они разработали свои продукты с учетом другой точки отсечения.

Запас по уровню является важной концепцией в аудиосистемах. Чтобы обеспечить надлежащий запас по уровню, вам необходимо иметь достаточный доступный диапазон сигнала, остающийся выше среднеквадратичного сигнала, чтобы справляться с пиками без ограничения. Клиппинг — это деформация формы аудиосигнала в результате насыщения или перегрузки системы.

Аналоговая система будет обрезаться, когда не будет остаточного напряжения для описания более громкого сигнала — он достиг максимального уровня напряжения, который система может воспроизвести, если она попытается сделать громче, самые громкие части «обрезаются».В цифровой системе отсечение происходит, когда нет дополнительных битов данных, доступных для кодирования сигнала, что приводит к цифровому шуму или хэшу.

С DSP-устройствами Biamp с плавающей запятой сигнал с пиковым значением более +28 дБн будет отсекаться, если он выходит из DSP через аналоговые или цифровые выходы. Сигналы с уровнем выше 0dBFS будут обрезаться, если они передаются по цифровым аудиопутям CobraNet, Dante, AVB или USB.

Чтобы сделать математику для dBFS, это будет означать, что ваш RMS средний уровень должен быть около -20dBFS, что равняется +4dBu (24dBu - 20dB = 4dBu; 0dBus - 20dBFS = -20dBFS). Это 0dBFS = +24dBu не является жестким правилом для всех производителей, обязательно проверьте свое оборудование, чтобы увидеть, на что ссылается уровень 0dBFS.

А как насчет минимального уровня шума? 24-битная цифровая аудиосистема (такая как Biamp DSP) имеет диапазон 144 дБ, поэтому рабочий уровень глубины дискретизации все еще на 120 дБ ниже сигнала -24 дБ полной шкалы. 16-битный сэмпл имеет диапазон 96 дБ, оставляя 72 дБ нижнего диапазона. В любом случае вас будут беспокоить минимальные уровни шума, создаваемые микрофонами и самой окружающей средой, а не диапазон используемой битовой глубины.

Настройки аналогового выхода

(Примечание. Чтобы увидеть упомянутые здесь элементы управления в программном обеспечении Audia или Nexia, обязательно включите Output Attenuation при создании блока Output.)

Мы в Biamp ссылаемся на наши измерители так, что 0 дБ = 0 дБн = 0,775 В при работе с выходной настройкой +24 дБн (по умолчанию). Если выбрано более низкое значение полной шкалы (dBu), выходное напряжение масштабируется соответствующим образом.

Аналоговый выходной каскад Biamp имеет выбираемые фиксированные настройки: -31 дБн, 0 дБн, 6 дБн, 12 дБн, 18 дБн или 24 дБн. Это максимальное значение напряжения, создаваемое, когда аналоговый выход управляется до начала ограничения.

Напоминаем, что Biamp показывает на измерителях точку отсечения +24 dBu. Сигнал +24dBu (0dBFS) активирует аналоговый выход до максимального напряжения. Цифровой сигнал полной шкалы преобразуется в аналоговый сигнал на выходном блоке, настройка dBu позволяет указать максимальное аналоговое напряжение, подаваемое на выход.

Изменение параметра Full Scale Out изменит напряжение, подаваемое на аналоговое выходное соединение. Важно ознакомиться со спецификацией следующего устройства в сигнальной цепочке, чтобы убедиться, что подаваемое напряжение не превышает номинальную чувствительность входа.

В выходном блоке параметр Выходной уровень (дБ) позволяет точно настроить уровень выходного сигнала перед преобразованием в аналоговый сигнал. Он изменяет уровень, пока он все еще находится в цифровом домене. Функционально он аналогичен элементу управления Level, размещенному в строке перед выходным блоком.

Настройка -31dBu обеспечивает уровень микрофона на выходе.

< /tr> < td>Полная шкала (dBu) Выход = 0

Настройки блока аналогового вывода< /td>	Максимальное напряжение аналогового выхода (Вэфф)
Полная шкала (дБу) Выход = 24 дБн	12,282 Вэфф
Полная шкала (dBu) Выход = 18	6,156 В (среднеквадратичное значение)
Полная шкала (dBu) Выход = 12	3.085 Vrms
Полная шкала (dBu) Out = 6	1.546 Vrms
0,775 В (среднеквадратичное значение)
Полная шкала (dBu) Выход = -31	0,0218 Vrms (21,8 мВrms)

Вы, наверное, слышали термины "профессиональный" уровень и "потребительский" уровень. Уровень Pro составляет +4 dBu = 1,228 В RMS и обычно используется в устройствах с балансным подключением. Потребительский уровень составляет -10 дБВ = 0,316 В RMS и обычно наблюдается в устройствах с несбалансированными соединениями. «Уровень» — это средний среднеквадратичный уровень для программного материала в точке единичного усиления внутри устройства. Пиковые уровни могут быть на 20 дБ и более выше среднего среднеквадратичного уровня.

"Потребительский" уровень -10 дБВ равен -7,7825 дБн, поэтому он на 11,7825 дБн (около 12 дБн) меньше, чем "профессиональный" уровень. Обратите внимание, что это не разница в 14 дБ, поскольку используются две разные шкалы (дБВ и дБн), вам необходимо преобразовать одно из значений в ту же шкалу, что и другое, и затем посмотреть на разницу на уровне между ними.

VU-метры — это баллистические стрелочные индикаторы, используемые в большинстве старых аналоговых устройств. На профессиональном (студийном) оборудовании 0VU = +4dBu. Вот почему мы называем +4 дБ "профессиональным уровнем". Это термин, унаследованный от старых времен создания звука и обозначающий 0 на измерителях громкости.

Мы в компании Biamp ссылаемся на наши измерители так, что 0 дБ = 0 дБн при работе с выходной настройкой +24 дБн (по умолчанию).

Чувствительность аналогового входа

Настройка Gain In блока аналоговых входов позволяет установить значение от 0 дБ до +66 дБ с шагом 6 дБ. Этот параметр используется для согласования входной чувствительности устройства с подключенным источником. Увеличивая значение Gain In, вы усиливаете входящее напряжение, подаваемое внешним устройством. Микрофон имеет очень, очень низкое выходное напряжение по сравнению с линейным выходом проигрывателя компакт-дисков или линейным выходом микшерного пульта, поэтому вы должны использовать более высокое значение Gain In для микрофона (усиливая его или «усиливая его»). вверх", больше) и ниже для устройств линейного уровня (которые требуют меньшего усиления).

Цель состоит в том, чтобы поднять напряжение в среднем до 0 dBu, номинального рабочего напряжения оборудования Biamp. Это позволит оптимизировать уровень входного напряжения для оборудования цифро-аналогового преобразования, обеспечивая наилучшее соотношение сигнал-шум и запас по запасу.

Обратите внимание, что когда вы устанавливаете входное усиление, вы согласовываете уровни напряжения между устройствами, а не импеданс. Согласование импеданса не является необходимым или желательным — производитель уже разработал компоненты, которые прекрасно взаимодействуют с другими компонентами.

Phan Pwr или Фантомное питание — это постоянный ток 48 В, подаваемый на входную цепь для подачи питания на конденсаторный/электретный микрофон или активный директ-бокс. Никогда не используйте его для устройств, которым не требуется фантомное питание.

Когда устройство-источник отправляет сигнал с уровнем 0 дБ на своих измерителях, измерители уровня входного сигнала на принимающем устройстве также должны показывать 0 дБ.

Для устройства линейного уровня, обеспечивающего максимальное выходное напряжение +24 дБн (или 12,23 В среднеквадратичного значения) для устройства Biamp, правильное значение входного усиления равно 0 дБ. При 0 дБ входной сигнал передается в устройство Biamp с единичным усилением — усиление не добавляется к сигналу и не вычитается из него.
Для устройства линейного уровня, обеспечивающего максимальное выходное напряжение +12 дБн (или 3,065 В среднеквадратичного значения) для устройства Biamp, правильное значение входного усиления составляет 12 дБ. Поскольку подаваемое напряжение понижается, вам необходимо увеличить входную чувствительность.
Для устройства микрофонного уровня, обеспечивающего максимальное выходное напряжение -31 дБн (или 0,021 В среднеквадратичного значения) для устройства Biamp, правильная настройка входного усиления составляет +54 дБ с «точной настройкой» +1 дБ для соответствия уровню входного сигнала. . Опять же, поскольку подаваемое напряжение было уменьшено, вам нужно увеличить входную чувствительность, чтобы вернуться к 0 дБ.

См. диаграмму ниже; и обратите внимание, что 0 дБ Gain In — это не то же самое, что 0 dBu напряжения.

Цифровой сигнальный процессор Biamp может работать с максимальным входным напряжением +24 dBu. Параметр Gain In, равный 0 дБ, означает, что для сигнала, поступающего от устройства, которое также создает максимальный уровень +24 дБн, корректирующее смещение не применяется для согласования со структурой усиления. Для любого устройства, обеспечивающего входное напряжение, чей (потенциальный) максимальный уровень ниже +24 dBu, нам необходимо обеспечить компенсирующее усиление, чтобы совместить точки ограничения двух устройств. Это относится к любому устройству ввода, будь то микрофон, ПК, кодек, музыкальный сервер, микшерный пульт или другое устройство DSP. Аналогичным образом, если максимальный уровень выходного сигнала устройства превышает +24 dBu, то это устройство необходимо ослабить, чтобы ограничить его максимальный уровень до +24 dBu.

Настройка Gain In используется для согласования напряжений между устройствами путем усиления низковольтного аналогового входного сигнала в среднем до 0 dBu RMS, когда он поступает в блок DSP, непосредственно перед AD (аналоговый в цифровое) преобразование.

< tr>

Настройка «Gain In» (иначе — чувствительность)	Тип источника входного сигнала	dBu (максимальный уровень от источника)	Vrms (максимальный уровень от источника)
0dB	линейный уровень	24 дБн	12,28 В среднеквадратичного значения
6 дБ	линейный уровень	18 dBu	6,16 Vrms
12dB	линейный уровень	12 dBu	3,09 Vrms
18dB	линейный уровень	6 dBu	1.55 Vrms
24dB	линейный уровень	0 dBu	0,775 Vrms
30 дБ	линейный уровень	-6 dBu	0,388 Vrms
36dB	микрофонный уровень	-12 dBu	0.195 В (среднеквадратичное значение)
42 дБ	уровень микрофона	-18 дБн	0,0975 В (97,5 мВ)
48 дБ	уровень микрофона	-24 dBu	0,0489 В (48,9 мВ)
54 дБ	уровень микрофона	-30 dBu	0,0245 В (24,5 мВ)
60dB	уровень микрофона	-36 dBu	0,01228 Vrms (12,28 мВ среднекв.)
66 дБ	уровень микрофона	-42 дБн	0,006156 В (6,156 мВ)

Протестировать

Можно измерить пиковое выходное значение Vrms устройства, подключив мультиметр к контактам 2 и 3 (+/-) линейного выхода.

Проверка максимального выходного напряжения

Используйте тон-генератор, настроенный на тон 1 кГц при +24 dBu, его можно подключить непосредственно к выходу в вашей раскладке.

Синусоиды имеют крест-фактор +3 дБ. Если вы подключите к сигнальному тракту и пиковый, и среднеквадратичный измеритель, вы увидите, что среднеквадратический измеритель сообщает о +24 дБ, а пиковый измеритель сообщает о +27 дБ.

Напомним, что с дБ, падение на 6 дБ (-6 дБ) равно 1/2 напряжения. Добавление 6 дБ равно удвоению напряжения.

Неврология??

В аудиофильской индустрии существует бесконечный список тем, вызывающих споры. Спорные темы, такие как дорогие кабели и звук высокого разрешения (hi-res), особенно раздражают сообщество.

Определение аудио высокого разрешения гласит, что любой музыкальный файл, записанный с частотой дискретизации и разрядностью выше 44,1 кГц/16 бит, считается аудио высокой четкости (HD).

Изображение от Sony

В этой статье мы рассмотрим основы частоты дискретизации и разрядности, а также их влияние на воспринимаемое качество звука.

Мы также коснемся еще одного понятия: битрейта. Битрейт или битрейт обычно используется для описания качества аудиопотока для сервисов потоковой передачи музыки.

Как звук записывается в цифровом виде?

При воспроизведении звука создается волна давления, которая распространяется по воздуху. Если диафрагма записывающего устройства, например микрофона, находится поблизости, волны давления в воздухе создают вибрацию в диафрагме. Благодаря волшебству преобразователей эта вибрация, в свою очередь, создает электрический сигнал, который постоянно меняется вместе с волнами в воздухе.

Эта непрерывная и пропорциональная вариация - то, откуда происходит термин "аналоговый".

Сигнал, создаваемый диафрагмой, часто сам по себе недостаточно силен. Обычно предварительный усилитель сначала усиливает сигнал, чтобы его можно было записать несколькими способами.

На протяжении всей истории для записи и хранения аналоговых сигналов использовались различные материалы. Сюда входят воск, виниловые диски и магнитные ленты. Со временем цифровые записи были введены и стали обычным явлением.

Цифровые системы (единицы и нули) записывают аналоговые сигналы (непрерывно изменяющиеся значения) путем их дискретизации.

Разница между низкой частотой дискретизации и высокой частотой дискретизации

Захватив достаточное количество образцов входящего аналогового сигнала и сохранив их в памяти, цифровые записи могут захватить, а затем воспроизвести указанный сигнал.

Обычная цифровая аудиозапись содержит до 44 100 сэмплов в секунду. Однако нередко можно увидеть 96 000 сэмплов в секунду для некоторых цифровых аудиоформатов.

Существует несколько типов методов дискретизации, но стандартом де-факто является импульсно-кодовая модуляция (ИКМ).

Что такое импульсно-кодовая модуляция?

PCM служит отраслевым стандартом для хранения аналоговых сигналов в цифровом формате. В потоке PCM амплитуда звука дискретизируется с одинаковым интервалом.PCM не является собственностью, поэтому каждый может использовать его бесплатно!

Однако звук в формате PCM редко можно найти по двум причинам:

Размер файла

Поскольку формат PCM несжатый, размер записанного аудиофайла огромен. Можно сжимать аудиофайлы, используя алгоритмы сжатия с потерями или даже без потерь, чтобы сохранить точность звука при уменьшении размера файла.

Dolby и DTS — это форматы сжатия аудио с потерями, которые часто используются для этой цели, поскольку они способны уменьшить размер аудиофайлов PCM на целых 90%.< /p>

К сожалению, способ, которым Dolby и DTS кодируют каналы PCM в битовый поток для хранения, а затем декодируют его обратно для воспроизведения, не идеален. Полученный звук, несмотря на меньший размер файла, не всегда такой чистый и четкий, как исходный, что приводит к снижению точности и качества.

Именно здесь на помощь приходят форматы без потерь, такие как Dolby Digital TrueHD и DTS-HD Master Audio. Они способны декодировать аудиосигналы PCM точно так, как они были изначально. захвачено.

Совместимость воспроизведения

К сожалению, популярные операционные системы (ОС) изначально не поддерживают воспроизведение файлов PCM. IBM и Microsoft определили формат Waveform Audio Format (WAV) для ОС Windows, в то время как Apple использовала формат аудиообмена (AIFF) для ОС Macintosh. Оба формата представляют собой просто обертку аудиоформата PCM с дополнительной аудиоинформацией, такой как профиль автора, название трека и т. д.

Представление достоверности

Верность/качество потока PCM определяется двумя атрибутами:

Эти два атрибута показывают, насколько цифровая запись соответствует исходному аналоговому сигналу.

Что такое частота дискретизации?

Вспомните анимационные фильмы, снятые пару десятилетий назад.

Фильмы представляли собой просто слайды из неподвижных изображений, которые показывались одно за другим, чтобы создать иллюзию движения. Скорость перехода определяла плавность полученной анимации. Чем быстрее переход, тем лучше иллюзия анимации.

Скорость смены слайдов такая же, как частота кадров в современном видео.

Цифровая звуковая волна подобна снимку исходного аудиосигнала. Чем больше сэмплированная звуковая волна похожа на оригинальную звуковую волну, тем выше точность цифровой звуковой волны.

В цифровых аудиозаписях частота дискретизации аналогична частоте кадров в видео. Чем больше звуковых данных (сэмплов) собрано за определенный период времени, тем ближе к исходному аналоговому звуку становятся захваченные данные.

Чем выше частота дискретизации, тем точнее захват исходного аудиосигнала

В типичной записи цифрового аудио компакт-диска частота дискретизации составляет 44 100 или 44,1 кГц. Если вам интересно, почему частота такая высокая, когда человеческое ухо может слышать частоты в лучшем случае до 20 кГц. Это связано с теоремой выборки Найквиста-Шеннона.

Теорема Найквиста

Этот принцип, обычно называемый теоремой Найквиста или частотой Найквиста, гласит, что для предотвращения потери информации при цифровой выборке сигнала частота дискретизации должна быть как минимум в два раза выше максимальной ожидаемой частоты сигнала.

В этом случае использование частоты дискретизации 44 100 выборок в секунду или 44,1 кГц позволяет точно воспроизводить частоты около 22 кГц.

Другие примеры распространенной частоты дискретизации: 8000 Гц для телефонов и от 96 000 Гц до 192 000 Гц для аудиодорожек Blu-ray. Частота дискретизации 384 000 Гц также используется в некоторых особых ситуациях, например при записи животных, излучающих ультразвук.

Что такое битовая глубина?

Компьютер хранит информацию в единицах и нулях. Эти двоичные значения называются битами. Чем выше число битов, тем больше места для хранения информации.

4-битное двоичное число. Время викторины: что представляет приведенный выше двоичный файл?

Когда сигнал дискретизируется, он должен хранить дискретизированную аудиоинформацию в битах. Вот где битовая глубина встает на место. Разрядность определяет, сколько информации может быть сохранено.Выборка с 24-битной глубиной может хранить больше нюансов и, следовательно, является более точной, чем выборка с 16-битной глубиной.

Чтобы быть более точным, давайте посмотрим, какое максимальное количество значений может хранить каждая битовая глубина.

16 разрядов: мы можем хранить до 65 536 уровней информации.
24-разрядная версия: мы можем хранить до 16 777 216 уровней информации.

Вы можете увидеть огромную разницу в количестве возможных значений между двумя разрядностями.

Динамический диапазон

Еще один важный фактор, на который влияет битовая глубина, — это динамический диапазон сигнала. 16-битный цифровой звук имеет максимальный динамический диапазон 96 дБ, а 24-битная глубина даст нам максимум 144 дБ.

Звук CD-качества записывается с глубиной 16 бит, потому что, как правило, мы хотим иметь дело только со звуком, который достаточно громкий, чтобы мы могли его слышать, но в то же время недостаточно громкий, чтобы повредить оборудование или барабанные перепонки.

Разрядность 16 бит при частоте дискретизации 44,1 кГц достаточна для воспроизведения слышимой частоты и динамического диапазона для среднего человека, поэтому он стал стандартным форматом компакт-диска.

Всегда ли записывать в формате 192 кГц/24 бит?

Несмотря на отсутствие ограничений по частоте дискретизации и битовой глубине, 192 кГц/24 бит — это золотой стандарт для аудио высокого разрешения. (Есть производители, которые уже рекламируют возможность 32-битной глубины, упс!) Мы будем использовать 192 кГц/24 бит в качестве эталона для вершины точности записи.

Так когда же требуется такая верность?

Мы знаем, что чем выше частота дискретизации и разрядность, тем больше наш цифровой сигнал будет похож на исходный аналоговый сигнал. Но это также дает нам дополнительный запас прочности.

Дополнительный запас

Запас – это разница между динамическим диапазоном аудиосигнала и допустимой разрядностью. Это как проехать на грузовике высотой 3 метра по эстакаде с вертикальным просветом 5 метров. Это дает вам 2 метра свободного пространства для работы на тот случай, если вам придется перевозить необычно высокий груз.

Сэмплирование в 16-битном режиме дает звукорежиссерам динамический диапазон 96 дБ. С другой стороны, 24-битный формат расширяет динамический диапазон до 144 дБ, хотя на самом деле большинство аудиооборудования может достигать только 125 дБ.

Благодаря дополнительному запасу звуковые инженеры могут свести к минимуму, если не устранить, возможность чрезмерного шума или клиппинга, когда звуковые волны по существу становятся плоскими и вызывают слышимые искажения.

Отсечение происходило, когда входящий электрический сигнал не мог быть представлен полностью в числовом виде. Это может произойти, если битовая глубина невелика.

Поскольку возможный диапазон сигналов профессионального звукового оборудования намного больше, чем то, что может слышать обычный человек, использование 24-битной технологии позволяет профессионалам в области звука безошибочно применять тысячи эффектов и операций, связанных с микшированием и мастерингом звука, чтобы подготовить его к работе. воспроизведение и распространение.

Увеличить размер файла

Помимо потенциально избыточного запаса, запись с более высокой точностью создает гораздо больший размер файла.

Расчет размера файла

Чтобы дать вам представление о разнице в размере файла, давайте попробуем придумать гипотетический сценарий с пятиминутной несжатой песней.

1) Сначала рассчитайте битрейт по формуле частота дискретизации * битовая глубина * количество каналов.

44,1 кГц/16 бит: 44 100 x 16 x 2 = 1 411 200 бит в секунду (1,4 Мбит/с).
192 кГц/24 бит: 192 000 х 24 х 2 = 9 216 000 бит в секунду (9,2 Мбит/с).

2) Используя вычисленный битрейт, мы умножаем его на продолжительность записи в секундах.

44,1 кГц/16 бит: 1,4 Мбит/с * 300 с = 420 МБ (52,5 МБ)
192 кГц/24 бит: 9,2 МБ/с * 300 с = 2 760 МБ (345 МБ)

Аудио, записанное в формате 192 кГц/24 бит, займет в 6,5 раз больше места, чем звук, записанный в формате 44,1 кГц/16 бит.

Итак, когда вам нужно записывать в формате 192 кГц/24 бит?

Все зависит от того, что вы хотите делать с аудиозаписью. Вы хотите манипулировать записью и у вас есть неограниченная память? Тогда 192 кГц/24 бита не составит труда. Но если вы собираетесь транслировать свою музыку своим слушателям, 192 кГц/24 бит будут поглощать полосу пропускания вашего слушателя и увеличивать его счета за интернет.

Обеспечивает ли 192 кГц/24 бит превосходное качество прослушивания?

Он использует комбинацию обработки сигнала и того, как мы, люди, воспринимаем звук, чтобы объяснить, почему сэмплирование в формате 192 кГц/24 бит не имеет смысла, а также дать читателям представление о том, как проводить собственные тесты на прослушивание дома, чтобы попробовать и проверить. самостоятельно.

Смысл в том, чтобы наслаждаться музыкой, верно? Современная точность воспроизведения непостижимо лучше, чем уже превосходные аналоговые системы, доступные поколение назад.Является ли логическая крайность чем-то большим, чем просто еще одной проблемой первого мира? Возможно, но меня беспокоят плохие миксы и кодировки; они отвлекают меня от музыки, и я, наверное, не одинок.

Зачем отказываться от 24/192? Потому что это решение несуществующей проблемы, бизнес-модель, основанная на умышленном невежестве и обмане людей. Чем больше лженаука выходит из-под контроля в мире в целом, тем труднее истине победить правдивость… даже если это небольшой и относительно незначительный пример.

Мы считаем, что закон убывающей отдачи применим к частоте дискретизации/разрядности. Как только вы достигаете определенного порога, незначительное улучшение качества звука становится все меньше и меньше, пока не станет незначительным.

Что такое битрейт?

Битрейт (или битрейт, если хотите) означает количество битов, передаваемых или обрабатываемых в секунду, минуту или любую другую единицу времени, используемую в качестве измерения.

Это похоже на частоту дискретизации, но вместо этого измеряется количество битов, а не количество выборок.

Битрейт чаще используется в контексте воспроизведения/потоковой передачи, чем в контексте записи.

Термин "битрейт" используется не только в аудиоиндустрии. Он также распространен в мультимедиа и сетях. Однако в музыке более высокий битрейт обычно ассоциируется с более высоким качеством. Это связано с тем, что каждый бит аудиофайла содержит часть данных, которые мы можем использовать для воспроизведения исходного звука.

По сути, чем больше битов вы можете уместить в единицу времени, тем ближе будет воссоздание исходной непрерывно изменяющейся звуковой волны и, следовательно, тем точнее она будет представлять песню.

К сожалению, более высокий битрейт также означает больший размер файла, что недопустимо, когда речь идет о месте для хранения и пропускной способности, например, при работе со службами потоковой передачи музыки, такими как Apple Music и Spotify.

Службы потоковой передачи музыки

Из приведенного выше раздела видно, что для потоковой передачи несжатой 5-минутной песни, записанной в формате 44,1 кГц/16 бит, требуется битрейт 1,4 Мбит/с, что является значительной пропускной способностью.

Apple Music и Spotify обходят эту проблему пропускной способности, сжимая звук. Конечно, сжатие файлов не проходит без последствий. Для начала Spotify ограничивает битрейт аудиофайлов до 160 кбит/с для пользователей настольных компьютеров и 96 кбит/с для мобильных пользователей. Однако у премиум-подписчиков есть возможность слушать звук со скоростью 320 кбит/с на настольном компьютере. Между тем, подписчики Apple Music «ограничены» битрейтом 256 кбит/с.

Качество потоковой передачи Spotify

Apple Music и Spotify используют формат AAC (Advanced Audio Coding) и формат Ogg Vorbis соответственно для своих служб потоковой передачи аудио.

Существуют также службы потокового аудио для тех, кто предпочитает слушать музыку с более высоким битрейтом.

И TIDAL, и Qobuz Sublime+ считаются популярными сервисами потоковой передачи аудио для тех, кто предпочитает потоковую передачу звука наилучшего качества. Варианты Hi-FI доступны при ежемесячной подписке за 19,99 долларов США.

TIDAL поддерживает файлы FLAC 44,1 кГц/16 бит, которые можно передавать со скоростью 1 411 кбит/с.

Таблица качества приливного звука

Подписка TIDAL Hi-Fi предлагает лучшее соотношение цены и качества. Это связано с тем, что вы получаете доступ к огромной библиотеке высококачественных файлов FLAC, а также к 50 000 песен высочайшего качества, сжатых с использованием запатентованной технологии Master Quality Authenticated (MQA) для улучшения качества звука.

Высокий битрейт гарантирует превосходное качество прослушивания?

В нашем примере выше типичная пятиминутная песня в формате 44,1 кГц/16 бит имела бы несжатый файл размером более 50 МБ.

Кодек MP3 был разработан для решения этой проблемы, позволяя сжимать звук с качеством CD без потери качества. Ранние кодеры MP3 начинали со 128 или 192 кбит/с, а затем перешли на 320 кбит/с, чтобы конкурировать с другими кодеками. Однако в потоковом аудио используются Ogg Vorbis (Spotify) и AAC (Apple Music).

Это общедоступный исходный код с открытым исходным кодом, который обеспечивает высокое качество по сравнению с пропускной способностью, необходимой для его потоковой передачи. Мы опробовали несколько различных форматов файлов и провели еще один тест пару лет назад, и формат Ogg Vorbis оказался лучшим.

Неизвестность формата не так уж актуальна, поскольку пользователи никогда не видят сами файлы, поэтому, если по какой-то причине стал известен другой формат, обеспечивающий более высокую рентабельность инвестиций, перейти на этот новый формат несложно. Бывший вице-президент Spotify.

Возвращаясь к объяснению Криса Монтгомери, мы теперь знаем, что все, что выше 192 кбит/с на приличном кодировщике, на самом деле не имеет значения — обычное человеческое ухо просто недостаточно точно, чтобы заметить разницу.

Это означает, что любая музыка с битрейтом 192 кбит/с или выше становится неотличимой от исходного аудиоаналога, если она правильно закодирована в аудиофайл Ogg, MP3, AAC или FLAC.

Конечно, это не означает, что высокий битрейт бесполезен. Это помогает гарантировать превосходное качество прослушивания. Однако это применимо только в определенных ситуациях. Например, если у вас есть полноценная аудиосистема Hi-Fi, вы можете воспользоваться небольшими улучшениями качества звука при потоковой передаче аудиофайлов Hi-Fi.

Как правило, случайный слушатель, использующий обычные наушники, не выиграет от потоковой передачи звука со скоростью ниже 192 кбит/с.

Заключение

Подводя итог, можно сказать, что частота дискретизации — это количество аудиосэмплов, записанных в единицу времени, а битовая глубина показывает, насколько точно были закодированы сэмплы. Наконец, битрейт — это количество битов, записываемых в единицу времени.

Теперь это было не так сложно, не так ли?

Надеюсь, с помощью нашего руководства мы помогли прояснить некоторые загадки, связанные с частотой дискретизации, битовой глубиной и битрейтом.

В дальнейшем вы должны быть в состоянии критически мыслить, когда кто-то говорит вам, насколько «чище» звучит аудиофайл в зависимости от процесса его кодирования. Что еще более важно, теперь вам будет проще находить соответствующие аудиоформаты и потоковые сервисы, отвечающие вашим слуховым потребностям.

В современную эпоху аудио нельзя не упомянуть о Hi-Res и 24-битной глубине музыки студийного качества, но понимает ли кто-нибудь, что это на самом деле означает?

В современную эпоху аудио нельзя не упомянуть музыку в формате Hi-Res и 24-битной музыки студийного качества. Если вы еще не заметили тенденцию в смартфонах высокого класса — кодек Sony LDAC Bluetooth — и потоковые сервисы, такие как Qobuz, вам действительно нужно больше читать этот сайт.

Обещание простое: превосходное качество звука благодаря большему объему данных, также известному как битовая глубина. Это 24 бита цифровых единиц и нулей по сравнению с жалким 16-битным пережитком эпохи компакт-дисков. Конечно, вам придется доплачивать за более качественные продукты и услуги, но чем больше битов, тем лучше, верно?

Звук в низком разрешении часто отображается в виде лестничной волны. Это не то, как работает сэмплирование звука, и это не то, как выглядит звук, исходящий от устройства.

Не обязательно. Потребность во все большей и большей битовой глубине основана не на научной реальности, а скорее на искажении правды и использовании неосведомленности потребителей о науке о звуке. В конечном счете, компании, продающие 24-битное аудио, могут получить гораздо больше прибыли, чем вы от превосходного качества воспроизведения.

Примечание редактора: эта статья была обновлена 13 июля 2021 г., чтобы обновить некоторые технические формулировки и добавить меню содержания.

Разрядность и качество звука: шаг по лестнице — это не проблема

Чтобы предположить, что 24-битный звук является обязательным, маркетологи (и многие другие, кто пытается объяснить эту тему) выдвигают очень знакомую лестницу качества звука в рай. 16-битный пример всегда показывает неровное, зубчатое воспроизведение синусоиды или другого сигнала, в то время как 24-битный эквивалент выглядит красиво гладко и с более высоким разрешением. Это простое наглядное пособие, но оно основано на незнании темы и научных данных, что приводит потребителей к неверным выводам.

Прежде чем кто-нибудь откусит мне голову, технически говоря, эти ступенчатые примеры довольно точно отображают звук в цифровой области. Тем не менее, диаграмма основы/леденец-диаграмма является более точным графическим изображением для визуального аудиосемплирования, чем эти ступенчатые ступени. Подумайте об этом так: сэмпл содержит амплитуду в определенный момент времени, а не амплитуду, удерживаемую в течение определенного периода времени.

Использование ступенчатых диаграмм намеренно вводит в заблуждение, поскольку базовые диаграммы обеспечивают более точное представление цифрового звука. Эти два графика отображают одни и те же точки данных, но ступенчатый график выглядит менее точным.

Тем не менее правильно, что аналого-цифровой преобразователь (АЦП) должен уместить бесконечно переменный аналоговый аудиосигнал в конечное число бит.Бит, попадающий между двумя уровнями, должен быть округлен до ближайшего приближения, что называется ошибкой квантования или шумом квантования. (Запомните это, так как мы еще вернемся к этому.)

Во-первых, то, что описывают эти ступенчатые диаграммы, если мы применим их к аудиовыходу, называется ЦАП нулевого порядка. Это очень простая и дешевая технология ЦАП, в которой сигнал переключается между различными уровнями каждый новый семпл для получения выходного сигнала. Это не используется ни в каких профессиональных или полуприличных потребительских аудиопродуктах. Вы можете найти его в микроконтроллере за 5 долларов, но уж точно не где-либо еще. Такое искажение аудиовыхода подразумевает искаженную и неточную форму волны, но это не то, что вы получаете.

На самом деле выход современного ∆Σ ЦАП представляет собой 1-битный сигнал PDM с передискретизацией (справа), а не сигнал с нулевым удержанием (слева). Последний производит более низкий уровень шума на аналоговом выходе при фильтрации.

АЦП и ЦАП звукового класса преимущественно основаны на дельта-сигма (∆Σ) модуляции. Компоненты этого калибра включают интерполяцию и передискретизацию, формирование шума и фильтрацию для сглаживания и уменьшения шума. Дельта-сигма ЦАП преобразуют аудиосэмплы в 1-битный поток (модуляция плотности импульсов) с очень высокой частотой дискретизации. При фильтрации это дает гладкий выходной сигнал с шумом, выведенным далеко за пределы слышимых частот.

В двух словах: современные ЦАП не выводят грубые зубчатые аудиосэмплы — они выводят битовый поток, который фильтруется шумом, в очень точный, гладкий выходной сигнал. Эта ступенчатая визуализация неверна из-за так называемого «шума квантования».

Понимание шума квантования

В любой конечной системе случаются ошибки округления. Это правда, что 24-битный АЦП или ЦАП будет иметь меньшую ошибку округления, чем 16-битный эквивалент, но что это на самом деле означает? Что еще более важно, что мы на самом деле слышим? Это искажение или нечеткость, детали потеряны навсегда?

На самом деле это и то, и другое, в зависимости от того, работаете ли вы в цифровом или аналоговом мире. Но ключевой концепцией для понимания обоих является понимание минимального уровня шума и того, как он улучшается по мере увеличения битовой глубины. Чтобы продемонстрировать, давайте отойдем от 16 и 24 бит и посмотрим на примеры с очень маленькой разрядностью.

Разница между глубиной 16 и 24 бита заключается не в точности формы сигнала, а в доступном пределе, при котором цифровой шум не будет мешать нашему сигналу.

В приведенном ниже примере есть довольно много вещей, которые нужно проверить, поэтому сначала краткое объяснение того, что мы рассматриваем. У нас есть входные (синие) и квантованные (оранжевые) сигналы на верхних диаграммах с разрядностью 2, 4 и 8 бит. Мы также добавили к нашему сигналу небольшое количество шума, чтобы лучше имитировать реальный мир. Внизу у нас есть график ошибки квантования или шума округления, который вычисляется путем вычитания квантованного сигнала из входного сигнала.

Увеличение битовой глубины делает квантованный сигнал более подходящим для входного сигнала. Однако это не главное, обратите внимание на гораздо больший сигнал ошибки/шума для более низких разрядностей. Квантованный сигнал не удаляет данные из нашего ввода, они фактически добавляются в этот сигнал ошибки. Аддитивный синтез говорит нам, что сигнал может быть воспроизведен суммой любых двух других сигналов, включая несовпадающие по фазе сигналы, которые действуют как вычитание. Так работает шумоподавление. Таким образом, эти ошибки округления вносят новый шумовой сигнал.

Это не просто теория. На самом деле вы можете слышать все больше и больше шума в аудиофайлах с более низкой битовой глубиной. Чтобы понять почему, изучите, что происходит в 2-битном примере с очень маленькими сигналами, например, до 0,2 секунды. Щелкните здесь для увеличения изображения. Очень небольшие изменения во входном сигнале вызывают большие изменения в квантованной версии. Это ошибка округления в действии, которая приводит к усилению шума слабого сигнала. Таким образом, шум снова становится громче по мере уменьшения битовой глубины.

Подумайте об этом и в обратном порядке: невозможно захватить сигнал меньше размера шага квантования, который по иронии судьбы называется наименее значащим битом. Небольшие изменения сигнала должны переходить к ближайшему уровню квантования. Большая битовая глубина имеет меньшие шаги квантования и, следовательно, меньшие уровни усиления шума.

Самое главное, обратите внимание, что амплитуда шума квантования остается неизменной, независимо от амплитуды входных сигналов.Это демонстрирует, что шум возникает на всех различных уровнях квантования, поэтому существует постоянный уровень шума для любой заданной битовой глубины. Большая битовая глубина производит меньше шума. Поэтому мы должны думать о различиях между 16- и 24-битной глубиной не как о точности формы сигнала, а как о доступном пределе, прежде чем цифровой шум будет мешать нашему сигналу.

Битовая глубина зависит от шума

Келли Сиккема. Нам нужна битовая глубина с достаточным отношением сигнал-шум, чтобы приспособиться к нашему фоновому шуму, чтобы записать наш звук так же идеально, как он звучит в реальном мире.

Ваше ухо имеет чувствительность в диапазоне от 0 дБ (тишина) до примерно 120 дБ (ужасно громкий звук), а теоретическая способность (в зависимости от нескольких факторов) различать громкость составляет всего 1 дБ. Таким образом, динамический диапазон вашего уха составляет около 120 дБ или около 20 бит.

Однако вы не можете услышать все это сразу, так как барабанная перепонка, или барабанная перепонка, напрягается, чтобы уменьшить объем звука, фактически достигающего внутреннего уха в шумной обстановке. Вы также не будете слушать музыку на такой громкости, потому что оглохнете. Кроме того, среда, в которой вы и я слушаем музыку, не такая тихая, как может слышать здоровое ухо. В хорошо оборудованной студии звукозаписи уровень фонового шума может снизиться до 20 дБ, но прослушивание в оживленной гостиной или в автобусе, очевидно, ухудшит условия и снизит полезность широкого динамического диапазона.

Человеческое ухо имеет огромный динамический диапазон, но не весь одновременно. Маскировка и собственная защита слуха нашего уха снижают ее эффективность.

Вдобавок ко всему: по мере увеличения громкости в вашем ухе начинает действовать маскировка более высоких частот. При низкой громкости от 20 до 40 дБ маскировка не происходит, за исключением звуков близкой по высоте. Однако при 80 дБ звуки ниже 40 дБ будут маскироваться, а при 100 дБ звуки ниже 70 дБ услышать невозможно. Динамический характер уха и материала для прослушивания затрудняет определение точного числа, но реальный динамический диапазон вашего слуха, вероятно, находится в районе 70 дБ в среднем окружении и всего до 40 дБ в очень громком окружении. Битовая глубина всего в 12 бит, вероятно, подойдет большинству людей, поэтому 16-битные компакт-диски дают нам достаточно места.

гиперфизика Маскировка высоких частот происходит при высокой громкости прослушивания, что ограничивает наше восприятие более тихих звуков.

Инструменты и записывающее оборудование тоже создают шум (особенно гитарные усилители) даже в очень тихих студиях звукозаписи. Также было проведено несколько исследований динамического диапазона различных жанров, включая это, которое показывает типичный динамический диапазон 60 дБ. Неудивительно, что жанры с большей близостью к тихим партиям, такие как хор, опера и фортепиано, показали максимальный динамический диапазон около 70 дБ, в то время как «более громкие» жанры рок, поп и рэп имели тенденцию к 60 дБ и ниже. В конечном счете, музыка создается и записывается только с определенной точностью.

Возможно, вы знакомы с "войнами за громкость" в музыкальной индустрии, что, безусловно, противоречит цели современных аудиоформатов Hi-Res. Интенсивное использование сжатия (которое усиливает шум и ослабляет пики) уменьшает динамический диапазон. У современной музыки значительно меньший динамический диапазон, чем у альбомов 30-летней давности. Теоретически современная музыка может распространяться с более низким битрейтом, чем старая музыка. Вы можете проверить динамический диапазон многих альбомов здесь.

16 бит — это все, что вам нужно

Это было довольно сложное путешествие, но, надеюсь, вы получили гораздо более детальное представление о битовой глубине, шуме и динамическом диапазоне, чем те вводящие в заблуждение примеры лестниц, которые вы так часто видите.

Битовая глубина зависит от шума, и чем больше битов данных у вас есть для хранения звука, тем меньше шума квантования будет внесено в вашу запись. Кроме того, вы также сможете более точно захватывать меньшие сигналы, помогая снизить уровень цифрового шума ниже уровня записи или прослушивания. Это все, для чего нам нужна битовая глубина. Нет смысла использовать огромную битовую глубину для мастер-аудио.

Алексей Рубан Из-за того, что шум суммируется в процессе микширования, имеет смысл записывать звук в 24-битном формате. Это не обязательно для окончательного мастер-стерео.

Удивительно, но 12 бит, вероятно, достаточно для приличного звучания музыкального мастера и для удовлетворения динамического диапазона большинства условий прослушивания. Однако цифровое аудио передает больше, чем просто музыку, и такие примеры, как запись речи или окружающей среды для телевидения, могут использовать более широкий динамический диапазон, чем большинство музыки. Плюс небольшой запас для разделения громкого и тихого звука никогда никому не помешает.

В целом, 16 бит (96 дБ динамического диапазона или 120 дБ с применением сглаживания) подходят для широкого диапазона типов звука, а также ограничений человеческого слуха и типичных условий прослушивания. Перцепционное увеличение 24-битного качества весьма спорно, если не просто плацебо, как, надеюсь, я продемонстрировал. Кроме того, увеличение размеров файлов и пропускной способности делает их ненужными. Тип сжатия, используемый для уменьшения размера файла в вашей музыкальной библиотеке или потоке, оказывает гораздо более заметное влияние на качество звука, чем 16- или 24-битный файл.

Несмотря на то, что обсуждению преобразования цифрового звука посвящено несколько книг, фундаментальное понимание двух терминов особенно важно для правильного использования вашей компьютерной системы записи: частота дискретизации и разрядность.

Процесс преобразования сложен, и существует несколько способов его выполнения. Но не беспокойтесь: мы собираемся обсудить частоту дискретизации и разрядность на базовом уровне применительно к линейной импульсно-кодовой модуляции (ИКМ), одной из наиболее распространенных технологий преобразования.

Основы выборки

На самом базовом уровне компьютеры выполняют одно действие за раз, последовательно включая и выключая переключатели с очень высокой скоростью. Поскольку компьютеры «думают» дискретными шагами, для преобразования аналоговых аудиосигналов в цифровой формат необходимо математически описать непрерывный аналоговый сигнал как последовательность дискретных значений амплитуды.

В аналого-цифровом преобразователе это достигается путем захвата с фиксированной скоростью серии коротких «моментальных снимков» — выборок — заданного размера. Каждый звуковой образец содержит данные, которые предоставляют информацию, необходимую для точного воспроизведения исходной аналоговой формы волны. В этом потоке данных содержатся такие вещи, как динамический диапазон, частотный контент и т. д. Мгновенный уровень амплитуды в каждой выборке определяется значением ближайшего шага измерения — процесс, называемый квантованием. Воспроизводя эти значения и воспроизводя их в том же порядке и с той же скоростью, с которой они были захвачены, цифро-аналоговый преобразователь создает практически идентичную (теоретически) копию исходного сигнала.

Частота захвата и воспроизведения называется частотой дискретизации. Размер выборки — точнее, количество битов, используемых для описания каждой выборки, — называется битовой глубиной или длиной слова. Количество битов, передаваемых в секунду, является битрейтом. Давайте посмотрим на это применительно к цифровому аудио.

Копаем немного глубже

Статус включения/выключения каждого переключателя на компьютере представлен как 1 или 0, система известна как двоичная. Таким образом, строка двоичных цифр — битов — используется для описания всего, что делает компьютер, включая манипулирование и отображение текста, изображений и аудио. Компьютеры могут одновременно управлять целыми строками этих битов; группа из 8 бит известна как байт; один или несколько байтов составляют цифровое слово. Шестнадцать бит (два байта) означают, что в слове 16 цифр, каждая из которых равна 1 или 0; 24 бита (три байта) означает, что в слове содержится 24 двоичных разряда; и так далее.

Число битов в слове определяет точность значений. Работа с более высокой битовой глубиной похожа на измерение линейкой с меньшим шагом: вы получаете более точное измерение. Когда значения имеют более точные приращения, преобразователю не нужно так сильно квантовать, чтобы получить ближайшее приращение измерения.

Таким образом, более высокая разрядность позволяет системе точно записывать и воспроизводить более тонкие колебания формы волны (см. рис. 1). Чем выше битовая глубина, тем больше данных будет захвачено для более точного воссоздания звука. Если битовая глубина слишком мала, информация будет потеряна, а качество воспроизводимого сэмпла ухудшится. Для сравнения, каждый образец, записанный с 16-битным разрешением, может содержать любое из 65 536 уникальных значений (216). При 24-битном разрешении вы получаете 16 777 216 уникальных значений (224) — огромная разница!

Самый важный практический эффект битовой глубины заключается в том, что она определяет динамический диапазон сигнала. Теоретически 24-битный цифровой звук имеет максимальный динамический диапазон 144 дБ по сравнению с 96 дБ для 16-битного, но современная технология цифрового аудиопреобразователя не может приблизиться к этому верхнему пределу. На момент написания этой статьи 24-битные преобразователи Burr-Brown в стоечных микшерах StudioLive серии RM и аудиоинтерфейсах Studio 192 обеспечивают динамический диапазон 118 дБ. Высокоскоростные преобразователи в аудиоинтерфейсах серии Quantum обеспечивают динамический диапазон 120 дБ.

Текущая ставка

Как отмечалось ранее, в процессе цифрового преобразования преобразователи записывают и воспроизводят сэмплы с заданной частотой дискретизации. Теорема дискретизации Найквиста-Шеннона утверждает, что для точного восстановления сигнала с заданной полосой пропускания (то есть определяемым диапазоном частот, например, от 20 Гц до 20 кГц) частота дискретизации должна быть более чем в два раза выше максимальной частоты сигнала. сигнал дискретизируется. Если используются более низкие частоты дискретизации, информация об исходном сигнале может быть не полностью восстановлена из дискретизированного сигнала (см. рис. 2).

Если частота дискретизации слишком низкая, это может привести к алиасинговым искажениям. Псевдонимы являются серьезной проблемой при использовании аналого-цифрового преобразования. Неправильная выборка аналогового сигнала приведет к тому, что высокочастотные компоненты сигнала будут совмещены с подлинными низкочастотными компонентами. Если это произойдет, цифро-аналоговое преобразование создаст неправильно реконструированный сигнал.

Кроме того, более высокая частота дискретизации позволяет записывать очень высокие частоты, превышающие нормальный диапазон человеческого слуха. Хотя сами по себе эти ультразвуковые частоты неслышны, они могут взаимодействовать друг с другом, создавая интермодуляционные искажения (такие как биения), что приводит к содержанию слышимых частот, которые, по мнению многих инженеров, создают тонкие психоакустические эффекты.

По ряду причин многие инженеры звукозаписи полагаются на частоту дискретизации 88,2, 96 и даже 192 кГц, чтобы обеспечить чрезвычайно точную запись с мельчайшими деталями.

Тариф, который вы выберете, зависит, по крайней мере частично, от продукта, который вам нужно доставить. Например, аудио компакт-диски и файлы MP3 воспроизводятся с частотой 44,1 кГц, поэтому выборка с частотой 88,2 кГц делает расчеты преобразователя относительно простыми. Цифровое вещание использует частоту 48 кГц, поэтому очевидным выбором является частота дискретизации 96 кГц. Тем не менее, некоторые инженеры считают, что сегодняшнее преобразование частоты дискретизации достаточно хорошо, чтобы не было необходимости выбирать частоту, основываясь на простой математике. Для этих инженеров более высокая ставка обычно считается лучшей.

Граница высокого разрешения

Варианты: моно (один канал) или стерео (два канала, правый/левый): чередование находится в одном файле; или сплит-стерео находится в двух отдельных файлах.

Частота дискретизации указана в герцах (Гц) или "циклах в секунду":
Используйте 44 100 Гц (44,1 кГц) = частота дискретизации качества CD для профессионального аудио. Каждый семпл содержит 16 бит информации.

Размеры файлов
Это огромный объем информации: 2 дорожки * 44 100 сэмплов в секунду * 16 бит/сэмпл = 1 411 200 бит/с.
Стереозвук CD-качества, 16 бит, 44,1 кГц = 176 кбайт/сек слишком высок для CD-ROM (2x привод ~ 200 кбайт/сек устойчиво) или модемов (28,8
модем ~2,88 кбайт/сек). сек). См. Сжатие ниже.

Хорошее эмпирическое правило: каждая минута 16-битного стереозвука с частотой 44,1 кГц требует около 10 МБ дискового пространства.
Таким образом, на пустой 200-мегабайтный жесткий диск можно записать чуть менее 20 минут стереозвука CD-качества (точно 19 минут 20 секунд).

Качество звука CD (стерео, 16 бит, 44,1 кГц = 176 кбайт/сек) слишком высокое для CD-ROM (2x привод ~ 200 кбайт/сек устойчиво) или модемов (модем 28,8
~ 2,88 кбайт /сек).
Аудиофайлы, сжатые в другие форматы, такие как rm или MP3, могут быть меньше, занимать меньше места на диске и передаваться быстрее.

../../index.html	sonic1ac.wav	155 КБ	13 сек
	звуковой.rm (то же, что и выше)	65 КБ	13 секунд
большая разрядность	sonic1ac.mp3 (то же, что и выше)	225 КБ	13 сек.
../audio/heartsounds.html	00b10001.wav	62 КБ	3 сек

Возможные компромиссы между качеством звука и размером файла:
В зависимости от вашего предполагаемого использования звука вы можете пожертвовать некоторым качеством, чтобы уменьшить объем информации, необходимой для оцифрованного звука. Вот некоторые вещи, которые следует учитывать:

Стерео часто можно свернуть в монофонический (однодорожечный) аудиофайл. Если две дорожки суммируются, вся звуковая информация будет сохранена, но информация о направлении будет потеряна. Поскольку компьютерные динамики часто не разнесены на подходящее расстояние, даже стереосигналы скомпрометированы. Переход в моно уменьшит размер файла вдвое.
Частота дискретизации: компьютеры часто предлагают частоты дискретизации 44K, 22K, 11K и 6K (или числа, очень близкие к этим). Частота дискретизации является важным фактором качества звука цифрового файла. Для полнодиапазонных звуков необходимы скорости 22K или 44K, в то время как речь часто приемлема при 11K. Когда вы снижаете частоту дискретизации, звук теряет свои высокие частоты, поэтому для воспроизведения криков певчих птиц вам может понадобиться 44K, но для озвучивания вполне подойдет 11K. Чтобы быть точным, частота дискретизации должна быть в два раза выше самой высокой частоты, которая должна быть оцифрована.

Для преобразования файла можно использовать кодировщик MP3. Но его битовая глубина составляет 128, поэтому размер файла может увеличиться.

Расчет требований к свободному пространству на жестком диске:
Для работы с компьютерным цифровым звуком требуется большое количество места на жестком диске. Если вы планируете создавать новые аудиофайлы на диске, вам потребуется достаточно места на жестком диске для их хранения.

Пример: я записал 13 секунд звука в коридоре ITC, 16-битное стерео, 44 100 Гц. Это файл размером 2,5 М, и его определенно нужно сжать.

Требования к аудиофайлам в байтах в секунду:

Качество звука CD (стерео, 16 бит, 44,1 кГц = 176 кбайт/сек) слишком высокое для CD-ROM (2x привод ~ 200 кбайт/сек устойчиво) или модемов (модем 28,8
~ 2,88 кбайт /сек).

Сжатие кодеком (компрессор/декомпрессор), возможно, для уменьшения размера файла:
Сжатие IMA работает достаточно хорошо для компакт-дисков, но является кросс-платформенным только с QuickTime.
MPEG 1 -- качество компакт-диска
MPEG 3 = MP3 и RealAudio являются наиболее популярными из многочисленных решений для веб-аудио.
Для музыки MIDI является лучшим решением как для компакт-дисков, так и для доставки через Интернет.
Кредиты для вышеуказанного материала:

Читайте также: