Почему звук плавает на компьютере

Обновлено: 21.11.2024

Я предполагаю, что часть людей, читающих это, слышали о 32-битной плавающей запятой, но до сих пор не уверены, что именно это такое. Каковы преимущества? Каковы недостатки? Когда я спросил своего друга, который также является опытным инженером, о 32-битной плавающей запятой, он сказал мне, что не знает и никогда не использовал ее.

После этого обсуждения, а затем сразу же после просмотра этого твита от опытного продюсера из Бруклина Эндрю Мори, я понял, что должен наконец выяснить, что это за чертовщина и стоит ли мне его использовать.

Итак, что такое 32-битная плавающая переменная?

Формат числа компьютеров, который занимает 4 байта (32 бита) в памяти компьютера и представляет широкий динамический диапазон значений с использованием плавающей запятой. В IEEE 754-2008 32-битный формат с основанием 2 официально называется двоичным32. В IEEE 754-1985 он назывался одиночным. В старых компьютерах использовались другие форматы с плавающей запятой размером 4 байта, например, типом данных с одинарной точностью в GW-BASIC был 32-битный формат с плавающей запятой MBF.

Хорошо, на этом мы заканчиваем… Это было слишком просто. Ха. Ха.

Начнем с определения битовой глубины, потому что я знаю его, и его не так уж сложно понять. Битовая глубина определяет динамический диапазон аудиофайла.

Значит, 32-битное плавающее означает более широкий динамический диапазон, верно? Не совсем так.

Так 32-битная плавающая лучше? Чем выше битрейт, тем лучше, верно? Вроде.

Получается, что причина, по которой никто не знает, что такое 32-битная плавающая переменная, заключается в том, что большинству инженеров бессмысленно даже беспокоиться об этом.

Видео в блоге Reaper — один из немногих найденных мною источников, в котором на практике объясняется 32-битное плавание. Это объяснение легко для человека, который не любит тратить время на размышления о цифровой обработке сигналов больше, чем необходимо.

Итак… 32-битная плавающая запись — это 24-битная запись с 8 дополнительными битами для громкости. По сути, если звук воспроизводится внутри компьютера, то 32-битное плавающее значение дает вам больше возможностей. Внутри компьютера это такие вещи, как эффекты AudioSuite в Pro Tools и внутренняя печать треков. Итак, скажем, вы решили использовать AudioSuite (или распечатать) компрессор, а уровень выходного сигнала плохо достигает максимума… Если вы используете 32-битное плавающее, вы можете снизить уровень и восстановить запас, чтобы файл не был искажен. Если бы вы записывали на магнитофон, это было бы возможно. Вы не можете просто записать клиппинг баса, а затем восстановить запас громкости. Преимущество 32-битного плавающего звука заключается в внутренней обработке, НО недостатком является то, что создаваемые им файлы на 50 % больше, чем стандартные 24-битные аудиофайлы.

Большинству опытных инженеров не нужно беспокоиться о запасе мощности, поскольку они, вероятно, уже знают, как убедиться, что уровни никогда не обрезаются, когда этого не должно быть. В этой статье от ask.audio говорится, что 32-битное плавающее значение также поможет уменьшить ненужный шум, создаваемый дизерингом AudioSuite и ошибками округления во время обработки сигнала в Pro Tools.

Возможно, в будущем я напишу статью, в которой проведу тест, чтобы увидеть, есть ли заметная разница между эффектами AudioSuite, обработанными с 24-битной и 32-битной плавающей запятой.

Обновление: я слышал из надежного источника, что большинство DAW обрабатывают 32-битное плавающее, поэтому, если вы обрабатываете какое-либо аудио, оно преобразуется в 32-битное для обработки, а затем обратно в 24-битное. Если позволяют условия, лучше всего работать в 32-битном плавающем режиме до мастеринга, чтобы избежать ненужных артефактов преобразования. После мастеринга проекта мастеринг-инженер может преобразовать окончательный аудиофайл в нужный сэмпл и битрейт.

Дэвид Сильверстайн

Дэвид Сильверстайн начал заниматься инженерией в возрасте 14 лет, когда купил четырехдорожечный кассетный магнитофон Fostex. После школы он поступил в колледж Five Towns College, где получил степень бакалавра профессиональных исследований в области бизнеса со специализацией в области технологии аудиозаписи. Он работал под руководством известных инженеров и продюсеров Джима Сабеллы (Marcy Playground, Nine Days и Public Enemy) и Брайса Гоггина (Pavement, Spacehog, The Ramones и The Lemonheads). В настоящее время Дэвид работает в своей студии в Восточном Гарлеме, штат Нью-Йорк, и в Sabella Studios в Рослине, штат Нью-Йорк. Просмотреть все сообщения Дэвида Сильверстайна

Кодирование аудио всегда было процессом компромисса. 16 или 24 бит? 44 кГц, 48 или 96 кГц? Рискуете обрезать громкие звуки или потерять детализацию из-за шума в тихих пассажах? Но не более. Вот что вам нужно знать.

Робин Харрис – главный аналитик TechnoQWAN LLC, основанной им в 2005 году исследовательской и консалтинговой компании в области систем хранения данных. Компания TechnoQWAN, базирующаяся в Седоне, штат Аризона, специализируется на новых технологиях, продуктах, компаниях и рынках.

zdnet рекомендует

Мы собрали несколько лучших (и при этом доступных) продуктов, чтобы вы могли получить максимальную отдачу от затраченных средств.

Кодирование всегда было частью цифрового звука. Форматы без потерь кодируют все в записи. Но если высокие частоты исходной записи обрезаны или усиление слишком низкое, чтобы уловить тихие звуки, они не смогут закодировать то, чего нет.

Но что, если уровни записи не имеют значения? Что, если бы вы могли забыть о проблемах, которые вызывает автоматическая регулировка усиления (АРУ)? Что, если бы вы могли начать с мягкого звука, похожего на трепет крыльев бабочки, и закончить звуком форсажной камеры реактивного двигателя на полной тяге, и вам не нужно было бы регулировать усиление — и все это при улавливании каждой детали во всем диапазоне звука? ?

Теперь вы можете. Думайте об этом как о расширенном динамическом диапазоне для ваших ушей.

32-битное число с плавающей запятой

Аудио кодируется в файлы с разной разрядностью. Чем меньше битов, тем менее точно цифровое аудио может представить аналоговые звуковые волны, и тем больше создается цифрового шума.

16-битное аудио кодирует звуки в один из 65 536 уровней. Наибольшее число — это максимальная громкость. Эта битовая глубина обеспечивает около 96 дБ динамического диапазона.

24-битный звук — наиболее распространенный на сегодняшний день профессиональный формат — поддерживает более 16 миллионов уровней звука, что соответствует динамическому диапазону 144,5 дБ. Лучше, но все же значительно ниже максимального звукового давления на уровне моря около 210 дБ.

Как 16-, так и 24-битный звук кодируется как числа с фиксированной точкой. Новый формат, называемый 32-битным числом с плавающей запятой в звуковых кругах, кодирует звук в стандартном формате одинарной точности IEEE-754: 1 бит для положительного или отрицательного; 8-битная экспонента; и 23-битная дробь.

В переводе на децибелы это дает диапазон более 1500 дБ. Это намного больше диапазона, чем вам когда-либо понадобится.

Кроме того, в отличие от кодирования с фиксированной точкой, здесь не указан максимальный уровень звука, поэтому громкие звуки не отсекаются.

Повысьте усиление на своем 32-битном записывающем устройстве с плавающей запятой! Вы можете отрегулировать уровни звука позже на вашей 32-битной цифровой звуковой рабочей станции (DAW). Сегодня большинство профессиональных DAW поддерживают 32-битное число с плавающей запятой.

Как всегда, бесплатных обедов не бывает: 32-битные файлы примерно на треть больше 24-битных. Но с учетом современных жестких дисков и твердотельных накопителей емкостью несколько терабайт это вряд ли проблема.

Рекордеры

Большая проблема заключается в том, что лишь немногие аудиорекордеры поддерживают 32-битный формат с плавающей запятой. Но они есть — посмотрите Sound Devices и Zoom — и стоят несколько сотен долларов. Я ожидаю увидеть больше вариантов в ближайшее время.

После того как ваш аудиоинтерфейс добился 32-битного плавающего звука, существует множество программ, которые могут его использовать. Бесплатная программа Audacity с открытым исходным кодом, доступная для macOS, Windows и Linux, редактирует 32-битные числа с плавающей запятой. Как и Protools и Logic Pro.

Теперь несколько предостережений. Если перед записью появились искажения — перегруженный капсюль микрофона, шум в сети — 32-битное число с плавающей запятой не поможет.

Кроме того, 32-разрядные цифровые сигнальные процессоры (DSP) с плавающей запятой стоят дороже, чем DSP с фиксированной запятой. При использовании качественного аудиоинтерфейса разница невелика, но на сегодняшний день это не самые дешевые записывающие устройства.

Вывод

32-битное число с плавающей запятой не является панацеей от всех проблем со звуком, но оно избавляет инженера звукозаписи от необходимости отслеживать клиппирование во время записи. Она может сосредоточиться на выборе и размещении микрофона, звуке помещения и отключении AGC.

Аудио обычно является самой важной и сложной частью любого видеопроекта. Устранение проблем с уровнем звука в записи упрощает тяжелую работу.

Комментарии? Если вы использовали 32-битное число с плавающей запятой, я хотел бы услышать, что вы думаете. Я планирую аудиопроект и думаю, не стоит ли обновить интерфейс Apogee One.

Читайте также: