20 секунд записи цифрового стереофонического аудиофайла занимают 4 МБ звуковой карты разрядностью 20 на диске

Обновлено: 27.02.2026

Эта утилита рассчитывает размер аудиофайлов (как несжатых, так и аудиофайлов PCM/IEEE FP, таких как .WAV/ .W64/ .RF64, .AIFF/.AIF, а также файлов со сжатием с потерями, таких как MP3, WMA, AAC и OGG Vorbis), в зависимости от продолжительности записи и выбранных вами настроек файла:

**N.B.** Если вы ищете калькулятор для обратного действия (т. е. для расчета продолжительности из доступного места), перейдите сюда.

Введите продолжительность файла в часах, минутах, секундах и миллисекундах. Для расчета размера несжатых файлов также требуется информация о частоте дискретизации, битовой глубине и канале (но не битовая скорость, которая рассчитывается автоматически). Помимо продолжительности, для расчета размера сжатых файлов, таких как MP3 и т. д., требуется только информация о скорости передачи (в этом случае информация о частоте дискретизации, разрядности и канале игнорируется). Для сжатых файлов, закодированных с помощью CBR (постоянная скорость передачи данных), отображаемый размер файла должен быть максимально точным (независимо от переменных, таких как информация заголовка и т. д. — см. ниже). Для сжатых файлов, закодированных с помощью VBR (переменная скорость передачи данных), отображаемый размер файла может быть немного менее точным, поскольку в этом случае скорость передачи данных может варьироваться в зависимости от программного материала.

Обратите внимание, что размер файла, сообщаемый вашим устройством, может немного отличаться от показанного из-за методов размещения файлов, возможных различий в количестве информации в заголовке и/или того факта, что некоторые операционные системы рассчитывают место на жестком диске иначе, чем другие (например, , некоторые считают его в двоичном формате и называют 1 КБ 1024 байтами, в то время как другие (и большинство производителей жестких дисков) вычисляют его в десятичном формате и называют 1 КБ 1000 байтами) — этот калькулятор поддерживает оба метода.

Если вы найдете это полезным и/или у вас есть какие-либо комментарии или предложения, дайте мне знать через раздел комментариев ниже (пожалуйста, ознакомьтесь с правилами нашего веб-сайта перед публикацией).

Дайте мне знать, что вы думаете. Отменить ответ

Этот сайт использует Akismet для уменьшения количества спама. Узнайте, как обрабатываются данные ваших комментариев.

74 мысли о «Калькуляторе размера аудиофайла»

Очень полезно, спасибо! Я получаю SD-карту для своего Zoom R8, и меня беспокоит, будет ли достаточно скорости записи U1. Выяснилось, что я могу одновременно записывать 64 канала в формате 24 бит/48 кГц, и карта U1 по-прежнему прекрасно с этим справится.

Я потратил время, чтобы выяснить формулы, используемые этим сайтом, чтобы определить размер файла аудио и максимально возможную длину на основе размера диска и скорости передачи данных, что я смог сделать благодаря этому сайту.
Благодаря этому я узнал, как рассчитать максимальный битрейт аудио на основе длины аудио и размера диска. Вот формула, если вам это нужно по какой-то причине:

((размер файла в мегабайтах / длина в секундах) * 1000) * 8

Если бы не этот сайт, я бы не смог его сделать, так как раньше не мог уложить в голове, как это сделать.

Если вам интересно, какой смысл в возможности рассчитать максимально возможный битрейт, это полезно для сжатия аудио до определенного размера файла, обычно для того, чтобы вы могли обойти ограничение размера файла на веб-сайте. Но для меня это полезно, потому что значительно упрощает сжатие аудио до размеров файлов, пригодных для потоковой передачи.

Рад, что вы нашли этот сайт полезным и нашли решение – вы действительно правы. Однако вашу формулу можно упростить для ясности. На самом деле, самые простые формулы для расчета размера файла, продолжительности или битрейта будут такими:

Размер файла (бит) = продолжительность (секунды) * скорость передачи данных (бит в секунду)

Продолжительность (секунды) = размер файла (биты) / скорость передачи данных (биты в секунду)

Битрейт (бит в секунду) = размер файла (бит) / продолжительность (секунды)

Это именно то, что мне было нужно. Я рассматриваю возможность реализации звукового сэмплера на плате микроконтроллера, и мне нужно знать, какая емкость мне понадобится. Это был идеальный инструмент для этого. Спасибо!

Очень полезно! Спасибо

Это то, что я искал. Спасибо.

Отличный инструмент! Спасибо за его создание.

Спасибо за создание, это действительно полезный ресурс, к которому я регулярно возвращаюсь. Есть ли шанс, что вы могли бы добавить 256 кГц в качестве частоты дискретизации? Это довольно часто встречается в ультразвуковых приборах.

Хорошо, Сэм, готово. 😉

Здравствуйте,
У меня вопрос об аудиоканалах.
Как может быть 65535 каналов в аудиофайле?

Здравствуйте, Saturn, потому что 65535 действительно является максимальным числом аудиоканалов, поддерживаемым форматом файла .wav. Дополнительную информацию можно найти здесь.

Звукорежиссер решил записать фоновый звук для предстоящего фильма в стереофоническом режиме. Для создания высококачественного несжатого цифрового аудиофайла звукоинженер будет использовать разрядность 16 бит и частоту дискретизации 88 кГц. Каким будет приблизительный результирующий размер файла для 1.5 минут 37 секунд звуковой дорожки?

Здравствуйте, roury! Конечно, просто введите эти данные в калькулятор выше.

да, извините, я думал, что сделал что-то не так, но теперь все хорошо.. большое спасибо

Здравствуйте, Колин! Я разрабатываю студию и пытаюсь рассчитать пропускную способность, которую должен иметь мой локальный сервер, чтобы иметь возможность запускать большую сессию оркестрового озвучивания — 400 дорожек (96 кГц/24 бит) на двух Рабочие станции Protools и видео 4K на третьей — чтобы прийти к выводу, какое серверное решение будет правильным.

Привет, Адитья! Всегда полезно знать, как люди используют мои онлайн-инструменты. Удачи вашему проекту!

Привет, Колин!
Я пытаюсь загрузить файлы аудиокниг в систему продажи аудиокниг Findaway Voices. Я автор и понятия не имею о битах и т. д. Файлы 129-битные. Компании нужны файлы в 192000 бит. Это звучит так, как будто есть так много различий. Что я делаю? Надеюсь, вы можете помочь. Спасибо.
КДж

Здравствуйте, KJ,
Похоже, вы записали свою аудиокнигу в формате mp3, да? С точки зрения кодирования mp3-файла, описание файла как 128 или 129 «бит» не имеет смысла. Важно понимать, что кодеки mp3-файлов (CODEC — сокращение от encode/decode) обычно выражаются в кбит/с, что означает килобиты В СЕКУНДУ, другими словами, это количество данных, которые передаются в потоке в секунду при воспроизведении. файл, поэтому он называется битрейтом — он НЕ относится к общему количеству битов в самом файле; размер файла определяется длительностью закодированного звука, умноженной на скорость передачи данных. Основная формула: Размер файла (биты) = Продолжительность (секунды) * Скорость передачи данных (биты в секунду).

Это также звучит так, как будто вы, возможно, использовали переменную скорость передачи данных (VBR), потому что 129 кбит/с (файлы не могут иметь 129 бит/с — это было бы смехотворно низкой скоростью передачи данных) не совсем стандартно для CBR (непрерывная скорость передачи битов). скорость) mp3-файлов — хотя стандартная скорость передачи данных — 128 кбит/с, это может быть просто ошибкой отчета.

Я ознакомился с их техническими требованиями, и вашему дистрибьютору, похоже, требуются либо файлы mp3 со скоростью 192 кбит/с, либо файлы FLAC с частотой дискретизации 44,1 кГц (и, по-видимому, поскольку они не уточняют это, 16-битные ).

В любом случае, похоже, что вы записали свои файлы со скоростью 128 или 129 кбит/с вместо требуемых 192 кбит/с, поэтому вам нужно будет исправить их перед отправкой. Поскольку mp3 — это формат с потерями, перекодирование в mp3 со скоростью 192 кбит/с неизбежно приведет к ухудшению качества (что может быть для вас приемлемым или неприемлемым). Однако способ, которым я справился бы с этим (за исключением перезаписи), состоял бы в том, чтобы преобразовать файлы в WAV (с частотой 44,1 кГц / 16 бит), а затем в FLAC (который сжат, но без потерь) и использовать это как формат доставки — таким образом вы не потеряете качество исходных файлов.

Поскольку вы спрашиваете моего совета; Я предлагаю вам в будущем всегда записывать файлы WAV (несжатые и без потерь), а НЕ mp3 (которые и сжаты, и с потерями). MP3 хорош как формат доставки, но (по нескольким причинам, слишком сложным, чтобы вдаваться в них) далек от идеального формата записи. Лично я всегда записывал разговорный материал (музыка немного отличается) в виде стандартного WAV-файла с частотой дискретизации 44,1 кГц/16 бит или 48 кГц/16 бит. Затем вы можете конвертировать в mp3 (или любой другой формат, который может потребоваться) для доставки, сохраняя исходные файлы WAV нетронутыми на случай, если вам может понадобиться преобразовать их в другой формат позже без потери качества звука.

Неврология??

В аудиофильской индустрии существует бесконечный список тем, вызывающих споры. Спорные темы, такие как дорогие кабели и звук высокого разрешения (hi-res), особенно раздражают сообщество.

Определение аудио высокого разрешения гласит, что любой музыкальный файл, записанный с частотой дискретизации и разрядностью выше 44,1 кГц/16 бит, считается аудио высокой четкости (HD).

Изображение от Sony

В этой статье мы рассмотрим основы частоты дискретизации и разрядности, а также их влияние на воспринимаемое качество звука.

Мы также коснемся еще одного понятия: битрейта. Битрейт или битрейт обычно используется для описания качества аудиопотока для сервисов потоковой передачи музыки.

Как звук записывается в цифровом виде?

При воспроизведении звука создается волна давления, которая распространяется по воздуху.Если диафрагма записывающего устройства, например микрофона, находится поблизости, волны давления в воздухе создают вибрацию в диафрагме. Благодаря волшебству преобразователей эта вибрация, в свою очередь, создает электрический сигнал, который постоянно меняется вместе с волнами в воздухе.

Эта непрерывная и пропорциональная вариация - то, откуда происходит термин "аналоговый".

Сигнал, создаваемый диафрагмой, часто сам по себе недостаточно силен. Обычно предварительный усилитель сначала усиливает сигнал, чтобы его можно было записать несколькими способами.

На протяжении всей истории для записи и хранения аналоговых сигналов использовались различные материалы. Сюда входят воск, виниловые диски и магнитные ленты. Со временем цифровые записи были введены и стали обычным явлением.

Цифровые системы (единицы и нули) записывают аналоговые сигналы (непрерывно изменяющиеся значения) путем их дискретизации.

Разница между низкой частотой дискретизации и высокой частотой дискретизации

Захватив достаточное количество образцов входящего аналогового сигнала и сохранив их в памяти, цифровые записи могут захватить, а затем воспроизвести указанный сигнал.

Обычная цифровая аудиозапись содержит до 44 100 сэмплов в секунду. Однако нередко можно увидеть 96 000 сэмплов в секунду для некоторых цифровых аудиоформатов.

Существует несколько типов методов дискретизации, но стандартом де-факто является импульсно-кодовая модуляция (ИКМ).

Что такое импульсно-кодовая модуляция?

PCM служит отраслевым стандартом для хранения аналоговых сигналов в цифровом формате. В потоке PCM амплитуда звука дискретизируется с одинаковым интервалом. PCM не является собственностью, поэтому каждый может использовать его бесплатно!

Однако звук в формате PCM редко можно найти по двум причинам:

Размер файла

Поскольку формат PCM несжатый, размер записанного аудиофайла огромен. Можно сжимать аудиофайлы, используя алгоритмы сжатия с потерями или даже без потерь, чтобы сохранить точность звука при уменьшении размера файла.

Dolby и DTS — это форматы сжатия аудио с потерями, которые часто используются для этой цели, поскольку они способны уменьшить размер аудиофайлов PCM на целых 90%.< /p>

К сожалению, способ, которым Dolby и DTS кодируют каналы PCM в битовый поток для хранения, а затем декодируют его обратно для воспроизведения, не идеален. Полученный звук, несмотря на меньший размер файла, не всегда такой чистый и четкий, как исходный, что приводит к снижению точности и качества.

Именно здесь на помощь приходят форматы без потерь, такие как Dolby Digital TrueHD и DTS-HD Master Audio. Они способны декодировать аудиосигналы PCM точно так, как они были изначально. захвачено.

Совместимость воспроизведения

К сожалению, популярные операционные системы (ОС) изначально не поддерживают воспроизведение файлов PCM. IBM и Microsoft определили формат Waveform Audio Format (WAV) для ОС Windows, в то время как Apple использовала формат аудиообмена (AIFF) для ОС Macintosh. Оба формата представляют собой просто обертку аудиоформата PCM с дополнительной аудиоинформацией, такой как профиль автора, название трека и т. д.

Представление достоверности

Верность/качество потока PCM определяется двумя атрибутами:

Эти два атрибута показывают, насколько цифровая запись соответствует исходному аналоговому сигналу.

Что такое частота дискретизации?

Вспомните анимационные фильмы, снятые пару десятилетий назад.

Фильмы представляли собой просто слайды из неподвижных изображений, которые показывались одно за другим, чтобы создать иллюзию движения. Скорость перехода определяла плавность полученной анимации. Чем быстрее переход, тем лучше иллюзия анимации.

Скорость смены слайдов такая же, как частота кадров в современном видео.

Цифровая звуковая волна подобна снимку исходного аудиосигнала. Чем больше сэмплированная звуковая волна похожа на оригинальную звуковую волну, тем выше точность цифровой звуковой волны.

В цифровых аудиозаписях частота дискретизации аналогична частоте кадров в видео. Чем больше звуковых данных (сэмплов) собрано за определенный период времени, тем ближе к исходному аналоговому звуку становятся захваченные данные.

Чем выше частота дискретизации, тем точнее захват исходного аудиосигнала

В типичной записи цифрового аудио компакт-диска частота дискретизации составляет 44 100 или 44,1 кГц. Если вам интересно, почему частота такая высокая, когда человеческое ухо может слышать частоты в лучшем случае до 20 кГц. Это связано с теоремой выборки Найквиста-Шеннона.

Теорема Найквиста

Этот принцип, обычно называемый теоремой Найквиста или частотой Найквиста, гласит, что для предотвращения потери информации при цифровой выборке сигнала частота дискретизации должна быть как минимум в два раза выше максимальной ожидаемой частоты сигнала.

В этом случае использование частоты дискретизации 44 100 выборок в секунду или 44,1 кГц позволяет точно воспроизводить частоты около 22 кГц.

Другие примеры распространенной частоты дискретизации: 8000 Гц для телефонов и от 96 000 Гц до 192 000 Гц для аудиодорожек Blu-ray. Частота дискретизации 384 000 Гц также используется в некоторых особых ситуациях, например при записи животных, излучающих ультразвук.

Что такое битовая глубина?

Компьютер хранит информацию в единицах и нулях. Эти двоичные значения называются битами. Чем выше число битов, тем больше места для хранения информации.

4-битное двоичное число. Время викторины: что представляет приведенный выше двоичный файл?

Когда сигнал дискретизируется, он должен хранить дискретизированную аудиоинформацию в битах. Вот где битовая глубина встает на место. Разрядность определяет, сколько информации может быть сохранено. Выборка с 24-битной глубиной может хранить больше нюансов и, следовательно, является более точной, чем выборка с 16-битной глубиной.

Чтобы быть более точным, давайте посмотрим, какое максимальное количество значений может хранить каждая битовая глубина.

16 разрядов: мы можем хранить до 65 536 уровней информации.
24-разрядная версия: мы можем хранить до 16 777 216 уровней информации.

Вы можете увидеть огромную разницу в количестве возможных значений между двумя разрядностями.

Динамический диапазон

Еще один важный фактор, на который влияет битовая глубина, — это динамический диапазон сигнала. 16-битный цифровой звук имеет максимальный динамический диапазон 96 дБ, а 24-битная глубина даст нам максимум 144 дБ.

Звук CD-качества записывается с глубиной 16 бит, потому что, как правило, мы хотим иметь дело только со звуком, который достаточно громок, чтобы мы его слышали, но в то же время недостаточно громок, чтобы повредить оборудование или барабанные перепонки.

Разрядность 16 бит при частоте дискретизации 44,1 кГц достаточна для воспроизведения слышимой частоты и динамического диапазона для среднего человека, поэтому он стал стандартным форматом компакт-диска.

Всегда ли записывать в формате 192 кГц/24 бит?

Несмотря на отсутствие ограничений по частоте дискретизации и битовой глубине, 192 кГц/24 бит — это золотой стандарт для аудио высокого разрешения. (Есть производители, рекламирующие возможность 32-битной глубины, упс!) Мы будем использовать 192 кГц/24 бит в качестве эталона для вершины точности записи.

Так когда же требуется такая верность?

Мы знаем, что чем выше частота дискретизации и разрядность, тем больше наш цифровой сигнал будет похож на исходный аналоговый сигнал. Но это также дает нам дополнительный запас прочности.

Дополнительный запас

Запас – это разница между динамическим диапазоном аудиосигнала и допустимой разрядностью. Это как проехать на грузовике высотой 3 метра по эстакаде с вертикальным просветом 5 метров. Это дает вам 2 метра свободного пространства для работы на тот случай, если вам придется перевозить необычно высокий груз.

Сэмплирование в 16-битном режиме дает звукорежиссерам динамический диапазон 96 дБ. С другой стороны, 24-битный формат расширяет динамический диапазон до 144 дБ, хотя на самом деле большинство аудиооборудования может достигать только 125 дБ.

Благодаря дополнительному запасу звуковые инженеры могут свести к минимуму, если не устранить, возможность чрезмерного шума или клиппирования, когда звуковые волны по существу становятся плоскими и вызывают слышимые искажения.

Отсечение происходило, когда входящий электрический сигнал не мог быть представлен полностью в числовом виде. Это может произойти, если битовая глубина невелика.

Поскольку возможный диапазон сигналов профессионального звукового оборудования намного больше, чем то, что может слышать обычный человек, использование 24-битного звука позволяет профессионалам в области звука аккуратно применять тысячи эффектов и операций, связанных с микшированием и мастерингом звука, чтобы подготовить его к работе. воспроизведение и распространение.

Увеличить размер файла

Помимо потенциально избыточного запаса, запись с более высокой точностью создает гораздо больший размер файла.

Расчет размера файла

Чтобы дать вам представление о разнице в размере файла, давайте попробуем придумать гипотетический сценарий с пятиминутной несжатой песней.

1) Сначала рассчитайте битрейт по формуле частота дискретизации * битовая глубина * количество каналов.

44,1 кГц/16 бит: 44 100 x 16 x 2 = 1 411 200 бит в секунду (1,4 Мбит/с).
192 кГц/24 бит: 192 000 х 24 х 2 = 9 216 000 бит в секунду (9,2 Мбит/с).

2) Используя вычисленный битрейт, мы умножаем его на продолжительность записи в секундах.

44,1 кГц/16 бит: 1,4 Мбит/с * 300 с = 420 МБ (52,5 МБ)
192 кГц/24 бит: 9,2 МБ/с * 300 с = 2 760 МБ (345 МБ)

Аудио, записанное в формате 192 кГц/24 бит, займет в 6,5 раз больше места, чем звук, записанный в формате 44,1 кГц/16 бит.

Итак, когда вам нужно записывать в формате 192 кГц/24 бит?

Все зависит от того, что вы хотите делать с аудиозаписью. Вы хотите манипулировать записью и у вас есть неограниченная память? Тогда 192 кГц/24 бита не составит труда. Но если вы собираетесь транслировать свою музыку своим слушателям, 192 кГц/24 бит будут поглощать полосу пропускания вашего слушателя и увеличивать его счета за интернет.

Обеспечивает ли 192 кГц/24 бит превосходное качество прослушивания?

Он использует комбинацию обработки сигнала и того, как мы, люди, воспринимаем звук, чтобы объяснить, почему сэмплирование в формате 192 кГц/24 бит не имеет смысла, а также дать читателям представление о том, как проводить собственные тесты на прослушивание дома, чтобы попробовать и проверить. самостоятельно.

Смысл в том, чтобы наслаждаться музыкой, верно? Современная точность воспроизведения непостижимо лучше, чем уже превосходные аналоговые системы, доступные поколение назад. Является ли логическая крайность чем-то большим, чем просто еще одной проблемой первого мира? Возможно, но меня беспокоят плохие миксы и кодировки; они отвлекают меня от музыки, и я, наверное, не одинок.

Зачем отказываться от 24/192? Потому что это решение несуществующей проблемы, бизнес-модель, основанная на умышленном невежестве и обмане людей. Чем больше лженаука выходит из-под контроля в мире в целом, тем труднее истине победить правдивость… даже если это небольшой и относительно незначительный пример.

Мы считаем, что закон убывающей отдачи применим к частоте дискретизации/разрядности. Как только вы достигаете определенного порога, незначительное улучшение качества звука становится все меньше и меньше, пока не станет незначительным.

Что такое битрейт?

Битрейт (или скорость передачи, если хотите) – это количество битов, передаваемых или обрабатываемых в секунду, минуту или любую другую единицу времени, используемую в качестве измерения.

Это похоже на частоту дискретизации, но вместо этого измеряется количество битов, а не количество выборок.

Битрейт чаще используется в контексте воспроизведения/потоковой передачи, чем в контексте записи.

Термин "битрейт" используется не только в аудиоиндустрии. Он также распространен в мультимедиа и сетях. Однако в музыке более высокий битрейт обычно ассоциируется с более высоким качеством. Это связано с тем, что каждый бит аудиофайла содержит часть данных, которые мы можем использовать для воспроизведения исходного звука.

По сути, чем больше битов вы можете уместить в единицу времени, тем ближе будет воссоздание исходной непрерывно изменяющейся звуковой волны и, следовательно, тем точнее она будет представлять песню.

К сожалению, более высокий битрейт также означает больший размер файла, что недопустимо, когда речь идет о месте для хранения и пропускной способности, например, при работе со службами потоковой передачи музыки, такими как Apple Music и Spotify.

Службы потоковой передачи музыки

Из приведенного выше раздела видно, что для потоковой передачи несжатой 5-минутной песни, записанной в формате 44,1 кГц/16 бит, требуется битрейт 1,4 Мбит/с, что является значительной пропускной способностью.

Apple Music и Spotify обходят эту проблему пропускной способности, сжимая звук. Конечно, сжатие файлов не проходит без последствий. Для начала Spotify ограничивает битрейт аудиофайлов до 160 кбит/с для пользователей настольных компьютеров и 96 кбит/с для мобильных пользователей. Однако у премиум-подписчиков есть возможность слушать звук со скоростью 320 кбит/с на настольном компьютере. Между тем, подписчики Apple Music «ограничены» битрейтом 256 кбит/с.

Качество потоковой передачи Spotify

Apple Music и Spotify используют формат AAC (Advanced Audio Coding) и формат Ogg Vorbis соответственно для своих служб потоковой передачи аудио.

Существуют также службы потокового аудио для тех, кто предпочитает слушать музыку с более высоким битрейтом.

И TIDAL, и Qobuz Sublime+ считаются популярными сервисами потоковой передачи аудио для тех, кто предпочитает потоковую передачу звука наилучшего качества. Варианты Hi-FI доступны при ежемесячной подписке за 19,99 долларов США.

TIDAL поддерживает файлы FLAC 44,1 кГц/16 бит, которые можно передавать со скоростью 1 411 кбит/с.

Таблица качества приливного звука

Подписка TIDAL Hi-Fi предлагает лучшее соотношение цены и качества. Это связано с тем, что вы получаете доступ к огромной библиотеке высококачественных файлов FLAC, а также к 50 000 песен высочайшего качества, сжатых с использованием запатентованной технологии Master Quality Authenticated (MQA) для улучшения качества звука.

Высокий битрейт гарантирует превосходное качество прослушивания?

В нашем примере выше типичная пятиминутная песня в формате 44,1 кГц/16 бит имела бы несжатый файл размером более 50 МБ.

Кодек MP3 был разработан для решения этой проблемы, позволяя сжимать звук с качеством CD без потери качества. Ранние кодеры MP3 начинали со 128 или 192 кбит/с, а затем перешли на 320 кбит/с, чтобы конкурировать с другими кодеками. Однако в потоковом аудио используются Ogg Vorbis (Spotify) и AAC (Apple Music).

Это общедоступный исходный код с открытым исходным кодом, который обеспечивает высокое качество по сравнению с пропускной способностью, необходимой для его потоковой передачи. Мы опробовали несколько различных форматов файлов и провели еще один тест пару лет назад, и формат Ogg Vorbis оказался лучшим.

Неизвестность формата не так уж актуальна, поскольку пользователи никогда не видят сами файлы, поэтому, если по какой-то причине стал известен другой формат, обеспечивающий более высокую рентабельность инвестиций, перейти на этот новый формат несложно. Бывший вице-президент Spotify.

Возвращаясь к объяснению Криса Монтгомери, мы теперь знаем, что все, что выше 192 кбит/с на приличном кодировщике, на самом деле не имеет значения — обычное человеческое ухо просто недостаточно точно, чтобы заметить разницу.

Это означает, что любая музыка с битрейтом 192 кбит/с или выше становится неотличимой от исходного аудиоаналога, если она правильно закодирована в аудиофайл Ogg, MP3, AAC или FLAC.

Конечно, это не означает, что высокий битрейт бесполезен. Это помогает гарантировать превосходное качество прослушивания. Однако это применимо только в определенных ситуациях. Например, если у вас есть полноценная аудиосистема Hi-Fi, вы можете воспользоваться небольшими улучшениями качества звука при потоковой передаче аудиофайлов Hi-Fi.

Как правило, случайный слушатель, использующий обычные наушники, не выиграет от потоковой передачи звука со скоростью ниже 192 кбит/с.

Заключение

Подводя итог, можно сказать, что частота дискретизации — это количество аудиосэмплов, записанных в единицу времени, а битовая глубина показывает, насколько точно были закодированы сэмплы. Наконец, битрейт — это количество битов, записываемых в единицу времени.

Теперь это было не так сложно, не так ли?

Надеюсь, с помощью нашего руководства мы помогли прояснить некоторые загадки, связанные с частотой дискретизации, битовой глубиной и битрейтом.

В дальнейшем вы должны быть в состоянии критически мыслить, когда кто-то говорит вам, насколько «чище» звучит аудиофайл в зависимости от процесса его кодирования. Что еще более важно, теперь вам будет проще находить соответствующие аудиоформаты и потоковые сервисы, отвечающие вашим слуховым потребностям.

Цифровое аудио превращает аналоговые звуки в форму, в которой их можно хранить и обрабатывать на компьютере. Audacity — это программное приложение для редактирования, микширования и применения эффектов к цифровым аудиозаписям.

Цифровая выборка

Все звуки, которые мы слышим ушами, представляют собой волны давления в воздухе. Начиная с демонстрации Томасом Эдисоном первого фонографа в 1877 году, стало возможным улавливать эти волны давления на физической среде, а затем воспроизводить их позже, регенерируя те же волны давления. Волны звукового давления, или формы волны, выглядят примерно так:

Аналоговые носители записи, такие как грампластинки и кассеты, представляют форму волны напрямую, используя глубину канавки для записи или величину намагниченности для ленты. Аналоговая запись может воспроизводить впечатляющий набор звуков, но она также страдает от шума. Примечательно, что каждый раз, когда копируется аналоговая запись, вводится больше шума, что снижает точность воспроизведения. Этот шум можно свести к минимуму, но не полностью устранить.

Цифровая запись работает по-другому: она сэмплирует сигнал в равномерно распределенных временных точках, представляя каждую выборку в виде точного числа.Цифровые записи, хранящиеся на компакт-диске (CD), цифровой аудиоленте (DAT) или на персональном компьютере, не ухудшаются со временем и могут быть идеально скопированы без каких-либо дополнительных помех. На следующем изображении показан образец звуковой волны:

Цифровой звук можно редактировать и микшировать без добавления дополнительных шумов. Кроме того, к оцифрованным аудиозаписям можно применять множество цифровых эффектов, например, для имитации реверберации, усиления определенных частот или изменения высоты тона.

Возможность Audacity воспроизводить или записывать звук непосредственно с вашего компьютера зависит от вашего конкретного компьютерного оборудования. Большинство настольных компьютеров поставляются с звуковой картой с разъемами 1/8 дюйма (3,5 мм), к которым можно подключить микрофон или другой источник для записи, а также динамики или наушники для прослушивания. Многие портативные компьютеры имеют встроенные динамики и микрофон. Звуковая карта, которая поставляется с большинством компьютеров, не особенно высокого качества, в этом случае вы можете рассмотреть возможность использования внешнего аудиоинтерфейса USB. Информацию о том, как настроить Audacity для воспроизведения и записи, см. в разделе Настройка и конфигурация Audacity.

Качество цифрового звука

Качество цифровой аудиозаписи сильно зависит от двух факторов: частоты выборки и формата выборки или разрядности. Увеличение частоты дискретизации или количества бит в каждом сэмпле повышает качество записи, но также увеличивает объем места, используемого аудиофайлами на компьютере или диске.

Коэффициенты выборки

Частота дискретизации измеряется в герцах (Гц) или циклах в секунду. Это значение представляет собой количество выборок, захваченных в секунду для представления формы волны. Более высокие частоты дискретизации позволяют представлять более высокие звуковые частоты. При условии, что частота дискретизации более чем в два раза превышает самую высокую имеющуюся звуковую частоту, форма волны может быть точно восстановлена из цифровых выборок. Частоты, которые составляют более половины частоты дискретизации, не могут быть правильно представлены в цифровых образцах, и, если они присутствуют в исходном звуке, должны быть удалены перед преобразованием в цифровой формат. Таким образом, «половина частоты дискретизации» представляет собой верхний предел, называемый частотой Найквиста, и аналоговый сигнал должен быть полностью ниже этого предела, чтобы его можно было правильно представить в цифровом виде. Аналоговые частоты на этом пределе или выше не могут быть правильно представлены цифровыми образцами и могут вызвать своего рода искажение, называемое алиасингом.

Человеческое ухо чувствительно к звуковым паттернам с частотами примерно от 20 Гц до 20 000 Гц. Звуки за пределами этого диапазона не слышны. Поэтому частота дискретизации 40 000 Гц является абсолютным минимумом, необходимым для воспроизведения всего диапазона слышимых звуков. Обычно используются более высокие скорости (называемые передискретизацией), чтобы обеспечить адекватную фильтрацию и избежать артефактов наложения псевдонимов в районе частоты Найквиста.

Частота дискретизации, используемая аудио компакт-дисками, составляет 44 100 Гц. Человеческая речь понятна, даже если исключить частоты выше 4000 Гц; на самом деле телефоны передают только частоты от 200 Гц до 4000 Гц. Поэтому обычная частота дискретизации для аудиозаписей составляет 8000 Гц, что иногда называют качеством речи. Обратите внимание, что на частоте Найквиста требуется очень крутая фильтрация (называемая сглаживающим фильтром), чтобы предотвратить сворачивание сигнала выше этой точки отсечки обратно в слышимый диапазон цифровым преобразователем и создание искажающие артефакты наложения шума.

Самые распространенные частоты дискретизации в Гц: 8000, 16 000, 22 050, 44 100, 48 000, 96 000 и 192 000. Частота дискретизации также может быть указана в кГц или в единицах 1000 Гц. Таким образом, в единицах кГц наиболее распространенные частоты выражаются как 8 кГц, 16 кГц, 22,05 кГц, 44,1 кГц, 48 кГц, 96 кГц и 192 кГц.

Audacity поддерживает любую из этих частот дискретизации, однако большинство звуковых карт компьютеров ограничены частотой не более 48 000 Гц, 96 000 Гц или иногда 192 000 Гц. Опять же, наиболее распространенная частота дискретизации на сегодняшний день составляет 44 100 Гц, поэтому многие карты по умолчанию используют эту частоту, какие бы другие частоты они ни поддерживали.

На изображении ниже левая половина имеет низкую частоту дискретизации, а правая половина — высокую частоту дискретизации (то есть высокое разрешение):

Примеры форматов

Другой мерой качества звука является формат сэмпла (или разрядность), который обычно измеряется числом компьютерных бит, используемых для представления каждого семпла. Чем больше битов используется, тем точнее представление каждой выборки.Увеличение числа битов также увеличивает максимальный динамический диапазон аудиозаписи, другими словами, разницу в громкости между самым громким и самым тихим звуком, который может быть воспроизведен.

Динамический диапазон измеряется в децибелах (дБ). Человеческое ухо может воспринимать звуки с динамическим диапазоном не менее 90 дБ. Однако, когда это возможно, рекомендуется записывать цифровой звук с динамическим диапазоном намного больше 90 дБ, отчасти для того, чтобы слишком тихие звуки можно было усилить для максимальной точности. Обратите внимание, что хотя сигналы, записанные обычно с низким уровнем, можно повысить (то есть нормализовать), чтобы воспользоваться преимуществами доступного динамического диапазона, при записи сигналов низкого уровня не будет использоваться вся доступная битовая глубина. Эту потерю разрешения невозможно восстановить, просто нормализовав общий уровень цифрового сигнала.

Распространенные образцы форматов и соответствующие им динамические диапазоны включают:

Обратите внимание, что существуют практические ограничения динамического диапазона из-за возможностей аппаратного обеспечения и входных и выходных преобразователей. Из-за этого практический предел больше похож на 90 дБ для 16 бит.

Другие форматы образцов, такие как ADPCM, приблизительно соответствуют 16-битному звуку со сжатыми 4-битными образцами. Audacity может импортировать многие из этих форматов, но они редко используются из-за гораздо лучших новых методов сжатия.

Аудио компакт-диски и большинство форматов компьютерных аудиофайлов используют 16-битные целые числа. Audacity использует 32-битные сэмплы с плавающей запятой внутри и, при необходимости, преобразует разрядность сэмпла при экспорте окончательного микса. Формат образца Audacity по умолчанию во время записи можно настроить в настройках качества или установить отдельно для каждой дорожки в раскрывающемся меню «Аудиодорожка». Во время воспроизведения аудио в любых дорожках, которые имеют формат сэмпла, отличный от проекта, будет пересэмплироваться на лету с использованием настроек преобразования в реальном времени в настройках качества. Настройки высококачественного преобразования используются при обработке, микшировании или экспорте.

На изображении ниже левая половина имеет образец формата с несколькими битами, а правая половина имеет образец формата с большим количеством битов. Если вы думаете о частоте дискретизации как о расстоянии между вертикальными линиями сетки, формат выборки — это расстояние между горизонтальными линиями сетки.

Размер аудиофайлов

Аудиофайлы очень большие, вероятно, намного больше, чем большинство файлов, с которыми вы работаете (если только вы не работаете с видеофайлами). Чтобы определить размер несжатого аудиофайла, умножьте частоту дискретизации (например, 44 100 Гц) на скорость передачи битов формата выборки (например, 16 бит) на количество каналов (2 для стерео) по количеству секунд. Полностью полный 74-минутный аудио CD со стереозвуком занимает более 6 миллиардов битов. Разделите это на 8, чтобы получить количество байтов; аудио компакт-диск весит чуть меньше 800 мегабайт (МБ). См. сжатый звук ниже.

Отсечение

Одним из ограничений цифрового звука является то, что в большинстве случаев он не может работать с волнами звукового давления, которые превышают максимальные уровни, для которых он предназначен. Когда регистрируется сигнал, превышающий максимальный уровень +/-1,0 линейный или 0 дБ, сэмплы за пределами диапазона обрезаются до максимального значения, например:

Звук, записанный с отсечением, будет звучать искаженно и резко. Хотя есть некоторые методы, которые могут устранить небольшое количество шума из-за клиппирования, всегда предпочтительнее избегать клиппинга во время записи. Измените громкость источника входного сигнала (микрофон, кассетный проигрыватель, проигрыватель грампластинок) и установите регулятор громкости входного сигнала Audacity (на панели инструментов микшера) таким образом, чтобы форма сигнала была максимально возможной (для максимальной точности) без обрезки.

Обратите внимание, что в стандартном 32-битном формате выборки Audacity с плавающей запятой законно захваченные значения выборки, превышающие максимальное значение, могут быть сохранены, но даже если они сохранены в экспортированном 32-битном файле с плавающей запятой, они, вероятно, все равно будут сохранены. искажения на любом обычном воспроизводящем оборудовании. Если Audacity обнаружит законные сэмплы выше предела, эффект Amplify покажет отрицательное значение по умолчанию «Усиление (дБ)», и вы можете нажать OK в этой настройке, чтобы уменьшить пиковое усиление до максимального 0 дБ без потери исходных пиков. форма волны.

Сжатое аудио

Поскольку цифровые аудиофайлы очень велики, по возможности обычно использовалась пониженная частота дискретизации. В 1991 году стандарт MP3 (MPEG I, слой 3) изменил все. MP3 – это метод сжатия с потерями, который позволяет значительно уменьшить размер цифрового аудиофайла, практически не влияя на качество.Одна секунда звука CD-качества занимает 1,4 мегабита, в то время как обычная скорость передачи данных для файлов MP3 составляет 128 кбит/с, что является коэффициентом сжатия более чем в 10 раз! Работа MP3 основана на психоакустической модели того, как наши уши и мозг обрабатывают звуки. Все файлы MP3 создаются по-разному; разные психоакустические модели приведут к разным искажениям в аудиофайле.

При поставке Audacity может импортировать и экспортировать файлы MP3.

С хорошими динамиками большинство людей могут услышать разницу между MP3 со скоростью 128 кбит/с и несжатым аудиофайлом с компакт-диска. Файлы MP3 со скоростью 256 кбит/с и 320 кбит/с более популярны среди аудиофилов, предпочитающих более высокое качество.

Существует много других форматов аудиофайлов со сжатием с потерями. Audacity полностью поддерживает формат Ogg Vorbis, который похож на MP3, но является полностью открытым стандартом без патентов. Со временем качество файлов Ogg Vorbis стало превосходить качество MP3, а его формат стал более расширяемым, поэтому возможны дополнительные улучшения. Ogg Vorbis — отличный выбор для вашего собственного аудио, однако реальность такова, что гораздо больше устройств, таких как iPod и другие портативные аудиоплееры, поддерживают MP3, но пока не поддерживают Ogg Vorbis.

К другим известным методам сжатия относятся ATRAC, используемый записывающими устройствами Sony MiniDisc, Windows Media Audio (WMA) и AAC. Audacity поддерживает больше форматов за счет добавления дополнительной библиотеки FFmpeg.

Сжатие без потерь

Сжатие без потерь уменьшает размер файла без потери качества. Этот, казалось бы, волшебный метод уменьшения размеров файлов можно применить и к аудиофайлам. В то время как в MP3 используется сжатие с потерями, для создания сжатых аудиофайлов без потерь можно использовать более новые алгоритмы сжатия, такие как FLAC и Apple Lossless.

Такое сжатие фактически перезаписывает данные исходного файла более эффективным способом. Однако, поскольку качество не теряется, результирующие файлы обычно намного больше, чем файлы изображений и аудио, сжатые с помощью сжатия с потерями. Например, файл, сжатый с использованием сжатия с потерями, может иметь размер в одну десятую от исходного, а сжатие без потерь вряд ли приведет к созданию файла меньше половины исходного размера.

Аудиоформаты без потерь чаще всего используются для архивирования или производства, в то время как меньшие аудиофайлы с потерями обычно используются на портативных проигрывателях и в других случаях, когда пространство для хранения ограничено или точное воспроизведение звука не требуется.

Когда вы пытаетесь сэмплировать звук из аналогового источника, вычисления выполняются внутри компьютера. Расчет преобразует аналоговые звуки гитары, клавишных или другого инструмента в цифровые данные. Частота дискретизации является ключом к качеству этого преобразования.

В этой статье мы рассмотрим, как частота дискретизации влияет на качество цифрового звука, и рассмотрим роль разрядности. Мы также покажем вам, как преобразовать и сжать конечный продукт, чтобы его можно было легко манипулировать и перемещать.

Что вы узнаете:

Что такое частота дискретизации?

Аудиосэмплирование — это процесс преобразования музыкального источника в цифровой файл. Цифровая аудиозапись делает это, беря образцы источника звука вдоль звуковых волн через равные промежутки времени. Чем больше сэмплов вы берете (известное как «частота дискретизации»), тем больше конечный цифровой файл будет похож на оригинал. Чем выше частота дискретизации, тем лучше качество воспроизведения звука.

Частота дискретизации обычно измеряется в секунду с использованием килогерц (кГц) или циклов в секунду. Компакт-диски обычно записываются с частотой 44,1 кГц, а это значит, что каждую секунду делается 44 100 сэмплов.

Если вы справитесь с частотой дискретизации, вы сможете создавать более точные записи. Имея эту цифровую копию, вы можете манипулировать ею, микшировать и редактировать без потери качества звука.

Окончательное качество звука вашей записи зависит не только от частоты дискретизации — свою роль играет и глубина цвета.

Что такое битовая глубина/скорость?

Каждый образец, который вы берете при создании аудиозаписи, должен храниться в «битах» вашего компьютера. Чем больше битов вы используете для записи каждого семпла, тем лучше воспроизведение звука.

Другими словами, высокая частота дискретизации в сочетании с высокой битовой глубиной ("скорость передачи" или "формат выборки") обеспечит наилучшее качество звука в вашей записи. Чем выше разрядность, тем выше динамический диапазон.

Динамический диапазон – это разница между низким и высоким уровнем громкости вашей записи. Измеряется в децибелах или дБ. Человеческое ухо может слышать звуки до 90 дБ, но запись на этом уровне позволяет усилить более тихие звуки для получения высококачественного звука.

Это воспроизведение довольно низкого качества, воспроизводящее звук на уровне 46 дБ, что составляет примерно половину максимального уровня человеческого слуха.

16-битный звук.

Здесь обычно слышится человеческое ухо на уровне 96 дБ.

24-битный звук.

Хотя уровень 145 дБ значительно превышает диапазон человеческого слуха, работать на этом уровне может быть полезно, чтобы уменьшить "минимальный уровень шума" — по сути, цифровой белый шум.

32-битный звук с плавающей точкой.

Это может обеспечить почти бесконечные уровни децибел и на самом деле используется только для сверхвысокого качества звука, например, внезапных громких шумов, которые необходимо улавливать без использования ограничителей.

Почему стандартная частота дискретизации звука составляет 44,1 кГц?

Многие современные записи используют частоту дискретизации 44,1 кГц, и это стандартная частота для компакт-дисков. Отчасти это связано с тем, как работает частота дискретизации и как мы слышим, как люди.

О частоте дискретизации впервые заговорили в 1940 году в рамках теоремы Найквиста–Шеннона. Это означает, что любая частота дискретизации должна в два раза превышать частоту исходной записи, иначе звук не будет воспроизводиться достоверно.

Человеческое ухо может слышать в диапазоне частот от 20 герц (20 Гц) до 20 килогерц (20 кГц). 44,1 кГц более чем в два раза превышает верхний диапазон человеческого слуха, поэтому, согласно теории, обеспечивает очень точное воспроизведение.

Некоторые люди по-прежнему записывают с более высокой частотой дискретизации, чтобы захватить все звуки. Хотя мы не слышим их в оригинальных записях, если аудиосэмпл, записанный на частоте 192 кГц, будет понижен, некоторые ранее неслышимые частоты станут слышимыми. Если бы он был записан с более низкой частотой дискретизации, а затем понижен, некоторые высокие частоты в этом звуке были бы потеряны.

Однако, даже если вы записываете с более высокой частотой, она, скорее всего, будет преобразована обратно в частоту 44,1 кГц — частоту, на которую настроены многие современные аудиосистемы.

Какие еще частоты дискретизации используются и для чего?

Поскольку 44,1 кГц является стандартом для аудио компакт-дисков, вы можете задаться вопросом, почему существуют другие частоты дискретизации. Как мы уже упоминали, более высокие частоты дискретизации могут обеспечить более чистый звук без белого шума. Они также могут быть полезны для мастеринга и микширования аудио. Даже если мы не слышим некоторые звуки, они существуют в записи с более высокой частотой дискретизации, и поэтому ими можно манипулировать.

48 кГц.

Эта частота дискретизации также используется в качестве стандартной частоты наряду с частотой 44,1 кГц. Тем не менее проверьте, так как звук, записанный с одной скоростью и воспроизводимый с другой, будет либо ускорен, либо замедлен.

88,2 кГц.

Теперь это золотой стандарт для записи в высоком разрешении. Использование этой частоты дискретизации приводит к меньшим искажениям (называемым «алиасингом») при преобразовании аналогового сигнала в цифровой и обеспечивает большую свободу при микшировании и мастеринге.

96 кГц.

Похожая на 88,2 кГц, эта частота дискретизации предоставляет больше возможностей при микшировании и мастеринге звука. Но работа с более высокими скоростями может стать проблемой, если ваш компьютер не может обрабатывать дополнительную информацию и необходимое хранилище.

192 кГц.

В некоторых отчетах предполагается, что запись с такой высокой частотой дискретизации может вызвать проблемы со звуком, например дрожание. Также трудно найти компьютеры, которые могут с этим справиться. На самом деле, это полезно только для замедления высокочастотного звука.

Можно ли сжать аудиофайл без потери качества?

При работе с высокой частотой дискретизации вы получите большие файлы. Чтобы получить приблизительное представление о том, насколько большим будет файл, вы можете использовать следующие расчеты:

Например:

44 100 Гц x 16 бит x 2 канала для стереозаписи x 4 400 секунд (74-минутная запись компакт-диска) = 6 209 280 000 бит, или около 6,2 млрд бит

6 209 280 000 бит/8 = 776 160 000 байт или 776 миллионов байт

776 160 000 байт/1 000 000 = 776,16 МБ

Сжатие размера файла.

Передача файлов такого размера и работа с ними могут быть затруднены. Один из вариантов — уменьшить размер файла.

Сжатие аудио стало обычной практикой с момента запуска файлов MP3. Такие файлы позволяли сжимать звук, практически не влияя на его качество. Преобразование аудио в MP3, которое можно выполнить на многих компьютерах и на некоторых веб-сайтах, в некоторых случаях может уменьшить размер файла в 10 раз. Это достигается за счет удаления любого записанного звука, который не может уловить человеческое ухо.

Чтобы сжать аудиофайл с помощью Adobe Audition, просто выберите формат файла MP3 при сохранении. Важно, чтобы вы сжимали в MP3 только один раз, иначе файл может быть повторно сжат. Это может сделать любые артефакты или звуковые ошибки более заметными.

Файлы MP3 сжимаются либо до 128 кбит/с, либо, что в последнее время более распространено, до 256 кбит/с и 320 кбит/с. Это относится к сжатию с потерями, при котором происходит некоторая реальная потеря качества звука, даже если большинство людей этого не слышит.

Сжатие без потерь.

В качестве альтернативы существует сжатие без потерь. Это уменьшает размер файла без потери качества звука. Вместо удаления звука он более эффективно перезаписывает данные в файле. Эти файлы больше, чем файлы MP3. Обычно размер файла сокращается вдвое, а не до одной десятой от исходного.

Эти типы файлов обычно используются не для повседневного использования, а скорее для хранения аудио. Основные типы: FLAC, WavPack, Monkey’s Audio и ALAC (Apple Lossless).

Как преобразовать аудиофайл в другую частоту дискретизации в Adobe Audition.

Вы можете легко преобразовать аудиофайл в другую частоту дискретизации с помощью Adobe Audition.

Сначала проверьте, какую частоту дискретизации поддерживает звуковая карта на вашем компьютере, так как она может быть ограничена. Затем выполните следующие действия:

Откройте для себя весь спектр функций аудиосемплирования, микширования и мастеринга, доступных в Adobe Audition.

Читайте также: