От чего зависит размер звукового файла

Обновлено: 04.07.2024

Узнайте, как звук становится цифровым, и узнайте, что обеспечивает высокое качество звука. Узнайте, как этот аспект цифровой музыки и аудиофайлов влияет на качество прослушивания.

Преобразование музыки, речи и звука в аудиоданные.

Цифровой звук — это цифровая информация. Эта информация может быть плотной или разреженной, качественной или низкокачественной. Битрейт — это термин, используемый для описания объема данных, передаваемых в аудио. Более высокий битрейт обычно означает лучшее качество звука. «Битрейт будет определять качество звука», — говорит продюсер и инженер Гас Берри. «У вас может быть запись с самым лучшим звучанием всех времен, но если вы воспроизведете ее с низким битрейтом, на другом конце она будет звучать хуже».

Понимание битрейта необходимо для записи, производства и распространения аудио. Чтобы по-настоящему понять битрейт, вам также необходимо узнать, из чего состоит аудиофайл и какие существуют различные типы аудиофайлов.

Несжатые, без потерь и сжатые аудиофайлы.

"Звук состоит из волн, а звуковые файлы представляют собой эти волны", – говорит продюсер Питер Родокер. «То, как эти волны кодируются в аудиофайлах с помощью отдельных сэмплов, включает в себя форму волны в данный момент и то, как далеко она находится от нулевой точки». Эта нулевая точка — тишина, а аудиофайлы измеряют расстояние между звуком и тишиной. «По сути, это снимок звуковых волн», — говорит Родокер.

Эти снимки могут быть самыми разными. Точно так же, как изображения различаются по качеству и четкости, типы аудиофайлов различаются по размеру, объему содержащейся информации и выполняемой роли. Хотя есть некоторые исключения, несжатые файлы будут содержать больше всего информации и, следовательно, будут иметь самый высокий битрейт. Сжатые файлы с потерями обычно содержат наименьшее количество информации и, следовательно, более низкую скорость передачи данных.

Каркас изображения, показывающий распределение битрейта

Изображение Джонатана Петерсена

  • Несжатые файлы. Эти аудиофайлы очень большие и содержат всю возможную информацию, которую может обнаружить звуковое оборудование. Несжатые форматы файлов включают WAV, AIFF и PCM.

Частота дискретизации и разрядность.

Частота дискретизации — это количество раз в секунду, когда берется аудиосэмпл: количество раз в секунду, когда записывающее оборудование преобразует звук в данные. Большая часть цифрового аудио имеет частоту дискретизации 44,1 кГц, что также является частотой дискретизации для аудио компакт-дисков. Это означает, что во время записи звук сэмплируется 44 100 раз в секунду. При воспроизведении аудио аппаратное обеспечение реконструирует звук 44 100 раз в секунду.

Эти отдельные образцы различаются по объему содержащейся в них информации. Битовая глубина – это количество битов в каждом семпле, или насколько информативным является каждый из этих 44 100 фрагментов аудио.

Высокая частота дискретизации и более высокая разрядность увеличивают объем информации в аудиофайле, а также увеличивают размер файла. Точно так же, как некоторые фотографии имеют высокое разрешение, аудиофайлы с высокой частотой дискретизации и битовой глубиной содержат больше деталей. Для большей детализации обычно требуется более высокий битрейт.

Звуковые волны, представленные световыми эффектами.

Нет лучшего битрейта, есть только правильный битрейт.

Правильный битрейт для файла зависит от того, для чего вы хотите использовать этот файл, и от способа доставки звука. Как правило, высокий битрейт означает высококачественный звук при условии, что частота дискретизации и битовая глубина также высоки. Больше информации в самом общем смысле означает лучшее качество звука.

Скорость передачи аудио CD всегда составляет 1411 кбит/с. Формат MP3 может иметь скорость от 96 до 320 Кбит/с, а потоковые сервисы, такие как Spotify, — от 96 до 160 Кбит/с.

Высокий битрейт нравится меломанам, но не всегда лучше. Имейте в виду, как вашему цифровому звуку придется бороться с узкими местами. Если слушатели будут загружать его или слушать в физических аудиоформатах, вы можете позволить себе высокий битрейт. Если они транслируют его, вы, вероятно, захотите, чтобы битрейт был немного ниже, чтобы его можно было эффективно транслировать. Однако при скорости ниже 90 Кбит/с человеческое ухо заметит значительное ухудшение качества даже без специальной подготовки.

Кроме того, файл с высоким битрейтом и высокой точностью воспроизведения не имеет значения, если он не воспроизводится на качественном оборудовании.Если пользователи слушают ваш звук в наушниках или наушниках массового рынка, они все равно не смогут получить все, что предлагает высококачественный звук. Битрейт CD-качества, который является высоким, лучше всего звучит на профессиональной стереосистеме, способной адекватно выражать очень высокие и очень низкие частоты, которые может вместить 1411 Кбит/с. Большинство наушников и многие настольные колонки не воспроизводят эти частоты.

Как найти правильный битрейт.

Когда вы начинаете новый аудиопроект, рекомендуется записывать максимально возможное качество с высокой частотой дискретизации и битовой глубиной. При создании аудио вы должны помнить, как ваш слушатель будет взаимодействовать с вашим аудио. Переменный битрейт может оказаться полезным при просмотре количества необходимых деталей, поскольку он постоянно меняет битрейт во время воспроизведения.

Независимо от того, если вы создаете аудио любого рода, вы всегда должны хранить файлы самого высокого качества, чтобы защитить их от новых технологий в будущем. Для будущих аудиоформатов может потребоваться более высокая скорость передачи данных, а будущие соединения или аппаратное обеспечение потенциально могут обеспечивать высококачественный звук. Вполне возможно, что коммерческое звуковое оборудование в следующем десятилетии или около того сможет передавать битрейт выше 160 Кбит/с, так что сохраняйте свои старые несжатые файлы. Всегда можно преобразовать несжатые файлы в новый формат.

Знать, какой тип файлов использовать, — это только одна часть процесса создания аудио. Изучение работы с графическим эквалайзером и понимание того, как микшировать музыку, значительно улучшит звук, который вы производите, независимо от битрейта.

Варианты: моно (один канал) или стерео (два канала, правый/левый): чередование находится в одном файле; или сплит-стерео находится в двух отдельных файлах.

Частота дискретизации указана в герцах (Гц) или "циклах в секунду":
Используйте 44 100 Гц (44,1 кГц) = частота дискретизации CD-качества для профессионального аудио. Каждый семпл содержит 16 бит информации.

Размеры файлов
Это огромный объем информации: 2 дорожки * 44 100 сэмплов в секунду * 16 бит/сэмпл = 1 411 200 бит/с.
Стереозвук CD-качества, 16 бит, 44,1 кГц = 176 кбайт/сек слишком высок для CD-ROM (2x привод ~ 200 кбайт/сек устойчиво) или модемов (28,8
модем ~2,88 кбайт/сек). сек). См. Сжатие ниже.

Хорошее эмпирическое правило: каждая минута 16-битного стереозвука с частотой 44,1 кГц требует около 10 МБ дискового пространства.
Таким образом, на пустой 200-мегабайтный жесткий диск можно записать чуть менее 20 минут стереозвука CD-качества (точно 19 минут 20 секунд).

Качество звука CD (стерео, 16 бит, 44,1 кГц = 176 кбайт/сек) слишком высокое для CD-ROM (2x привод ~ 200 кбайт/сек устойчиво) или модемов (модем 28,8
~ 2,88 кбайт /сек).
Аудиофайлы, сжатые в другие форматы, такие как rm или MP3, могут быть меньше, занимать меньше места на диске и передаваться быстрее.

../../index.html sonic1ac.wav 155 КБ
13 сек

sonic.rm (то же, что и выше)
65 КБ
13 секунд
большая разрядность
sonic1ac.mp3 (то же, что и выше)
225 КБ
13 секунд
../audio/heartsounds.html 00b10001.wav 62 КБ 3 сек

Возможные компромиссы между качеством звука и размером файла:
В зависимости от вашего предполагаемого использования звука вы можете пожертвовать некоторым качеством, чтобы уменьшить объем информации, необходимой для оцифрованного звука. Вот некоторые вещи, которые следует учитывать:

Стерео часто можно свернуть в монофонический (однодорожечный) аудиофайл. Если две дорожки суммируются, вся звуковая информация будет сохранена, но информация о направлении будет потеряна. Поскольку компьютерные динамики часто не разнесены на подходящее расстояние, даже стереосигналы скомпрометированы. Переход в моно уменьшит размер файла вдвое.
Частота дискретизации: компьютеры часто предлагают частоты дискретизации 44K, 22K, 11K и 6K (или числа, очень близкие к этим). Частота дискретизации является важным фактором качества звука цифрового файла. Для полнодиапазонных звуков необходимы скорости 22K или 44K, в то время как речь часто приемлема при 11K.Когда вы снижаете частоту дискретизации, звук теряет свои высокие частоты, поэтому для воспроизведения криков певчих птиц вам может понадобиться 44K, но для озвучивания вполне подойдет 11K. Чтобы быть точным, частота дискретизации должна быть в два раза выше самой высокой частоты, которая должна быть оцифрована.

Для преобразования файла можно использовать кодировщик MP3. Но его битовая глубина составляет 128, поэтому размер файла может увеличиться.

Расчет требований к свободному пространству на жестком диске:
Для работы с компьютерным цифровым звуком требуется большое количество места на жестком диске. Если вы планируете создавать новые аудиофайлы на диске, вам потребуется достаточно места на жестком диске для их хранения.

Пример: я записал 13 секунд звука в коридоре ITC, 16-битное стерео, 44 100 Гц. Это файл размером 2,5 М, и его определенно нужно сжать.

Требования к аудиофайлам в байтах в секунду:

Хорошее эмпирическое правило: каждая минута 16-битного стереозвука с частотой 44,1 кГц требует около 10 МБ дискового пространства.
Таким образом, на пустой 200-мегабайтный жесткий диск можно записать чуть менее 20 минут стереозвука CD-качества (точно 19 минут 20 секунд).

Качество звука CD (стерео, 16 бит, 44,1 кГц = 176 кбайт/сек) слишком высокое для CD-ROM (2x привод ~ 200 кбайт/сек устойчиво) или модемов (модем 28,8
~ 2,88 кбайт /сек).


Сжатие кодеком (компрессор/декомпрессор), возможно, для уменьшения размера файла:
Сжатие IMA работает достаточно хорошо для компакт-дисков, но является кросс-платформенным только с QuickTime.
MPEG 1 -- качество компакт-диска
MPEG 3 = MP3 и RealAudio являются наиболее популярными из многочисленных решений для веб-аудио.
Для музыки MIDI является лучшим решением как для компакт-дисков, так и для доставки через Интернет.
Кредиты для вышеуказанного материала:

Если вы когда-нибудь хотели уменьшить размер аудиофайла, но не знали, как это сделать без ущерба для качества записи, вот все, что вам нужно знать.

В тот или иной момент каждый должен узнать, как работают аудиофайлы. Эти знания могут показаться тривиальными или неважными, но они могут пригодиться при записи музыки, создании подкаста или оптимизации фонотеки.

В этом посте будут рассмотрены различные факторы, влияющие на качество звука и размер аудиофайла. Добиться идеального баланса между ними непросто, но вы должны знать достаточно, чтобы к концу чувствовать себя комфортно и экспериментировать самостоятельно.

Примечание. Чтобы применить эти знания на практике, вам понадобится бесплатный аудиоредактор, такой как Audacity или любой другой. Изучение этих инструментов выходит за рамки этой статьи.

1. Частота дискретизации

В реальной жизни звук — это волна. Когда кто-то говорит или хлопает в ладоши, вы на самом деле слышите изменение давления, которое распространяется по воздуху и в конечном итоге ударяет по барабанным перепонкам.

Но как записать этот звук и преобразовать его в цифровые данные? Мы не можем просто записать полную звуковую волну как есть; вместо этого мы должны делать периодические «моментальные снимки» звука с течением времени. Когда вы воспроизводите все это последовательно, вы получаете приблизительное воссоздание исходного звука.

Изображение предоставлено: Pluke/Wikimedia

Каждый снимок называется выборкой, а интервал, используемый между каждым снимком, называется частотой выборки. Чтобы определить их, это количество цифровых снимков, сделанных в секунду в аудиофайле аналого-цифровым преобразователем. Частота дискретизации измеряется в герцах, поэтому ее можно выразить как частоту.

Чем короче интервал, тем выше частота. Более высокие частоты обеспечивают более точную запись, но также требуют больше данных для хранения каждой секунды записанного звука.

Например, для аудио качества CD используется частота дискретизации 44,1 кГц (или 44 100 выборок в секунду), тогда как для аудио качества ТВ и DVD используется частота дискретизации 48 кГц. Учитывая 10-минутную несжатую монофоническую аудиозапись, размер первого может составлять 51,7 МБ, а второго — 56,3 МБ.

Вы можете понизить частоту до 32 кГц для записи только речи и не столкнуться с большой потерей качества, но придерживайтесь 44,1 кГц, если задействована музыка или если вам нужно максимальное качество. При снижении до 22,05 кГц звучание будет ближе к AM-радио.

2. Битрейт

Битрейт — это не то же самое, что частота дискретизации. Многие люди склонны смешивать эти два понятия, но важно, чтобы вы этого не делали. Во-первых, если частота дискретизации – это частота создания моментальных снимков звука, то битовая глубина – это количество данных, записываемых во время каждого моментального снимка.

Для иллюстрации представьте звуковую волну в виде потока воды, и вы пытаетесь поймать (то есть записать) эту воду с помощью ведра. Частота дискретизации — это то, как часто вы опускаете ведро в поток, а битовая глубина — это размер вашего ведра. Измерение битовой глубины — это биты. С каждым увеличением на один бит точность записи удваивается.

Изображение предоставлено Aquegg/Wikimedia

Чем выше разрядность, тем больше данных захватывается в выборке. Это приводит к более точной записи за счет большего пространства, необходимого для хранения этих данных.

Но если вы слишком сильно уменьшите разрядность, звуковые данные будут потеряны. Аудио компакт-диски используют 16 бит на семпл, а диски DVD и Blu-ray – 24 бита на каждый семпл.

Битрейт — это объем обрабатываемых звуковых данных (выражается в килобитах в секунду). Чтобы получить битрейт, вы умножаете частоту дискретизации на битовую глубину. Аудиофайл компакт-диска с частотой дискретизации 44,1 кГц и глубиной 16 бит будет иметь несжатый битрейт 44 100*16, т. е. 705,6 кбит/с.

Чтобы дать вам представление о разнице в размере файла, давайте рассмотрим пятиминутную несжатую песню, записанную в двухканальном стереозвуке.

  1. 44,1 кГц/16 бит: 44 100 * 16 * 2 = 1 411 200 бит в секунду (1,4 Мбит/с)
  2. 192 кГц/24 бит: 192 000 * 24 * 2 = 9 216 000 бит в секунду (9,2 Мбит/с)

Используя рассчитанный битрейт, умножьте его на длину записи

  1. 1,4*300 = 420 МБ или 52,5 МБ
  2. 9,2*300 = 2760 МБ или 345 МБ

Таким образом, звук, записанный в формате 192 кГц/24 бит, займет в шесть раз больше места, но все сводится к тому, что вы хотите делать с аудиозаписью. Иногда для данного снимка не требуется полный битрейт, например, когда есть тишина.

В этом случае вы можете использовать переменный битрейт (VBR), поддерживаемый форматами MP3, OGG, AAC и WMA. В прошлом VBR не поддерживался широко, но в настоящее время это не является большой проблемой.

3. Стерео против моно

Этот момент довольно прост, поэтому я буду краток. Моно означает один канал, а стерео означает два канала. Два канала в стереофоническом аудиофайле можно назвать «левым» и «правым» каналами.

В наушниках вы сможете слышать один из стереоканалов одним ухом, а другой — другим ухом. При прослушивании монофонического аудиофайла вы будете слышать один и тот же канал в обоих ушах.

В некотором смысле стереофонические аудиофайлы представляют собой два монофонических аудиофайла в одном. Это означает, что стереофонический аудиофайл всегда в два раза больше монофонического аудиофайла с учетом частоты дискретизации, разрядности, исходного звука и т. д. одинаковы между ними. Таким образом, самый простой способ мгновенно уменьшить размер аудиофайла вдвое — преобразовать его из стерео в моно.

Для записей только с голосом почти всегда предпочтительнее использовать моно, поскольку оно делает звук мощным, чистым и четким. Но если вы хотите записать двух или более вокалистов в помещении с уникальной акустикой, вокал должен быть стереофоническим.

Аналогичным образом запись подкаста также может быть монофонической. Однако в музыкальных записях именно благодаря стереофоническому звучанию большая часть музыки звучит более трехмерно, как будто музыка играет вокруг вас, а не на вас (т. е. моно звучит более плоско).

4. Сжатие

Если вы работаете с файлами WAV, единственный способ уменьшить размер файла – изменить один из указанных выше параметров (частота дискретизации, битовая глубина или количество каналов). Во всем остальном сжатие является самым большим фактором в размере аудиофайла. Существует два вида сжатия:

  • Сжатие с потерями удаляет из аудио «ненужные» данные, например звуки, которые не слышны большинству людей. После сжатия эти удаленные данные невозможно восстановить.
  • При сжатии без потерь аудиофайл максимально уплотняется с помощью математических алгоритмов. Однако его необходимо распаковывать во время воспроизведения, что требует большей вычислительной мощности. Фактические данные не теряются.

Режим сжатия, который вы хотите использовать, зависит от предполагаемого использования аудиофайла. Как правило, вам следует использовать сжатие без потерь, если вы хотите сохранить почти точную копию исходного материала, и сжатие с потерями, когда несовершенная копия достаточно хороша для повседневного использования.

Например, вы можете сохранить свою коллекцию скопированных компакт-дисков в формате FLAC (если у вас нет места для хранения) и использовать MP3 для их хранения на телефоне. Если вы мало что знаете о сжатии, вот наше полное руководство о том, как работает сжатие файлов, и список инструментов для эффективного сжатия больших аудиофайлов.

5. Формат файла

После того, как вы решили использовать сжатие с потерями, вам нужно решить, какой формат файла вам больше подходит. На момент написания этой статьи тремя наиболее популярными вариантами являются MP3, OGG и AAC. Чтобы узнать больше, прочтите наше руководство по сравнению различных форматов аудиофайлов.

MP3 на сегодняшний день является самым популярным, главным образом потому, что он был первым из трех, появившихся на сцене. AAC технически лучше, чем MP3, но не имеет такой же скорости использования. OGG тоже хорош, но не многие устройства его поддерживают, так что придерживайтесь MP3 или AAC.

Независимо от того, какой из них вы используете, вы в конечном итоге сожмете до целевого битрейта. Если предположить, что вы собираетесь использовать формат MP3, то в настоящее время используются пять наиболее распространенных битрейтов:

  • 64 кбит/с соответствует качеству AM-радио. Идеально подходит для разговорных подкастов, поскольку голоса не так сложны, как музыка.
  • 96 кбит/с соответствует качеству FM-радио.Музыка будет звучать хорошо, но вы сможете сказать, что она не полнотелая, в основном потому, что некоторые слышимые частоты были удалены.
  • 128 кбит/с — это качество звука компакт-диска. Это настолько стандартно, насколько это возможно. Музыка звучит "достаточно хорошо" для большинства людей с таким битрейтом.
  • 256 кбит/с — это высокое качество звука. Вы можете заметить некоторые звуки и инструменты, которые не различимы при более низком битрейте.
  • 320 кбит/с — наилучшее качество звука. Вы можете подняться выше, но вряд ли заметите разницу, даже если считаете себя меломаном.

Что касается уменьшения размера файла, MP3, сжатый до 128 кбит/с, теряет примерно 90 % исходных звуковых данных, тогда как MP3, сжатый до 320 кбит/с, теряет только около 60 %.

Кроме того, если у вас есть MP3 и AAC, сжатые до одинакового битрейта, AAC часто будет звучать лучше, поскольку в нем используется более совершенный алгоритм сжатия. Это означает, что вы можете получить большее "качество на мегабайт" с AAC, чем с MP3.

Оптимизируйте размеры аудиофайлов

Понимание этих пяти факторов поможет вам решить, как лучше всего записывать и сжимать музыку и/или созданные вами подкасты, а также решать, какие музыкальные форматы приобретать или какие потоковые сервисы использовать.

Как вы узнали ранее в этом курсе, размер файлов важен; как правило, мы хотим, чтобы медиафайлы были как можно меньше, сохраняя при этом достаточное качество. Размер файла изображений зависит от их разрешения и разрядности. На этом этапе мы рассмотрим, что влияет на размер звуковых файлов.

Продолжительность записи

Очевидно, что более длинная запись представлена ​​большим количеством двоичных чисел, чем более короткая. Для записи всего концерта требуется больше места для хранения, чем для звукового файла короткого сигнала, который воспроизводится на вашем телефоне, чтобы вы знали, что получили текстовое сообщение.

Хотите продолжать
учиться?

Представление данных в вычислениях: оживление данных

Частота выборки

Сэмплирование звука также влияет на размер аудиофайла. Частота дискретизации — частота дискретизации аналогового сигнала в секунду — — это один из факторов.

Более высокая частота дискретизации приводит к увеличению размера файла, но если частота дискретизации слишком низкая, запись не будет содержать достаточного количества сэмплов для захвата всех деталей звука.

Например, телефонные разговоры часто оцифровываются с частотой 8 кГц, что намного ниже, чем стандарт CD – 44,1 кГц. Это означает, что некоторые детали голоса людей теряются в телефонных разговорах, что влияет на звуки «с» и «ф» и придает говорящему «телефонный голос». Эта частота дискретизации упрощает передачу нескольких телефонных сигналов по одному и тому же соединению, при этом предоставляя достаточно данных, чтобы человек, который слушает, мог понять, что говорит говорящий.

Пример разрешения

На размер аудиофайла также влияет разрешение выборки записи (или разрядность звука), то есть количество битов, используемых для представления каждой выборки.

Как для файлов изображений, так и для аудиофайлов компьютер должен определить, сколько различных «уровней» доступно для представления одной точки. Для изображений RGB это определяет, сколько различных уровней красного, зеленого и синего может иметь один пиксель; для аудиофайлов это определяет количество различных частот, которые может иметь образец звука, взятый в определенный момент времени.

Большая битовая глубина звука приводит к увеличению размера аудиофайла, но также позволяет записывать без искажений звуки с более широким диапазоном частот.

Классический концерт с шумами, варьирующимися от треугольника и высоких звуков скрипки до звуков тубы или тяжелой перкуссии, должен быть записан с более высоким разрешением выборки, чем электронная музыка с меньшим разрешением. диапазон частот.

Моно против стерео

Есть еще один фактор, влияющий на размер аудиофайла: является ли звук монофоническим или стереофоническим, также называемым монофоническим и стереофоническим. Монозвук — это всего лишь одна звуковая дорожка, тогда как стереофонический звук содержит две разные дорожки, чтобы добавить в запись впечатление позиционирования и направления. Как и следовало ожидать, наличие двух дорожек удваивает требуемый объем памяти.

Стереозапись той же длины, частоты дискретизации и разрешения имеет вдвое больший размер файла, чем монофоническая запись.

Битрейт

Частота дискретизации и битовая глубина аудиофайла часто объединяются в одну меру, известную как битрейт, которая представляет собой количество битов в секунду, используемых для хранения звукозаписи:

Расчет размеров аудиофайлов

Для монофайла умножение скорости передачи данных на длину звука в секундах дает общий размер файла в битах:

Для стереофайла единственным отличием уравнения является еще один коэффициент 2, учитывающий использование двух дорожек:

Введение
На размер звукового файла и качество его воспроизведения может влиять ряд факторов. К ним относятся частота дискретизации, разрешение сэмпла и способ сжатия файла.

Цифровая запись звука и его воспроизведение
Когда вы говорите или воспроизводите музыку в микрофон, микрофон улавливает звуковые волны и преобразует их в напряжение. Поскольку звуковые волны меняются, напряжение меняется. Микрофон подключен к звуковой карте компьютера. Эта карта измеряет напряжение микрофона через определенные промежутки времени. Мы можем показать образец некоторого звука на графике. Звук, который мы передаем на микрофон, постоянно меняется, поэтому он известен как «аналоговый сигнал».

graph2

Давайте сделаем то, что делает звуковая карта, и замерим напряжение. Мы начнем с того, что будем делать это с интервалом в 1 секунду, начиная с 0 секунд. Когда образец будет взят, мы преобразуем показания в «двоичный сигнал».

data1

Теперь мы взяли звук и оцифровали его. Наш файл выглядит так: 0000 1000 0101 1011 1100 0101 1010 1000 1000 1001 0010

Теперь мы можем сохранить наш цифровой файл и воспроизвести его, когда захотим. Мы делаем это, беря каждый образец данных и выводя его через нашу звуковую карту на динамики. Звуковая карта принимает цифровой сигнал и выполняет необходимое преобразование, чтобы динамики могли воспроизводить звук. Мы можем «услышать», как это может звучать, отобразив наши двоичные данные обратно на графике. Мы нанесем наши данные поверх исходного звукового файла, чтобы мы могли их сравнить.

graph3

Красная линия обозначает цифровой файл. В идеальном мире красная линия должна располагаться прямо над синей линией, которая представляет исходный записанный нами звук. Если бы красная линия находилась на синей линии, то воспроизводимый звук был бы таким же, как и записанный. Однако это не так, поэтому звук не будет точно таким же, как оригинал. Причина этого связана с нашим «интервалом выборки». Измерение каждую секунду дало нам небольшой файл, но качество было плохим. Если мы вдвое сократим интервал между чтениями, мы удвоим размер файла, но, надеюсь, улучшим качество воспроизведения. Давайте считывать каждые полсекунды, а не каждую секунду. Вот данные:

data3

А вот данные поверх оригинального звукового файла:

graph4

Это большое улучшение по сравнению с тем, что было раньше, хотя размер файла теперь удвоился. Мы могли бы снова уменьшить интервал между выборками, возможно, считывая показания каждые 0,25 с, и это, без сомнения, еще больше улучшит запись, сделав ее еще ближе к оригиналу. Цена, конечно, будет еще больший размер файла. Вы можете увидеть в любом программном обеспечении для записи фразу «частота дискретизации». Это просто то, сколько раз мы считываем показания в секунду. Это просто другой взгляд на интервал выборки.

В следующий раз, когда вы «скопируете» музыкальный компакт-диск, чтобы превратить его в набор записей MP3, и вам нужно будет выбрать качество звука, вы поймете, что происходит. Вы просто выбираете частоту дискретизации. Вы будете знать, что можете получить действительно хорошие, точные записи оригинальных песен, но размеры файлов будут увеличиваться по мере улучшения качества. Это важно, потому что MP3-плеер или ваш телефон будут иметь фиксированный объем памяти, и вы не хотите, чтобы все это было занято тремя песнями! Хитрость заключается в том, чтобы найти баланс между качеством воспроизведения и размером файла.

Сжатие звука и кодеки
Для хранения звукового файла требуется много данных. Сами звуковые файлы могут быть очень большими. Это может быть проблемой, если у вас ограниченное пространство для хранения на устройстве хранения или вы хотите слушать песни через Интернет, слушая «потоковую» музыку. Потоковая музыка — это когда вы слушаете музыку в том виде, в каком она загружается из Интернета, а не сначала загружаете и сохраняете всю песню, а затем воспроизводите ее. По мере загрузки первых нескольких секунд потоковой песни она помещается в специальную область хранения, называемую «буфером», после чего начинается воспроизведение. Пока эта часть песни воспроизводится, другая часть песни загружается и буферизуется. Однако, если файлы слишком велики, вы не сможете загрузить их достаточно быстро, чтобы их можно было буферизовать и воспроизвести. Песня ненадолго останавливается, чтобы дать вашему компьютеру время загрузить больше песни, прежде чем можно будет возобновить воспроизведение.

Чтобы обойти эту проблему, они обычно "сжимаются".Это означает, что к необработанному звуковому файлу применяется математическая формула (называемая кодеком или кодером/декодером), так что необработанный файл сжимается. Файл становится намного меньше по размеру, поэтому его можно быстрее загрузить и воспроизвести.

Сжатие с потерями и без потерь
Файлы можно сжимать с использованием различных типов кодеков. Один тип кодека называется «сжатие с потерями». Математическая формула для них направлена ​​​​на удаление частей звукового файла, которые считаются относительно неважными, например звуковые образцы, которые находятся за пределами диапазона человеческого уха. Некоторые популярные кодеки с потерями включают MP3 и OGG (Ogg Vorbis). Другой тип кодека называется «сжатие без потерь». Эти кодеки хранят всю информацию о звуковом файле. Формат файла WAV является примером кодека без потерь. Кодеки без потерь дают вам файл меньшего размера, чем необработанный звуковой файл, но обеспечивают очень высокое качество звука. Кодеки с потерями, с другой стороны, дают вам гораздо меньший звуковой файл, но с некоторой потерей качества (хотя большинству людей трудно заметить разницу).

Читайте также: