Объяснение технологий

5 советов по оптимизации размеров аудиофайлов

5 советов по оптимизации размеров аудиофайлов

Каждый должен в тот или иной момент узнать, как работают аудиофайлы. Это знание может показаться тривиальным или неважным, но оно действительно может пригодиться — например, при записи музыки создании подкаста или оптимизация вашей музыкальной библиотеки .

В этой статье мы рассмотрим различные факторы, которые влияют на качество звука и размер аудиофайла. Конечно, достичь идеального баланса между ними непросто, но к концу вы должны знать достаточно, чтобы чувствовать себя комфортно и экспериментировать для себя.

Примечание. Чтобы применить эти знания на практике, вам понадобится бесплатный аудиоредактор, такой как Audacity или одна из множества альтернатив Audacity. . Изучение этих инструментов выходит за рамки этой части.

1. Частота дискретизации

В реальной жизни звук — это волна. Когда кто-то говорит или хлопает в ладоши, то, что вы на самом деле слышите, — это изменение давления, которое распространяется по воздуху и в конечном итоге попадает в ваши барабанные перепонки.

Но как нам захватить этот звук и преобразовать его в цифровые данные? Мы не можем просто записать полную звуковую волну, как она есть; вместо этого мы должны делать периодические «снимки» звука с течением времени. Когда вы воспроизводите все это последовательно, вы получаете приблизительное воссоздание оригинального звука.

аудио-файл размером выборки скорости

Каждый снимок называется выборкой, а интервал, используемый между каждым снимком, называется частотой выборки . Чем короче интервал, тем выше частота. Более быстрые частоты дают более точные записи, но также требуют больше данных для хранения каждой секунды записанного звука.

Например, для аудио с качеством CD используется частота дискретизации 44,1 кГц (или 44 100 сэмплов в секунду), тогда как для звука с качеством телевизора и DVD используется частота дискретизации 48 кГц. Учитывая 10-минутную несжатую монофоническую аудиозапись, первая может быть 51,7 МБ, а вторая — 56,3 МБ.

Вы можете снизить частоту до 32 кГц для записи только речи и не испытывать значительных потерь в качестве, но придерживайтесь 44,1 кГц, если речь идет о музыке или если вам нужно максимальное качество. Падение до 22,05 кГц будет звучать ближе к AM-радио.

2. Битрейт

Битрейт это не то же самое, что частота дискретизации. Многие люди склонны сравнивать два, но важно, чтобы вы этого не делали. Прежде всего, если частота дискретизации — это то, как часто делаются снимки звука, то битовая глубина — это количество данных, записываемых во время каждого снимка.

Для иллюстрации представьте звуковую волну в виде потока воды, и вы пытаетесь захватить (т.е. записать) эту воду с помощью ведра. Частота дискретизации будет зависеть от того, как часто вы погружаете свое ведро в поток, в то время как битовая глубина равна размеру вашего ведра.

аудио-файлов, размер битовой глубины

Чем выше битовая глубина, тем больше данных захватывается на выборку. Это приводит к более точной записи за счет большего пространства, необходимого для хранения этих данных. Но если вы слишком сильно уменьшите битовую глубину, звуковые данные будут потеряны.

Битрейт — это количество фактических звуковых данных, обрабатываемых в секунду; в этом случае вы умножаете частоту дискретизации на битовую глубину. Аудиофайл CD с частотой дискретизации 44,1 кГц и глубиной 16 бит будет иметь несжатый битрейт 705,6 кбит / с.

Подробнее об оптимальных битрейтах читайте в последнем разделе этой статьи о форматах файлов.

Иногда полный битрейт не требуется в данном снимке, например, когда есть тишина. В этом случае вы можете использовать переменный битрейт (VBR), который поддерживается MP3, OGG, AAC и WMA. В прошлом VBR не получал широкой поддержки, но в настоящее время это не большая проблема.

3. Стерео против Моно

Этот момент довольно прост, поэтому я буду кратким. Моно означает один канал, а стерео означает два канала. Два канала в стереофоническом аудиофайле могут называться «левым» и «правым» каналами.

С помощью наушников вы сможете прослушивать один из стереоканалов в одном ухе, а другой стереоканал — в другом ухе. При прослушивании монофонического аудиофайла вы услышите один и тот же канал в обоих ушах.

аудио-файл размером стерео-против-моно

В некотором смысле стереофонические аудиофайлы, по сути, представляют собой два монофонических аудиофайла в одном — это означает, что стереофонический аудиофайл всегда в два раза больше монофонического аудиофайла, при условии, что частота дискретизации, битовая глубина, исходный звук и т. Д. Одинаковы. между двумя.

Поэтому самый простой способ мгновенно сократить размер аудиофайла вдвое — это преобразовать его из стерео в моно . По этой причине для записи голоса только моно почти всегда предпочтительнее.

Обратите внимание, что стерео — это то, что заставляет большую часть музыки звучать более трехмерно, как будто музыка играет вокруг вас, а не у вас (то есть, моно звуки более плоские). Но многие люди не могут заметить разницу, поэтому вы можете быть в порядке с этим. Только вы можете решить, стоит ли это сокращать.

4. Сжатие

Если вы работаете с файлами WAV, единственный способ уменьшить размер файла — изменить один из указанных выше параметров (частоту дискретизации, битовую глубину или количество каналов). Для всего остального, сжатие является самым большим фактором в размере аудио файла.

Существует два вида сжатия:

  • Сжатие с потерями удаляет «лишние» данные из звука, такие как звуки, которые находятся за пределами слышимости большинства людей. После сжатия эти отброшенные данные не могут быть восстановлены.
  • Сжатие без потерь берет аудиофайл и максимально упаковывает его, используя математические алгоритмы, но они должны быть распакованы во время воспроизведения, что требует большей вычислительной мощности. Фактические данные не теряются.

Сжатие без потерь обеспечивает то же качество, что и несжатый звук, но даже в лучшем случае сжатие без потерь приводит к размерам файлов, которые как минимум вдвое больше, чем сжатие с потерями. Для оптимальных размеров файлов используйте сжатие с потерями.

Если вы никогда ранее не сжимали аудиофайл или ищете хороший инструмент для выполнения работы, подумайте об использовании одного из этих простых и эффективных способов сжатия аудио.

5. Формат файла

Как только вы решили использовать сжатие с потерями, вы должны решить, какой формат файла лучше для вас. На момент написания статьи тремя наиболее популярными вариантами являются MP3 , OGG и AAC .

MP3 является самым популярным на сегодняшний день, главным образом потому, что он был первым из трех, кто появился на сцене. AAC технически лучше, чем MP3, но не имеет такой же степени использования. OGG тоже хорош, но не многие устройства поддерживают его, поэтому придерживайтесь MP3 или AAC.

Независимо от того, какой из них вы используете, вы в конечном итоге сжимаете до целевого битрейта. Если мы предполагаем, что вы собираетесь использовать формат MP3, то это пять наиболее распространенных битрейтов, используемых в настоящее время:

  • 64 кбит / с — это качество AM-радио. Идеально подходит для подкастов только для разговоров, потому что голоса не так сложны, как музыка.
  • 96 кбит / с — это качество FM-радио. Музыка будет звучать хорошо, но вы сможете сказать, что она не насыщенная, в основном потому, что были удалены определенные слышимые частоты.
  • 128 кбит / с — это качество звука CD. Это настолько стандартно, насколько это возможно. Музыка звучит «достаточно хорошо» для большинства людей на этом битрейте.
  • 256 кбит / с — это высокое качество звука. Вы можете заметить определенные звуки и инструменты, которые не были обнаружены на низких битрейтах.
  • 320 кбит / с — лучшее качество звука. Вы можете подняться выше, но вы, вероятно, не сможете заметить разницу — даже если вы считаете себя аудиофилом.

С точки зрения уменьшения размера файла, MP3, сжатый до 128 кбит / с, теряет примерно 90% исходных звуковых данных, тогда как MP3, сжатый до 320 кбит / с, теряет только около 60%.

Кроме того, если у вас есть MP3 и AAC, сжатые с одинаковым битрейтом, AAC часто будет звучать лучше, поскольку использует более продвинутый алгоритм сжатия. Это означает, что с AAC вы можете получить больше «качества на мегабайт», чем MP3.

Понимание этих пяти факторов не только поможет вам выбрать наилучший способ записи и сжатия музыки и / или подкастов. том, что вы создали, но также можете решить, какие музыкальные форматы покупать или какие потоковые сервисы использовать.

Как слушатель, какой формат файла вы предпочитаете и битрейт для музыки? Как создатель, какие настройки вы используете для своей музыки или подкастов? Дайте нам знать с комментарием ниже!

Кредиты изображений: частота дискретизации через Викимедиа , битовая глубина через Викимедиа , стерео трек через Audacity Manual

Похожие посты
Объяснение технологий

Как работает жесткий диск? [Технология объяснила]

Объяснение технологий

Что такое программное обеспечение с открытым исходным кодом? [MakeUseOf Объясняет]

Объяснение технологий

Разрешения графического дисплея - что означают цифры? [MakeUseOf Объясняет]

Объяснение технологий

Как переформатировать внешний жесткий диск, не теряя на нем все