Объяснение технологий

Смерть MP3: краткая история любимого аудиоформата в мире

Смерть MP3: краткая история любимого аудиоформата в мире

Немецкий фонд, которому принадлежит патент на почтенный «старый» музыкальный формат MP3, недавно объявил о том, что его патент истечет. MP3 взорвал обмен аудиофайлами, широко открытый в 1990-х и начале 2000-х годов. Сочетание сжатия данных, размера файла и сохраненного качества звука гарантировало популярность аудиоформатов по обе стороны от аргумента пиратства.

Заголовки гласят «MP3 Is Dead», но любой настоящий аудиофил знает, что настоящая смерть маловероятна. Тем не менее, пришло время взглянуть на историю всемирно известного аудиоформата и на то, что может произойти в ближайшем будущем.

Как именно работает MP3?

В зависимости от возраста и состояния вашего уха, ваш слуховой диапазон частот находится в диапазоне от 20 до 20000 Гц. Кроме того, наши уши наиболее чувствительны к звуковым частотам от 2 кГц до 5 кГц. Наш слух также ограничен нашей способностью фильтровать и обрабатывать аудиосигналы по мере их поступления.

mp3 логотип большой
Изображение предоставлено: flatvector via Shutterstock

Маскировка частоты — ключ к сжатию MP3 — основана на неспособности мозга различать определенные сигналы.

Представьте, что у нас есть два звука. У них очень похожие частоты (например, 200 Гц и 210 Гц), но они воспроизводятся с разной громкостью. Более слабый звук слышен сам по себе, но более сильный различим, только если они воспроизводятся одновременно. Процесс покрытия одной частоты другой близкой частотой называется «маскированием». Маскирование частоты эффективно работает в верхней и нижней частях звукового спектра.

Копирование CD

Давайте предположим, что мы копируем компакт-диск на ваш компьютер. Образцы музыки на компакт-диске сэмплированы 44,100 раз в секунду (44,1 кГц). Сэмплы имеют длину 2 байта (1 байт — 16 бит). MP3 поддерживает несколько скоростей, но обычно использует стандарт CD 44,1 кГц.

Отдельный MP3-файл состоит из MP3-фреймов с заголовком и блоком данных. Каждый кадр содержит 1152 образца. Технически это две «гранулы» из 576 образцов. Сэмплы проходят через фильтр, который дополнительно разделяет звук на определенный набор из 32 частотных диапазонов. Затем алгоритм MP3 дополнительно делит эти 32 полосы частот в 18 раз, создавая 576 полос еще меньшего размера. Каждая полоса содержит 1/576 частотного диапазона исходного сэмпла (когда мы начали копировать компакт-диск на ваш компьютер).

формат файла mp3
Изображение предоставлено: Ким Мейрик через Викимедиа

На этом этапе работают два сложных математических алгоритма: модифицированное дискретное косинусное преобразование (MDCT) и быстрое преобразование Фурье (FFT). Каждый из них выполняет свой процесс с разбитым исходным материалом.

БПФ анализируют каждую полосу частот на наличие звуков, которые можно легко замаскировать, следя за тем, чтобы маскирование частоты сохраняло жизненно важные звуки в дорожке.

Затем образцы сортируются и передаются в MDCT. MDCT превращает каждую полосу в набор спектральных значений. Спектральные значения более точно отражают то, как наш слух интерпретирует звук. Поэтому многие сжатые аудиокодеры используют спектральные значения для удаления аудиоданных. Как только спектральная информация и анализ гранулы завершены, начинается фактический процесс сжатия.

Краткая история MP3

Вы помните свой первый MP3-плеер? Мне повезло иметь оригинальный iPod — пока человек с ножом не освободил его из моего владения. Во всяком случае, мини-диски были намного круче.

Несмотря на это, к тому времени, когда оригинальный iPod быстро обострил стремление к MP3 (в 2001 году), формату уже исполнилось восемь лет. Кроме того, MP3 уже волновал Интернет и другие портативные цифровые музыкальные устройства.

Откуда появился MP3?

MP3 представлял собой передвижную группу изображений (MPEG), являющуюся частью оригинального стандарта сжатия аудио и видео MPEG-1. MP3 — это аббревиатура MPEG-1 Audio Layer III, одобренная для использования в 1991 году и окончательно опубликованная в 1993 году.

Идея MP3 довольно крутая.

Алгоритм MP3 использует преимущества восприятия человеческого слуха, называемого слуховой маскировкой. Слуховое маскирование происходит, когда на восприятие одного звука влияет присутствие другого. Кроме того, каждая песня содержит аудио элементы, незаметные для общего прослушивания. Манфред Р. Шредер впервые предложил кодек для психоакустической маскировки в 1979 году. Однако только после образования MPEG (в качестве подкомитета ISO / IEC) в 1988 году началась согласованная инициатива по разработке глобального стандарта.

В истории MP3 есть еще одно важное имя: Карлхайнц Бранденбург. Бранденбург начал работать над сжатием цифровой музыки в 1980-х годах, защитив докторскую диссертацию в 1989 году. Различные способы сжатия, над которыми он работал, нашел ограничения в обеих доступных технологиях в то время, а также в дизайне ранних процессов кодирования. Он, наряду с другими членами-основателями MPEG, понял, что будет достаточно только новой системы.

Институт Фраунгофера

В 1990 году Бранденбург стал доцентом в университете Эрланген-Нюрнберг. Он продолжил свою работу по сжатию в Обществе Фраунгофера (в конце концов он присоединился к Фраунгоферу в 1993 году).

«У нас была звуковая подгруппа в группе кинофильмов [MPEG], — пояснил Бранденбург в интервью NPR . «В итоге мы все вместе выработали компромисс, в котором были разные режимы, так называемый уровень I, уровень II, уровень III. , , И большинство наших идей заключалось в режимах сжатия звука MPEG. , , который был самым сложным и дает лучшее качество при низких битрейтах — это называлось Layer III ».

Бранденбург использовал песню «Tom’s Diner» Сюзанны Веги, чтобы усовершенствовать алгоритм сжатия, слушая его снова и снова, чтобы убедиться, что его игра не пагубно влияет на запись голоса Веги.

MP3 взрывается

MP3 несколько лет после официального выпуска, кодек считался «слишком сложным» для широкого использования.

Однако в 1997 году все изменилось — быстро.

Сначала «австралийский студент» приобрел профессиональное программное обеспечение для кодирования l3enc у немецкой компании. Он отменил проектирование программного обеспечения, перекомпилировал его и загрузил на FTP-файл американского университета с файлом README, в котором говорилось: «Это бесплатно благодаря Fraunhofer». Этот небольшой акт мгновенно изменил доступ к кодированию и декодированию MP3. Внезапно, вставив компакт-диск в компьютер, вы получите высококачественный звук в файлах небольшого размера.

Во-вторых, Nullsoft выпустила почтенный аудиоплеер Winamp. MP3-файлы, скопированные с компакт-диска, можно легко воспроизвести на компьютере.

В то же время Интернет распространился на миллионы домов по всему миру. Миллионы жестких дисков были заполнены MP3-файлами , и этот формат стал предпочтительным форматом обмена аудиофайлами для ранних одноранговых сервисов обмена файлами, таких как Napster, Gnutella и eDonkey (Gnutella был другим Проект Nullsoft). Музыкальное пиратство было живым и безудержным и в немалой степени способствовало появлению MP3.

Mp3-плееры

Еще одним благом для устоявшейся аудиоиндустрии стали портативные MP3-плееры. В начале 90-х годов Институт Фраунгофера пытался и не смог создать рыночный MP3-плеер. Это было просто слишком рано для широкого распространения. Требовалось вышеупомянутое сочетание обмена файлами, распространения в Интернете и программного обеспечения для копирования, чтобы придать импульс портативным MP3-плеерам.

Южнокорейская компания Elger Labs представила MPMAN F10 стоимостью 250 долларов США с 32-мегабайтной памятью. Это не было ошеломляющей искрой для индустрии, какой мы ее знаем. Эта награда лежит на Diamond Rio PMP300, также с 32 МБ.

Mpman F10 mp3-плеер

Успех Diamond Rio привлек нежелательное внимание. Американская ассоциация звукозаписывающих компаний (RIAA) подала в суд на Diamond Multimedia Systems (производитель) — и проиграла. Тем не менее, RIAA правильно предположил, что это было началом эндемичного музыкального пиратства, которое продолжается и по сей день.

Что случилось дальше, спросите вы?

Что ж, малоизвестное устройство под названием iPod появилось на рынках, полностью объявив MP3 де-факто аудиоформатом того времени, и RIAA начала (продолжающийся) крестовый поход против пиратов по всему миру.

Остальное, как мы говорим, история.

Почему MP3 умирает тогда?

Институт Фраунгофера владел патентом MP3. 23 апреля 2017 года срок действия их оставшихся патентов истек. Поэтому Fraunhofer больше не может выдавать новые лицензии MP3. Мы точно объяснили, что происходит. с этими «апокалиптическими» заголовками, а также о том, как это повлияет на вас.

Хотите TL; DR? MP3 не умер и никуда не денется.

Одна из основных причин, по которым Фраунгофер отказался от MP3, — это возраст. Он больше не может конкурировать со своими новыми и блестящими кузенами-кодеками. Их предложение? Вместо этого используйте Advanced Audio Coding (AAC). По совпадению, Fraunhofer также имеет (текущий) патент на AAC, поэтому у нас есть несколько вариантов MP3, из которых вы можете выбрать ниже.

Альтернативы MP3

Ваша коллекция MP3 не будет внезапно сгореть, так же, как существующие кодеры и декодеры будут продолжать производить файлы MP3. Тем не менее, MP3 немного устарела сейчас. Существует несколько бесплатных альтернативных аудиоформатов аудиоформатов вы можете использовать для хранения вашей цифровой музыки сейчас.

  • AAC — Advanced Audio Coding, как упоминалось выше, является преемником MP3. Единственная проблема заключается в том, что формат сам по себе выглядит немного устаревшим. Тем не менее, AAC, как правило, обеспечивает более высокое качество звука, чем MP3, с аналогичными битрейтами и размерами файлов. AAC также формат с потерями.
  • Ogg Vorbis — формат Vorbis, обычно используемый в сочетании с форматом контейнера Ogg. Это лучший, немного моложе, кузен с открытым исходным кодом для MP3. Несмотря на то, что Ogg обеспечивает лучшее сжатие, более высокую скорость передачи данных и, как правило, лучшее качество звука, Ogg никогда не работал так же, как MP3, из-за отсутствия поддерживаемых устройств. Ogg также формат с потерями.
  • FLAC — Бесплатный аудио кодек без потерь — самый популярный формат аудио кодеков без потерь. Зачем? FLAC предлагает точную аудиокопию исходного материала в два раза меньше традиционного CD. Звуки, наиболее подверженные влиянию MP3 (например, гитары, тарелки, реверберация и т. Д.), Остаются четкими, несмотря на значительное сжатие. FLAC — это формат без потерь.

MP3 не умер

Вам не о чем беспокоиться. Вы можете продолжить копирование в MP3, и ваши устройства продолжат воспроизводить вашу музыку. В долгосрочной перспективе, по крайней мере, стоит изучить новый аудиоформат для вашей коллекции. Методы сжатия будут развиваться и размер файлов точных копий уменьшится.

Кроме того, стоит учитывать емкость хранилища. Когда появились первые портативные MP3-плееры с хранилищем объемом 32 МБ. , это было круто , но явно недостаточно. Самое большое хранилище для iPod Classic составило 160 ГБ. Это может быть связано с обновлением пользовательского хранилища. на огромных 240 ГБ — более 1000000 отдельных MP3-треков. Дело в том, что с увеличением размера хранилища и уменьшением физического размера мы можем делать больше с меньшими затратами.

Наконец, интернет продолжает менять то, как мы слушаем музыку. Раньше я занимался пиратской музыкой, потому что не мог позволить себе платить по 12–20 долларов за каждый выходящий новый альбом. Теперь у меня есть учетная запись семейного плана Spotify. учетными записями. учетными записями. с доступом к миллионам треков и учетной записи Amazon Prime с еще миллионами. Единственное, что меня ограничивает, — это мое интернет-соединение, и даже тогда у них обоих есть возможность автономной загрузки в высококачественных форматах.

Это не так важно, как раньше, но MP3 не умер.

Какой формат аудио вы предпочитаете? Вам нужна свежая реальность без потерь? Или экстремальное сжатие формата с потерями? Изменилось ли использование вашей музыки с тех пор, как потоковые сервисы стали широко распространенными? Оставьте мне строку в комментариях, и я вернусь к вам.

Кредит Фотографии: Ти Санти через Shutterstock.com

Похожие посты
Объяснение технологий

Как работает жесткий диск? [Технология объяснила]

Объяснение технологий

Что такое программное обеспечение с открытым исходным кодом? [MakeUseOf Объясняет]

Объяснение технологий

Разрешения графического дисплея - что означают цифры? [MakeUseOf Объясняет]

Объяснение технологий

Как переформатировать внешний жесткий диск, не теряя на нем все