MP3
MP3 | |
---|---|
Расширение |
.mp3 [1] |
MIME-тип | audio/mpeg[2][3] |
Разработчик | Общество Фраунгофера, Карлхайнц Брэнденбург, Heinz Gerhäuser[d], Bernhard Grill[d] и Harald Popp[d] |
Опубликован |
1993 |
Тип формата |
аудиоформат |
Медиафайлы на Викискладе |
MP3, mp3 (сокр.от MPEG-1 Audio Layer III или MPEG-2 Audio Layer III) —
MP3 является одним из самых распространённых и популярных
В формате MP3 используется алгоритм
История
MP3 разработан рабочей группой Института Фраунгофера (нем. Fraunhofer-Institut für Integrierte Schaltungen) под руководством Карлхайнца Бранденбурга и университета Эрланген-Нюрнберг в сотрудничестве с AT&T Bell Labs и Thomson (Джонсон, Штолл, Деери и др.).
Основой разработки MP3 послужил экспериментальный кодек ASPEC (Adaptive Spectral Perceptual Entropy Coding). Почти полный стандарт появился в открытом доступе 6 декабря 1991 года. При разработке алгоритма тесты проводились на вполне конкретных популярных композициях. Основной стала песня Сюзанны Веги «Tom’s Diner». Отсюда возникла шутка, что «MP3 был создан исключительно ради комфортного прослушивания любимой песни Бранденбурга», а Вегу стали называть «мамой MP3».
Первым кодировщиком в формат MP3 стала программа L3Enc, выпущенная летом 1994 года, а в сентябре 1995 года Институт Фраунгофера выпустил первый программный MP3-плеер — Winplay3. С 1996 года началось нелегальное распространение музыкальных MP3 файлов в интернете. Первой композицией загруженной в сеть 10 августа 1996 года риппером под ником NetFrack, стала песня «Until it Sleeps» с альбома «Load» группы Metallica[6][7].
23 апреля 2017 года истекли последние патенты на формат и были прекращены сборы лицензионных отчислений с производителей программного обеспечения и встраиваемых решений[8][9]. О прекращении лицензирования формата сообщил Институт Фраунгофера на своём официальном сайте[10]. И, хотя формат mp3 всё ещё весьма популярен среди пользователей, большинство радиостанций и телеканалов перешли на использование современных кодеков, обеспечивающих лучшее сжатие и меньшую потерю качества звука.
Описание формата
Как и формат
MP3 и «качество Audio-CD»
В прошлом было распространено мнение, что запись с битрейтом 128
На 2008 год наиболее часто встречаются MP3-файлы с битрейтом 192 кбит/c, что может косвенно говорить о том, что большинство считает этот битрейт достаточным. Реально воспринимаемое «качество» зависит от исходного аудиофайла, слушателя и его аудиосистемы. Некоторые меломаны предпочитают сжимать музыку с «максимальным качеством» — 320 кбит/c, либо даже переходить на кодеки без потерь, например, FLAC. Также среди меломанов/аудиофилов бытует мнение, что некоторые семплы (фрагменты аудиозаписи) не поддаются качественному сжатию с потерями: на всех возможных битрейтах не составляет особого труда отличить сжатое аудио от оригинала. Однако есть и серьёзные возражения[11]:
Совершенно очевидно, что (возьмём с запасом) битрейта 256 kbps в подавляющем большинстве случаев должно быть более чем достаточно для комфортного восприятия музыки с CDA-источника (44 kHz/16 bit/stereo). Это очевидно не только из моего доморощенного теста, но и по анализу профессиональных слепых тестов (например, германского издания «c’t», июнь 2000 г.): даже в них экспертам не всегда удаётся «угадать» сжатый до 256 kbps звук, причём тестирование проходит в специально подготовленных помещениях и на дорогом оборудовании, а эксперт знает, что надо «слушать», чтобы почувствовать сжатие.
Режимы кодирования и опции
Существует три версии MP3 формата для различных нужд: MPEG-1, MPEG-2 и MPEG-2.5. Отличаются они возможными диапазонами битрейта и частоты дискретизации:
- 32—320 кбит/c при частотах дискретизации 32000 Гц, 44100 Гц и 48000 Гц для MPEG-1Layer 3;
- 16—160 кбит/c при частотах дискретизации 16000 Гц, 22050 Гц и 24000 Гц для MPEG-2 Layer 3;
- 8—160 кбит/c при частотах дискретизации 8000 Гц и 11025 Гц для MPEG-2.5 Layer 3.
Режимы управления кодированием звуковых каналов
Так как формат MP3 поддерживает двухканальное кодирование (стерео), существует 4 режима:
- Стерео — двухканальное кодирование, при котором каналы исходного стереосигнала кодируются независимо друг от друга, но распределение бит между каналами в общем битрейте может варьироваться в зависимости от сложности сигнала в каждом канале.
- Моно— одноканальное кодирование. Если закодировать двухканальный материал этим способом, различия между каналами будут полностью стёрты, так как два канала смешиваются в один, он кодируется и он же воспроизводится в обоих каналах стереосистемы. Единственным плюсом данного режима может являться только выходное качество по сравнению с режимом Стерео при одинаковом битрейте, так как на один канал приходится вдвое большее количество бит, чем в режиме Стерео.
- Двухканальное стерео (кбит/c, то для каждого канала он будет равен только 96 кбит/c.
- Объединённое стерео (англ. Joint Stereo) — способы двухканального кодирования, позволяющие увеличить коэффициент сжатия файла. Первый способ Mid / Side Stereo, когда левый и правый каналы преобразуются в их сумму (L+R) и разность (L−R). Для большинства звуковых файлов насыщенность канала с разностью (L−R) получается намного меньше канала с суммой (L+R). Поэтому объединённое стерео позволяет либо сэкономить на битрейте канала разности (L−R), либо улучшить качество на том же битрейте, поскольку на канал суммы (L+R) отводится бо́льшая часть битрейта. Бытует мнение, что данный режим не подходит для звукового стереоматериала, в котором в двух каналах воспроизводится субъективно абсолютно различный материал, так как он стирает различия между каналами. Но современные кодеки используют различные режимы в разных фреймах (включая чистое стерео) в зависимости от исходного сигнала. Второй способ Intensity Stereo опирается на свойство человеческого слуха различать положение звуков в пространстве не во всём спектре частот, игнорируя положение очень низких и очень высоких. Таким образом, кодирование звуков сверхнизкой и сверхвысокой частоты в режиме моно повышает эффективность сжатия данных[12].
CBR
CBR расшифровывается как Constant Bit Rate, то есть постоянный битрейт, который задаётся пользователем и не изменяется при кодировании произведения. Таким образом, каждой секунде произведения соответствует одинаковое количество закодированных бит данных (даже при кодировании тишины). CBR может быть полезен для потоков мультимедиа-данных по ограниченному каналу; в таком случае кодирование использует все возможности канала данных. Для хранения данный режим кодирования не является оптимальным, так как он не может выделить достаточно места для сложных отрезков исходного произведения, при этом бесполезно тратя место на простых отрезках. Повышенные битрейты (выше 256
VBR
VBR расшифровывается как Variable Bit Rate, то есть изменяющийся битрейт или переменный битрейт, который динамически изменяется программой-кодером при кодировании в зависимости от насыщенности кодируемого аудиоматериала и установленного пользователем качества кодирования (например, тишина закодируется с минимальным битрейтом). Этот метод MP3-кодирования является самым прогрессивным и до сих пор развивается и улучшается, так как аудиоматериал разной насыщенности может быть закодирован с определённым качеством, которое обычно выше, чем при установке среднего значения в методе CBR. Плюс к тому, размер файла уменьшается за счёт фрагментов, не требующих высокого битрейта. Минусом данного метода кодирования является сложность предсказания размера выходного файла. Но этот недостаток VBR-кодирования незначителен в сравнении с его достоинствами. Также минусом является то, что VBR считает «незначительной» звуковой информацией более тихие фрагменты, таким образом получается, что если слушать очень громко, то эти фрагменты будут некачественными, в то время как CBR делает с одинаковым битрейтом и тихие, и громкие фрагменты.
Формат VBR постоянно улучшается, благодаря постоянному совершенствованию математической модели кодеков, в частности, после выхода обновлённой версии свободного MP3-кодека LAME (версия 3.99.3), кодирование с переменным битрейтом, по заявлению разработчиков, качественно лучше CBR и тем более ABR. Однако формат CBR 320 кбит/c всё ещё позиционируется как гарантирующий максимальное качество (например он используется в пресете «--preset insane»).
ABR
ABR расшифровывается как Average Bit Rate, то есть усреднённый битрейт, который является гибридом VBR и CBR: битрейт в
Кодеки
Типы программ, необходимые для преобразования форматов файлов. Наиболее распространённые кодеки MP3.
- mp3PRO-codec (использует частотное преобразование SBR).
- LAME-codec.
- Fraunhofer-codec.
Структура файла
MP3-файл состоит из нескольких фрагментов (фреймов) MP3, которые, в свою очередь, состоят из заголовка и блока данных. Такая последовательность фрагментов называется
Теги
Теги (от англ. tag — ярлык, метка, бирка) — метки в границах MP3-файла (в начале и/или в конце). В них может быть записана информация об авторстве, альбоме, годе выпуска, обложка альбома и текст песни и прочая информация о треке. В более поздних версиях тегов возможно хранение прочих данных о звуковой записи. Существуют различные версии тегов (см.: ID3).
Недостатки
Технические недостатки. Количество каналов звука ограничено двумя, в отличие от
Юридические ограничения. Патентом на MP3 владеет компания Alcatel-Lucent, которая требовала лицензирования некоторых способов использования формата (срок действия связанных с MP3 патентов истёк 23 апреля 2017).
В США изобретения, публично раскрытые более года[когда?], не могут быть запатентованы; однако для патентов, оформленных до 8 июня 1995 года (почти полный стандарт появился в открытом доступе 6 декабря 1991), существовала возможность увеличить их сроки действия.
Известные патенты, касающиеся расшифровки MP3, прекратили действие в США к декабрю 2012; по другим данным, если учитывать только патенты, заявка на которые была подана до декабря 1992 года, этого не произошло в сентябре 2015 года[13][14].
В 2017 году все патенты, касающиеся данного формата, окончили действие, так как не были продлены правообладателями[4].
См. также
- LAME
- AAC
- Vorbis
- Opus
- Сжатие аудиоданных
- Цифровые звуковые форматы
- Список аудиоформатов файлов
- Как музыка стала свободной
Примечания
- ↑ https://www.file-extension.info/format/mp3
- ↑ Nilsson M. The audio/mpeg Media Type (англ.) — IETF, 2000. — 5 p. — doi:10.17487/RFC3003
- ↑ https://www.iana.org/assignments/media-types/audio/mpeg
- ↑ 1 2 Orlowski, Andrew. MP3 'died' and nobody noticed: Key patents expire on golden oldie tech (англ.). The Register (16 мая 2017). Дата обращения: 26 марта 2020. Архивировано 26 марта 2020 года.
- doi:10.1109/5.241504.
- ↑ 20 лет назад в интернет выложили первый пиратский MP3-файл. | Студия ВВЦ . alltodigital.ru. Дата обращения: 30 марта 2023. Архивировано 30 марта 2023 года.
- ↑ 20 лет назад в интернет выложили первый пиратский MP3-файл . Хабр. Дата обращения: 30 марта 2023. Архивировано 30 марта 2023 года.
- Газета.Ru, 15.05.2017
- Хабрахабр, 3 мая 2017
- ↑ mp3 (англ.). Fraunhofer Institute for Integrated Circuits IIS. Дата обращения: 15 мая 2017. Архивировано 22 марта 2018 года.
- ↑ Фобомания Архивная копия от 19 июля 2014 на Wayback Machine Журнал «Компьютерра», 14 декабря 2008
- ↑ Joint Stereo . Audio Coding (28 января 2015). Дата обращения: 11 июля 2018. Архивировано 11 июля 2018 года.
- ↑ Cogliati, Josh Patent Status of MPEG-1, H.261 and MPEG-2 . Kuro5hin (20 июля 2008). Архивировано 25 февраля 2013 года. This work failed to consider patent divisions and continuations.
- ↑ US Patent Expiration for MP3, MPEG-2, H.264 . Дата обращения: 15 февраля 2013. Архивировано 2 апреля 2013 года.
Ссылки
- Статья о заголовке фрейма MPEG
- Developement and Implementation of an MPEG1 Layer III Decoder on x86 and TMS320C6711 platforms — Презентация Power Point с описанием структуры файла
- Developement and Implementation of an MPEG1 Layer III Decoder on x86 and TMS320C6711 platforms — Презентация Power Point с описанием процесса декодирования
- Audio Coding (TU Ilmenau) — учебный курс профессоров Карлхайнца Бранденбурга и Геральда Шуллера.