Обробка зображень лабораторна №5 Федорова Анастасія

Матеріал з Вікі ЦДУ
Перейти до: навігація, пошук

Формати звукових файлів

Існує три основні групи аудіофайлів:

  • нестиснені формати — такі як WAV, AIFF, AU або PCM;
  • формати із стисненням без втрат — FLAC, Monkey's Audio (розширення APE), Shorten, Tom's lossless Audio Kompressor (TAK), TTA, ATRAC Advanced Lossless, Apple Lossless, MPEG-4 SLS, MPEG-4 ALS, MPEG-4 DST, Windows Media Audio Lossless (WMA Lossless).
  • формати із стисненням з втратами, як наприклад MP3, Ogg Vorbis, Musepack, AAC, ATRAC чи lossy Windows Media Audio (WMA).

Формати аудіо без стиснення

WAV

WAV (англ. waveform audio format) — формат аудіофайла розроблений компаніями Microsoft та IBM. WAVE базується на форматі RIFF, поширюючи його на інформацію про такі параметри аудіо, як застосований кодек, частота дискретизації та кількість каналів. WAV як і RIFF передбачався для комп'ютерів IBM PC, тому всі змінні записані у форматі little endian. Відповідником WAV для комп'ютерів PowerPC є AIFF. Хоча файли WAVE можуть бути записані за допомогою будь-яких кодеків аудіо, зазвичай використовується нестиснений PCM, який призводить до великих обсягів файлу (близько 172 кБ на секунду для CD-якості). Іншим недоліком файлу є обмеження обсягу до 4 ГБ, через 32-бітну змінну. Формат WAV був частково витіснений стисненими форматами, проте, завдяки своїй простоті, надалі знаходить широке використання в процесі редагування звуку та на переносних аудіопристроях, як програвачі та цифрові диктофони.

AU

Формат файлу Au - простий формат аудіофайлів, уведений Sun Microsystems. Формат був поширений на NeXT системах і на ранніх веб-сторінках. Спочатку це були 8-бітові, кодовані за μ-законом, дані без заголовків, на частоті дискретизації 8000 Гц. Обладнання інших виробників часто використовували частоту дискретизації 8192 Гц, кратну тактовим сигналам відео. Нові файли мають заголовок, що складається з шести непідписаних 32-бітових слів, додаткову інформацію, а потім дані (у великому форматі зворотний порядок байт). Хоча формат тепер підтримує безліч аудіо форматів кодування, він залишається пов'язаним з логарифмічним кодуванням за μ-законом. Це кодування й інтерфейс стали стандартом де-факто для Unix звуку.

PCM

І́мпульсно-ко́дова модуля́ція (ІКМ або PCM — англ. Pulse Code Modulation) - процес перетворення аналогового сигналу у цифровий сигнал, коли через певні інтервали часу беруться відліки аналогового сигналу і незалежно один від одного квантуються і далі кодуються цифрами[1]. ІКМ використовується для оцифровки аналогових сигналів перед їхньою передачею. Практично всі види аналогових даних (відео, голос, музика, дані телеметрії) допускають застосування ІК-модуляції.

Формати аудіо зі стисненням без втрат

WMA (Windows Media Audio)

Ліцензований формат файла, розроблений компанією Microsoft для зберігання і трансляції аудіо-інформації.
Номінально формат WMA характеризується гарною здатністю стискання даних, що дозволяє йому «обходити» формат Mp3 і конкурувати по цих параметрах з форматами Ogg vorbis і AAC.

FLAC (Free Lossless Audio Codec)

FLAC є вільним форматом: його використання не вимагає виплат роялті, специфікації є відкритими та його основна реалізація є вільним програмним забезпеченням.
При розпакуванні звукові дані залишаються повністю ідентичним до початкового файлу перед стисненням.

APE (Monkey's Audio)

Поширюється безкоштовно разом з відкритим вихідним кодом і набором програмного забезпечення для кодування і відтворення, а також плагінами до популярних плеєрів.
Офіційно кодек Monkey's Audio випускається тільки для платформи Windows, хоча існує ряд неофіційних кодеків для GNU/Linux й Mac OS X, які в більшості випадків дозволяють лише стискати файли, перетворюючи їх в інший формат.

Формати аудіо зі стисненням з втратами

MP3

MP3 — формат файлу для зберігання аудіо-інформації. Розроблений наприкінці 1980-тих років Карлгайнцем Бранденбургом, аспірантом Університету Ерлангена—Нюрнберга, Німеччина. Формат був ліцензованим, але 23 квітня 2017 року термін дії всіх патентів сплив і ліцензійні збори скасовано. Широко використовується в файлообмінних мережах для передачі музичних творів. Базується на теоремі Котельникова-Шеннона. Є форматом стиснення з втратами, тобто частина звукової інформації, яку вухо людини майже не сприймає, безповоротно видаляється з запису. Розробка цього формату була пов'язана з тим, що файл формату Audio-CD — дуже великий за розміром (1 хвилина ~ 10-15 Мб інформації), і для пересилання в інтернеті був дуже незручним. Тому треба було зменшити розмір файла та зберегти якість звучання.

AAC

AAC (англ. Advanced Audio Coding) — стандартна схема стиснення із втратами для аудіоданих. AAC розроблена як альтернатива форматам mp3 його розробником, Fraunhofer IIS. На 2007 рік поширений менше ніж mp3 і ogg vorbis. З'явився у 1997 році.

  • Підтримка частоти дискретизації від 8 кГц до 96 кГц (MP3: 8 кГц — 48 кГц)
  • До 48 звукових каналів
  • Більша ефективність кодування при постійному звуковому потоці
  • Більша ефективність кодування при змінюваному звуковому потоці
  • Гнучкіший Joint stereo

Все це означає, що слухач одержує поліпшену й стабільнішу якість звуку, ніж при Mp3 з таким самим або меншим бітрейтом.

Musepack

MusePack (mpp, mp+, mpc, MPEG+) — неліцензований формат файлу для зберігання аудіо, розповсюджуваний за GNU General Public License. Якість кодування MPC на високих бітрейтах (160 Кбіт/с і вище) є помітно (якщо не значно) вищою за якість MP3. При кодуванні використовується інший психоакустичний алгоритм стиснення, у mpc не втрачаються частоти, які MP3-кодери ігнорують, оскільки на їх думку їх все одно не буде чути. Основна особливість — точна настройка психоакустики, що дозволяє працювати з чистим VBR-кодуванням (кодування зі змінним бітрейтом). Основним завданням Musepack є прозорість звучання закодованої музики.

3 улюблені музикальні композиції в некомпресованому форматі

Imagine Dragons - Natural
Imagine Dragons - Whatever it takes
OneRepublic - Counting stars

Компресування композицій з бітрейдом від 128 до 320 Кбіт на сек.

Стандартна якість (128 Кбіт на сек.)

Imagine Dragons - Natural
Imagine Dragons - Whatever it takes
OneRepublic - Counting stars

Середня якість (192 Кбіт на сек.)

Imagine Dragons - Natural
Imagine Dragons - Whatever it takes
OneRepublic - Counting stars

Найвища якість (320 Кбіт на сек.)

Imagine Dragons - Natural
Imagine Dragons - Whatever it takes
OneRepublic - Counting stars

Порівняння якості звуку в отриманих файлах

Назва композиції Виконавець Формат композиції Бітрейд Довжина копозиції Розмір композиції (Мб)
Natural Imagine Dragons MP3 некомпресований формат 00:03:08 31,7
128 2,88
192 4,31
320 7,19
Whatever it takes Imagine Dragons некомпресований формат 00:03:21 33,9
128 3,08
192 4,61
320 7,69
Counting stars OneRepublic некомпресований формат 00:04:16 43,1
128 3,91
192 5,87
320 9,78

Висновок

Отже,чим вищий бітрейд композиції, тим краща якість звуку, тому відповідно розмір композиції з кращим звучанням буде більшим.