Обробка зображень лабораторна №5 Антонова Катерина

Матеріал з Вікі ЦДУ
Перейти до: навігація, пошук

Формати звукових файлів

Звукові файли займають зазвичай великий об'єм (навіть у стислому вигляді). Дуже часто вживають також музичні файли у форматі MIDI. MIDI-файли не містять власне звукової інформації. Вони містять тільки набір команд типу клавішу ДО першої октави натиснути через 2 секунди після початку, відпустити ще через 0.5 секунд (звичайно, це дуже примітивний опис MIDI-команди, але в цілому дає уявлення про те, що це таке). Ці команди виконуються синтезатором, вбудованим в звукову карту користувача (або зовнішнім модулем, якщо такий є). Тому якість звучання, почута користувачем, сильно залежить від устаткування, що є у нього. Проте файли, написані для стандарту GM (General MIDI) зазвичай звучать дуже схоже на всіх синтезаторах, що підтримують його, а його підтримують практично всі сучасні звукові карти.

Основна проблема використання формату MIDI полягає в тому, що якщо у нас вже є готовий музичний запис (наприклад на компакт-диску), то її ніяк не можна перевести у формат MIDI, окрім як наново “склавши” і записавши її в MIDI-редакторові. Просто такої технології сьогодні ще немає.

Стиснення звукових файлів

Нестиснені формати AU (.au, .snd) - формат звукових файлів, що використовується на робочих станціях фірми Sun (.au) і в операційній системі NeXT (.snd). Отримав широке розповсюдження в Internet, на ранній стадії розвитку якого відігравав роль стандартного формата для звукової інформації. Спочатку це були 8-бітові, кодовані за μ-законом, дані без заголовків, на частоті дискретизації 8000 Гц. Обладнання інших виробників часто використовували частоту дискретизації 8192 Гц, кратну тактовим сигналам відео. Нові файли мають заголовок, що складається з шести непідписаних 32-бітових слів, додаткову інформацію, а потім дані (у великому форматі зворотний порядок байт).

WAVE (.wav) - найширше розповсюджений звуковий формат. Використовується в Windows для зберігання звукових файлів. В його основі лежить формат RIFF (Resource Interchange File Format), який дозволяє зберігати довільні дані в структурованому вигляді. Для записування звуку використовуються різні способи стиснення, оскільки звукові файли мають великий об’єм. Найпростіший спосіб стиснення - імпульсно-кодова модуляція (Pulse Code Modulation, PCM), але він не забезпечує достатньо гарного стиснення. Цей спосіб був дещо вдосконалений і на його основі розроблені ще два методи: DPCM (Differential Pulse Code Modulation - диференційна імпульсно-кодова модуляція) та ADPCM (Adaptive Differential Pulse Code Modulation - адаптивна диференційна імпульсно-кодова модуляція), що забезпечують більш сильне стиснення з прийнятною якістю.

SACD (англ. Super Audio Compact Disc) — компакт-диск нового покоління, винайдений, як і CD, фірмами Sony і Philips. При запису SACD використовується формат DSD, що теоретично дає неперевершену якість звучання. Запис на SACD може містити від 1 до 6 звукових каналів. Для відтворення SACD потрібен спеціальний програвач, сумісний із цим форматом.

Стиснення звукових файлів з втратами Поширеними форматами стиснення звукових файлів є RealAudio та MPEG 1 Layer 3.

Формат RealAudio був розроблений фірмою RealNetworks. Це самий ранній з форматів стиснення звукозапису, і тому він найбільш поширений. Їх переважно використовувати лише для мовних записів, оскільки при швидкості потоку 16 kBit/s максимальна відтворна частота звуку не перевищує 8 kHz, тобто при прослуховуванні користувач практично не почує високих частот, а при сильнішому стисненні (до 5 kBit/s) про якесь адекватне сприйняття взагалі говорити не доводиться. Для стиснення музики краще використовувати швидкість потоку не менше 32 kBit/s, що дає цілком прийнятні результати для монофрагментів.

Файли формату RealAudio зазвичай мають розширення імені .rm. (Іноді для сумісності із старими версіями програвачів використовується розширення .ra, проте одного розширення тут недостатньо. Для такої сумісності необхідно використовувати також старі версії алгоритмів стиснення.)

Інший поширений формат стиснення звукових даних називається MPEG 1 Layer 3, а скорочено - просто mр3(саме таке розширення імені зазвичай мають файли цього формату). Цей формат використовує інші алгоритми стиснення. Для деяких звукових файлів вони підходять краще, ніж алгоритми RealAudio, для деяких - гірше). Крім того, підтримуються ступені стиснення до 320 kBit/s. Таке стиснення зменшує початковий незжатий файл всього в чотири рази, зате їх якість практично невідмітна від “сьогодення”. Часто використовують mр3-стиснення з шириною потоку 128 kBit/s, при якому початкові файли стискаються приблизно в 10 разів.

Windows Media Audio (WMA) — ліцензований формат файла, розроблений компанією Microsoft для зберігання і трансляції аудіо-інформації.

Від самого початку формат WMA позиціювався як альтернатива MP3, але сьогодні Microsoft протиставляє йому формат AAC (використається в популярному на Заході онлайновому музичному магазині iTunes). Номінально формат WMA характеризується гарною здатністю стискання даних, що дозволяє йому «обходити» формат Mp3 і конкурувати по цих параметрах з форматами Ogg vorbis і AAC. Але як було показано незалежними тестами, а також при суб'єктивній оцінці якість форматів все таки не є однозначною, а в перевазі навіть над mp3 є також сумніви, незважаючи на заперечення компанією Microsoft. Особливо варто відзначити, що ранні версії формату (або його реалізації) мали проблеми на низьких швидкостях потоку. Однак даний формат постійно розвивається, тож можна припустити, що якість оптимізовуватиметься.

Стиснення звукових файлів без втрат

Monkey's Audio або APE — популярний формат кодування цифрового звуку без втрат. Файли Monkey's Audio використовують такі розширення: .ape для зберігання аудіо і .apl для зберігання метаданих. Незважаючи на відкритий вихідний код, Monkey's Audio не є вільним, тому що його ліцензія накладає значні обмеження на використання. Офіційно кодек Monkey's Audio випускається тільки для платформи Windows, хоча існує ряд неофіційних кодеків для GNU/Linux й Mac OS X, які в більшості випадків дозволяють лише стискати файли, перетворюючи їх в інший формат.

FLAC (англ. Free Lossless Audio Codec — вільний аудіокодек без втрат) — аудіокодек для стиснення аудіо при 100% збереженні оригінального звукового потоку. На відміну від таких кодеків, як MP3, WMA чи Ogg Vorbis, FLAC забезпечує т.зв. стиснення без втрат (англ. lossless), тобто при розпакуванні звукові дані залишаються повністю ідентичним до початкового файлу перед стисненням. FLAC також включає можливість перевірки точності даних завдяки збереженню у файлі відбитку MD5 оригінальних даних. FLAC є вільним форматом: його використання не вимагає виплат роялті, специфікації є відкритими та його основна реалізація є вільним програмним забезпеченням. Розвиває цей кодек Xiph.Org Foundation.

Музикальні композиції в некомпресованому форматі

The Pretty Reckless - My Medicine

BTS - Sea

Jason Derulo feat. Lay Zhang & NCT 127 - Let's Shut Up & Dance

Компресування композицій з бітрейдом від 128 до 320 Кбіт на сек.

Стандартна якість (128 Кбіт на сек.):

Гарна якість (192 Кбіт на сек.):

Найкраща якість (320 Кбіт на сек.):

Порівняння якості звуку в отриманих файлах

Назва композиції Виконавець Формат композиції Бітрейд (Кбіт на сек.) Довжина копозиції (год.:хв.:сек.) Розмір композиції (Мб) Розмір композиції (байт)
My Medicine The Pretty Reckless MP3 некомпресований формат 00:03:13 32,6 34 219 326 байт
128 2,96 3 105 062
192 4,44 4 657 572
320 7,41 7 771 342
Sea BTS некомпресований формат 00:05:10 52,2 54 747 830
128 5,03 5 283 840
192 7,40 7 765 641
320 9,65 10 128 745
Let's Shut Up & Dance Jason Derulo feat. Lay Zhang & NCT 127 некомпресований формат 00:03:28 35,0 36 749 312
128 3,17 3 334 198
192 4,76 5 001 228
320 8,06 8 457 275

Висновок: отже, з наведеної вище таблиці бачимо: чим більший бітрейд композиції, тим якість звуку вища та розмір композиції більший і аналогічно навпаки.