Обробка зображень лабораторна №5 Ізовіта Олесь

Матеріал з Вікі ЦДПУ
Перейти до: навігація, пошук

Формати звукових файлів

WAVE

WAVE (.wav) - найширше розповсюджений звуковий формат. Використовується в Windows для зберігання звукових файлів. В його основі лежить формат RIFF (Resource Interchange File Format), який дозволяє зберігати довільні дані в структурованому вигляді. Для записування звуку використовуються різні способи стиснення, оскільки звукові файли мають великий об’єм. Найпростіший спосіб стиснення - імпульсно-кодова модуляція (Pulse Code Modulation, PCM), але він не забезпечує достатньо гарного стиснення. Цей спосіб був дещо вдосконалений і на його основі розроблені ще два методи: DPCM (Differential Pulse Code Modulation - диференційна імпульсно-кодова модуляція) та ADPCM (Adaptive Differential Pulse Code Modulation - адаптивна диференційна імпульсно-кодова модуляція), що забезпечують більш сильне стиснення з прийнятною якістю.

AU

AU (.au, .snd) - формат звукових файлів, що використовується на робочих станціях фірми Sun (.au) і в операційній системі NeXT (.snd). Отримав широке розповсюдження в Internet, на ранній стадії розвитку якого відігравав роль стандартного формата для звукової інформації.

MPEG-3

MPEG-3 (.mp3) –на сьогоднішній час самий популярний формат збереження оцифрованого звуку МР-3 використовує приблизно у 10 разів менше дискового простору при збереженні звуку відповідної якості, ніж файл у форматі WAV.

Iсторія створення

В 1988р. Міжнародною організацією стандартів ISO був створений комітет з розробки стандартів збереження рухомих зображень (відео), звуку та їх суміщення – Moving Picture Expert Group – MPEG – група експертів в області рухомих зображень. Групою були розроблені стандартизовані формати зображення відео – та звукової інформації з використанням різних механізмів стиснення. Були створені такі формати збереження відеоданих, як MPEG – 1, MPEG – 2, MPEG – 4.

В рамках MPEG – 1та MPEG – 2 використовувались допоміжні формати зберігання звукової інформації. Layer – 1, Layer – 2, та Layer – 3, що відрізнялись різною ефективністю стиснення та різною складністю відтворення. Найпростіший - Layer – 1, дає найменше стиснення, але він мало завантажує процесор. Формат Layer – 3, розроблений у 1996р., найбільш трудоємкий, але за його допомогою досягається найбільше стиснення звуку. Формат отримав самостійне використання під назвою МР3 для розширення файлів, в яких зберігається стиснута ним інформація.

В МР3 для стиснення даних використовується механізм обрізання частот, які маскуються; механізм резервуванням інформації, за яким відновлюються високі частоти; механізм суміщеного стерео, а також стандартні алгоритми стиснення даних без втрат (алгоритм Хафмана). Досягається стисненням у 10-12 разів із збереженням CD – якості звуку, при цьому Бітрейт* =112-128 Кб/с

MIDI

MIDI (.mid) - цифровий інтерфейс музичних інструментів (Musical Instrument Digital Interface). Цей стандарт розроблений на початку 80х років для електронних музичних інструментів і комп’ютерів. MIDI визначає обмін даними між музичними та звуковими синтезаторами різних виробників. MIDI-файл являє собою послідовність команд, якими записані дії, наприклад, натиснення клавіши на піаніно або повертання регулятора. Ці команди, що надсилаються на пристрій відтворення MIDI-файлів, керують звучанням. Невелике MIDI-повідомлення може викликати відтворення звуку або послідовності звуків на музичному інструменті або синтезаторі, тому MIDI-файли займають менший об’єм, ніж еквівалентні файли оцифрованого звуку. Існує декілька різновидів стандарта MIDI.

General MIDI

General MIDI (GM) - стандарт, що регламентує набір тембрів (інструментів) в музичних синтезаторах. GM - перша розробка фірми Roland, яка уніфікує набір MIDI-інструментів. У відповідності із стандартом GM синтезатор повинен мати 128 мелодичних тембрів з можливістю відтворення звуку різної висоти в каналах 1-9 і 11-16 і 46 ударних інструментів в каналі 10. За всіма інструментами закріплено номери. Партитура, підготовлена у відповідності із стандартом GM, повинна звучати подібно на різних GM-інструментах. На жаль, подібність звучання розповсюджується лише на класичні тембри реальних інструментів. А більшість синтетичних (Pad/FX) і багато ударних інструментів сильно відрізняються за швидкістю наростання/затухання, голосністю, та іншими параметрами звучання.

General Standard

General Standard (GS) - загальний стандарт фірми Roland, який регламентує набір тембрів. Крім елементів стандарту General MIDI він включає додаткові набори мелодичних та ударних інструментів, а також різні ефекти (скрипіння дверей, звук мотору, крики та ін.).

Extended General

Extended General (XG) - новий стандарт фірми Yamaha, який включає декілька сотень мелодичних та ударних інструментів і став альтернативою формату GS.

MOD

MOD (.mod) - музичний формат, в ньому зберігаються взірці оцифрованого звуку, які можна потім використовувати як шаблони для індивідуальних нот. Файли в цьому форматі починаються з набору взірців звуку, за якими слідують ноти та інформація про тривалість. Кожна нота відтворюється за допомогою одного з наведених на початку звукових шаблонів. Такий файл відносно невеликий і має структуру, яка базується на нотах. Це полегшує його редагування за допомогою програм, імітуючих традиційний музичний запис. Він, на відміну від MIDI-файла, повністю задає звук, що дозволяє відтворювати його на довільній комп’ютерній платформі.

IFF

IFF (.iff) - Interchange File Format - формат, попередньо розроблений для комп’ютерної платформи Amiga. Зараз він використовується на компакт-дисках в форматі CD-I. Його структура дуже подібна на структуру формата RIFF.

AIFF

AIFF (.aiff) - Audio Interchange File Format - формат для обміну звуковими даними, використовується на комп’ютерних платформах Silicon Graphics і Mac. Дуже нагадує формат Wave, однак на відміну від нього дозволяє використовувати оцифрований звук та шаблони. Більшість програм здатні відкривати файли в цьому форматі, а також існує багато вільно розповсюджених програм перетворень форматів для платформ Wintel і Mac.

RealAudio

RealAudio (.ra, .ram) - формат, розроблений для відтворення звуку в Internet в реальному часі. Розроблений фірмою RealNetworks, яка безкоштовно розповсюджує як програму стиснення звукової інформації в цьому форматі, так і програму для програвання отриманих при цьому файлів. Програма стиснення дозволяє перетворювати 8- та 16-бітні аудіофайли в формат RealAudio. Результуюча якість в кращому випадку відповідає поганій аудіокасеті, а для якісного запису музичних творів краще використовувати формат mp3.

SSEYO Koan

SSEYO Koan (.skd, .skp) - формат файлів для запису довільної об’ємної комп’ютерної музики або Koan-музики. Термін Koan-музика був введений її автором Тимом Коуном в 1994 році. Це деяка фантазія на музичну тему. Музичні Koan-файли можуть бути малими за об’ємом, а відтворення самої музики може тривати до 8 годин. В файлі вказуються основні параметри, а музика генерується на комп’ютері за допомогою біля 200 спеціальних змінних параметрів керування. Не можна відтворити і почути одну і ту ж саму музику двічі, навіть з одного і того ж Koan-файла. Файли з розширенням SKD (SSEYO Koan Design) призначені для збереження інформації з Koan-музикою для її подальшого редагування. Для розміщення готових творів в Internet призначений захищений формат SKP (SSEYO Koan Play), який містить ту ж саму інформацію, що і SKD, але не може бути відредагований наявними редакторами Koan-файлів. Ці редактори дозволяють також записати отриману музику в форматах WAV і MIDI, що робить їх досить цікавим інструментом для музичної творчості.

Композиції в некомпресованому форматі

ABBY - Again
Incubus - Drive
Slipknot - (SIC)

Компресування композицій з бітрейдом від 128 до 320 Кбіт на сек.

Бітрейд - 128

ABBY - Again
Incubus - Drive
Slipknot - (SIC)

Бітрейд - 224

ABBY - Again
Incubus - Drive
Slipknot - (SIC)

Бітрейд - 320

ABBY - Again
Incubus - Drive
Slipknot - (SIC)

Порівняння якості звуку в отриманих файлах

Параметри ABBY - Again Incubus - Drive Slipknot - (SIC)
Оригiнал 47,1 MB 41,3 MB 35,3 MB
128 Кб/с 4,07 МБ 3,57 МБ 3,05 МБ
224 Кб/с 7,13 МБ 6,25 МБ 5,34 МБ
320 Кб/с 10,18 МБ 8,93 МБ 7,63 МБ
Формат MP3 MP3 MP3
Довжина 4:26 3:54 3:19

Висновок

БІТРЕЙТ – (bitrate) – кількість інформації в кілобітах, що описує 1 с. звуку. 128 Кб/с (16 КВ/с) для більшості людей достатньо, щоб рахувати звук ідеальним. Але, чим бітрейт вищий, тим краще.