Обробка зображень лабораторна №5 Кислий Олександр

Матеріал з Вікі ЦДПУ
Перейти до: навігація, пошук

Формати звукових файлів

Цифрові звукові формати — формати файлів для збереження звукових даних у комп'ютерних системах. Файли таких форматів називають також аудіо-файлами, або звуковими файлами. Загальний принцип збереження аудіо на цифрових носіях полягає у послідовній фіксації значень амплітуди звукових коливань, які при відтворенні звуку відповідатимуть положенню мембран у гучномовцях. Ці значення записуються з певною частотою дискретизації та певним амплітудним розділенням. Для зменшення обсягів, ці дані можуть бути стиснені звтратами або без втрат.

Аудіо формати файлів

Стиснення звукових даних (стиснення аудіо) — тип стиснення даних, кодування, що застосовується для зменшення обсягу аудіо файлів або заради можливості зменшення смуги пропускання для потокового аудіо. Алгоритми стиснення звукових файлів реалізуються у комп'ютерних програмах, що називаються аудіокодеками. Винайдення спеціальних алгоритмів стиснення звукових даних вмотивовано тим, що загальні алгоритми стиснення неефективні для роботи зі звуком і унеможливлюють роботу у реальному часі.

АУДІО ФОРМАТИ БЕЗ ВТРАТ

Складність стиснення звуку без втрат полягає в тому, що записи звуку є надзвичайно складними у своїй структурі. Одним із методів стиснення є пошук взірців і їх повторень, проте цей метод не ефективний для більш хаотичних даних, якими є, наприклад оцифрований звук.
БЕЗ СТИСНЕННЯ

  • AIFF AIFF

Розроблений компанією Apple Computer в 1988 році, на основі формату IFF компанії Electronic Arts, і найчастіше використовується в комп'ютерах Apple Macintosh.
Звукові дані в стандартному файлі формату AIFF представляють із себе незжатими імпульсно-кодову модуляцію. Також існує і стисла версія формату AIFF, яку називають AIFC (зрідка AIFF-C), в якій для стиснення можуть бути використані різні кодеки.
AIFF використовується в професійних аудіо і відео додатках, так як в ньому звук не скорочується і не має втрат в якості.
Як і будь-які стиснені файли, файли AIFF займають набагато більше дискового простору ніж їх стислі аналоги: одна хвилина стерео звуку з частотою дискретизації 44,1 кГц і розміром вибірки 16 біт займає близько 10МБ.
Стандартне розширення файлів: .AIFF або .AIF, для стисненого варіанти повинно застосовуватися розширення .AIFC.

  • AU

Формат AU був розроблений компанією Sun Microsystems. Цей формат значно полегшує завдання надійного зберігання аудіофайлів.
При цьому файл AU складається з трьох частин:
заголовка (макс. 24 байта), блоку опису різних розмірів, а також власне звукової інформації.
Незважаючи на те, що цей формат файлів використовується на комп'ютерах на ОС Sun або Unix, його можна відкрити іншими програвачами звукової інформації.
Розширення файлів .au

  • CDDA - стандарт для аудиоCD

Розширення файлу CDDA це формат даних відомий як CD Digital Audio File. CDDA файли аудіо файли перезапису з диска, відформатований за допомогою специфікації CD Digital Audio. Вони використовуються для збереження аудіо CD на комп'ютер і прожига нових компакт-дисків. Ці файли були використані для програвачів компакт-дисків для дому та автомобіля. Вони також пов'язані з Apple Itunes мультимедійний плеєр і IOS пристроїв керуючої заявки на Apple Mac OS X і Microsoft Windows.
Ці файли використовують частоту дискретизації 44,1 кГц, що приблизно в два рази вища за частоту,яку чутно людьми про 22 кГц. Файли в форматі CDDA може бути відкритий з Apple Itunes, Apple Logic Pro 9 і Apple, Logic Express 9 в системах Mac, а також Apple Itunes в системах на основі Microsoft Windows.

  • IFF-8SVX Interchange File Format

Формат IFF-8SVX для 8-бітових звукових зразків, створений Electronic Arts у 1984 році.

  • RAW

Формат даних, що містить необроблені дані. У таких файлах міститься повна інформація про сигнал,що обробляється. У разі обробки звуку під RAW розуміються звукові дані без стиснення і заголовків.

  • (WAV - Microsoft Wave (Waveform audio format). Розроблено разом з IBM

Формат файлу-контейнера для зберігання записи оцифрованого аудіо-потоку. Під Windows цей формат найчастіше використовується в якості оболонки для нестислого звуку (PCM). У контейнер WAV можна помістити звук, стиснений майже будь-яким кодеком (але з відтворенням таких файлів можуть виникати проблеми).
Структура: складається з трьох заголовків, за якими слідують дані самого звукового файлу, тобто сукупність електронних даних самого звукового сигналу.
Перший - RIFF заголовок. Він займає 8 байт з самого початку файлу і містить інформацію про довжину файлу.
Другий заголовок - WAV заголовок, містить інформацію про кол-ве каналів (моно або стерео).
Третій заголовок - інформацію про кол-ве байт, що виділяються під самі WAV дані.
Далі йдуть самі дані звукового файлу.
ІЗ СТИСНЕННЯМ

  • FLAC (вільний кодек із проекту Ogg)

Аудіокодек для стиснення аудіо при 100% збереженні оригінального звукового потоку. Забезпечує т. зв. стиснення без втрат (англ. lossless), тобто при розпакуванні звукові дані залишаються повністю ідентичними до початкового файлу перед стисненням. FLAC також включає можливість перевірки точності даних завдяки збереженню у файлі відбитку MD5 оригінальних даних. FLAC є вільним форматом.
Основними частинами потоку є:
Рядок з чотирьох байтів«fLaC»
Блок метаданих STREAMINFO
Інші необов'язкові блоки метаданих
Аудіофрейми

  • Lossless Audio (.la)
  • Lossless Predictive Audio Compression LPAC (.pac)
  • Apple Lossless (M4A)

Абревіатура "M4A" є скороченням від MPEG-4 Part 14. Цей формат був створений компанією Apple в 2004 році на основі формату QuickTime File Format.
Формат є цифровий мультимедійний контейнер, який використовується для зберігання аудіокомпонентів. Незважаючи на це, він також здатний зберігати інші дані (наприклад, зображення).
Файли MPEG-4 Part 14 можна зберігати як з розширенням M4A, так і з розширенням MP4 (основна відмінність полягає в тому, що файли MP4 здатні зберігати відео).
Як і більшість інших форматів аудіофайлів, присутня можливість стиснення з втратами - за допомогою кодека FFC. Але на відміну від інших форматів аудіофайлів можливо також стиснення і без втрат, яке можна зробити за допомогою формату Apple Lossless.
Технічні відомості про файли: M4A
Файли M4A є покращеною версією файлів MP3. Такого поліпшення вдалося досягти завдяки тому, що на відміну від MP3 такі файли можуть бути отримані в результаті стиснення без втрат. Це означає, що файли можуть бути конвертовані в обох напрямках без втрати якості або зменшення розміру. Копіювання файлів MP4 обмежено засобами захисту DRM (при цьому файли M4A в цьому відношенні поширювати набагато простіше). Саме тому компанія Apple використовуємо саме M4A, адже цей формат дозволяє користувачам купувати файли в магазинах компанії, а після записувати їх на компакт-диск або мобільний пристрій. Через те, що цей формат - власна розробка компанії Apple, програвати його в ОС Windows складно. Втім, програма iTunes для ОС Windows дозволяє це зробити. Крім того, вона дозволяє конвертувати їх в сумісні з Windows аудіоформати.

  • Monkey's Audio (APE)

Поширюється безкоштовно разом з відкритим вихідним кодом і набором програмного забезпеченнядля кодування і відтворення, а також плагінами до популярних плеєрів.
Файли використовують такі розширення:
.ape для зберігання аудіо і .apl для зберігання метаданих.
ПЕРЕВАГИ
Висока ефективність
Хороша підтримка програмного забезпечення
Версія Java (працює на багатьох платформах, multiplatform)
Підтримує теги (ID3v1, APE tags)
Підтримка високороздільне аудіо (Highresolution)
Підтримка RIFF чанків (Тільки в енкодері з графічним інтерфейсом GUI)
Pipe support (тільки в спеціальній версії)

  • OptimFROG (.ofr)

Аудіо-файл, стискається за допомогою OptimFROG - програми стиснення аудіо без втрат, яка вперше була введена в експлуатацію в 2001 році. Зберігає аудіо у власному форматі, який не підтримує широким рядом стандартних медіа-програвачів.
Розширення файлу .ofr є аудіо-файл OptimFROG.
Звуки в форматі OFR можуть бути відтворені за допомогою наступних програм:
OptimFROG Lossless Audio Compressor, Nullsoft Winamp з тим, що підключається модулем OptimFROG, Foobar2000 з тим, що підключається модулем OptimFROG, XMMS з тим, що підключається модулем OptimFROG.

  • RKAU (.rka)
  • Shorten (SHN)

Аудіо-файл, стискається за допомогою компресії без втрат Shorten. Стискає аудіо CD-якості без втрат. Близький до формату FLAC (.FLAC) і компресії Monkey's Audio (.APE).

  • TTA True Audio, вільний кодек
  • WavPack (.wv)

Аудіо-файл, стиснутий за допомогою WavPack Hybrid Lossless Compression. Підтримує як стиснення з втратами, так і без втрат, що дає можливість створювати файли, стислі в високій якості. Ступінь стиснення коливається, як правило, від 30 до 70%.
Стиснення WavPack підтримує моно, стерео і багатоканальне аудіо. Воно сумісне з більшістю аудіо-форматів PCM, включаючи записи в 8, 16, 24 і 32 біти, а також підтримує частоту відліків від 6 до 192 kHz.

  • Windows Media Audio 9 Lossless (WMA)

АУДІО ФОРМАТИ З ВТРАТАМИ

Стиснення із втратами має надзвичайно широке застосування. Окрім комп'ютерних програм, стиснення з втратами використовується в потоковому аудіо в DVD, цифровому телебаченні і радіо та потоковому медіа в інтернеті.
Головним параметром стиснення з втратами є бітрейт, що визначає ступінь стиснення файлу та, відповідно, якість.
Розрізняють стиснення з з постійним бітрейтом (англ.Constant BitRate - CBR), змінним бітрейтом (англ.Variable BitRate - VBR) та усереденим бітрейтом (англ.Average BitRate -ABR).
Найпоширенішими форматами стиснення з втратами є: AAC, ADPCM, ATRAC, Dolby AC-3, MP2, MP3, MusepackOgg Vorbis, WMA та інші.

  • Mp3

Формат призначений для значного зменшення обсягу даних, який необхідний для прослуховування запису і збереження якості звуку максимально близького до вихідного. Такий файл із середнім бітрейтом (128кбіт/с) призводить до отримання файлу приблизно в 1/11 від початкового файлу з audiocd, який має середній бітрейт близько 1411 кбіт/с. Якість отриманого файлу залежить від бітрейту, з яким можуть створюватися mp3-файли. Найбільш прийнятним є бітрейт від 128-320.
Але крім бітрейта якість залежить так само і від самої програми, що кодує. При стисненні у даному форматі є три варіанти режиму бітрейта:

  1. CBR - постійний бітрейт, в якому для кодування кожної секунди потоку застосовується однакова кількість біт.
  2. EBR
  3. VBR - змінний бітрейт, коли на кожну секунду застосовується різна кількість біт.

Від вибору режиму так само буде залежати і якість кодування.

  • WMA (windows media audio) - формат розроблений з метою збереження і трансляції аудіо. Спочатку його презентували як альтернативу mp3. Але суб'єктивно якість wma не завжди відповідає якості mp3.
  • AAC (.m4a, .mp4, .m4p, .aac) - файли будуть якіснішими в процесі кодування в порівнянні з перерахованими вище форматами стиснення. Зараз даний формат вважається одним з найбільш якісних і підтримується більшістю пристроїв. З переваг можна назвати гарну якість при будь-якому варіанті бітрейта, і підтримки частоти дискретизації до 96 кГц, в той час як mp3 всього лише 48кГц.
  • Vorbis - проект Ogg, вільний, схожий за принципами на MP3
  • Speex - проект Ogg, вільний, стиснення голосу, низький бітрейт
  • Opus - проект Ogg, вільний, передача звуку по мережі; заснований на технологіях кодеків CELT і SILK.
  • MPC, Musepack Compressed Audio File (.mpc)

MPC-файли є результатом стиснення звукового файлу за допомогою технології стиснення Musepack. Файли можна співвіднести з файлами формату MP2, який зазнав, однак, істотні зміни. Незважаючи на те, що файли MPC мають значно кращу якість звуку, ніж MP3-файли, вони набагато менш популярні.
Технічні відомості про файли MPC: Формат MPC - це формат, який змінив формат MP + N, який раніше використовувався Musepack для стиснення звукових файлів. Більшість стандартних аудіоплеєри здатні відкрити MPC-файлів. Якщо аудіоплеєр не може відкрити цей файл, то можна завантажити відповідний плагін, який дозволяє відкривати такі файли.

  • TwinVQ - Yamaha TwinVQ (VQF)

Аудіо-формат, розроблений Nippon Telegraph and Telephone Corporation (NNT Labs). Використовує обтяжену перемежающуюся векторну дискретизацию на основі перетворень для компресії аудіо-даних. Може кодуватися в бітрейт 80, 96, 112, 128, 160 і192 kbps.
Формат VQF був проданий компанією Yamaha під ім'ям "SoundVQ".

  • RealAudio (RA, RM)
  • OTS Audio File - схожий на MP3
  • SWA - Macromedia Shockwave Audio; стиснення як в MP3 з додатковими заголовками для Macromedia Director ти дискретизації до 96 кГц, в той час як mp3 всього лише 48кГц.

Інші формати

  • MID, MIDI (Musical Instrument Digital Interface)

Стандартний файл MIDI (Musical Instrument Digital Interface), застосовуваний програмами розробки і мікшування музики, а також апаратними пристроями MIDI. Містить музичні дані, наприклад, інформація про те, де і які ноти грати, як довго звучить кожна з них.
Файли MID використовуються для кодування даних MIDI в стандартний формат, який застосовується для взаємодії між різними типами програм і пристроїв. Вони можуть містити дані контролера для пристрою. Наприклад, файл MID може застосовуватися для зміни інструментів для пристрої MIDI або зміни інформації педалі сустейна.
Файли MID містять атрибути музичних даних, а не самі дані. Вони можуть відтворюватися за допомогою інструментів програми, які інтерпретують ці дані.
Для конвертації аудіо файлів в MIDI існують різні програми. В якості вихідних можуть використовуватися як файли WAV, так і файли MP3, доріжки Audio CD і т.д.
Наприклад, можна використовувати програму AmazingMIDI. Але треба бути готовим до того, що звучання може відрізнятися, тому що формат MIDI - це послідовність нот, а не музичний формат, тобто вийшов MIDI файл - це скоріше транскрипція аудіо. Файл MIDI так само можна конвертувати в аудіо файли, наприклад, MP3. Для цього можна скористатися програмою Awave Studio.

  • VGM (Video Game Music File)

Аудіо-файл, який використовується деякими звуковими мікросхемами Yamaha і Texas Instruments, які входили до складу старих систем відео-ігор. Містить аудіо з відео-ігри, яке може синтезуватися звуковий мікросхемою. Може відтворюватися за допомогою комп'ютерної програми, яка емулює звукову мікросхему. Файли VGM застосовувалися для таких ігрових консолей як Sega Genesis, Sega Game Gear і аркадних машин Capcom.

  • NSF (NES music)

Музичний файл з оригінальної гри Nintendo (NES / Famicom); дозволяє відтворювати музику з ігор Nintendo без завантаження фактичної гри; можуть бути відкриті різноманітними гравцями NSF.

  • MOD (Amiga Music Module File)

Стандартний формат музичного модуля, розпізнаваний більшістю аудіо-програм. Може бути створена за допомогою FastTracker, StarTrekker, Noise Tracker або іншої програми створення MOD. Файли MOD містять образи (більше подібних до файлів MIDI), а також звукові сэмпли, що застосовуються для різних інструментів. Звукові сэмпли називають різними треками в модулі і відтворюють у відповідності з замітками.

Композиції в некомпресованому форматі

Foals - Exits
Kaleo - Way Down We Go
Один в каное - У мене немає дому

Компресування композицій з бітрейдом від 128 до 320 Кбіт на сек.

Стандартна якість (128 Кбіт на сек.):

Гарна якість (192 Кбіт на сек.):

Найкраща якість (320 Кбіт на сек.):

Порівняння якості звуку в отриманих файлах

Виконавець Назва композиції Довжина копозиції (хв.:сек.) Формат композиції Бітрейд (Кбіт на сек.) Розмір композиції (Мб)
Foals Exits 06:39` WAV некомпресований формат 67,1
MP3 128 6,4
192 9,6
320 16
Kaleo Way Down We Go 03:34 WAV некомпресований формат 35,9
MP3 128 3,4
192 5,1
320 8,6
Один в каное У мене немає дому 03:19 WAV некомпресований формат 33,3
MP3 128 3,2
192 4,8
320 7,9