Обробка зображень та мультимедіа. Лабораторна №5 Галушка Антон

Матеріал з Вікі ЦДУ
Перейти до: навігація, пошук

Формати звукових файлів

Стиснення без втрат

Це спосіб кодування, що дозволяє повністю відновити вихідні дані з жатого потоку. Тому його застосовують у разі необхідності повного збереження якості вихідного звуковий аудіо інформації. Сучасні алгоритми стиснення без втрат дозволяють скоротити обсяг більш ніж в 2 рази, при цьому не втративши якість. Подібні кодери працюють за принципом звичайного архіватора. Але на відміну від них вони адаптовані спеціально для роботи з аудіо.

  • FLAC (.flac) - вільний кодек з проекту Ogg
  • Lossless Audio (.la)
  • Lossless Predictive Audio Compression (LPAC; .pac)
  • Apple Lossless (.m4a)
  • Monkey's Audio (.ape)
  • OptimFROG (.ofr)
  • RKAU (.rka)
  • Shorten (.shn)
  • TTA - True Audio, вільний кодек
  • TAK (.tak) - Tom's lossless Audio Kompressor
  • WavPack (.wv)
  • Windows Media Audio 9 Lossless (.wma)
  • ADX - формат звуку з максимальним бітрейтом 1 Гбіт / с
  • PXD (.pxd) - формат компанії PXD Media. Один з перших аудіокодеків без втрат (1997). Використовується в музичних конструкторах EJAY та інших.


Стиснення з втратами

Застосовується, коли потрібно, як можна сильніше стиснути дані, зберігши при цьому їх якість на прийнятному рівні. Кодування з втратами складається з положення про те що у вихідних незжатих матеріалах міститься багато зайвої інформації, яка не несе ніякої користі для слуху, її можна видалити, що як наслідок забезпечити підвищення рівня стиснення.

У процесі стиснення аудіо дані аналізуються кодером на предмет виявлення різних тонкощів звучання, якими можна знехтувати. Для підвищення стиснення можна позбутися від прихованих частот, які ми погано чуємо взагалі, але тим не менше вони присутні (це стосується діапазону нижче 20Гц і вище 22КГц).

Але при такому стисканні дуже часто разом з «зайвою» відбувається нехтування корисним сигналом, що веде часто істотну різницю в порівнянні звучання з оригіналом. При такому кодуванні діє правило - чим сильніше стискається сигнал, тим більша вірогідність втрати корисного сигналу.

  • Mp3 - на даний момент один з найбільш популярних форматів стиснення з втратами. Формат призначений для значного зменшення обсягу даних, який необхідний для прослуховування записи і збереження якості звуку максимально близького до вихідного. Такий файл із середнім бітрейтом (128кбіт/с) призводить до отримання файлу приблизно в 1/11 від початкового файлу з audiocd, який має середній бітрейт близько 1411 кбіт/с. Якість отриманого файлу залежить від бітрейту, з яким можуть створюватися mp3-файли.

Найбільш прийнятним є бітрейт від 128-320. Але слід врахувати один цікавий факт, що для нормального якісного звучання досить усього лише 256Кбит/с. Це показали «сліпі тести» - в якому експерти з зав'язаними очима не могли на слух відрізнити стиснене до 256 кбіт/с сигнал від сигналу з 320кбіт/с. Подібні тести проводяться в спеціальних приміщеннях з використанням дорогого обладнання.

Але крім бітрейта якість залежить так само і від самої програми, що кодує. При стисненні у даного формату є три варіанти режиму бітрейта:

    • CBR - постійний бітрейт, в якому для кодування кожної секунди потоку застосовується однакова кількість біт.
    • EBR
    • VBR - змінний бітрейт, коли на кожну секунду застосовується різна кількість біт.

Від вибору режиму так само буде залежати і якість кодування.

  • WMA (windows media audio) - формат розроблений з метою збереження і трансляції аудіо. Спочатку його презентували як альтернативу mp3. Але суб'єктивно якість wma не завжди відповідає якості mp3.
  • AAC (.m4a, .mp4, .m4p, .aac) - файли будуть якіснішими в процесі кодування в порівнянні з перерахованими вище форматами стиснення. Зараз даний формат вважається одним з найбільш якісних і підтримується більшістю пристроїв. З переваг можна назвати гарну якість при будь-якому варіанті бітрейта, і підтримки частоти дискретизації до 96 кГц, в той час як mp3 всього лише 48кГц.
  • Vorbis - проект Ogg, вільний, схожий за принципами на MP3
  • Speex - проект Ogg, вільний, стиснення голосу, низький бітрейт
  • Opus - проект Ogg, вільний, передача звуку по мережі; заснований на технологіях кодеків CELT і SILK.
  • G.723.1 - один з базових кодеків мовної IP-телефонії
  • G.729 - ефективний вузькосмуговий мовний кодек IP-телефонії
  • Musepack - Musepack (MPC)
  • TwinVQ - Yamaha TwinVQ (VQF)
  • RealAudio (RA, RM)
  • OTS Audio File - схожий на MP3
  • SWA - Macromedia Shockwave Audio; стиснення як в MP3 з додатковими заголовками для Macromedia Director ти дискретизації до 96 кГц, в той час як mp3 всього лише 48кГц.

Без стиснення і втрат

  • Wav (wave) - частіше використовується як оболочка нестислого сигналу, при якому на кожен відлік амплітуди виділяється певна кількість біт.
  • AIFF - формат, який часто використовується для зберігання аудіо матеріалу. Розробником даного формату є Apple, ще в 80-х роках XX століття. Тому даний формат найчастіше зустрічається у тих, хто використовує платформу MacOS, ніж на платформі PC.
  • AU
  • CDDA - формат, який використовується в аудіо-CD
  • DSD - формат, який використовується в SACD
  • DXD - якість цифрового звукозапису DXD за багатьма параметрами перевершує не тільки інші ІКМ-формати, але і DSD.
  • IFF-8SVX - Interchange File Format
  • IFF-16SV
  • RAW - необроблені («сирі») виміри без будь-якого заголовка або синхронізації

Робота з композиціями

Назва композиції Тривалість Бітрейт(формат mp3) Вага оригіналу
320 kbps 192 kbps 128 kbps
Avicii - Trouble.flac 2:51 6.60 МБ 3.98 МБ 2.67 МБ 20.6 МБ
Foxes - Devil Side.flac 3:59 9.23 МБ 5.57 МБ 3.75 МБ 25.7 МБ
Sum 41 - I'm Dead Again.flac 2:21 7.71 МБ 4.62 МБ 3.08 МБ 27.6 МБ