Причислий Лабораторна робота №5

Матеріал з Вікі ЦДУ
Перейти до: навігація, пошук

Формати звукових файлів

Звукові формати файлів — це формати файлів для збереження звукових даних у комп'ютерних системах. Файли таких форматів називають аудіофайлами. Загальний принцип збереження аудіо на цифрових носіях полягає у послідовній фіксації значень амплітуди звукових коливань, які при відтворенні звуку відповідатимуть положенню мембран у гучномовцях. Ці значення записуються з певною частотою дискретизації та певним амплітудним розділенням(для зменшення обсягів, ці дані можуть бути стиснені з втратами або без втрат). Існує дві основні групи аудіофайлів: формати без втрат та формати з втратами. Група аудіо форматів без втрат поділяються ще на дві групи - зі стисненням та без стиснення.

Формати із стисненням з втратами

Стиснення із втратами має надзвичайно широке застосування. Окрім комп'ютерних програм, стиснення з втратами використовується в потоковому аудіо в DVD, цифровому телебаченні і радіо та потоковому медіа в інтернеті. Новацією цього методу стиснення було використання психоакустики для виявлення компонентів звучання, що не сприймаються слухом людини. Прикладом можуть слугувати або високі частоти, які сприймаються лише при достатній їх потужності, або тихі звуки, що виникають одночасно або одразу після голосніших звуків і тому маскуються ними — такі компоненти звучання можуть бути передані менш точно, або і взагалі не передані.

  • AAC (Advanced Audio Coding) — Стандартна схема стиснення із втратами для аудіоданих, розроблена у 1997 році Fraunhofer IIS як альтернатива форматам mp3. Наразі поширена менше ніж mp3 і ogg vorbis.
  • GSM - був розроблений спеціально для використання на телефонах в Європі, оптимізований для запису телефонних розмов і голосів.
  • Speex - вільний кодек для стиснення мовного сигналу, який може використовуватися в додатках «голос-через-інтернет» (VoIP)
  • MP3 - ліцензований формат файлу для зберігання аудіо-інформації. Розроблений наприкінці 1980-тих років Карлгайнцем Бранденбургом для передачі файлів в мережі Інтернет.
  • Ogg Vorbis - вільний формат стиснення звуку, призначений для зберігання аудіо-інформації, подібно до MP3, однак його поява була зумовлена тим, що MP3 захищений патентом.
  • Musepack - ( mpp, mp+, mpc, MPEG+) — неліцензований формат файлу для зберігання аудіо, розповсюджуваний за GNU General Public License.

Формати із стисненням без втрат

Складність стиснення звуку без втрат полягає в тому, що записи звуку є надзвичайно складними у своїй структурі. Одним із методів стиснення є пошук взірців і їх повторень, проте цей метод не ефективний для більш хаотичних даних, якими є, наприклад оцифрований звук чи фотографії. Цікаво, що якщо згенерована комп'ютером графіка значно легше піддається стисненню без втрат, то синтезований звук в цьому відношенні не має переваг. Це пояснюється тим, що навіть згенерований комп'ютером звук зазвичай має дуже складну форму, яка представляє складне завдання для винайдення алгоритму.

  • FLAC - Free Lossless Audio Codec — кодек для стиснення аудіоданих. Стиснутий файл залишається ідентичним оригіналу, тобто жоден фрагмент даних не втрачається. Ступінь стичнення формату FLAC, як правило, варіюється у межах від 50 до 60% від оригінального розміру. Квантування - від 4 до 32 біт на семпл. Частота дискретизації від 1 Гц до 655 250 Гц з кроком 1 Гц. Кількість каналів від 1 до 8. FLAC є вільним форматом: його використання не вимагає виплат роялті, специфікації є відкритими та його основна реалізація є вільним програмним забезпеченням.
  • Monkey's Audio (APE) — Monkey's Audio — популярний формат кодування цифрового звуку без втрат. Перевага над FLAC полягає у більш високому ступені стиснення і підтримці багатопоточності. Файли Monkey’s Audio мають розширення .ape для аудіоданих та .apl для метаданих. Офіційно кодек Monkey's Audio випускається тільки для платформи Windows, хоча існує ряд неофіційних кодеків для GNU/Linux й Mac OS X, які в більшості випадків дозволяють лише стискати файли, перетворюючи їх в інший формат.
  • WMA - Windows Media Audio - ліцензований формат файла, розроблений компанією Microsoft, з самого початку WMA позиціювався як альтернатива MP3
  • Apple Losseless (M4A) - відкритий аудіокодек, розроблений Apple Inc
  • WavPack - вільний аудіокодек з відкритими вихідними кодами для стиснення аудіо-сигналу без втрати якості.
  • MPEG-4 — група стандартів на цифрове стиснення аудіо й відео, прийняту MPEG (Moving Picture Experts Group — Групою Експертів в області Відео). З'явився у 1998 році і містить у собі групу стандартів стиснення аудіо і відео і суміжні технології.
  • Shorten(SHN) - це формат стиснення без втрат аудіо файлів CD-якості.Shorten більше не розробляється

Нестиснені формати

  • AU - простий формат аудіофайлів, уведений Sun Microsystems.
  • AIFF - Audio Interchange File Format (AIFF) — розроблений компанією Apple Computer (нині Apple Inc.) в 1988 році, найчастіше використовується в комп'ютерах Apple Macintosh. Формат використовує два канали для стерео звуку.
  • WAV - Waveform audio format — формат аудіофайла розроблений компаніями Microsoft та IBM. Частота дискретизації: 44 100 Гц. Квантування 16 біт на семпл. WAV мже містити стиснене аудіо, але найчастіше застосовується для збереження нестисених звукових файлів. WAV-файли мають досить великий розмір, що робить формат незручним для обміну через мережу, тому частіше за все використовується для збереження початкового вигляду для файлів високої якості у випадках, де розмір вільного дискового простору не є серйозним обмеженням.

Бітрейт

Бі́това шви́дкість, бітре́йт (англ. bitrate) — швидкість проходження бітів інформації за секунду. Бітову швидкість прийнято використовувати до вимірювання ефективної швидкості передачі інформації по каналу, тобто швидкості передачі «корисної інформації» (адже крім такої є ще службова інформація, наприклад, стартові й стопові символи за асинхронної передачі, або контрольні символи за надлишкового кодування).

3 улюблені музикальні композиції в некомпресованому форматі

Назва композиції Тривалість Бітрейт(формат mp3)
128kbps 192kbps 256kbps 320kbps
[RagnBone Man - Human] 3:19 3Mb [1] 5Mb [2] 6Mb [3] 8Mb [4]
[Creedence Clearwater Revival - Fortunate Son] 2:19 2.31 Mb [5] 3.20 Mb [6] 4.37 Mb [7] 5.46 Mb [8]
[Europe - The Final Countdown] 5:11 4.7Mb [9] 4.9Mb [10] 5.6Mb [11] 7.5Mb [12]

Висновки

Отже, з наведеної вище таблиці можна зробити такий висновок: чим більший бітрейд композиції, тим якість звуку вища і відповідно розмір композиції більший і аналогічно навпаки: чим менший бітрейд, тим якість звуку гірша і розмір композиції менший. 128 kbps мають менший розмір за рахунок видалення високих частот в деяких випадках (>16 kHz). Проте, потрібно враховувати тип музики, яка сжимається (багато високих частот, фокус на ударних інструментах) а також вік слухаючого. При порівнянні представлених композицій я помітив, що при використанні 128 kbps більше чути переходи і місцями музика наче обривається на долю секунди. При прослуховуванні 320 kbps одразу було відчутно, що звук став більш об'ємним, насиченим різними частотами, а також стало можливим почути деякі призвуки і елементи композиції, які не було чутно на динаміках. музика звучить плавніше і майже не помітно "обривів". Для цього експеременту я використовував динаміки та навушники. Порівнюючи компресовані аудіофайли з бітрейтом 128 - 320 kbps та оригінальні файли бітрейт яких склав від 995 kbps до 1059 kbps, можна зробити висноки, що на дешевому обладнанні аудіофайли з бітрейтом від 128 до 192 звучать майже однаково і тільки при 256 і 320 kbps є невелике та малозамітне покращення якості. Що стосується аудіофайлів, бітрейт яких складав від 995 kbps до 1059 kbps, можна сказати, що на звичайних недорогих колонках чи навушниках ці аудіофайли мають добре звучання.