Коріонов Дмитро ЛР 5

Матеріал з Вікі ЦДПУ
Перейти до: навігація, пошук

Вивчення представлення звуку

Для зберігання, обробки та відтворення звуку комп'ютеру необхідно перетворити неперервний сигнал у дискретний. Ця операція називається дискретизацією. Головним її параметром є частота дискретизації, яка визначає кількість сигналів за секунду при перетворенні неперервного сигналу в дискретний. Вимірюється в герцах. Найпопулярніші частоти дискретизації: 44100 Гц (покриває весь діапазон приблизного середнього людського слуху, від 20 Гц до 22 КГц) та 48000 Гц. Із цим параметром пов'язаний ще один термнін — частота Найквіста, що дорівнює половині частоти дискретизації та визначає максимальну частоту цифрового сигналу (виходячи за цей поріг може виникнути деформація сигналу).

Цифрові формати збереження аудіо-даних, що використовують PCM (імпульсно-кодову модуляцію) мають ще однин важливий параметр — розрядність (bit depth), який визначає ширину діапазону можливих значень кожного семпла аудіо-файлу, а саме кількість бітів, що його визначають. Більша глибина, звичайно, збільшує розмір файлу, але є показником більшого доступного динамічного діапазону. Параметр, що визначає кількість біт, яка передається на одиницю часу називається бітрейтом (bitrate) і буває статичним (CBR), “плаваючим” (VBR), або усереденим (ABR)

Формати для зберігання звуку поділяються на три основних класи: нестисненні формати (можуть мати найбільший розмір у порівнянні із стисненними, але є найбільш подібними до оригінального звуку при записі), стисненні без втрат (lossless, полягають у можливості відтворення нестисненного сигналу без спотворень), стисенні із втратами (lossy, унеможливлюють відтворення оригінального сигналу внаслідок специіальних алгоритмів стиснення, але, зазвичай, мають найменший розмір).

Формати без стиснення

  • CD-Audio (Compact Disc Digital Audio) — частота дискретизації 44.1 КГц, розрядність 16 біт, двоканальний.
  • WAV (Waveform Audio Format) — можлива частота дискретизації 11.025 - 192.0 КГц, можлива розрядність 8 - 32 біт, число каналів від одного до шести.
  • AIFF (Audio Interchange File Format) — можлива частота дискретизації 11.025 - 192.0 КГц, можлива розрядність 8 - 32 біт, число каналів від одного до шести. Використовується переважно із продукцією Apple.

Формати із стисненням без втрат

  • FLAC (Free Lossless Audio Codec ) — частота дискретизації 1Гц - 655.350 КГц, можлива розрядність 4 - 32, число каналів від одного до восьми, відкритий та багатоплатформний.
  • APE (Monkey's Audio) — частота дискретизації 8 - 96 КГц, можлива розрядність 16, або 24, двоканальний, відкритий.
  • ALAC (Apple Lossless Audio Codec) — частота дискретизації 44.1 - 192 КГц, можлива розрядність 16, або 24, підтримка до шести каналів. Основне призначення формату в сумісністності із сервісами Apple, які не підтримуюсь FLAC.

Формати із стисненням з втратами

  • MP3 (MPEG-1 Audio Layer 3) — частота дискретизації до 48 КГц, розрядність 16 бітна, двоканальний, бітрейт обмежений діапазоном 8 — 320 кбіт/c.
  • OGG (Ogg Vorbis) — частота дискретизації до 192 КГц, розрядність до 32 біт, число каналів до 255, багатоплатформений та більш гнучкий в налаштуванні.
  • AAC (Advanced Audio Coding) — частота дискретизації до 192 КГц, число каналів до 48, на останій час є менш популярним форматом у порівнянні із mp3 та ogg.
Author - Title (Length) original 128kbps 256 kbps 320 kbps
Killy - no bad no sad. (02:12) origin 5.01 MB low quality 2.01 MB medium quality 3.01 MB high quality 5.01 MB
Xxxtentacion - look at me (2:06) original 4.82 MB low quality 1.93 MB medium quality 2.89 MB high quality 4.83 MB
Nirvana - Smells like teen spirit (5:01) original 11.7 MB low quality 4.60 MB medium quality 6.90 MB high quality 11.4 MB

Порівняння

Після порівняння якості звуку в конвертованих композиціях не значну різницю вдалося почути лише між 128 та 320. В файлі з з бітрейтом 128 можна почути шуми,це пояснюється тим, що при компресуванні втрачається чіткість на високих та низьких частотах. Між 220 та 320 різниця майже не відчувається, проте все залежить від обладнання на якому проводиться прослуховування композицій. Під час компресування змінюється також і розмір файлів, це відбуваеться через видалення високих частот