Відмінності між версіями «Обробка зображень лабораторна №5 Козін Іван»

Матеріал з Вікі ЦДУ
Перейти до: навігація, пошук
м
м
 
(не показано 7 проміжних версій цього учасника)
Рядок 1: Рядок 1:
 
=Вивчення представлення звуку=
 
=Вивчення представлення звуку=
[[Файл:sampling.jpg|міні]]
 
 
Для зберігання, обробки та відтворення звуку комп'ютеру необхідно перетворити неперервний сигнал у дискретний. Ця операція називається дискретизацією. Головним її параметром є '''частота дискретизації''', яка визначає кількість сигналів за секунду при перетворенні неперервного сигналу в дискретний. Вимірюється в герцах. Найпопулярніші частоти дискретизації: 44100 Гц (покриває весь діапазон приблизного середнього людського слуху, від 20 Гц до 22 КГц) та 48000 Гц. Із цим параметром пов'язаний ще один термнін — частота Найквіста, що дорівнює половині частоти дискретизації та визначає максимальну частоту цифрового сигналу (виходячи за цей поріг може виникнути деформація сигналу).<br />
 
Для зберігання, обробки та відтворення звуку комп'ютеру необхідно перетворити неперервний сигнал у дискретний. Ця операція називається дискретизацією. Головним її параметром є '''частота дискретизації''', яка визначає кількість сигналів за секунду при перетворенні неперервного сигналу в дискретний. Вимірюється в герцах. Найпопулярніші частоти дискретизації: 44100 Гц (покриває весь діапазон приблизного середнього людського слуху, від 20 Гц до 22 КГц) та 48000 Гц. Із цим параметром пов'язаний ще один термнін — частота Найквіста, що дорівнює половині частоти дискретизації та визначає максимальну частоту цифрового сигналу (виходячи за цей поріг може виникнути деформація сигналу).<br />
  
[[Файл:bit_depth.jpg|міні]]
 
 
Цифрові формати збереження аудіо-даних, що використовують PCM (імпульсно-кодову модуляцію) мають ще однин важливий параметр — '''розрядність''' (bit depth), який визначає ширину діапазону можливих значень кожного семпла аудіо-файлу, а саме кількість бітів, що його визначають. Більша глибина, звичайно, збільшує розмір файлу, але є показником більшого доступного динамічного діапазону. Параметр, що визначає кількість біт, яка передається на одиницю часу називається '''бітрейтом''' (bitrate) і буває статичним (CBR), “плаваючим” (VBR), або усереденим (ABR)<br />
 
Цифрові формати збереження аудіо-даних, що використовують PCM (імпульсно-кодову модуляцію) мають ще однин важливий параметр — '''розрядність''' (bit depth), який визначає ширину діапазону можливих значень кожного семпла аудіо-файлу, а саме кількість бітів, що його визначають. Більша глибина, звичайно, збільшує розмір файлу, але є показником більшого доступного динамічного діапазону. Параметр, що визначає кількість біт, яка передається на одиницю часу називається '''бітрейтом''' (bitrate) і буває статичним (CBR), “плаваючим” (VBR), або усереденим (ABR)<br />
  
Рядок 23: Рядок 21:
 
{| class="wikitable" width="100%"
 
{| class="wikitable" width="100%"
 
|-
 
|-
!  Author - Title - Length!!WAV (2822)!!MP3 (320)!!MP3 (256)!!MP3 (128)!!Spectrogram
+
!  Author - Title (Length)!!original!!128kbps!!256 kbps!!320 kbps
 
|-
 
|-
| IAMX - No Maker Made Me - 03:59||[https://drive.google.com/open?id=0B3bFpDCUergaam00N3VFUFphU2c wav] 80.7 MB||[https://drive.google.com/open?id=0B3bFpDCUergacE9jX19Pc2k3QkU 320] 9.16 MB||[https://drive.google.com/open?id=0B3bFpDCUergabmJsQ3pjLTduVDQ 256] 7.32 MB||[https://drive.google.com/open?id=0B3bFpDCUergaaVVySTY3UktnbEU 128] 3.66 MB||[https://drive.google.com/open?id=0B3bFpDCUergaSEZ3OEwxZU5YWDQ GIF]
+
| Scarlxrd - NX PRESSURE. (02:33)||[https://drive.google.com/open?id=1BkGX-_qwmy2HJm2XHnIJzhSZlMAehGrS original] 56 MB||[https://drive.google.com/open?id=1s6-EUTKHRD5YPgPpGkiTAYYEFG6pxCBS low quality] 2.33 MB||[https://drive.google.com/open?id=1z08BQErZJ7Kn3AflvPEYS7Cz2mVbsKKA medium quality] 4.67 MB||[https://drive.google.com/open?id=1ov1A7rgU1ta7iFTVXitlQLlYorQP886N high quality] 5.84 MB
 
|-
 
|-
| 65daysofstatic - Retreat! Retreat! - 04:09||[https://drive.google.com/open?id=0B3bFpDCUergabk9Tb2R3RWItNVk wav] 84.1 MB||[https://drive.google.com/open?id=0B3bFpDCUergaTFVVLWpsRE5RNTg 320] 9.53 MB||[https://drive.google.com/open?id=0B3bFpDCUergaaHgtQTZMdHZXLVk 256] 7.63 MB||[https://drive.google.com/open?id=0B3bFpDCUergaT2Y2NjYyeEdrNmM 128] 3.81 MB||[https://drive.google.com/open?id=0B3bFpDCUergaS1FoM2VDTUZlcWM GIF]
+
| Seether - Same Damn Life (03:19)||[https://drive.google.com/open?id=1nl1HLPsLUZOt7ncIyxUwq4A3945exF-v original] 73.1 MB||[https://drive.google.com/open?id=1X-bz51whEzRvZ3PCSjZkdrUSDoUTUW3X low quality] 3.04 MB||[https://drive.google.com/open?id=1uMHla8jj6OxmOF8OsT9UX1ziN6Bp74xg medium quality] 6.09 MB||[https://drive.google.com/open?id=10TqMHGTIDkHSm_eDYI4uSpH3dfDp5V20 high quality] 6.09 MB
 
|-
 
|-
| Xploding Plastix - Funnybones & Lazylegs - 04:48||[https://drive.google.com/open?id=0B3bFpDCUergaTk93c1p2ckJYd2M wav] 97.0 MB||[https://drive.google.com/open?id=0B3bFpDCUergacGFxLTluWDdoOVU 320] 11.0 MB||[https://drive.google.com/open?id=0B3bFpDCUergaNjZVT2FicTRVVHc 256] 8.80 MB||[https://drive.google.com/open?id=0B3bFpDCUergaSG51Q0dsc1hmc3M 128] 4.40 MB||[https://drive.google.com/open?id=0B3bFpDCUergaMDJIMEFYS09TUTA GIF]
+
| Fat Nick & Shakewell - Pemex (02:36)||[https://drive.google.com/open?id=1x46BXANfl4kh6mlEKPmZr1yogcwZeQ4S original] 57.2 MB ||[https://drive.google.com/open?id=1rfBgerwz_U8tZIxHT18iNB0V-WeyrDYE low quality] 2.38 MB||[https://drive.google.com/open?id=1MLoQZUAnGFWwqFCYWjTeuagYFD_rTg66 medium quality] 4.76 MB||[https://drive.google.com/open?id=15d8ANt6z6ZK_2sn7ck6gwi2pGH68OGdA high quality] 7.62 MB
 
|}
 
|}
  
==Результати порівняння==
 
У порівнянні між нестисненим та стисненим (320 кбіт/с) форматами не було помічено суттєвих відмінностей. Між двома варіантами  стиснених форматів (320 проти 256 кбіт/с) на деяких ділянках відчувалась різниця частотного діапазону. Найгірша в даному порівняні якість стисненого формату (128 кбіт/с) дає можливість не тільки відчути різницю у частотному спектрі, а також помітити спотворення сигналу на граничних для цього бітрейту частотах.
 
 
==Порівняння якості звуку==
 
==Порівняння якості звуку==
 
128 kbps мають менший розмір за рахунок видалення високих частот в деяких випадках (>16 kHz). Проте, потрібно враховувати тип музики, яка сжимається (багато високих частот, фокус на ударних інструментах) а також вік слухаючого.<br />
 
128 kbps мають менший розмір за рахунок видалення високих частот в деяких випадках (>16 kHz). Проте, потрібно враховувати тип музики, яка сжимається (багато високих частот, фокус на ударних інструментах) а також вік слухаючого.<br />
 
При порівнянні представлених композицій я помітив, що при використанні 128 kbps більше чути переходи і місцями музика наче обривається на долю секунди. При прослуховуванні 320 kbps музика звучить плавніше і майже не помітно "обривів".<br />
 
При порівнянні представлених композицій я помітив, що при використанні 128 kbps більше чути переходи і місцями музика наче обривається на долю секунди. При прослуховуванні 320 kbps музика звучить плавніше і майже не помітно "обривів".<br />
 
Але якщо потрібно визначити різницю між 128, 256 та 320 kbps, то треба використовувати спеціальне обладнання.
 
Але якщо потрібно визначити різницю між 128, 256 та 320 kbps, то треба використовувати спеціальне обладнання.

Поточна версія на 16:03, 14 травня 2019

Вивчення представлення звуку

Для зберігання, обробки та відтворення звуку комп'ютеру необхідно перетворити неперервний сигнал у дискретний. Ця операція називається дискретизацією. Головним її параметром є частота дискретизації, яка визначає кількість сигналів за секунду при перетворенні неперервного сигналу в дискретний. Вимірюється в герцах. Найпопулярніші частоти дискретизації: 44100 Гц (покриває весь діапазон приблизного середнього людського слуху, від 20 Гц до 22 КГц) та 48000 Гц. Із цим параметром пов'язаний ще один термнін — частота Найквіста, що дорівнює половині частоти дискретизації та визначає максимальну частоту цифрового сигналу (виходячи за цей поріг може виникнути деформація сигналу).

Цифрові формати збереження аудіо-даних, що використовують PCM (імпульсно-кодову модуляцію) мають ще однин важливий параметр — розрядність (bit depth), який визначає ширину діапазону можливих значень кожного семпла аудіо-файлу, а саме кількість бітів, що його визначають. Більша глибина, звичайно, збільшує розмір файлу, але є показником більшого доступного динамічного діапазону. Параметр, що визначає кількість біт, яка передається на одиницю часу називається бітрейтом (bitrate) і буває статичним (CBR), “плаваючим” (VBR), або усереденим (ABR)

Формати для зберігання звуку поділяються на три основних класи: нестисненні формати (можуть мати найбільший розмір у порівнянні із стисненними, але є найбільш подібними до оригінального звуку при записі), стисненні без втрат (lossless, полягають у можливості відтворення нестисненного сигналу без спотворень), стисенні із втратами (lossy, унеможливлюють відтворення оригінального сигналу внаслідок специіальних алгоритмів стиснення, але, зазвичай, мають найменший розмір).

Формати без стиснення

  • CD-Audio (Compact Disc Digital Audio) — частота дискретизації 44.1 КГц, розрядність 16 біт, двоканальний.
  • WAV (Waveform Audio Format) — можлива частота дискретизації 11.025 - 192.0 КГц, можлива розрядність 8 - 32 біт, число каналів від одного до шести.
  • AIFF (Audio Interchange File Format) — можлива частота дискретизації 11.025 - 192.0 КГц, можлива розрядність 8 - 32 біт, число каналів від одного до шести. Використовується переважно із продукцією Apple.

Формати із стисненням без втрат

  • FLAC (Free Lossless Audio Codec ) — частота дискретизації 1Гц - 655.350 КГц, можлива розрядність 4 - 32, число каналів від одного до восьми, відкритий та багатоплатформний.
  • APE (Monkey's Audio) — частота дискретизації 8 - 96 КГц, можлива розрядність 16, або 24, двоканальний, відкритий.
  • ALAC (Apple Lossless Audio Codec) — частота дискретизації 44.1 - 192 КГц, можлива розрядність 16, або 24, підтримка до шести каналів. Основне призначення формату в сумісністності із сервісами Apple, які не підтримуюсь FLAC.

Формати із стисненням з втратами

  • MP3 (MPEG-1 Audio Layer 3) — частота дискретизації до 48 КГц, розрядність 16 бітна, двоканальний, бітрейт обмежений діапазоном 8 — 320 кбіт/c.
  • OGG (Ogg Vorbis) — частота дискретизації до 192 КГц, розрядність до 32 біт, число каналів до 255, багатоплатформений та більш гнучкий в налаштуванні.
  • AAC (Advanced Audio Coding) — частота дискретизації до 192 КГц, число каналів до 48, на останій час є менш популярним форматом у порівнянні із mp3 та ogg.
Author - Title (Length) original 128kbps 256 kbps 320 kbps
Scarlxrd - NX PRESSURE. (02:33) original 56 MB low quality 2.33 MB medium quality 4.67 MB high quality 5.84 MB
Seether - Same Damn Life (03:19) original 73.1 MB low quality 3.04 MB medium quality 6.09 MB high quality 6.09 MB
Fat Nick & Shakewell - Pemex (02:36) original 57.2 MB low quality 2.38 MB medium quality 4.76 MB high quality 7.62 MB

Порівняння якості звуку

128 kbps мають менший розмір за рахунок видалення високих частот в деяких випадках (>16 kHz). Проте, потрібно враховувати тип музики, яка сжимається (багато високих частот, фокус на ударних інструментах) а також вік слухаючого.
При порівнянні представлених композицій я помітив, що при використанні 128 kbps більше чути переходи і місцями музика наче обривається на долю секунди. При прослуховуванні 320 kbps музика звучить плавніше і майже не помітно "обривів".
Але якщо потрібно визначити різницю між 128, 256 та 320 kbps, то треба використовувати спеціальне обладнання.