Стаття до проекту "Штучний інтелект" Дегтярьова Анастасія

Матеріал з Вікі ЦДПУ
Перейти до: навігація, пошук


Розпізнавання мовлення

Iskusstvennyy-intellekt02.jpg

Перший пристрій для розпізнавання усної мови з'явився в 1952 році, він міг розпізнавати вимовлені людиною цифри. В 1964 році на ярмарку комп'ютерних технологій у Нью-Йорку було представлено пристрій IBM Shoebox. Комерційні програми з розпізнавання мовлення з'явилися на початку дев'яностих років. Зазвичай їх використовують люди, які через травми рук не в змозі набирати велику кількість тексту. Ці програми (наприклад, Dragon Naturally Speaking, VoiceNavigator) переводять голос користувача в текст, таким чином, розвантажуючи його руки. Надійність перекладу у таких програм не дуже висока, але з роками вона поступово покращується. Збільшення обчислювальних потужностей мобільних пристроїв дозволило і для них створити програми з функцією розпізнавання усної мови. Серед таких програм варто відзначити Microsoft Voice Command, яка дозволяє працювати з багатьма прикладними програмами за допомогою голосу. Наприклад, можна включити відтворення музики в плеєрі або створити новий документ. Однак, прогрес не стоїть на місці і останнім часом у телефонних інтерактивних програмах все частіше використовують системи автоматичного розпізнавання і синтезу мовлення. У цьому випадку спілкування з голосовим порталом стає природнішим, оскільки вибір в ньому може бути здійснений не тільки за допомогою тонового набору, але і за допомогою голосових команд. При цьому системи розпізнавання є незалежними від дикторів, тобто розпізнають голос будь-якої людини. Основною перевагою голосових систем є доброзичливість до користувача — він позбавляється від необхідності продиратися крізь складні і заплутані лабіринти голосових меню. Тепер достатньо вимовлення мети дзвінка, після чого голосова система автоматично перемістить абонента в потрібний пункт меню. Наступним кроком технологій розпізнавання мови можна вважати розвиток так званих Silent Speech Interfaces (SSI) (Інтерфейсів Безмовного/Артикуляторного Доступу). Ці системи обробки мовлення базуються на одержанні й обробці мовних сигналів на ранній стадії артикуляції. Цей етап розвитку розпізнавання мови викликаний двома істотними вадами сучасних систем розпізнавання: надмірна чутливість до шумів, а також необхідність чіткої і ясної вимови при звертанні до системи розпізнавання. Підхід, заснований на SSI, полягає в тому, щоби використовувати нові сенсори, що не піддаються впливу шумів, як доповнення до оброблених акустичних сигналів.


Опис проблеми

Блог до проекту

Блог (https://htuchnejintelect.blogspot.com)

Мультимедійна презентація

Презентація (https://drive.google.com/open?id=15cMpU2erY-sloEJ1atmXLXUi0yLcaOfTHwQJ2c3NnbA)

Календар подій проекту:

Google Календар ( https://calendar.google.com/calendar?cid=bWl1M2poM3BjZzB1Z2tjOGU5cTh0bmFnaDBAZ3JvdXAuY2FsZW5kYXIuZ29vZ2xlLmNv )

Опитування до проекту

Google Форми ( https://docs.google.com/forms/d/e/1FAIpQLSfQImfk7XBfd6WbBOOb8ydOCmSu_IYmPJJYWRPilBy7XfgYYQ/viewform?usp=sf_link )

Фотоальбом до проекту

Google Фотознімки (https://photos.google.com/album/AF1QipMd7XLK05Vhpl5YVS8nkgODttLwLI9_S-J8a-Cm)

Спілкування між учасниками проекту

  • Чат
  • Форум
  • Спільнота на базі соціальних мереж
  • Skype
  • Telegram
  • Viber
  • Wiki-сторінка
  • Сайт
  • .....

Інформаційні ресурси

Друковані джерела

  1. Программы распознавания речи. ITCua. 28 грудня 2004.
  2. ...
  3. ...

Відеоматеріали

  1. ...
  2. ...
  3. ...

Електронні ресурси

  1. [1]
  2. ...


(http://kspu.kr.ua/ Центральноукраїнський державний педагогічний університет імені Володимира Винниченка)