Відмінності між версіями «Стаття до проекту "Штучний інтелект" Дегтярьова Анастасія»

Матеріал з Вікі ЦДПУ
Перейти до: навігація, пошук
Рядок 2: Рядок 2:
  
  
=Тема статті=
+
=Розпізнавання мовлення=
 
[[Файл:Iskusstvennyy-intellekt02.jpg|праворуч|350px]]
 
[[Файл:Iskusstvennyy-intellekt02.jpg|праворуч|350px]]
  
Штучний інтелект – це розділ комп`ютерної лінгвістики та інформатики, що формалізує завдання, які нагадують справи, що виконує людина. Іншими словами, комп’ютер робитиме те, що донедавна виконували ми. Це поняття вів професор Дартмутського коледжу Джон МакКарті в 1956 році. Він цікавився, чи можна навчити машину, як і дитину – абстрактним поняттям, використовувати мову і самостійно вдосконалюватись методом спроб і помилок. Це поняття обговорюють наче це далеке майбутнє. Але насправді ШІ уже увійшов у наше життя.
+
Перший пристрій для розпізнавання усної мови з'явився в 1952 році, він міг розпізнавати вимовлені людиною цифри. [1] В 1964 році на ярмарку комп'ютерних технологій у Нью-Йорку було представлено пристрій IBM Shoebox.
На даний час ми стикаємось зі штучним інтелектом кожного дня. Це голосовий пошук – Siri і Alexa, які доступні на iOs, Android і Windows, відеоігри – персонажі, яких можуть поводитись непередбачувано для живого гравця. Автономні авто – навчають водити машину, точно так як і людину, авто зможе саме аналізувати ситуацію на дорозі і діяти.
+
Комерційні програми з розпізнавання мовлення з'явилися на початку дев'яностих років. Зазвичай їх використовують люди, які через травми рук не в змозі набирати велику кількість тексту. Ці програми (наприклад, Dragon Naturally Speaking, VoiceNavigator) переводять голос користувача в текст, таким чином, розвантажуючи його руки. Надійність перекладу у таких програм не дуже висока, але з роками вона поступово покращується.
 +
Збільшення обчислювальних потужностей мобільних пристроїв дозволило і для них створити програми з функцією розпізнавання усної мови. Серед таких програм варто відзначити Microsoft Voice Command, яка дозволяє працювати з багатьма прикладними програмами за допомогою голосу. Наприклад, можна включити відтворення музики в плеєрі або створити новий документ.
 +
Однак, прогрес не стоїть на місці і останнім часом у телефонних інтерактивних програмах все частіше використовують системи автоматичного розпізнавання і синтезу мовлення. У цьому випадку спілкування з голосовим порталом стає природнішим, оскільки вибір в ньому може бути здійснений не тільки за допомогою тонового набору, але і за допомогою голосових команд. При цьому системи розпізнавання є незалежними від дикторів, тобто розпізнають голос будь-якої людини. Основною перевагою голосових систем є доброзичливість до користувача — він позбавляється від необхідності продиратися крізь складні і заплутані лабіринти голосових меню. Тепер достатньо вимовлення мети дзвінка, після чого голосова система автоматично перемістить абонента в потрібний пункт меню.
 +
Наступним кроком технологій розпізнавання мови можна вважати розвиток так званих Silent Speech Interfaces (SSI) (Інтерфейсів Безмовного/Артикуляторного Доступу). Ці системи обробки мовлення базуються на одержанні й обробці мовних сигналів на ранній стадії артикуляції. Цей етап розвитку розпізнавання мови викликаний двома істотними вадами сучасних систем розпізнавання: надмірна чутливість до шумів, а також необхідність чіткої і ясної вимови при звертанні до системи розпізнавання. Підхід, заснований на SSI, полягає в тому, щоби використовувати нові сенсори, що не піддаються впливу шумів, як доповнення до оброблених акустичних сигналів.
  
  

Версія за 19:52, 15 травня 2019


Розпізнавання мовлення

Iskusstvennyy-intellekt02.jpg

Перший пристрій для розпізнавання усної мови з'явився в 1952 році, він міг розпізнавати вимовлені людиною цифри. [1] В 1964 році на ярмарку комп'ютерних технологій у Нью-Йорку було представлено пристрій IBM Shoebox. Комерційні програми з розпізнавання мовлення з'явилися на початку дев'яностих років. Зазвичай їх використовують люди, які через травми рук не в змозі набирати велику кількість тексту. Ці програми (наприклад, Dragon Naturally Speaking, VoiceNavigator) переводять голос користувача в текст, таким чином, розвантажуючи його руки. Надійність перекладу у таких програм не дуже висока, але з роками вона поступово покращується. Збільшення обчислювальних потужностей мобільних пристроїв дозволило і для них створити програми з функцією розпізнавання усної мови. Серед таких програм варто відзначити Microsoft Voice Command, яка дозволяє працювати з багатьма прикладними програмами за допомогою голосу. Наприклад, можна включити відтворення музики в плеєрі або створити новий документ. Однак, прогрес не стоїть на місці і останнім часом у телефонних інтерактивних програмах все частіше використовують системи автоматичного розпізнавання і синтезу мовлення. У цьому випадку спілкування з голосовим порталом стає природнішим, оскільки вибір в ньому може бути здійснений не тільки за допомогою тонового набору, але і за допомогою голосових команд. При цьому системи розпізнавання є незалежними від дикторів, тобто розпізнають голос будь-якої людини. Основною перевагою голосових систем є доброзичливість до користувача — він позбавляється від необхідності продиратися крізь складні і заплутані лабіринти голосових меню. Тепер достатньо вимовлення мети дзвінка, після чого голосова система автоматично перемістить абонента в потрібний пункт меню. Наступним кроком технологій розпізнавання мови можна вважати розвиток так званих Silent Speech Interfaces (SSI) (Інтерфейсів Безмовного/Артикуляторного Доступу). Ці системи обробки мовлення базуються на одержанні й обробці мовних сигналів на ранній стадії артикуляції. Цей етап розвитку розпізнавання мови викликаний двома істотними вадами сучасних систем розпізнавання: надмірна чутливість до шумів, а також необхідність чіткої і ясної вимови при звертанні до системи розпізнавання. Підхід, заснований на SSI, полягає в тому, щоби використовувати нові сенсори, що не піддаються впливу шумів, як доповнення до оброблених акустичних сигналів.


Опис проблеми

Блог до проекту

Blogger або WordPress

Мультимедійна презентація

Google Диск

Календар подій проекту:

Google Календар ( https://calendar.google.com/calendar?cid=bWl1M2poM3BjZzB1Z2tjOGU5cTh0bmFnaDBAZ3JvdXAuY2FsZW5kYXIuZ29vZ2xlLmNv )

Опитування до проекту

Google Форми ( https://docs.google.com/forms/d/e/1FAIpQLSfQImfk7XBfd6WbBOOb8ydOCmSu_IYmPJJYWRPilBy7XfgYYQ/viewform?usp=sf_link )

Фотоальбом до проекту

Google Фотознімки (посилання на альбом)

Спілкування між учасниками проекту

  • Чат
  • Форум
  • Спільнота на базі соціальних мереж
  • Skype
  • Telegram
  • Viber
  • Wiki-сторінка
  • Сайт
  • .....

Інформаційні ресурси

Друковані джерела

  1. ...
  2. ...
  3. ...

Відеоматеріали

  1. ...
  2. ...
  3. ...

Електронні ресурси

  1. ...
  2. ...
  3. ...


Центральноукраїнський державний педагогічний університет імені Володимира Винниченка