Много от нас, слушане на това обаждане (на английски), те няма да забележат нищо странно: човек, който си резервира среща при фризьора. Проблемът е, че трябва да има нещо странно, тъй като ние го слушаме разговор в реално време между човек и машина.

Разкритието изненада всички, защото за разлика от други области (като разпознаването на хора), алгоритмите за изкуствен интелект винаги са намирали големи граници в разбирането и производството на устния език, дотолкова, че тази област е конфигурирана като истинското предизвикателство на 'изкуствен интелект. В крайна сметка са ни необходими няколко секунди, за да разпознаем истинско телефонно обаждане от едно, направено със записан глас. Или поне до сега.

В документа за представяне на Google Duplex (това е името на технологията) ще забележим много предизвикателства, с които се сблъскват разработчиците (очевидно, решаването им) и че ние, които работим в областта на вербалната комуникация, знаем добре:


  • За разлика от търсенето с Google, гласовата резервация е много повече неточен: съдържа колебания, думи, повтаряни няколко пъти, самокорекции. Следователно една от задачите на машината е да "почисти" сигнала и да извлече информационното съдържание
  • Хората често говорят бързо и когато са по телефона, могат да имат фонов шум. Следователно, друга задача на машината е идентифицират и изолират съобщението
  • Съдържанието може да бъде двусмислен: както в примера, предоставен от страницата на Google, на английски "Ok for 4" може да означава "Ok for 4: oo" или "Ok for 4 people". Следователно задачата на машината е да идентифицира и разграничи тези възможни ситуации
  • Признайте аспектите практичен: понякога машината трябва да реагира с действия на изрични заявки, например "Можете ли да изчакате минута?", "Можете ли да повторите?", "Можете ли да го кажете буква по буква?"

Интересен е фактът, че да изглежда по-естествено, системата трябва да е по-неточна: „момичето“, което прави срещата, използва вмъквания, колебания и преформулировки с единствената цел да изглежда по-естествено.

За щастие за нас, Duplex ще трябва да се идентифицира като робот преди да започнете телефонен разговор с нас.

Фактът остава, че откритията, направени за преодоляване на всички описани по-горе трудности, могат да окажат огромно влияние върху модели на разбиране и езикова продукция.

Започнете да пишете и натиснете Enter, за да търсите

грешка: Съдържанието е защитено !!
Споделено четене