Alexa, Siri a Google nerozumí Slovu, které říkáš

Amazonka

Asistenti hlasu, jako jsou Alexa, Asistent Google a Siri, prošli v posledních letech dlouhou cestou. Ale kvůli všem jejich vylepšením je jedna věc zadržuje: Nerozumějí vám. Spolehlivě spoléhají na konkrétní hlasové příkazy.

Rozpoznávání řeči je jen kouzelný trik

Amazonka

Hlasové asistenti tě nerozumějí. Ani ne. Když mluvíte s Google Home nebo Amazon Echo, v podstatě převádí vaše slova na textový řetězec a porovnává to s očekávanými příkazy. Pokud zjistí přesnou shodu, pak následuje řada instrukcí. Pokud tomu tak není, hledá alternativu toho, co má dělat na základě informací, které má, a pokud to nefunguje, dostanete chybovou zprávu, jako je "Je mi líto, ale nevím to "Je to jen málo víc než jen trochu ruční kouzla, která vás dovedla k tomu, abyste si mysleli, že to rozumí.

Nemůže používat kontextové stopy k tomu, aby co nejlépe odhadl, nebo dokonce chápal podobná témata pro informování svých rozhodnutí. Není také těžké zastavit hlasové asistenty. Zatímco se můžete zeptat Alexy "Pracujete pro NSA?" A dostanete odpověď, pokud se zeptáte "Jste tajně součástí NSA?" Dostanete odpověď "Nevím, že jedna" (alespoň na čas tohoto psaní).

Lidé, kteří skutečně rozumí řeči, nefungují takhle. Předpokládejme, že se zeptáte člověka: "Co je to klarvain na obloze? Ten, který je klenutý a plný pruhovaných barev, jako je červená, oranžová, žlutá a modrá. "I přes to, že klarvain je napsané slovo, osoba, kterou jste se zeptala, by pravděpodobně mohla vyvodit z kontextu, že popisujete duhu.

Zatímco byste mohli tvrdit, že člověk přeměňuje řeč na myšlenky, člověk může použít znalosti a porozumění k tomu, aby uzavřel odpověď. Pokud se zeptáte člověka, pokud tajně pracuje pro NSA, dá vám odpověď ano nebo ne, i když je tato odpověď lžou. Člověk by neřekl "tohle já nevím", na takovou otázku. To, že lidé mohou lhát, je něco, co přichází s opravdovým porozuměním.

Hlasové asistenti nemohou jít za programováním

Hlasové asistenty jsou nakonec omezeny na naprogramované očekávané parametry a bloudění mimo ně přeruší proces. Tento fakt ukazuje, kdy se zařízení třetích stran hrají. Obvykle je příkaz k interakci s těmito velice těžkopádnými, což znamená, "řekni výrobci zařízení, aby nařídil volitelný argument." Přesný příklad by byl: "Řekni Whirlpoolu, aby zastavil sušičku." Pro ještě těžší zapamatovatelný příklad, Geneva Alexa dovednosti řídí některé pece GE. Uživatel této dovednosti si musí pamatovat, že "řekne Ženevě", ne "řekne GE", pak zbytek příkazu. A když můžete požádat o předehřátí trouby na 350 stupňů, nemůžete pokračovat s žádostí o zvýšení teploty o dalších 50 stupňů. Člověk by však mohl tyto požadavky řídit.

Amazon a Google velmi tvrdě pracovali na překonání těchto překážek a ukazuje to. Tam, kde jste museli sledovat výše uvedený postup, abyste mohli ovládat inteligentní zámek, můžete nyní namísto toho zadat "zamknout přední dveře". Alexa bývala zmatená slovy "řekni mi vtip na psa", ale dneska o něho požádejte a bude to fungovat. Přidali k příkazům, které používáte, varianty, ale nakonec je třeba znát správný příkaz. Musíte použít správnou syntaxi ve správném pořadí.

A pokud si myslíte, že to zní hodně jako příkazový řádek, nejste špatně.

Hlasové asistenti jsou poměrné příkazové řádky

Příkazový řádek je úzce definován pro provádění jednoduchých úkolů, ale pouze pokud znáte správnou syntaxi. Pokud vyklouznete z této správné syntaxe a zadejte dyr namísto adresáře, příkazový řádek vám poskytne chybovou zprávu. Můžete použít aliasy pro snadnější zapamatování příkazů, ale potřebujete představu o tom, jaké byly původní příkazy, jak fungují a jak efektivně využívat aliasy. Pokud nebudete mít čas na to, abyste se dozvěděli, jak se dostat do příkazové řádky, nebudete z toho nikdy moc.

Hlasové asistenti se neliší. Potřebujete vědět správný způsob, jak říct příkaz nebo položit otázku. A potřebujete vědět, jak nastavit skupiny pro Google a Alexa, proč seskupení vašich zařízení je zásadní a jak pojmenovat vaše inteligentní zařízení. Pokud nebudete postupovat podle těchto kroků, pocítíte frustraci, že byste požádali svého hlasového asistenta o vypnutí studie pouze na dotaz, "která studie" by měla být vypnuta.

Dokonce i když použijete správnou syntaxi ve správném pořadí, proces může selhat. Buď s nesprávnou odpovědí nebo s překvapivým výsledkem. Dvě domovy Google ve stejném domě mohou dát počasí trochu jiným místům, přestože mají přístup ke stejným informacím o uživatelských účtech a k připojení k internetu.

Ve výše uvedeném příkladu je uveden příkaz "Nastavit časovač na půl hodiny". Domovský rozbočovač Google vytvořil časovač s názvem "Hodina" a poté se zeptal, jak dlouho má být časovač. A přesto opakovat stejný příkaz třikrát jinak pracoval správně a vytvořil 30 minutový časovač. Použití příkazu "Nastavit časovač po dobu 30 minut" pracuje správně na konzistentnějším základě.

Zatímco mluvit s domácím nebo Echo Google může být více tekuté, pod hlasy asistentů hlasu a příkazové řádky pracují stejným způsobem. Možná nebudete muset naučit nový jazyk, ale musíte se naučit nový dialekt.

Úzké porozumění hlasovým asistentům omezí růst

Nic z toho zabraňuje, aby asistenti hlasu, například Asistent Google a Alexa, pracovali dostatečně dobře (ačkoli Cortana je jiný příběh). Asistent Google a Alexa a vyhledáváte online otázky slušně, i když není překvapivé, že Google je lepší při hledání a může odpovědět na základní otázky, jako jsou konverze měření a jednoduché matematické údaje. Se správným nastavením chytrého domova a dobře vyškoleného uživatele budou většina inteligentních domovských příkazů pracovat podle očekávání. Ale to přišlo přes práci a úsilí, ne intelektuální porozumění.

Časovače a alarmy byly zjednodušující. Časem bylo přidáno pojmenování, pak možnost přidat čas do časovače. Přešli od zjednodušujícího ke složitějšímu. Hlasové asistenti mohou odpovědět na další otázky a každý den přináší nové dovednosti a funkce. Ale to není produkt sebe-růstu, který pochází z učení a porozumění.

A žádný z nich neposkytuje inherentní schopnost používat to, o čem je známo, že dosáhne neznámého. Pro každý příkaz a otázku, která funguje, budou vždy tři, které ne. Bez průlomu v A.I. který poskytuje lidskou schopnost porozumění, Hlasové asistenti nejsou asistenti vůbec. Jsou to jen hlasové příkazové řádky - užitečné v pravém scénáři, ale omezené na ty scénáře, které byly naprogramovány tak, aby je pochopily.

Jinými slovy: stroje se učí věci, ale nerozumí jim.