Çoğu akıllı asistan neden uyandırıcı kelimenin çok az kişiselleştirilmesini sunuyor?


14

Amazon Echo ve Google Home gibi akıllı yardımcı markaların çoğu , uyandırma kelimesi için özelleştirme yolunda çok az şey sunuyor (cihazı uyandırmak için kullandığınız ifade sizi dinliyor).

Örneğin, Alexa yalnızca üç seçenek sunar ve Google Home yalnızca 'Tamam Google'ı destekler . Birçok kullanıcı özel uyandırma sözcükleri fikriyle ilgileniyor gibi görünüyor, ancak büyük markaların hiçbiri destek eklemedi.

Uyanık sözcük özelleştirmesini kısıtlamanın herhangi bir teknik nedeni var mı, yoksa sadece bir marka seçimi mi?

Google'ın marka bilinci oluşturma fikrinin doğru olabileceğini öne süren 'OK Google'ı kullanma motivasyonunu okudum , ancak aynı zamanda uyandırma sözcüğü tanıma çok doğru değil , belki de teknik bir nedeni gösteriyor. Asıl neden hangi faktörün açıklığa kavuştuğunu bilebilir mi?


2
Hatırlanması gereken bir şey, bunun gibi işlemenin çok düşük güçlü, her zaman açık bir alanda yapılması gerektiğidir - daha büyük bazı SoC'larda (özellikle telefonlarda kullanılanlar) bu görev için genellikle özel donanımlar vardır, ve filtre katsayılarının / diğer parametrelerin dikkatlice hesaplandığını ve bu donanıma yüklendiğini varsayıyorum. Hangi SoC Echo'nun çalıştığını unutuyorum, ama benzer bir filtrenin olduğunu hayal ediyorum. Algoritmalar sınıfının adı şu anda beni kaçıyor
Krunal Desai

Yanıtlar:


12

Evet, bunun birkaç nedeni var.

Bu blog yazısı, Yankı ve Alexa'nın uyanık kelimesini açıklıyor . Biraz özetleyeceğim.

Uyandırma sözcüğü tanıma yerel olarak ve gerçek zamanlı olarak yapılır . Bu, açık işlem sınırlamaları nedeniyle uyanık sözcüğün uzunluklarını sınırlar. Ayrıca, kullanıcılar akıllı asistanı etkinleştirmek için bir şiir okumak istemiyorlar. Bu yüzden kısa olmalı.

Arandığında neredeyse% 100 doğrulukla çalışmalı ve istenmediğinde bu kesinlikle tanınmaz . Bu sorun yaratır ve ayrıca uyandırma sözcükleri için minimum bir uzunluk sağlar. Amazon'un Echo'ya izin verme seçimi oldukça şaşırtıcı çünkü sadece iki hece .

Olağan şüphelilere bakarsak Alexa (3 hece), Amazon (3), Yankı (2), Ok Google (4), Hey Cortana (4) ve Hey Siri (3) var. Tüm endüstri devleri neredeyse üçünün iyi bir hece sayısı olduğu konusunda hemfikir.

Garip bir şekilde en çok aranan uyanık kelime "bilgisayar" da üç heceye sahiptir ve bu gereksinimi kolayca karşılar. Ayrıca ticari markalı değildir.

Blogun ve aklın bize söylediği gibi, yanlış pozitiflerden tamamen kaçınmak istiyoruz. Bilgisayar, Siri, Cortana ve Alexa kelimelerinin nasıl kurulduğuna bir göz atalım. Bu, 2008'deki Google kitap grubu.

Ngram bilgisayar alexa ve siri outshines

Tam olarak, Siri ve Alexa neredeyse bilgisayara yaslanıyor ve Cortana bir hata veriyor. Bulunamadı. Şirket, 2008'den beri mantıklı. Bize bilgisayarın neden korkunç bir uyanıklık kelimesi olduğu hakkında daha fazla perspektif vermek için başka bir grafik.

ngram bilgisayar ve diğer kelimeler

Bu Ngram, 2016'nın en popüler iki ABD bebek ismini (para birimi için) ve Tom ve Dave de bilgisayara karşı düz çizgileri gösteriyor . Kraliçe, basketbol ve polis kayıtlarını düzgün yapmayı başarıyor. Her neyse, bu bize Computer, Earl Gray, Hot'un şu ana kadar neden izin verilmediğine dair bir fikir veriyor . İnsanlar bilgisayar kelimesini çok sık kullanıyor.

Yanlış pozitiflerle ilgili bir şey daha. Alexa söyleyecek hiçbir şey olmadan kafiyeli.

Alexa ile kafiyeli 19 şey

Bilgisayar 74 şeyle kafiyeli.


1
... ve bu Scotty'nin bilgisayarı neden uyandırmadığını açıklıyor .
Ghanima

2
"Bir kuşu seks yapacağım ... Hayır sen değilsin Alexa!"
David, Reinstate Monica'nın

1
"OK Google" dört hecedir ("oh kay goo gull"), üç değil ve çok fazla fonemden çok daha fazla.
Monty Harder

1
Alexa çok garip bir isim ... Ben şahsen bu ismi taşıyan biri biliyorum ki biri kuzen. Yankı benim dilimde olduğu gibi kullanılıyor. Telefonda yankı olduğunda sık sık "yankı var" derim. Amazon, benim gibi rol oynayan bir adamın nispeten sık söylediği bir nehrin / eski kabilenin adıdır. Bunu gerçekten berbat ettiler.
Olivier Grégoire

2
"Bilgisayar" kelimesinin neden işe yaramadığına dair bir açıklama aldığımdan emin değilim. Kelimenin kendisi tanınan tek şey değildir. Bir ifadenin ilk kelimesi olmak ve ardından bir duraklama, komut sözcüğünü tanımlayan önemli bilgi parçalarıdır.
Kevin Krumwiede

2

Uyanık sözcük özelleştirmesini kısıtlamanın herhangi bir teknik nedeni var mı

Yardımcı cihaz kullanılmadığında, uygulama işlemcisi (Alexa ve Google Home durumunda ARM sanırım) askıya alınır ve mümkün olan en düşük güç durumuna alınır. Uyanma sözcüğü algılama, ortam gürültüsünü / seslerini dinleyen ve uyandırma sözcüğüyle eşleşme olup olmadığına karar vermek için bir algoritma çalıştıran çok güç verimli DSP'ye bırakılır. Güvenle bir eşleşme bulursa DSP, işlemin geri kalanına başlamak için ARM çekirdeğini uyandırır.

Şimdi hedef güç açısından verimli olmak olduğundan söz konusu DSP algoritmayı çalıştırıyor ve şablon desenini ana yerleşik RAM yerine çip belleğinde saklıyor. Bu, sistemin DDR RAM'i en düşük güç durumuna bile almasını sağlar.

DSP'nin yapacak bazı önemli şeyleri ve çok az çipli belleği olduğu için, Yardımcı uyandırma sözcükleri, algoritma tarafından yüksek derecede güvenle eşleştirilebilecek en seçkin kelimelerle sınırlıdır.

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.