Önceki sorumu takip ederken , var olan herhangi bir konuşma algılama kütüphanesi olup olmadığını merak ediyordum. Konuşma algılama ile bir ses arabelleğine geçmek ve konuşmanın başladığı ve durduğu bir dizini geri almak kastediyorum. 44kHz'de 10 saniyelik ses örneklemem varsa, şöyle bir sayı dizisi beklerim:
44000
88000
123000
190334
...
Bu, örneğin konuşmanın bir saniye içinde başlayıp iki saniye noktasında bittiği anlamına gelir.
Ne ediyorum değil arayan söylenen söz metni dışarı yazıyor konuşma tanıma olduğunu. Ne yazık ki bu 'konuşma algılama' google çok gördüğüm şey.
İPhone için bir uygulama yazarken kütüphanenin C, C ++ veya hatta Objective-C olması harika olurdu.
Teşekkürler!