Aşağıda konuşan birinin kaydını gösteren bir sinyal var. Buna dayanarak bir dizi daha küçük ses sinyali oluşturmak istiyorum. 'Önemli' sesin ne zaman başladığını ve bittiğini saptamak ve yeni ses parçacığını yapmak için bunları işaretçiler için kullanmak fikri. Başka bir deyişle, sessizliği bir ses chunk'unun ne zaman başladığına veya durduğuna ve buna dayanarak yeni ses tamponları oluşturduğuna dair göstergeler olarak kullanmak istiyorum.
Mesela, eğer bir kişi kendini söyleyerek kaydederse
Hi [some silence] My name is Bob [some silence] How are you?
bundan sonra üç ses klibi yapmak istiyorum. Biri diyor Hi
, biri diyor My name is Bob
diğeri diyor How are you?
.
Benim ilk fikrim, düşük genlikli alanların nerede olduğunu kontrol etmek için sürekli olarak ses tamponundan geçmek. Belki bunu ilk on örneği alarak yapabilirim, değerleri ortaladım ve sonuç düşükse o zaman sessiz olarak etiketleyin. Sonraki on örneği kontrol ederek arabellek aşağı ilerlerdim. Bu şekilde artarak zarfların nerede başladığını ve nerede durduğunu tespit edebildim.
Herhangi birisinin iyi, ancak basit bir şekilde yapması için herhangi bir tavsiyesi varsa, bu harika olurdu. Benim amacıyla çözüm olabilir oldukça ilkel olması.
DSP'de profesyonel değilim, ancak bazı temel kavramları anlıyorum. Ayrıca, bunu programlı olarak yapıyor olurdum, böylece algoritmalar ve dijital örnekler hakkında konuşmak en iyisi olacaktı.
Tüm yardımların için teşekkürler!
1 EDIT
Şimdiye kadar büyük tepkiler! Bunun canlı yayında olmadığını açıklamak istedim ve algoritmaları kendim C veya Objective-C olarak yazacağım, böylece kütüphaneleri kullanan herhangi bir çözüm gerçekten bir seçenek olamaz.