Yanıtlar:
Azalan popülerliğin sırası :
diyelim ki GNUstep konuşma motorunu kullanarak metni sesli konuşmaya dönüştürür.
sudo apt-get install gnustep-gui-runtime
say "hello"
festival Genel çok dilli konuşma sentez sistemi.
sudo apt-get install festival
echo "hello" | festival --tts
spd-say , konuşma dağıtıcısına metinden konuşmaya çıktı isteği gönderir
sudo apt-get install speech-dispatcher
spd-say "hello"
espeak , çok dilli bir yazılım konuşma sentezleyicisidir.
sudo apt-get install espeak
espeak "hello"
spd-say
14.04 önceden yüklenmiş ve daha sonra gereken görünür: releases.ubuntu.com/trusty/...
sudo pip install gTTS
, (Google Text to Speech / github.com/pndurette/gTTS ) o gtts-cli "hello" -o hello.mp3
zaman da onu yayınlayabilirsinizmpg123 -
. gtts-cli "why, hello there" | mpg123 -
.
spd-say
aynı anda tts oynayabiliyor gibi görünmüyor, sadece bir seferde
espeak
/ spd-say
memler için en iyisidir (diğerleri "meme" kelimesini doğru telaffuz edemezler). En iyi söyleyebilirim arka uç olarak spd-say
kullanır espeak
(sesler aynı geliyor).
espeak
güzel bir küçük araçtır.
Komut satırında onunla oynamayı seviyorum. Pulseaudio ile çakışmış bulabilirsin, bu yüzden düzgün kurması gerekmeyen uzun soluklu bir sürüm kullanıyorum.
sudo apt-get install espeak
espeak --stdout "this is a test" | paplay
espeak --help
size okuma hızını, ses tonunu, sesi vb. ayarlama seçeneklerini gösterecek.
Notlarınızı yaparken, bunları bir metin dosyası olarak kaydedin ve ardından:
echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"
Daha sonra PCM'den MP3 veya OGG gibi daha yönetilebilir bir şeye sıkıştırmak için ffmeg et al ile uğraşabilirsiniz. Ama bu farklı bir hikaye.
Kimden man spd-say
:
ADI spd-say - konuşma dağıtıcısına metinden konuşmaya çıktı isteği gönder ÖZET spd-say [seçenekler] "bazı metinler" AÇIKLAMA spd-say, konuşmayı yürüten işlemciye, onu işleyen ve sonucu en iyi şekilde çıkaran konuşma dağıtıcı işlemine gönderir ses sistemine. SEÇENEKLER -r, --rate Konuşma hızını ayarlayın (-100 ile +100 arasında, varsayılan: 0) -p, --pitch Konuşma perdesini ayarlayın (-100 ile +100 arasında, varsayılan: 0) -i, - hacim Konuşmanın ses seviyesini (yoğunluğunu) ayarlayın (-100 ile +100 arasında, varsayılan: 0)
Böylece aşağıdaki komutu uygulayarak metni konuşmaya alabilirsiniz:
spd-say "<type text>"
Ör:
spd-say "Welcome to Ubuntu Linux"
Ayrıca edebilirsiniz konuşma hızını, eğim, hacim vb set insan sayfasına bakın.
spd-say -t female2 "text"
Mbrola 11.10'dan beri çalışmıyor.
SVOX (pico) araçlarının kurulumu kolaydır, kullanımı kolaydır ve Ubuntu'da kaliteli sesler sunar. Yükle:
sudo apt-get install libttspico0 libttspico-utils libttspico-data
Daha da kolay, LibreOffice'i "Metin Okuma" eklentisini yükleyerek SVOX (pico) araçlarıyla birlikte kullanabilir ve bu mükemmel TTS yazılımı için bir "GUI" alabilirsiniz:
Okuma Metin Uzantısı seçeneklerini Araçlar - Eklentiler - Okuma seçimi ile ayarlayın .... Harici program olarak / usr / bin / python kullanın. Belirteci içeren bir komut satırı seçeneği seçin (PICO_READ_TEXT_PY).
Python Google Konuşma:
pip install google_speech
google_speech "Test the hello world"
Android'den Svox:
apt-get install svox-pico
pico2wave --wave=test.wav "Test the hello world"
play test.wav
Svox Nanotts:
git clone https://github.com/gmn/nanotts.git
cd nanotts
make
./nanotts -v en-US "Test the hello world"
Bağlantılar - Wiki:
google_speech
ubuntu 18.04 yüklemem gerekiyordu üzerinde python3-pip
ve libsox-fmt-mp3
ve kullanımı pip3 install google_speech
.
Aşağıdaki bir FLOSS çözümü değildir, ancak buna değer bulabilirsiniz. (bu bir şarap çözümüdür),
Şahsen TTS'ye çok düşkünüm, sıkça kullanıyorum ... örn. Asla başkalarına sadık kalmayacağım rahatsız edici bir söylem dinlerken (çünkü başka bir kahve almam lazım ... :)
Yol boyunca keşfettiğim birkaç şey .. ya da söylemeliyim, yol boyunca keşfetmediğim şeyler ... Açıkça söylemek gerekirse: Denediğim her FOSS TTS ses yazılımı parçası bu yüzden herhangi bir yarı-uzun süreli dinleme için uygun değil ...
Şu anda ATnT's NaturalVoices kullanıyorum. Sadece Windows için kullanılabilir (belki Mac için), ancak wine
Ubuntu'da çalışmaktadır .. (küçük bir glikası vardır, bazen okuyucudan uzaklaştığımda panele tıklamam gerekir) NatualVoices'ın konuşma kalitesi ile kazanılan avantajla karşılaştırıldığında sorun.
Yarı-duyarlı bir dinleme deneyimi için neredeyse zorunlu bulduğum diğer bazı şeyler;
Bu TTS progamları zeki değil (belki de genç bir maymun gibi zeki) .. bu yüzden alabilecekleri her türlü yardıma ihtiyaçları var. ve bir (ve tek bir tane Okuyucu uygulaması denir .. bunda büyük ölçüde yardımcı olur buldum programı ReadPlease (2003 Pro)
O gibi özel telaffuz edilecek kelimeler ve kelime gruplarını değiştirme allowd ... sen ... It onları istiyorum hiçbir şekilde mükemmel değil, ama benim için tüm sürecin kullanılabilir olması ve kullanılamaz olması arasındaki farkı yarattı ...
Doğal Sesler'deki konuşma "tamam", ancak biraz sıkıcı. Başka iyi ürünler de var, ama hepsi Windows için, ne yazık ki) ..
Bazen şaşırtıcı derecede kötü etkiler .. ama OMG, başlangıçta bir acı! .. # 2 # * sabrınız ... ve "özel kelimeler" listenizi güncellemek çoktur ... Sabrınızla, demek istediğim (ben) aslında benim özel babumun konuşma kalıplarına alıştım:) ... ve Bu arada, şu anda artık “İnsan” olarak adlandırılan ve bunları duyduğumda beni sıkıntıya sokmayacak kadar yeterli olan yaklaşık 3000 kelimem var.
3 .. "Zıplayan Topu Takip Edin" ... Yine, ses asla gerçek bir konuşmacı kadar iyi olmadığı için, bazı şeylerin netleştirilmesi gerekir ... Kullandığım Reader programı, oldukça çekici görünen arayüzü ile bile kullandığım bir özelliğe sahip ... "Şu anda okunmakta olanı seç" bir kelime seçeneğine sahip. Ekranın ortası .. Bu, kaçırdıklarınızı hızlı bir şekilde yeniden okumak için ileri ve arkayı görebilmeniz için paha biçilmezdir (yani, kıvrımlı çizgiyi otomatik ortalamak iyidir) ...
Evet, bu benim deneyimim .. Şimdi bir kahve yapacağım ve bunu yaparken, "nasıl okuduğunu" görmek için bunu dinleyeceğim .... TTS almak için şaşırtıcı bir şey yazım hataları (Çok fazla yazım hatası yapıyorum) ...
Eğer ATnT NaturalVoices kadar iyi bir şey Ubuntu deposunda ortaya çıkarsa, atlayacağım.
İşte bazı Doğal Sesler örnekleri bağlantısı : "MIke" kullanıyorum
SVOX pico2wave
Ben onu kullanırım. Kulağa doğal geliyor, anlaşılması kolay, Birimleri tanıyor (m, ° C, kg, ...)
İşte benim pico2wave benim ilk yazı
Tüm yapman gereken:
Ubuntu Software Center'a gidin ve "pico" kelimesini aratın. "Küçük Ayak İzi Ling ..." ile 4 veya 5 giriş bulacaksınız. Onları yükleyin.
Pico2wave'nin olası bir kullanımı ilk yazımda açıklanmaktadır (yukarıdaki bağlantıyı takip edin).
Hoşçakal
İçin festival
(ses bana daha doğal görünüyor):
sudo apt-get install festival
echo "hello" | festival --tts
Adım ve hız yapılandırma:
oluştur ~/.festivalrc
:
(Parameter.set 'Audio_Command "play -b 16 -c 1 -e signed-integer -r $SR -t raw $FILE tempo 1.5 pitch -100")
(Parameter.set 'Audio_Method 'Audio_Command)
Ayrıca bakınız http://www.solomonson.com/content/ubuntu-linux-text-speech
Güncelleme: başka bir ubuntu bilgisayarda denedim. Festival ile düzgün çalışmak için ingilizce konuşma motoru paketini yüklemek zorunda kaldı:
sudo apt-get install festvox-kallpc16k
Ayrıca play
paketle birlikte verilen bir cli komutu var sox
:
sudo apt-get install sox
Zaten bir cevabı kabul etseniz bile festival
, ben de çok hoşuma gitti, bahsetmek istedim . Ubuntu forumlarındaki bu yazı, çok güzel sesler almak için hazırlanmış çok fazla bilgiye sahip.
Tanışma espeak-ng
- Çok dilli bir yazılım konuşma sentezleyicisi:
espeak-ng "text to read"
espeak-ng -f "~/file to read"
Varsayılan bir İngilizce sesini kullanır, ancak diğer diller ve hatta lehçeler için sayısız başka sesler de vardır ve espeak-ng --voices
(herkes için) veya örneğin espeak-ng --voices=en
(İngilizce için ) ile listelenebilir . -v
Dil kısaltması veya dosya adıyla birlikte ayarlanabilir , örneğin İskoç veya Svahili dili için:
espeak-ng -v en-gb-scotland "text to read" # language name
espeak-ng -v bnt/sw "text to read" # file name: “bnt” for Bantu, “sw” for Swahili
Örneğin -s
hız ve -w
çıktının bir dalga dosyasına yazılması için mevcut birçok seçenek vardır, aşağıdaki bağlantıya bakınız.
espeak-ng
(“Yeni nesil” için “ng”), orijinal espeak
konuşma sentezleyici yazılımının aktif olarak geliştirilmiş bir çatalıdır , Wikipedia'daki Tarih bölümüne bakın . Her ikisi de resmi kaynaklardan paket yoluyla espeak
veya espeak-ng
sırasıyla edinilebilir .
Wine altında Balabolka (benim için) SAPI4 sesleriyle (benim Linux sistemimde SAPI5 sesleri algılanmıyor) gayet iyi çalışıyor. Dosyaları açıp okumaya başlayabilir.
Şarabın Balabolka için AppDB girişine link: https://appdb.winehq.org/objectManager.php?sClass=application&iId=17859
GTTS aracı, metinden ses dosyaları oluşturmak için mükemmeldir. Google Translate'in konuşma metni API'sını kullanır ve mp3 dosyaları oluşturur. Kurulum
için kullandığı pip
için, Miniconda'yı kurmanızı şiddetle tavsiye ediyorum, sonra da gTTS'yi kurabileceğiniz conda
bir ortam oluşturmak için kullanın . Miniconda'yı buradan indirebilirsiniz:
https://docs.conda.io/en/latest/miniconda.html
GTTS için GitHub deposu:
https://github.com/pndurette/gTTS
Ve gTTS belgelerini burada bulabilirsiniz: