Komut satırı kullanılarak metinden konuşmaya nasıl çıkılır?


Yanıtlar:


125

Azalan popülerliğin sırası :

  • diyelim ki GNUstep konuşma motorunu kullanarak metni sesli konuşmaya dönüştürür.

    sudo apt-get install gnustep-gui-runtime
    say "hello"
    
  • festival Genel çok dilli konuşma sentez sistemi.

    sudo apt-get install festival
    echo "hello" | festival --tts
    
  • spd-say , konuşma dağıtıcısına metinden konuşmaya çıktı isteği gönderir

    sudo apt-get install speech-dispatcher
    spd-say "hello"
    
  • espeak , çok dilli bir yazılım konuşma sentezleyicisidir.

    sudo apt-get install espeak
    espeak "hello"
    

13
spd-say14.04 önceden yüklenmiş ve daha sonra gereken görünür: releases.ubuntu.com/trusty/...
Ciro Santilli新疆改造中心法轮功六四事件

3
Ayrıca sudo pip install gTTS, (Google Text to Speech / github.com/pndurette/gTTS ) o gtts-cli "hello" -o hello.mp3zaman da onu yayınlayabilirsinizmpg123 - . gtts-cli "why, hello there" | mpg123 -.
Elijah Lynn

ne yazık ki, spd-sayaynı anda tts oynayabiliyor gibi görünmüyor, sadece bir seferde
phil294

@ElijahLynn çalışmıyor
karartır

espeak/ spd-saymemler için en iyisidir (diğerleri "meme" kelimesini doğru telaffuz edemezler). En iyi söyleyebilirim arka uç olarak spd-saykullanır espeak(sesler aynı geliyor).
QwertyChouskie

18

espeak güzel bir küçük araçtır.

Komut satırında onunla oynamayı seviyorum. Pulseaudio ile çakışmış bulabilirsin, bu yüzden düzgün kurması gerekmeyen uzun soluklu bir sürüm kullanıyorum.

sudo apt-get install espeak
espeak --stdout "this is a test" | paplay

espeak --help size okuma hızını, ses tonunu, sesi vb. ayarlama seçeneklerini gösterecek.

Notlarınızı yaparken, bunları bir metin dosyası olarak kaydedin ve ardından:

echo "these are my notes" > text.txt
espeak --stdout -f text.txt > text.wav
paplay text.wav # you should hear "these are my notes"

Daha sonra PCM'den MP3 veya OGG gibi daha yönetilebilir bir şeye sıkıştırmak için ffmeg et al ile uğraşabilirsiniz. Ama bu farklı bir hikaye.


1
çok güzel, bir de espeak, espeak-gui, Grafik Kullanıcı Arayüzü deneyebilirsiniz.
Sabacon

14

Kimden man spd-say:

ADI
       spd-say - konuşma dağıtıcısına metinden konuşmaya çıktı isteği gönder

ÖZET
       spd-say [seçenekler] "bazı metinler"

AÇIKLAMA
       spd-say, konuşmayı yürüten işlemciye, onu işleyen ve sonucu en iyi şekilde çıkaran konuşma dağıtıcı işlemine gönderir
       ses sistemine.

SEÇENEKLER
       -r, --rate
              Konuşma hızını ayarlayın (-100 ile +100 arasında, varsayılan: 0)

       -p, --pitch
              Konuşma perdesini ayarlayın (-100 ile +100 arasında, varsayılan: 0)

       -i, - hacim
              Konuşmanın ses seviyesini (yoğunluğunu) ayarlayın (-100 ile +100 arasında, varsayılan: 0)

Böylece aşağıdaki komutu uygulayarak metni konuşmaya alabilirsiniz:

spd-say "<type text>"

Ör:

spd-say "Welcome to Ubuntu Linux"

Ayrıca edebilirsiniz konuşma hızını, eğim, hacim vb set insan sayfasına bakın.


3
spd-say -t female2 "text"
akla dayanıklı

6

Mbrola 11.10'dan beri çalışmıyor.

SVOX (pico) araçlarının kurulumu kolaydır, kullanımı kolaydır ve Ubuntu'da kaliteli sesler sunar. Yükle:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

Daha da kolay, LibreOffice'i "Metin Okuma" eklentisini yükleyerek SVOX (pico) araçlarıyla birlikte kullanabilir ve bu mükemmel TTS yazılımı için bir "GUI" alabilirsiniz:

Okuma Metin Uzantısı seçeneklerini Araçlar - Eklentiler - Okuma seçimi ile ayarlayın .... Harici program olarak / usr / bin / python kullanın. Belirteci içeren bir komut satırı seçeneği seçin (PICO_READ_TEXT_PY).


4

Python Google Konuşma:

pip install google_speech

google_speech "Test the hello world"

Android'den Svox:

apt-get install svox-pico

pico2wave --wave=test.wav "Test the hello world"
play test.wav

Svox Nanotts:

git clone https://github.com/gmn/nanotts.git
cd nanotts
make

./nanotts -v en-US "Test the hello world"

Bağlantılar - Wiki:

Konuşma sentezleyicilerin karşılaştırılması


1
Yüklemek ve kullanmak için google_speechubuntu 18.04 yüklemem gerekiyordu üzerinde python3-pipve libsox-fmt-mp3ve kullanımı pip3 install google_speech.
artm

3

Ve yine bir başka espeak gui: gespeaker. Hem kullanır espeakve mbrolamotorlar. Ayrıca, daha fazla seçenek var espeak-gui.


3

Aşağıdaki bir FLOSS çözümü değildir, ancak buna değer bulabilirsiniz. (bu bir şarap çözümüdür),

Şahsen TTS'ye çok düşkünüm, sıkça kullanıyorum ... örn. Asla başkalarına sadık kalmayacağım rahatsız edici bir söylem dinlerken (çünkü başka bir kahve almam lazım ... :)

Yol boyunca keşfettiğim birkaç şey .. ya da söylemeliyim, yol boyunca keşfetmediğim şeyler ... Açıkça söylemek gerekirse: Denediğim her FOSS TTS ses yazılımı parçası bu yüzden herhangi bir yarı-uzun süreli dinleme için uygun değil ...

Şu anda ATnT's NaturalVoices kullanıyorum. Sadece Windows için kullanılabilir (belki Mac için), ancak wineUbuntu'da çalışmaktadır .. (küçük bir glikası vardır, bazen okuyucudan uzaklaştığımda panele tıklamam gerekir) NatualVoices'ın konuşma kalitesi ile kazanılan avantajla karşılaştırıldığında sorun.

Yarı-duyarlı bir dinleme deneyimi için neredeyse zorunlu bulduğum diğer bazı şeyler;

  1. Bu TTS progamları zeki değil (belki de genç bir maymun gibi zeki) .. bu yüzden alabilecekleri her türlü yardıma ihtiyaçları var. ve bir (ve tek bir tane Okuyucu uygulaması denir .. bunda büyük ölçüde yardımcı olur buldum programı ReadPlease (2003 Pro)O gibi özel telaffuz edilecek kelimeler ve kelime gruplarını değiştirme allowd ... sen ... It onları istiyorum hiçbir şekilde mükemmel değil, ama benim için tüm sürecin kullanılabilir olması ve kullanılamaz olması arasındaki farkı yarattı ...

  2. Doğal Sesler'deki konuşma "tamam", ancak biraz sıkıcı. Başka iyi ürünler de var, ama hepsi Windows için, ne yazık ki) ..
    Bazen şaşırtıcı derecede kötü etkiler .. ama OMG, başlangıçta bir acı! .. # 2 # * sabrınız ... ve "özel kelimeler" listenizi güncellemek çoktur ... Sabrınızla, demek istediğim (ben) aslında benim özel babumun konuşma kalıplarına alıştım:) ... ve Bu arada, şu anda artık “İnsan” olarak adlandırılan ve bunları duyduğumda beni sıkıntıya sokmayacak kadar yeterli olan yaklaşık 3000 kelimem var.

    3 .. "Zıplayan Topu Takip Edin" ... Yine, ses asla gerçek bir konuşmacı kadar iyi olmadığı için, bazı şeylerin netleştirilmesi gerekir ... Kullandığım Reader programı, oldukça çekici görünen arayüzü ile bile kullandığım bir özelliğe sahip ... "Şu anda okunmakta olanı seç" bir kelime seçeneğine sahip. Ekranın ortası .. Bu, kaçırdıklarınızı hızlı bir şekilde yeniden okumak için ileri ve arkayı görebilmeniz için paha biçilmezdir (yani, kıvrımlı çizgiyi otomatik ortalamak iyidir) ...

Evet, bu benim deneyimim .. Şimdi bir kahve yapacağım ve bunu yaparken, "nasıl okuduğunu" görmek için bunu dinleyeceğim .... TTS almak için şaşırtıcı bir şey yazım hataları (Çok fazla yazım hatası yapıyorum) ...

Eğer ATnT NaturalVoices kadar iyi bir şey Ubuntu deposunda ortaya çıkarsa, atlayacağım.

İşte bazı Doğal Sesler örnekleri bağlantısı : "MIke" kullanıyorum


3

SVOX pico2wave

Ben onu kullanırım. Kulağa doğal geliyor, anlaşılması kolay, Birimleri tanıyor (m, ° C, kg, ...)

İşte benim pico2wave benim ilk yazı

Konuşmaya Doğal Sondaj Metni?

Tüm yapman gereken:

Ubuntu Software Center'a gidin ve "pico" kelimesini aratın. "Küçük Ayak İzi Ling ..." ile 4 veya 5 giriş bulacaksınız. Onları yükleyin.

Pico2wave'nin olası bir kullanımı ilk yazımda açıklanmaktadır (yukarıdaki bağlantıyı takip edin).

Hoşçakal


yolunu kullandım pls yolunu kullanarak nasıl naturl tatlı bir kadın sesi elde edebileceğini söyleyebilir misin
user49557

3

İçin festival(ses bana daha doğal görünüyor):

sudo apt-get install festival

echo "hello" | festival --tts

Adım ve hız yapılandırma:

oluştur ~/.festivalrc:

(Parameter.set 'Audio_Command "play -b 16 -c 1 -e signed-integer -r $SR -t raw $FILE tempo 1.5 pitch -100") (Parameter.set 'Audio_Method 'Audio_Command)

Ayrıca bakınız http://www.solomonson.com/content/ubuntu-linux-text-speech

Güncelleme: başka bir ubuntu bilgisayarda denedim. Festival ile düzgün çalışmak için ingilizce konuşma motoru paketini yüklemek zorunda kaldı:

sudo apt-get install festvox-kallpc16k

Ayrıca playpaketle birlikte verilen bir cli komutu var sox:

sudo apt-get install sox


2

Zaten bir cevabı kabul etseniz bile festival, ben de çok hoşuma gitti, bahsetmek istedim . Ubuntu forumlarındaki bu yazı, çok güzel sesler almak için hazırlanmış çok fazla bilgiye sahip.


2

Tanışma espeak-ng- Çok dilli bir yazılım konuşma sentezleyicisi:

espeak-ng "text to read"
espeak-ng -f "~/file to read"

Varsayılan bir İngilizce sesini kullanır, ancak diğer diller ve hatta lehçeler için sayısız başka sesler de vardır ve espeak-ng --voices(herkes için) veya örneğin espeak-ng --voices=en(İngilizce için ) ile listelenebilir . -vDil kısaltması veya dosya adıyla birlikte ayarlanabilir , örneğin İskoç veya Svahili dili için:

espeak-ng -v en-gb-scotland "text to read" # language name
espeak-ng -v bnt/sw "text to read" # file name: “bnt” for Bantu, “sw” for Swahili

Örneğin -shız ve -wçıktının bir dalga dosyasına yazılması için mevcut birçok seçenek vardır, aşağıdaki bağlantıya bakınız.

daha fazla okuma

espeak-ng(“Yeni nesil” için “ng”), orijinal espeakkonuşma sentezleyici yazılımının aktif olarak geliştirilmiş bir çatalıdır , Wikipedia'daki Tarih bölümüne bakın . Her ikisi de resmi kaynaklardan paket yoluyla espeakveya espeak-ngsırasıyla edinilebilir .



0

GTTS aracı, metinden ses dosyaları oluşturmak için mükemmeldir. Google Translate'in konuşma metni API'sını kullanır ve mp3 dosyaları oluşturur. Kurulum
için kullandığı pipiçin, Miniconda'yı kurmanızı şiddetle tavsiye ediyorum, sonra da gTTS'yi kurabileceğiniz condabir ortam oluşturmak için kullanın . Miniconda'yı buradan indirebilirsiniz:

https://docs.conda.io/en/latest/miniconda.html

GTTS için GitHub deposu:

https://github.com/pndurette/gTTS

Ve gTTS belgelerini burada bulabilirsiniz:

https://gtts.readthedocs.io/en/latest/

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.