Bazı doğal sesler Ubuntu için konuşma yazılımı metin yüklemek için kolay arıyorum. Ben yükledim Festival
, Gespeaker
vb, ama hiçbir şey çok doğal geliyor. Hepsi çok sentetik ve anlaşılması zor.
Herhangi bir öneriniz var mı?
Bazı doğal sesler Ubuntu için konuşma yazılımı metin yüklemek için kolay arıyorum. Ben yükledim Festival
, Gespeaker
vb, ama hiçbir şey çok doğal geliyor. Hepsi çok sentetik ve anlaşılması zor.
Herhangi bir öneriniz var mı?
Yanıtlar:
Çok minimalist bir TTS, espeak veya mbrola'dan daha iyi bir ses (aklıma göre). Burada bazı bilgiler .
Pico2wave'ın neden espeak ya da mbrola'yla karşılaştırıldığında, nadiren tartışıldığını anlamıyorum. Küçük, ama kulağa çok hoş geliyor (doğal). Değişiklik yapmadan, doğal bir kadın sesi duyarsınız.
VE ... Mbrola'ya kıyasla, Birimleri tanır ve doğru şekilde konuşur!
Örneğin:
Yüklemeden sonra bir komut dosyasında kullanıyorum:
#!/bin/bash
pico2wave -w=/tmp/test.wav "$1"
aplay /tmp/test.wav
rm /tmp/test.wav
Ardından istediğiniz metinle çalıştırın:
<scriptname>.sh "hello world"
veya bütün bir dosyanın içeriğini okuyun:
<scriptname>.sh "$(cat <filename>)"
Hepsi Ubuntu'da hafif ve kararlı bir çalışma TTS'sine sahip olmak.
pico2wave
libttspico-utils
ubuntu'nun son sürümlerinde pakettir . @ CarlosEugenioThompsonPinzóncat <filename> | xargs -I foo -0 pico2wave -w blah.wav foo
pico2wave -w a.wav "$(input.txt)"
=). Bu CLI arayüzünün kötü bir tasarım olduğunu kabul edin: CLI'lerin büyük çoğunluğunun aksine ve OS max CLI uzunluğuna ulaşmak mümkündür .
echo {1..1000}
"SpeakIt" adlı bir Google Chrome eklentisini kullanarak en iyi TTS yazılımını ücretsiz bulduğuma inanıyorum. Bu sadece Ubuntu'da benim için Chrome tarayıcısında çalışıyor. Bazı nedenlerden dolayı Chromium ile çalışmıyor. SpeakIt, her ikisine de çok gerçekçi gelen iki kadın sesiyle geliyor. Sorgu olarak "TTS" yi kullanarak Chrome Web Mağazası'nda arama yaparsanız, Chrome uzantılarında listelenen en az dört erkek ve kadın sesi var.
Kullanım : Bir web sitesinde kullanım için. Okumak istediğiniz metni vurgulayın, sağ tıklayıp "SpeakIt" seçeneğini tıklayın veya Chrome üst çubuğunda yerleşik SpeakIt simgesini tıklayın.
Firefox kullanıcılarının da iki seçeneği var. Firefox eklentileri içinde, TTS için bir arama yapın; "Konuş" düğmesini ve ayrıca "Sesli Metin" i de bulmalısınız. Sesler, Chrome SpeakIt sesleri kadar iyi değil, ancak kesinlikle kullanışlıdır.
SpeakIt uzantısı, iSpeech teknolojisini kullanır ve yılda 20 ABD doları karşılığında site, metni MP3 ses dosyalarına dönüştürebilir. Metin, URL, RSS beslemelerinin yanı sıra TXT, DOC ve PDF gibi belgeleri girebilir ve MP3 olarak verebilirsiniz. Podcast, ses gömme vb. İşlemleri yapabilirsiniz. İşte bir link ve seslerinin bir örneği (bağlantının ne kadar süreceğini bilmiyoruz).
Pico ve espeak'in çalışması eğlenceli ve kolaydır, ancak hepsi o kadar iyi değildir. Varsayılan Festival sesleri de o kadar iyi değil. Bununla birlikte, Festival, çok sayıda araştırmacının daha iyi eklenti sesleri oluşturduğu, programa dayalı bir konuşma çerçevesidir. Pico2wave kalitesini Ubuntu stoklarında kolayca aşabilirsiniz, çünkü bu seslerden biri hazır paket olarak mevcuttur.
Festival'in doğal görünmesi için yapmanız gerekenler:
sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts)
festival> (SayText "Don't hate me, I'm just doing my job!")
Komut satırından -b
(veya --batch
) kullanarak ve her komutu tek tırnak işaretleri içine alarak yapabilirsiniz:
festival -b '(voice_cmu_us_slt_arctic_hts)' \
'(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'
Nitech deposundan başka oldukça iyi sesler alabilirsiniz, ancak bunları yüklemek çok hassastır ve varsayılan yollar değişti, böylece paketlenmiş şema dosyalarındaki dosya adı referansları, Ubuntu hisse senedi üzerinde çalışmak üzere manuel olarak düzenlenmesi gerekebilir.
Proje sayfasından güncelleme (2019-02) : Bu proje şu anda bakımsızdır ve öngörülebilir gelecek için öyle kalacaktır.
Daha iyi bir alternatif olmadığından, Google Translate üzerinden TTS sağlamak için Michal Fapso'nun bir perl komut dosyasıyla etkileşime giren bir bash betiği yazdım . Proje tanımından:
Amaç, Google’ın konuşma sentez sistemi aracılığıyla metinden konuşmaya çıkışına kolay kullanımlı bir arayüz sağlamaktır. İnternet bağlantısı bulunmadığında pico2wave kullanan bir geri dönüş seçeneği otomatik olarak TTS sentezini sağlar.
Paketleyici, standart girdiden, düz metin dosyalarından ve X seçiminden (vurgulanan metin) okumayı destekler.
Ana özellikler:
Kurulum ve kullanım proje sayfasında belgelenmiştir .
Bir denesen memnun olurum. Hata raporları ve diğer geri bildirimler bekliyoruz!
Yüksek kaliteli Ubuntu için konuşma metni için yüksek ve düşük baktım. Hiçbiri yok. Ses tellerim felç oldu, bu yüzden Ubuntu videolarıma sesli talimatlar eklemek için TTS'ye ihtiyacım vardı . Konuşma yazılımına ticari yüksek kaliteli Linux metni buradan alabilirsiniz . Bu sadece gerçekten pahalı. Ben 40 $ için Windows için Doğal Okuyucu (Ubuntu Şarap altında çalışmıyor) satın alma sona erdi. Belki daha sonra Linux olanını alırım.
Konuşma seslerine en iyi ses veren ve kolayca ayarlanan metni araştırıyorum. Aşağıda, ses kalitesi sırasındaki en iyi 5 ürün olduğunu düşündüğüm şeylerin bir listesi verilmiştir. Bu ürünle ilişkili web sitelerinin çoğunda, kendi kararınızı vermenize olanak sağlayacak etkileşimli bir demo vardır.
Festivalde Nitech HTS seslerini çok doğal buldum ve duyduğum diğer sesler karşısında rahatladım. Festivalde Nitech ve diğer seslerin nasıl ayarlanacağı ile ilgili linke bakınız . Bu sesleri yapılandırmak için kullanabileceğim iyi bir GUI bulamadım ancak festival.scm aracılığıyla ayarlamaya devam ediyorum. Bu gönderi çok eski ve "locate festival" komutunu kullanarak gerçek kurulum dizinini bulmak isteyebilirsiniz.
SVOX araçlarını (pico) LibreOffice ile birleştirin:
SVOX (pico) araçlarının kurulumu kolaydır ve Ubuntu'da kaliteli sesler sunar. Yükle:
sudo apt-get install libttspico0 libttspico-utils libttspico-data
LibreOffice'i, "Metin Okuma" eklentisini yükleyerek SVOX (pico) araçlarıyla birlikte kullanabilir ve bu mükemmel TTS yazılımı için bir "GUI" alabilirsiniz:
Okuma Metni Extension'ın seçeneklerini ayarlayın ile Eklentileri - - Oku seçimi .... Tools Kullanımı / usr / bin / python harici program olarak. Belirteci (PICO_READ_TEXT_PY) içeren bir komut satırı seçeneği seçin , bunlardan bazılarını denemek isteyebilirsiniz.
Şimdi sadece LO Writer, Calc, Impress veya Draw'da bir metin seçmeniz ve araç çubuğu olarak eklenmiş simgeye kliklemeniz gerekir (balonlu mutlu bir yüz).
İşte pdf ve diğer metin dosyaları için saf doğal konuşma yapmak için yaptığım şey (diğer çözümler doğal değil ya da sadece ücretli hizmetler). Bu aslında krom veya krom kullanarak yapılan bir çalışmadır ancak hızlı ve kolaydır.
.Doc ve .txt gibi diğer dosyaları da chrome'da açmanın ve aynı yöntemi kullanmanın da yolları vardır. Chrome için pdf dosyalarını görüntüleyen, size daha uygun olup olmadığını kontrol eden başka uzantılar da var. Ayrıca Google Drive'a her türlü metni yükleyebilir ve SpeakIt! senin için okumak için. 'Konuşma metni' olarak adlandırılan bir başka uzantı da aynı şekilde çalışır ve doğal konuşur.
Yeni ile kullanmak için daha iyi bir tts motoru ararken firefox 49 anlatı modu buldum piko tts sevdiğim TTS motoru - (SVOX).
sudo apt install espeak libttspico0 libttspico-data libttspico-utils
Varsayılan konuşma sentezi motoru sistemini nasıl değiştirebilirim?
Arch Linux'taki insanlar beni doğru yola getirdi:
İstediğiniz modülü açın ve konuşma dağıtıcı ayarlarında varsayılan yapın:
# sudo vim /etc/speech-dispatcher/speechd.conf
[...]
# -----OUTPUT MODULES CONFIGURATION-----
# Each AddModule line loads an output module.
#AddModule "espeak" "sd_espeak" "espeak.conf"
AddModule "pico-generic" "sd_generic" "pico-generic.conf"
[...]
#DefaultModule espeak
DefaultModule pico-generic
Daemon'u yeniden başlatın:
# sudo systemctl restart speech-dispatcher.service
AMA firefox'u tekrar başlatırken hiçbir şey olmuyor. Yukarıdaki bağlantıya göre (10 ve 16 nolu baştaki forum forumu) festival ile çalışır (denememiştir), ancak pico için konuşmacı mevcut sesleri listelemez. Çalışmayacak.
Dışarıdaki herhangi bir fikir çok takdir edilecektir ;-)
En sevdiğim metin-konuşma programına Magic English denir, ancak Joe Steiger tarafından belirtilen Natural Reader gibi, bu bir Windows programıdır ve Wine altında çalışacağından emin değilim.
AT&T Natural Voices bir demo olarak çevrimiçi olarak mevcuttur, ancak bu bir çözümden çok daha fazlası ...
Pico, mbrola, cmu, festival, flite, 2017'de hepsi SUCK (90'larda şaşırtıcıydı). AT&T doğal konuşması (fantastik olan) linux ile uyumlu değil ve ücretsiz değil, bu yüzden Google’ı kullanıyoruz
git clone https://github.com/Glutanimate/simple-google-tts.git
sudo apt install xsel libnotify-bin libttspico0 libttspico-utils libttspico-data libwww-perl libwww-mechanize-perl libhtml-tree-perl so$
cd simple-google-tts
sudo ln -s `pwd`/simple_google_tts /usr/local/bin
simple_google_tts en "Text to speech is now installed"
cd -
gTTS ( Google Metin-Konuşma ), Google Çeviri'nin metin-konuşma API'si ile arayüz oluşturmak için bir Python kütüphanesi ve CLI aracı. Sözlü
mp3
verileri bir dosyaya, daha ileri ses manipülasyonu için dosyaya benzer bir nesneye (bytestring) yazar veyastdout
.
Eksileri : Yalnızca CLI. Google genel açık uç nokta isteğinde bulunmak için çevrimiçi olması gerekir.
sudo -H pip install gTTS # Install
kullanım
gtts-cli 'hello' --output hello.mp3
gtts-cli -l es 'Nadie es patria, todos lo somos' | play -t mp3 -
Bazıları zaten söylendi
Mimik . Kurulum:
sudo apt-get install gcc make pkg-config automake libtool libasound2-dev
git clone https://github.com/MycroftAI/mimic.git # take a while
cd mimic
./dependencies.sh --prefix="/usr/local" # take a while
./autogen.sh
./configure --prefix="/usr/local"
make # take a while
make check
eSpeak + Gespeaker (GUI) ( Gespeaker kaynak kodu )
Eksileri : Eski ve çirkin
sudo apt install espeak gespeaker
Bunun için Akıllı Konuşmacı yapıyorum - Google Chrome için uzantı. Sayfa seçimi olmadan da okuyabilir (metin tutulması doğru olduğunda).