Konuşmaya Doğal Sondaj Metni?


Yanıtlar:


51

SVOX pico2wave

Çok minimalist bir TTS, espeak veya mbrola'dan daha iyi bir ses (aklıma göre). Burada bazı bilgiler .

Pico2wave'ın neden espeak ya da mbrola'yla karşılaştırıldığında, nadiren tartışıldığını anlamıyorum. Küçük, ama kulağa çok hoş geliyor (doğal). Değişiklik yapmadan, doğal bir kadın sesi duyarsınız.

VE ... Mbrola'ya kıyasla, Birimleri tanır ve doğru şekilde konuşur!
Örneğin:

  • 2 ° C → iki derece
  • 2m → iki metre
  • 2kg → iki kilogram

Yüklemeden sonra bir komut dosyasında kullanıyorum:

#!/bin/bash
pico2wave -w=/tmp/test.wav "$1"
aplay /tmp/test.wav
rm /tmp/test.wav

Ardından istediğiniz metinle çalıştırın:

<scriptname>.sh "hello world"

veya bütün bir dosyanın içeriğini okuyun:

<scriptname>.sh "$(cat <filename>)"

Hepsi Ubuntu'da hafif ve kararlı bir çalışma TTS'sine sahip olmak.


1
Görebildiğim kadarıyla, sadece giriş olarak cli parametrelerini kullanır. Pico2wave 'nin bir dosya adından metni okumasını sağlayacak bir yol var mı?
Carlos Eugenio Thompson Pinzón,

13
pico2wavelibttspico-utilsubuntu'nun son sürümlerinde pakettir . @ CarlosEugenioThompsonPinzóncat <filename> | xargs -I foo -0 pico2wave -w blah.wav foo
naught101

1
@ CarlosEugenioThompsonPinzón pico2wave -w a.wav "$(input.txt)"=). Bu CLI arayüzünün kötü bir tasarım olduğunu kabul edin: CLI'lerin büyük çoğunluğunun aksine ve OS max CLI uzunluğuna ulaşmak mümkündür .
Ciro Santilli,

1
@Koen Bilmiyorum! :-) Başka bir problem gibi, minimal bir örnek üretmeye çalışın, örneğinecho {1..1000}
Ciro Santilli

1
@ user49557 Başkalarının sorularını kaçırmamamız gerekiyor, bu yüzden belki de tam olarak ne yüklediğinizi ve neyin yanlış gittiğini açıklayan yeni bir soru oluşturabilirsiniz ve sonra size her zaman deneyip yardım edebilirim (garanti yok, ancak) , Ben uzman değilim: P)
Koen

22

Onu konuş!

"SpeakIt" adlı bir Google Chrome eklentisini kullanarak en iyi TTS yazılımını ücretsiz bulduğuma inanıyorum. Bu sadece Ubuntu'da benim için Chrome tarayıcısında çalışıyor. Bazı nedenlerden dolayı Chromium ile çalışmıyor. SpeakIt, her ikisine de çok gerçekçi gelen iki kadın sesiyle geliyor. Sorgu olarak "TTS" yi kullanarak Chrome Web Mağazası'nda arama yaparsanız, Chrome uzantılarında listelenen en az dört erkek ve kadın sesi var.

Kullanım : Bir web sitesinde kullanım için. Okumak istediğiniz metni vurgulayın, sağ tıklayıp "SpeakIt" seçeneğini tıklayın veya Chrome üst çubuğunda yerleşik SpeakIt simgesini tıklayın.


Firefox kullanıcılarının da iki seçeneği var. Firefox eklentileri içinde, TTS için bir arama yapın; "Konuş" düğmesini ve ayrıca "Sesli Metin" i de bulmalısınız. Sesler, Chrome SpeakIt sesleri kadar iyi değil, ancak kesinlikle kullanışlıdır.

SpeakIt uzantısı, iSpeech teknolojisini kullanır ve yılda 20 ABD doları karşılığında site, metni MP3 ses dosyalarına dönüştürebilir. Metin, URL, RSS beslemelerinin yanı sıra TXT, DOC ve PDF gibi belgeleri girebilir ve MP3 olarak verebilirsiniz. Podcast, ses gömme vb. İşlemleri yapabilirsiniz. İşte bir link ve seslerinin bir örneği (bağlantının ne kadar süreceğini bilmiyoruz).


3
Ne yazık ki tarayıcı seçeneklerinden hiçbiri PDF dosyaları için çalışmıyor. Bunu yapanla mı karşılaştınız? Bir PDF'den okumak için paragraflar seçebilmek istiyorum (yani, uçları terminale veya başka bir yere yapıştırmak zorunda
kalmazsınız

1
bu eklenti benim için chromium 50.0.2661.94'te Debian 8.4 ve bunun harikalarını kullanarak çalışıyor! özellikle ingilizce kadın sesini seviyorum. tek şikayetim, virgüllerde çok uzun süre durması.
mulllhausen

Genellikle kelimeleri yanlış telaffuz eder ve metni yalnızca kendi sisteminizi kullanmak yerine ayrı bir sunucuya göndermek zaman alır.
Goddard

14

Pico ve espeak'in çalışması eğlenceli ve kolaydır, ancak hepsi o kadar iyi değildir. Varsayılan Festival sesleri de o kadar iyi değil. Bununla birlikte, Festival, çok sayıda araştırmacının daha iyi eklenti sesleri oluşturduğu, programa dayalı bir konuşma çerçevesidir. Pico2wave kalitesini Ubuntu stoklarında kolayca aşabilirsiniz, çünkü bu seslerden biri hazır paket olarak mevcuttur.

Festival'in doğal görünmesi için yapmanız gerekenler:

sudo apt-get install festival
sudo apt-get install festvox-us-slt-hts
festival -i
festival> (voice_cmu_us_slt_arctic_hts) 
festival> (SayText "Don't hate me, I'm just doing my job!")

Komut satırından -b(veya --batch) kullanarak ve her komutu tek tırnak işaretleri içine alarak yapabilirsiniz:

festival -b '(voice_cmu_us_slt_arctic_hts)' \
    '(SayText "The temperature is 22 degrees centigrade and there is a slight breeze from the west.")'

Nitech deposundan başka oldukça iyi sesler alabilirsiniz, ancak bunları yüklemek çok hassastır ve varsayılan yollar değişti, böylece paketlenmiş şema dosyalarındaki dosya adı referansları, Ubuntu hisse senedi üzerinde çalışmak üzere manuel olarak düzenlenmesi gerekebilir.


2
BTW, Ubuntu 16.04’te bu paket eksik görünüyor. Debian'ı Debian'dan indirip yükleyebilirsiniz ve iyi sonuç verecektir: Packages.debian.org/sid/all/festvox-us-slt-hts/download sudo dpkg -i Yüklemeler / festvox-us-slt-hts_0.2010.10. 25-2_all.deb
Jon Watte

13

Basit Google ™ TTS

Proje sayfasından güncelleme (2019-02) : Bu proje şu anda bakımsızdır ve öngörülebilir gelecek için öyle kalacaktır.


Daha iyi bir alternatif olmadığından, Google Translate üzerinden TTS sağlamak için Michal Fapso'nun bir perl komut dosyasıyla etkileşime giren bir bash betiği yazdım . Proje tanımından:

Amaç, Google’ın konuşma sentez sistemi aracılığıyla metinden konuşmaya çıkışına kolay kullanımlı bir arayüz sağlamaktır. İnternet bağlantısı bulunmadığında pico2wave kullanan bir geri dönüş seçeneği otomatik olarak TTS sentezini sağlar.

Paketleyici, standart girdiden, düz metin dosyalarından ve X seçiminden (vurgulanan metin) okumayı destekler.

Ana özellikler:

  • Google çeviri yoluyla çevrimiçi TTS sentezi
  • pico2wave ile çevrimdışı TTS sentezi
  • çeşitli farklı dilleri destekler
  • CLI, metin dosyaları ve vurgulanan metinleri okuyabilir
  • Vurgulanan metnin sabit biçimlendirmeyle okunmasını destekler (örn. PDF dosyaları)

Kurulum ve kullanım proje sayfasında belgelenmiştir .

Bir denesen memnun olurum. Hata raporları ve diğer geri bildirimler bekliyoruz!


Bu şimdiye kadar gördüğüm en havalı projelerden biri olmalı. Sadece vay canına. User

5
Bu artık korunmuyor.
Goddard

8

Yüksek kaliteli Ubuntu için konuşma metni için yüksek ve düşük baktım. Hiçbiri yok. Ses tellerim felç oldu, bu yüzden Ubuntu videolarıma sesli talimatlar eklemek için TTS'ye ihtiyacım vardı . Konuşma yazılımına ticari yüksek kaliteli Linux metni buradan alabilirsiniz . Bu sadece gerçekten pahalı. Ben 40 $ için Windows için Doğal Okuyucu (Ubuntu Şarap altında çalışmıyor) satın alma sona erdi. Belki daha sonra Linux olanını alırım.


dostum, var ve onu geçen haftaki gibi kullanıyordum, en az 5 ya da 6 var ve hayatım boyunca bunlardan birini bulamıyorum, topluluğumuzu sevmek zorundayım
mchid

Textaloud'un ürünlerinin şarap altında çalışmasını sağlayacak talimatlar vardır. nextup.com/forum/viewtopic.php?t=3349 bakınız. Cepstral'in de bir linux portu olduğuna inanıyorum. Favori yazılım balabolka'nın çalışmasını sağlayamadım. TTS işlemesi için çoğunlukla Windows 10 yüklü. MS David iyi ve cepstral david'e benzer. Windows
10'unuz

6

Konuşma seslerine en iyi ses veren ve kolayca ayarlanan metni araştırıyorum. Aşağıda, ses kalitesi sırasındaki en iyi 5 ürün olduğunu düşündüğüm şeylerin bir listesi verilmiştir. Bu ürünle ilişkili web sitelerinin çoğunda, kendi kararınızı vermenize olanak sağlayacak etkileşimli bir demo vardır.

  1. NeoSpeech
  2. Ivona
  3. Acapela
  4. AT&T Doğal sesler
  5. CereProc Sesleri

1
Linux için var mı? sanmıyorum böyle
Mehdi Khademloo

5

Festivalde Nitech HTS seslerini çok doğal buldum ve duyduğum diğer sesler karşısında rahatladım. Festivalde Nitech ve diğer seslerin nasıl ayarlanacağı ile ilgili linke bakınız . Bu sesleri yapılandırmak için kullanabileceğim iyi bir GUI bulamadım ancak festival.scm aracılığıyla ayarlamaya devam ediyorum. Bu gönderi çok eski ve "locate festival" komutunu kullanarak gerçek kurulum dizinini bulmak isteyebilirsiniz.


Çok iyi görünüyor. Burada demolar bulundu cstr.ed.ac.uk/projects/festival/onlinedemo.html
Iacchus

2
Evet, Nitech sesleri diğer Festival seslerinin başında ve omuzlarıdır (CMU sesleri hariç, aynı zamanda çok iyi.) Kurması zor. Ubunut'ta varsayılan paketi olan, cmu_us_slt_arctic_hts adında ve festvox-us-slt-hts paketinde gelen iyi bir CMU sesi var. Pico ya da espeak'ten çok daha iyi!
Jon Watte

5

SVOX araçlarını (pico) LibreOffice ile birleştirin:

SVOX (pico) araçlarının kurulumu kolaydır ve Ubuntu'da kaliteli sesler sunar. Yükle:

sudo apt-get install libttspico0 libttspico-utils libttspico-data

LibreOffice'i, "Metin Okuma" eklentisini yükleyerek SVOX (pico) araçlarıyla birlikte kullanabilir ve bu mükemmel TTS yazılımı için bir "GUI" alabilirsiniz:

Okuma Metni Extension'ın seçeneklerini ayarlayın ile Eklentileri - - Oku seçimi .... Tools Kullanımı / usr / bin / python harici program olarak. Belirteci (PICO_READ_TEXT_PY) içeren bir komut satırı seçeneği seçin , bunlardan bazılarını denemek isteyebilirsiniz.

Şimdi sadece LO Writer, Calc, Impress veya Draw'da bir metin seçmeniz ve araç çubuğu olarak eklenmiş simgeye kliklemeniz gerekir (balonlu mutlu bir yüz).


4

İşte pdf ve diğer metin dosyaları için saf doğal konuşma yapmak için yaptığım şey (diğer çözümler doğal değil ya da sadece ücretli hizmetler). Bu aslında krom veya krom kullanarak yapılan bir çalışmadır ancak hızlı ve kolaydır.

  1. SpeakIt yükleyin ! krom veya krom üzerinde uzatma.
  2. Krom kullanıyorsanız (chrome zaten ücretsiz bir pdf görüntüleyiciye sahipse) PDF Görüntüleyici'yi yükleyin ve chromium'un uzantı ayarlarında 'Gizli olarak izin ver' ve 'Dosya URL'lerine erişime izin ver' seçeneklerini işaretleyin.
  3. Tarayıcınıza pdf dosyasını sürükleyip bırakın.
  4. Şimdi bir metni vurgulayın ve sağ tıklayın ve SpeakIt! Böylece saf doğal metinden sese dinleyebilirsiniz.

.Doc ve .txt gibi diğer dosyaları da chrome'da açmanın ve aynı yöntemi kullanmanın da yolları vardır. Chrome için pdf dosyalarını görüntüleyen, size daha uygun olup olmadığını kontrol eden başka uzantılar da var. Ayrıca Google Drive'a her türlü metni yükleyebilir ve SpeakIt! senin için okumak için. 'Konuşma metni' olarak adlandırılan bir başka uzantı da aynı şekilde çalışır ve doğal konuşur.


SpeakIt’in Google Drive’da kaydedilen pdf dosyalarını okumasını nasıl sağlayabilir misiniz?
Marco Lackovic

2

Yeni ile kullanmak için daha iyi bir tts motoru ararken firefox 49 anlatı modu buldum piko tts sevdiğim TTS motoru - (SVOX).

sudo apt install espeak libttspico0 libttspico-data libttspico-utils

Varsayılan konuşma sentezi motoru sistemini nasıl değiştirebilirim?

Arch Linux'taki insanlar beni doğru yola getirdi:

İstediğiniz modülü açın ve konuşma dağıtıcı ayarlarında varsayılan yapın:

# sudo vim /etc/speech-dispatcher/speechd.conf

[...]
# -----OUTPUT MODULES CONFIGURATION-----
# Each AddModule line loads an output module.
#AddModule "espeak"       "sd_espeak"   "espeak.conf"
AddModule "pico-generic"  "sd_generic"   "pico-generic.conf"

[...]
#DefaultModule espeak
DefaultModule pico-generic

Daemon'u yeniden başlatın:

# sudo systemctl restart speech-dispatcher.service

AMA firefox'u tekrar başlatırken hiçbir şey olmuyor. Yukarıdaki bağlantıya göre (10 ve 16 nolu baştaki forum forumu) festival ile çalışır (denememiştir), ancak pico için konuşmacı mevcut sesleri listelemez. Çalışmayacak.

Dışarıdaki herhangi bir fikir çok takdir edilecektir ;-)


1

En sevdiğim metin-konuşma programına Magic English denir, ancak Joe Steiger tarafından belirtilen Natural Reader gibi, bu bir Windows programıdır ve Wine altında çalışacağından emin değilim.

AT&T Natural Voices bir demo olarak çevrimiçi olarak mevcuttur, ancak bu bir çözümden çok daha fazlası ...


1

Basit Google ™ TTS

Pico, mbrola, cmu, festival, flite, 2017'de hepsi SUCK (90'larda şaşırtıcıydı). AT&T doğal konuşması (fantastik olan) linux ile uyumlu değil ve ücretsiz değil, bu yüzden Google’ı kullanıyoruz

git clone https://github.com/Glutanimate/simple-google-tts.git
sudo apt install xsel libnotify-bin libttspico0 libttspico-utils libttspico-data libwww-perl libwww-mechanize-perl libhtml-tree-perl so$
cd simple-google-tts
sudo ln -s `pwd`/simple_google_tts /usr/local/bin
simple_google_tts en "Text to speech is now installed"
cd -

Bu, Glutanimate cevabının bir kopyası (bu projenin yazarı). Ayrıca: "Durum güncellemesi: Bu proje şu anda bakımsız ve yakın gelecekte de öyle kalacak." Bazı alternatifler
Pablo A,

1

gTTS

gTTS ( Google Metin-Konuşma ), Google Çeviri'nin metin-konuşma API'si ile arayüz oluşturmak için bir Python kütüphanesi ve CLI aracı. Sözlü mp3verileri bir dosyaya, daha ileri ses manipülasyonu için dosyaya benzer bir nesneye (bytestring) yazar veya stdout.

Eksileri : Yalnızca CLI. Google genel açık uç nokta isteğinde bulunmak için çevrimiçi olması gerekir.

sudo -H pip install gTTS  # Install

kullanım

gtts-cli 'hello' --output hello.mp3
gtts-cli -l es 'Nadie es patria, todos lo somos' | play -t mp3 -

Belgeleme ve daha fazla örnek

Diğerleri

Bazıları zaten söylendi


Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.