Огляд безкоштовних синтезаторів мови, блог розробника

Розпізнавати мову ми навчилися хоч і, поки, тільки англійську, чи не будемо стояти на місці, їдемо далі, точніше в протилежну сторону - займемося перетворенням тексту в голосову мова.







Найбільш популярні і вільні синтезатори мови, які мені відомі і з якими я мав практичний досвід: Festival. eSpeak. OpenMary.
Розглянемо всі 3 по порядку.

Досить просунутий синтезатор, поставляється з наступними мовними пакетами: англійська (в англійському та американському вимові), валлійський і іспанська. Також існують і інші пакети, такі, як кастільський іспанська, чеська, фінський, хінді, італійська, маратхі, польська, російська і телугу. Festival входить в поставку декількох дистрибутивів Linux-а. Синтезатор досить добре розуміє російську мову, якщо погратися з написанням слів, знаками пунктуації можна домогтися цілком осудною мови.

Простий, компактний, програмний синтезатор мови. Якщо вірити інформації, eSpeak використовується в мобільних операційних системах Android, починаючи з версії 1.6, і Maemo. Версії під Windows і Linux регулярно оновлюються разом з вихідним кодом, з іншими платформами справи йдуть гірше. Підтримується безліч мов, в тому числі російська, англійська, французька, іспанська і т.д. Якщо брати в порівняння російську мову - eSpeak поступається Festival, англійська, франзузскій, німецький - на рівні.







У деяких дистрибутивах Лінукс еСпік вже встановлено, якщо немає - ставиться він також просто з консолі (espeak), або качаємо потрібну версію з офіційного сайту. наприклад, у випадку з Windows.

де:
-v мову (ru, en, de)
-s швидкість (80-450)

Молодий і, поки що, не дуже популярний синтезатор, але в той же час дуже функціональний і просунутий. Написаний на Java, що дозволяє йому бути платформонезавісимость. Працює за принципом клієнт-сервер. Володіє просунутими мовними надбудовами, за допомогою яких можна вказувати інтонацію, тембр, швидкість для кожного слова. Поставляється з клієнтом, написаним на тій же Яві, з графічним інтерфейсом.

Установка досить легка і не вимагає певних зусиль, качаємо ява-установник (не забуваємо, що потрібно Java). Запускаємо інсталятор і слідуємо інструкції. У певному етапі установки запропонують вибрати мовні пакети, якими ми будемо користуватися, для себе я вибрав російську та англійську.

Переходимо в директорію установки, заходимо в папку bin і запускаємо сервер - maryserver. Як тільки сервер буде запущений, запускаємо клієнт - maryclient.

Огляд безкоштовних синтезаторів мови, блог розробника

Якщо все було зроблено правильно, після натискання кнопки "Play" має бути чутно вимови написаного тексту. В папці example, Директорією вище, є приклади реалізації клієнтів під різними мовами.

Festival: для середніх домашніх і корпоративних проектів (інформування про погоду, читання листів, "мова" для ботів і т.п.).
eSpeak: для реалізації малих завдань (повідомлення поточного часу, інформування про пробки, кількості листів в поштовій скриньці, вільне місце на жорсткому диску і т.п.).
OpenMary: для великих проектів (системи "розумного будинку", озвучка програм, читання великого тексту).







Схожі статті