Великий словник вимов для Говорилка - Гиричев м

Великий словник для "Говорилка"

Раніше я використовував для роботи "2nd Speech Center" з російським "Миколою" від Digalo.com. Але недавно скачав абсолютно безкоштовну російську "Говорилка" і переконався, що вона комерційного продукту не поступається, а місцями і просто зручніше.

Що б не писали на форумах, але "Микола" - ймовірно, кращий на сьогоднішній день з доступних російськомовних модулів, хоча він не позбавлений недоліків.
Основні з них:
- не знає більшості імен та прізвищ (при цьому наголоси прагне поставити на середній склад);
- не зовсім коректно промовляє числівники, часом гаркавить і гугнявить;
- не знає ненормативної лексики (ну який же російський обійдеться без неї!);
- часто промовляє слова так, як вони пишуться, а не вимовляються (наприклад, "будь ласка" - в побутовому мовленні цю букву не вимовляв);
- слова на латиниці промовляє по-російськи;
- часом глючить і опускає слово цілком, якщо в реченні є числа;
- має "баги", що призводять до аварійної помилку при спробі вимовити текст;

На відміну від 2nd Speech Center, "Говорилка" може довантажувати зовнішні словники.

Правила вимови зберігаються в словниках (для "Миколи" це Digalo Russian Nicolai.dic в папці DIC робочої програми). Про особливості написання правил можна почитати в меню допомоги "Говорилка". Допускаються маски типу * град * де * - будь-які символи як до, так і після тексту. Російський інтерфейс "Говорилка" явно виграє в порівнянні з "2nd".

Алгоритм роботи з правилами вимови, на мій погляд, реалізований краще, ніж у "2nd", який відпрацьовує правила в порядку їх написання, тому набір правил потрібно оптимізувати за принципом "від довгих словосполучень - до коротким". В "Говорилка" правила не прив'язані до порядку їх написання (точного алгоритму з'ясувати поки не вдалося).

Оскільки раніше мною був складений набір вимови для "2nd", в якому є більше 3000 правил, я взяв його за основу і переробив для "Говорилка". З огляду на особливості останньої стало можливим відмовитися від ряду правил і включити маски, завдяки чому якість вимови злегка зросла. Зараз в словнику близько 3000 правил, але, можливо, число їх з часом буде знижуватися в міру оптимізації набору правил з урахуванням можливостей "Говорилка".

Отже, що ж потрібно для якісного відтворення тексту голосом?