Субтитри на іноземних мовах - боротьба з абракадаброю - Ілля Медісон

Приємно і ефективно вивчати іноземні мови за фільмами.

З'ясуємо, чому це відбувається, і тоді рішення буде простим.

Почнемо з витоків. На зорі комп'ютерної ери кожен символ тексту - буква, цифра, розділовий знак і т.д. кодувався одним байтом. Це мінімальна одиниця обміну інформацією. Сам же байт складається з 8-і бітів - комп'ютерних нулів і одиниць. Таким чином, розмірність байта дозволяє кодувати 256 різних символів. Кількість 256 цілком достатньо, щоб закодувати будь-буквений алфавіт окремо, плюс цифри, розділові знаки і деякі інші символи. Однак необхідно було домовитися, як якісь алфавіти кодувати. Тому були придумані різні кодові сторінки. У всіх цих систем кодувань 1-я половина таблиці: від 0 до 127 - незмінна. Вона містить 26 літер стандартної латиниці, арабські цифри, розділові знаки і деякі керуючі символи. А ось інтерпретація 2-ї частини таблиці якраз і відрізняє одну кодову сторінку від іншої. Наприклад, «Кирилицю» (російський, сербський і ін.) Від «Західноєвропейської» (французька, іспанська та ін.), «Центральноєвропейської» (чеська, румунська та ін.) І т.д.

Таким чином, якщо текст закодований за принципом «один байт - один символ», і в ньому використовувалися літери, що не входять в стандартну латиницю, комп'ютерна програма для його відображення повинна знати, яку кодову сторінку використовувати.

Якщо така інформація не надана, програма використовує кодову сторінку, встановлену на комп'ютері за замовчуванням. Природно, в самому тексті, закодованому таким аскетичним чином, цієї інформації немає. Отже, якщо текст - на французькому, а Windows налаштована під російськомовного користувача, замість французьких букв з діакрітікой ми побачимо літери кирилиці, що перетворить текст у малозрозумілу кашу.

Як вирішити цю проблему?

Спосіб 1. Найтупіший.

Налаштувати комп'ютер так, щоб кодова сторінка за замовчуванням відповідала кодуванні субтитрів. У Windows це вікно «Пуск / Панель управління / Мова і регіональні стандарти». У цьому вікні вибираємо вкладку «Додатково». В панелі «Мова програм, які не підтримують Юнікод» в випадаючому списку вибираємо потрібну мову. Наприклад, французький. Перезавантажуємо комп'ютер і дивимося фільм, насолоджуючись французькими субтитрами.

Чому цей спосіб тупий? Після такого налаштування в деяких древніх програмах інформація російською мовою перетвориться в абракадабру і ви не зможете в них працювати.

2-й спосіб: старанний.

Так воно і є. Наприклад, якщо у вас встановлений універсальний набір кодеків і утиліт K-Lite Codec Pack, при завантаженому фільмі клацніть по зеленій стрілці DirectVobSub в правому нижньому кутку екрану. Відкриється вікно, в якому можна вибрати кодування. Наприклад, ANSI (0) і набір символів - західноєвропейський.

3-й спосіб: прогресивний.