L глава 2

Поняття кодування. Цілі кодування.

Одну і ту ж інформацію можна виразити різними способами: проговорити, написати, висловити жестами і т.д. Для автоматизації роботи з інформацією, представленою в різних видах, дуже важливо уніфікувати форму її подання, тобто виражати дані одного типу через дані іншого типу. Для цього використовують кодування інформації (даних). Природні людські мови - це не що інше, як системи кодування понять для вираження думок за допомогою мови. До мов близько прилягають азбуки (системи кодування компонентів мови за допомогою графічних символів). Історія знає цікаві спроби створення "універсальних" мов і абеток. Подібна проблема універсального засобу кодування досить успішно реалізується в окремих галузях техніки, науки і культури. Як приклади можна привести систему запису математичних виразів, телеграфну абетку, морську прапорцевим абетку, систему Брайля для сліпих і т.д.

При кодуванні можуть ставитися різні цілі і, відповідно, застосовуватися різні методи. Найбільш поширеними цілями кодування є наступні [1, c.47]:

· Економність, тобто зменшення надмірності повідомлення; підвищення швидкості передачі або обробки;

· Надійність, тобто захист від випадкових спотворень;

· Збереження, тобто захист від несанкціонованого доступу до інформації;

· Зручність фізичної реалізації (наприклад, двійкове кодування інформації в ЕОМ);

Ці цілі часто суперечать один одному. Економні повідомлення можуть виявитися ненадійними, так як вони не містять зайвих символів, спотворення будь-якого символу може змінити зміст повідомлення. Детально досліджує проблеми розумного поєднання економності та надійності при передачі інформації теорія кодування. В даний час важливим стає і захист інформації від несанкціонованого доступу. Захист вимагає спеціальних способів забезпечення секретності (паролів, ключів і т.п.), що збільшує обсяг інформації, що зберігається і уповільнює роботу з нею.

На різних етапах складного інформаційного процесу досягаються різні цілі, тому інформація неодноразово перекодируется, тобто змінює своє уявлення. Наприклад, така перекодування відбувається при передачі телеграм. При вирішенні задачі за допомогою ЕОМ відбувається перетворення алгоритму розв'язання задачі, написаного на природній мові, в програму, записану на мові програмування, далі відбуваються послідовно введення, трансляція, робота програми і виведення результатів. На кожному з етапів відбувається перекодування інформації.

Для того щоб повідомлення було передано отісточніка до споживача, воно повинно бути якимось чином відображено, зафіксовано. Таке відображення здійснюється за допомогою деяких символів (знаків). "Знак - це елемент кінцевого безлічі відмінних один від одного елементів. Знак разом з його змістом називають символом. Набір знаків, в якому визначено їх порядок, називається алфавітом. Алфавіт, що складається з двох знаків, називається двійковим алфавітом .Кодірованіем називається процес перетворення одного набору знаків в інший набір знаків "[1, c. 45]. Кодування - спосіб збереження і передачі інформації, форма подання її на носії. Шифрування - це теж кодування повідомлення відправником, але таке, щоб воно було незрозуміло несанкціонованому користувачеві. Послідовність символів алфавіту називається словом. Повідомлення фіксується як послідовність слів. Простий і всім зрозумілий приклад такого уявлення повідомлення - його запис словами, складеними з букв російського алфавіту. У каналі зв'язку спосіб представлення повідомлення може змінюватися: один алфавіт замінюватися іншим. Для того, щоб закодувати інформацію, необхідно вибрати код. "Кодом називається правило для перетворення одного набору знаків в інший набір знаків. Довжиною коду називається така кількість знаків, яке використовується при кодуванні "[1, c. 45].

Кількість символів в алфавіті кодування і довжина коду - абсолютно різні речі. Наприклад, в російській алфавіті 33 літери, а слова можуть бути довжиною в 1, 2, 3 і т.д. літери. Код може бути постійною і непостійною довжини. У техніці коди різної довжини зустрічаються досить рідко. Винятком є ​​лише код Морзе. У ньому, наприклад, буква Е позначається одним символом - «. »; буква А двома символами - «. - - »; буква D трьома символами - «-. », Буква J чотирма символами«. - - - ». Азбука Морзе - це трійчастий код з набором знаків: крапка, тире, пауза. Пауза використовується як роздільник між буквами і словами, так як довжина коду непостійна. За загальним правилом радистів, тривалість точки дорівнює тривалості паузи, тривалість тире дорівнює тривалості трьох крапок, тривалість пропуску (між буквами) дорівнює трьом тривалої паузи. У кодах з постійною довжиною закодовані символи можуть слідувати один за одним безпосередньо. Розташування цих символів встановлюється за допомогою відліку. У цьому випадку повідомлення може бути розкодувати однозначно.

Застосування кодів з постійною довжиною дозволяє використовувати для кодування двійковий алфавіт, як найбільш простий. Чим менше букв в алфавіті, яким кодується інформація, тим простіше має бути пристрій для розпізнавання (дешифрування) інформаційного повідомлення. Однак, чим менше букв в цьому алфавіті, тим більша кількість їх (велика довжина коду) може знадобитися для запису однієї і тієї ж інформації.

В обчислювальній техніці існує своя система кодування. Вона називається двійковим кодуванням і заснована на представленні даних послідовністю усього двох знаків: 0 та 1. Тобто, алфавіт складають дві цифри 0 і 1. Ці знаки називаються двійковими цифрами, по-англійськи - binary digit або скорочено bit (біт).

Чому довжина коду обрана в два символи? Така форма дозволяє створювати досить прості технічні пристрої для подання (кодування) і розпізнавання (дешифрування) інформації. Двійкове кодування вибрали для того, щоб максимально спростити конструкцію декодирующей машини, адже дешифратор повинен вміти розрізняти всього два стани (наприклад, 1 - є струм в ланцюзі, 0 - струму в ланцюзі немає). Двійкові елементи найнадійніші - важко переплутати стан "включено" зі станом "вимкнено". Троичное кодування, незважаючи на ряд технічних спроб, успіху не мало. У Радянському Союзі в 60-і роки випускався малою серією комп'ютер з троичной системою числення при кодуванні, який називався "Сетунь", комп'ютери з десятковою системою числення так і не вийшли зі стін лабораторій.

Одним бітом, як уже згадувалося, можуть бути виражені два поняття: 0 або 1 (так чи ні. Чорне або біле. Істина або брехня і т.п.). Якщо кількість бітів збільшити до двох, то вже можна висловити чотири різних поняття: 00 01 10 11. Трьома бітами можна закодувати вісім різних значень: 000 001 010 011 100 101 110 111. Збільшуючи на одиницю кількість розрядів в системі двійкового кодування, збільшуємо в два рази кількість значень, яке може бути виражено в даній системі, тобто загальна формула має вигляд: N = 2 m. де N - кількість незалежних кодованих значень; m - розрядність двійкового кодування, прийнята в даній системі.

Розглянемо, як в ЕОМ кодуються символьний або текстова інформація, цілі і речові числа, графічна і звукова інформація.

Схожі статті