2 Подання інформації, мови, кодування

сторінка 1
§2 Подання інформації, мови, кодування. (10 кл.)

З базового курсу вам відомо:

  • Історичний розвиток людини, формування людського общес-тва пов'язано з розвитком мови, з появою і поширенням язи-ков. Мова - це знакова система для подання та передачі ін-формації. У його склад входить алфавіт, лексика (слова), граматика, пунктуація (правила для запису слів і пропозицій).

  • Люди зберігають свої знання в записах на різних носіях. Носій інформації - фізичне середовище, що містить образи повідомлень. Повідомлення - частина інформації. Завдяки цьому знання передаються не тільки в просторі, але і в часі - від покоління до покоління.

  • Мови бувають природні, наприклад російську, китайську, англійська-ський, і формальні (штучно створені людиною для якоїсь науки або з певною метою), наприклад математична символіка, нотна грамота, мови програмування. У формальних мовах кожне слово має єдине значення і сенс. У них немає синонімів, омонімів.

Писемність і кодування інформації

Процес читання тексту - це зворотний по відношенню до листа про-процес, при якому письмовий текст перетворюється в усне мовлення. Читання можна назвати декодуванням письмового тексту.

Зазвичай кодуванням називають переклад інформації з «людського» мови на формальний, наприклад, в двійковий код, а декодуванням - зворотний перехід.

Цілі і способи кодування

А тепер звернемо увагу на те, що може існувати багато спо-собів кодування одного і того ж тексту на одному і тому ж мовою. Один символ вихідного повідомлення може замінюватися одним символом нового коду або декількома символами, а може бути і навпаки - кілька символів вихідного повідомлення замінюються одним символом в новому коді.

З уществует безліч способів кодування. Наприклад, стеногра-фія - швидкий спосіб запису усного мовлення. Нею володіють лише деякі спеціально навчені люди - стенографісти. Вони встигають записувати текст синхронно з промовою доповідача людини. У стенограмі один значок позначає ціле слово чи поєднання букв. Розшифрувати (декодувати) стенограм-му може тільки сам стенографіст.

Подивіться на текст стенограми на рис. 1.2. Там написано наступне: «гово-рить вміють все люди на світі. Навіть у са-мих примітивних племен є мова. Мова - це щось загальне і саме чоло-веческое, що є на світі ».

Китайські ієрогліфи позначають цілі слова і поняття. Можна придумати й інші способи ко-дирования.

Наведені приклади ілюструють наступне важливе правило: для кодування однієї і тієї ж інформації можуть бути використані раз-ні способи; їх вибір залежить від ряду обставин: мети кодування, умов. наявних коштів. Якщо треба записати текст в темпі мови, робимо це за допомогою стенографії; якщо треба передати текст за кордон, користуємося транслитом; якщо треба уявити текст у вигляді, по-нятном для грамотного російської людини, записуємо його за правилами граматики російської мови.

Ще одна важлива обставина: вибір способу кодування інформа-ції може бути пов'язаний з передбачуваним способом її обробки. Обсу-дим це на прикладі уявлення чисел - кількісної інформації. Використовуючи російський алфавіт, можна записати число «тридцять п'ять». Використовуючи ж алфавіт арабської десяткової системи числення, пишемо: 35. Нехай вам треба зробити обчислення. Скажіть, яка запис зруч-неї для виконання розрахунків: «тридцять п'ять помножити на сто двадцять сім» або «35 х 127»? Очевидно, що для перемноження багатозначних чисел ви будете користуватися другим записом.

Зауважимо, що дві ці записи, еквівалентні за змістом, використовують різні мови: перша - природний російську мову, друга - формальний-ний мова математики, який не має національної приналежності. Пе-реход від уявлення природною мовою до подання на фор-мальном мовою можна також розглядати як кодування. Людині зручно використовувати для кодування чисел десяткову систему счісле-ня, а комп'ютера - двійкову систему.

Широко використовуються в інформатиці формальними мовами є-ються мови програмування.


Історія технічних способів кодування інформації

З

2 Подання інформації, мови, кодування
появою технічних засобів зберігання і передачі інформації виникли нові ідеї і прийоми кодування. Першим технічним середовищ-ством передачі інформації на відстань став теле-граф, винайдений в 1837 році американцем Семюе-лем Морзе.

Телеграфне повідомлення - це послідовно-ність електричних сигналів, що передається від одного телеграфного апарату по дротах до іншого телеграфному апарату. Ці технічні йдуть-тва привели Морзе до ідеї використання всього двох видів сигналів - короткого і довгого - для кодування повідомлення, переданого по лініях телеграфного зв'язку.

Такий спосіб кодування отримав назву азбу-ки Морзе. У ній кожна буква алфавіту кодується послідовністю коротких сигналів (точок) і довгих сигналів (тире). Букви відокремлюються одна від одної паузами - відсутністю сигналів.

У таблиці наведено азбука Морзе стосовно російсько-му і англійським алфавітом. Спеціальні знаки пунктуації в Росії зазвичай запи-Сива словами: «точка» - точка, «кома» - кома і т. П.


Самим знаменитим телеграфним повідомленням є сигнал лиха-наслідком «SOS (Save Our Souls - врятуйте наші душі). Ось як він виглядає в коді азбуки Морзе: • • • - - - • • •

Три точки позначають букву S, три тире - букву О. Дві паузи відділяють букви один від одного.

Характерною особливістю азбуки Морзе є змінна довжина коду різних букв, тому код Морзе називають нерівномірним кодом. Букви, які зустрічаються в тексті частіше, мають більш короткий код, ніж рідкісні букви. Наприклад, код букви «Е - одна точка, а код букви« Комерсант »складається з шести знаків. Навіщо так зроблено? Щоб скоротити довжину всього повідомлення. Але через змінної довжини коду букв виникає проблема відділення букв один від одного в тексті. Тому доводиться для поділу-лення використовувати паузу (пропуск). Отже, телеграфний алфа-вит Морзе є потрійним, так як в ньому використовується три знака: точ-ка, тире, пропуск.

Рівномірний телеграфний код був винайдений фран-цузом Жаном Морісом Бодо в кінці XIX століття. У ньому ис-користувалося всього два види сигналів. Неважливо, як їх назвати: точка і тире, плюс і мінус, нуль і одиниця. Це два відмінних один від одного електричних сигналу.

2 Подання інформації, мови, кодування
2 Подання інформації, мови, кодування
2 Подання інформації, мови, кодування

У коді Бодо довжина кодів всіх символів алфавіту оди-наково і дорівнює п'яти. В такому випадку не виникає про-блеми відділення букв один від одного: кожна п'ятірка сигналів - це знак тексту.

Код Бодо - це перший в історії техніки спосіб двійкового кодування інформації. Завдяки ідеї Бодо вдалося автоматизувати процес передачі і пе-чати букв. Був створений клавішний телеграфний апарат. Натискання кла-виші з певною буквою виробляє відповідний пятіімпульсний сигнал, який передається по лінії зв'язку. Приймаючий ап-Параті під впливом цього сигналу друкує ту ж букву на паперовій стрічці.

З базового курсу інформатики вам відомо, що в сучасних когось Пьютер для кодування текстів також застосовується рівномірний дво-ічний код. Кожен символ кодується вісьмома або шістнадцятьма сигналами (бітами).

Закодоване повідомлення можна однозначно декодувати з початку, якщо виконується умова Фано: ніяке кодове слово не є початком іншого кодового слова. Закодоване повідомлення можна однозначно декодувати з кінця, якщо виконується зворотне умова Фано: ніяке кодове слово не є закінченням іншого кодового слова. Умова Фано - це достатня, але не необхідна умова однозначної декодування.
Система основних понять


Мови представлення інформації


Код Бодо: рівномірний-ний, двоіче-ний код


Для чоло-століття: деся-тичная с. с.


Для когось пьютера: двійкова с. с.

Контрольні питання:

  1. Що таке мова? Що входить до його складу?

  2. Що таке носій інформації?

  3. Що таке повідомлення?

  4. Чим відрізняються природні мови від формальних?

  5. Як ви думаєте, латинь - це природний або формальний мову?

  6. Що таке кодування і декодування?

  7. Від чого може залежати спосіб кодування?

  8. Чим відрізняється кодування від шифрування?

  9. Чим відрізняється рівномірний код від нерівномірного?

  10. У чому перевага коду Бодо в порівнянні з кодом Морзе?

  11. У чому перевага коду Морзе в порівнянні з кодом Бодо?
завдання

  1. Для 6 букв латинського алфавіту задані їх двійкові коди (для деяких букв з двох біт, для деяких - з трьох). Ці коди представлені в таблиці:

А В С D Е F

00 100 10 011 11 101

Визначте, яка послідовність з 6 букв закодована двійковій рядком 011 11 10 00 101 100.

1) DEFBAC 2) ABDEFC 3) DECAFB 4) EFCABD


  1. Для кодування повідомлення, що складається тільки з букв A, B, C, D і E, використовується нерівномірний по довжині двійковий код:


Яке (тільки одне!) З чотирьох отриманих повідомлень було передано без помилок і може бути розкодувати:

1) 110000001011110 2) 110000011011110 3) 110001001001110 4) 11 000 001 001 11 10


  1. Для передачі по каналу зв'язку повідомлення, що складається тільки з букв А, Б, В, Г, вирішили використовувати нерівномірний по довжині код: A = 1, Б = 01, В = 001. Як потрібно закодувати букву Г, щоб довжина коду була мінімальною і допускалося однозначне розбиття кодованого повідомлення на літери?

1) 0001 2) 000 3) 11 4) 101

  1. Для передачі по каналу зв'язку повідомлення, що складається тільки з символів А, Б, В і Г використовується посимвольного кодування: А-0, Б-11, В-100, Г-011. За допомогою з'єднання передається повідомлення: ГБАВАВГ. Закодуйте повідомлення даними кодом. Отриману двійкову послідовність переведіть в восьмеричний код. 1) DBACACD 2) 75043 3) 7A23 4) 3304043


  1. Для передачі по каналу зв'язку повідомлення, що складається тільки з символів А, Б, В і Г використовується посимвольного кодування: А-10, Б-11, В-110, Г-0. За допомогою з'єднання передається повідомлення: ВАГБААГВ. Закодуйте повідомлення даними кодом. Отриману двійкову послідовність переведіть в шістнадцятковий код. 1) D3A6 2) 62032206 3) 6A3D 4) CADBAADC


  1. Чорно-біле растрове зображення кодується через підрядник, починаючи з лівого верхнього кута і закінчуючи в правому нижньому кутку. При кодуванні 1 позначає чорний колір, а 0 - білий.

Схожі статті