Як порахувати інформацію

Аналізуючи інформацію, ми стикаємося з необхідністю оцінки якості й визначення кількості отримання інформації. Визначити якість інформації надзвичайно складно, а часто і взагалі неможливо. Будь-які відомості, наприклад історичні, десятиліттями вважаються непотрібними, і раптом їх цінність може різко зрости. Разом з цим визначити кількість інформації не тільки потрібно, але і можна. Це перш за все необхідно для того, щоб порівняти один з одним масиви інформації, визначити, які розміри повинні мати матеріальні об'єкти (папір, магнітна стрічка і т. Д.), Що зберігають цю інформацію.

Для визначення кількості інформації потрібно знайти спосіб представити будь-яку її форму (символьну, текстову, графічну) в єдиному вигляді. Інакше кажучи, треба зуміти ці форми інформації перетворити так, щоб вона отримала єдиний стандартний вигляд. Таким видом стала так звана двійкова форма представлення інформації - запис будь-якої інформації у вигляді послідовності тільки двох символів.

Ці символи можуть на папері позначатися будь-яким способом: буквами А, Б; словами ТАК, НІ. Однак заради простоти запису взяті цифри 1 і 0. В електронному апараті, що зберігає або обробляє інформацію, що розглядаються символи можуть також позначатися по-різному: один з них - наявністю в даній точці електричного струму або магнітного поля, другий - відсутністю в цій точці електричного струму або магнітного поля.

Методику представлення інформації в двійковій формі можна пояснити, провівши наступну гру. Потрібно у співрозмовника отримати цікаву для нас інформацію, задаючи будь-які питання, але отримуючи у відповідь тільки одне з двох: ТАК або НІ.

Відомим способом одержання під час цього діалогу двійковій форми інформації є перерахування всіх можливих подій.

Розглянемо найпростіший приклад отримання інформації. Ви задаєте тільки одне питання: «Чи йде дощ?». При цьому домовимося, що з однаковою ймовірністю очікуєте відповідь «ТАК» або «НІ». Легко побачити, що будь-який з цих відповідей несе найменшу порцію інформації. Ця порція визначає одиницю виміру інформації, яка називається бітом. Завдяки введенню поняття одиниці інформації з'явилася можливість визначення розміру будь-якої інформації числом бітів. Образно кажучи, якщо, наприклад, обсяг грунту визначають в кубометрах, то обсяг інформації - у бітах.

Домовимося кожну позитивну відповідь представляти цифрою 1, а негативний - цифрою 0. Тоді запис усіх відповідей утворить багатозначну послідовність цифр, що складається з нулів і одиниць, наприклад 0100.

Розглянутий процес отримання двійковій інформації про об'єкти дослідження називають кодуванням інформації. Кодування інформації перерахуванням всіх можливих подій дуже складно. Тому на практиці кодування здійснюється більш простим способом. Він заснований на тому, що один розряд послідовності двійкових цифр має вже удвічі більше різних значень (00, 01, 10, 11), ніж однорозрядна послідовність (0 і 1). Трехразрядное послідовність має також удвічі більше значень (000, 001, 010,011, 100, 101, 110, 111), ніж двухразрядного, і т. Д. Додавання одного розряду збільшує число значень удвічі. Взагалі кажучи, п-розрядна послідовність має 2 "значень.

Користуючись цим, легко закодувати будь-яка множина подій. Наприклад, нам потрібно закодувати 32 літери російського алфавіту, для цієї мети достатньо взяти п'ять розрядів, тому що пятіразрядний послідовність має 32 різних значення.

В інформаційних документах широко використовуються не тільки російські, але й латинські букви, цифри, математичні знаки та інші спеціальні знаки, всього приблизно 200 250 символів. Тому для кодування всіх зазначених символів використовується восьмирозрядна послідовність цифр 0 і 1. Наприклад, російські літери передаються восьмирозрядних послідовностями в такий спосіб: А - 11000001, І - 1100101), Я - 11011101.

Слід зазначити, що вказаний спосіб кодування використовується тоді, коли до нього не пред'являються додаткові вимоги: припустимо, необхідно вказати на виниклу помилку, виправлення помилки, забезпечити таємність інформації. У цих випадках застосовують спеціальне кодування, при використанні якого коди виходять довшими, ніж в зазначеному способі.

Для представлення графічної інформації в двійковій формі використовується так званий поточечной спосіб. На першому етапі вертикальними і горизонтальними лініями ділять зображення. Чим більше при цьому по / навчалося квадратів, тим точніше буде передана інформація про зображення. Як відомо з фізики, будь-який колір може бути представлений у вигляді суми різної яскравості зеленого, синього та червоного кольорів. Тому інформація про кожній клітині буде мати досить складний вид: номер клітини - 101 10010, 01111010, яскравість зеленого - 1010, яскравість синього - 1101, яскравість червоного - ООП.

Перед тим як кодувати будь-яку інформацію, потрібно домовитися про те, які використовуються кодь, в якому порядку вони записуються, зберігаються і передаються Це називається мовою представлення інформації.

З прикладів, розглянутих вище, видно, що інформація описується багаторозрядними послідовностями двійкових чисел. Тому для зручності ці г оследовательно-сти об'єднуються в групи по 8 біт. Така група іменується байтом, наприклад, число 11010011 - це ннфермація величиною в один байт.

У своїй діяльності людина використовує всі великі масиви інформації. Так, якщо з 1940 по 1950 рік обсяг інформації подвоївся приблизно за 10 років, то в даний час це подвоєння уже відбувається за 2-3 роки. При роботі з інформацією доводиться вирішувати большо'.1 число питань, пов'язаних зі зручними й вигідними формами її зберігання, передачі, пошуку, обробки. Крім цього, ісзнікают завдання, пов'язані з визначенням структури інформації. Необхідно також вивчати загальні властивості інформації. Всім цим займається наука інформатика.

Схожі статті