Подання інформації в комп'ютері, одиниці виміру інформації

1.2. Технічні засоби обробки інформації

1.2.5. Подання інформації в комп'ютері, одиниці виміру інформації

У ЕОМ застосовується двійкова система числення, тобто всі числа в комп'ютері представлені за допомогою нулів і одиниць, тому комп'ютер може обробляти тільки інформацію, представлену в цифровій формі.

Для перетворення числової, текстової, графічної, звукової інформації в цифрову необхідно застосувати кодування. Кодування - це перетворення даних одного типу через дані іншого типу. У ЕОМ застосовується система двійкового кодування, заснована на уявленні даних послідовністю двох знаків: 1 і 0, які називаються двійковими цифрами (binary digit - скорочено bit).

Таким чином, одиницею інформації в комп'ютері є один біт, тобто двійковий розряд, який може приймати значення 0 або 1. Вісім послідовних біт складають байт. В одному байті можна закодувати значення одного символу з 256 можливих (256 = 2 певною мірою 8). Більш великою одиницею інформації є кілобайт (Кбайт), що дорівнює 1024 байтам (1024 = 2 певною мірою 10). Ще більші одиниці вимірювання даних: мегабайт, гігабайт, терабайт (1 Мбайт = 1024 Кбайт; 1 Гбайт = 1024 Мбайт; 1 Тбайт = 1024 Гбайт).

Цілі числа кодуються двійковим кодом досить просто (шляхом ділення числа на два). Для кодування нечислової інформації використовується наступний алгоритм: всі можливі значення кодируемой інформації нумеруються і ці номери кодуються за допомогою двійкового коду.

Наприклад, для представлення текстової інформації використовується таблиця нумерації символів або таблиця кодування символів, в якій кожному символу відповідає ціле число (порядковий номер). Вісім двійкових розрядів можуть закодувати 256 різних символів.

Існуючий стандарт ASCII (8 - розрядна система кодування) містить дві таблиці кодування - базову і розширену. Перша таблиця містить 128 основних символів, в ній розміщені коди символів англійського алфавіту, а в другій таблиці кодування містяться 128 розширених символів.

Так як в цей стандарт не входять символи національних алфавітів інших країн, то в кожній країні 128 кодів розширених символів замінюються символами національного алфавіту. В даний час існує безліч таблиць кодування символів, в яких 128 кодів розширених символів замінені символами національного алфавіту.

Так, наприклад, кодування символів української мови Widows - тисячі двісті п'ятьдесят одна використовується для комп'ютерів, які працюють під ОС Windows. Інша кодування для української мови - це ЯКІ - 8, яка також широко використовується в комп'ютерних мережах і українському секторі Інтернет.

Але використання різних кодових сторінок для національних алфавітів (застосування 8 - розрядної системи кодування) створює проблеми для обміну файлами між різними вузлами мережі Інтернет. З метою усунення недоліків стандарту ASCII, організація Unicode впровадила новий стандарт універсальної системи UNICODE, заснований на 16 - розрядному кодуванні символів.

У першій версії Юникода була представлена ​​кодування з фіксованим розміром символу в 16 біт (два байти). Ця 16 - розрядна система забезпечує універсальні коди для 65536 різних символів, тобто в цій таблиці можуть розміститися символи мов більшості країн світу.

Але впровадження фіксованої 16 - розрядної системи кодування символів (UTF-16) привела б до збільшення обсягу текстових файлів в два рази. В даний час Юнікод має кілька форм представлення: UTF-8, UTF-16 і UTF-32. UTF-32 використовує для кодування будь-якого символу 32 біта, а UTF-8 і UTF-16 використовують для представлення символів змінне число байтів.

Фактично зараз застосовується кодування UTF-8, яка забезпечує сумісність з системою ASCII, що використовує 8-бітові символи. Символи ASCII займають один байт в UTF-8 і використовують ті ж біти. Решта символів Юнікоду, які не належать до символів ASCII, кодуються змінним числом байтів від двох до чотирьох.

Для кодування графічних даних застосовується, наприклад, такий метод кодування як растр. Координати точок і їх властивості описуються за допомогою цілих чисел, які кодуються за допомогою двійкового коду. Так чорно-білі графічні об'єкти можуть бути описані комбінацією точок з 256 градаціями сірого кольору, тобто для кодування яскравості будь-якої точки достатньо 8 - розрядного двійкового числа.

Режим подання кольорової графіки в системі RGB з використанням 24 розрядів (по 8 розрядів для кожного з трьох основних кольорів) називається повнокольоровим. Для поноцветного режиму в системі CMYK необхідно мати 32 розряду (чотири кольори по 8 розрядів).

Далі. >>> Тема: 1.3.1. Структура програмного забезпечення ПК

Схожі статті