Інформатика, текстовий редактор

глава 5
Комп'ютер і текст

У цьому розділі ви дізнаєтеся:
  • як в комп'ютері кодується текст, і як визначити необхідний для зберігання документа обсяг пам'яті;
  • чому іноді замість тексту ми бачимо на екрані незрозумілі символи, і що таке програма-конвертор, а також
  • що вміє текстовий процесор.

В інформатиці текстом вважають послідовність будь-яких символів. Зараз комп'ютери в основному користуються алфавітами, що містять 256 знаків 1. Кожному із символів відповідає свій восьмизарядний двійкового коду. Таким чином будь-який символ тексту, включаючи пробіли, займає 8 біт (1 байт) в пам'яті комп'ютера. Знаючи це, можна легко оцінити обсяг пам'яті, необхідний для зберігання того чи іншого текстового документа.

Згадаймо, як пов'язано кількість біт в коді з тим, скільки потрібно різних кодів.

Один біт (двійкова цифра) може приймати два значення, додавання кожного розряду в код подвоює кількість одержуваних комбінацій: двухбітовий код - чотири варіанти, трехбітовий - вісім, четирехбітовий - шістнадцять і т. Д.

Розглянемо приклад. Машинописна сторінка стандартного формату (А4) містить близько 55 рядків. На кожному рядку міститься в середньому 60 символів 2. Підрахуємо кількість текстової інформації на такій сторінці. Кожен символ - 1 байт інформації, а всього символів - 60 * 55 = 3300. Значить, на сторінці 3300 байт (близько 3 Кбайт). Як пов'язані двійкові коди і відповідні їм символи? Це визначається таблицею кодування. Всі використовувані на персональних комп'ютерах таблиці 3 засновані на американському стандарті ASCII 4. Він визначає перші 128 кодів: для латинських букв, цифр, основних знаків пунктуації та математичних операцій. Решта 128 кодів використовуються для спеціальних символів і букв національних алфавітів (в тому числі, російського). І, оскільки загальноприйнятого стандарту для цього не було, виникло багато різних кодувань. в тому числі, кілька - для кирилиці 5. Саме тому, отримавши від кого-небудь текст і спробувавши прочитати його на своєму комп'ютері, ми часто бачимо на екрані набір незрозумілих "закорючек".

У такій ситуації на допомогу приходять програми-конвертори 6. Вони замінюють двійковий код кожного символу на код, яким такий символ представляється в іншому кодуванні. Це відповідність визначається таблицею перекодування. Зазвичай користувач повинен вказати, з якої кодування в яку йде перетворення, однак з'явилися і програми, які вміють автоматично визначати кодування вихідного тексту.

Якими ж даними оперують ці програми? Очевидно, що найменшим об'єктом буде символ. Однак можна працювати не тільки з окремими символами, а й зі словами, рядками, абзацами, довільними фрагментами і текстом в цілому. Деякі дії можна виконати з будь-якої з цих структур, інші - тільки з какй певної. Опрацьований текст представляється як би у вигляді рулону "паперу", який можна прокручувати на екрані вперед і назад. Більшість сучасних програм дозволяє одночасно працювати з декількома текстами, кожен з яких виводиться в окреме вікно. Крім основних "листів" текстовий процесор, як і інші програми використовує "конверт" (або "кишеню"), в якому можна тимчасово зберігати фрагмент тексту при його копіюванні або переміщенні.

Контрольні питання

  1. Як пов'язано кількість біт в коді з числом різних станів, які потрібно кодувати? Скільки біт пам'яті займає 1 символ тексту? Чому?
  2. Що таке таблиця кодування? Як прочитати текст, якщо в ньому використана не така, як у вашому комп'ютері, кодування?
  3. Розкажи про призначення текстового процесора і наданих їм користувачеві можливості.

Примітки

Схожі статті