World wide web - всесвітня інформаційна павутина

[3] Робота з WWW аж ніяк не обмежується тільки передачею (отриманням) заздалегідь підготовлених файлів з документами. Клієнту також надається можливість запуску програм на сервері. При цьому дані, які видають ці програмами, висилаються клієнту у вигляді документів. Таким чином організовується, наприклад, робота через WWW з системами пошуку інформації, інтерактивними навчальними програмами та багатьма іншими системами, де потрібно діалог користувача з сервером. Стандарт, за яким здійснюється запит на виконання програм і передача результатів клієнту, отримав назву Common Gateway Interface (CGI). Далі в книзі ми розповімо про CGI більш докладно.

[7] Увага: URL записується в один рядок і не містить пробілів. У даній книзі через обмежену ширини сторінки іноді доводиться переносити частину URL на наступний рядок.

[9] Нагадуємо, що в DOS і Microsoft Windows 3.1 на довжину імен файлів і директорій накладається так зване обмеження "8.3", тобто, максимум 8 символів до точки і максимум 3 символи після крапки, причому, великі та малі літери не розрізняються. У Microsoft Windows 95 і Windows NT обмеження "8.3" знято, і довжина імені файлу може досягати 256 символів, при цьому великі та малі літери вважаються різними символами.

[10] Для Microsoft Windows 95 і Windows NT це також справедливо.

[11] Інформація про багатьох типах файлів і відповідних їм суффиксах буде неодноразово зустрічатися в даній книзі. Відповідні довідкові відомості подані в Додатку на стор. 170.

[12] Ми ще раз торкнемося дане питання при обговоренні розміщення своїх файлів на WWW-сервері.

[13] Я це знаю, бо сам його туди помістив - Д.Р.

[15] Це робиться, щоб змусити користувача або встановити наступну бета-версію, або придбати налагоджену версію програми.

[23] При цьому Netscape Navigator зв'язується зі своєю WWW-сторінкою, звідки ви можете отримати інформацію про останні версії програм-приставок для даного типу файлів.

[25] Зауваження для знавців: ми поки не ведемо мову про кодування Unicode і інших кодуваннях, де кожен символ займає більше 8 біт. Взагалі, в цьому розділі ми свідомо істотно спрощуємо деякі технічні деталі, знання яких для користувача не обов'язково.

[26] За винятком літери є.

[29] В Netscape Navigator 4.0 меню Preferences викликається з меню Edit.

[30] Під "Cyrillic" в Netscape Navigator for Windows мається на увазі Windows-1251.

[31] пропорційно (proportional) називають шрифт, під кожен символ якого в рядку відводиться інтервал, пропорційний його ширині. Прикладом є шрифти гарнітур Times і Arial. Всі символи моноширинного (fixed) шрифту займають в рядку однакові інтервали, подібно символам в друкованому тексті. Моноширинний є все шрифти сімейства гарнітур Courier.

[32] Гарнітурою (typeface) називають накреслення шрифту або сукупність накреслень, об'єднаних загальним підходом до побудови знаків і рішенням деталей форми.

[33] Як правило, російськомовні документи зберігаються на сервері в якій-небудь одній кодуванні (найчастіше в KOI8-r), а перекодування відбувається безпосередньо при висилці документа клієнту, "на льоту".

[34] В Netscape Navigator 4.0 меню Encoding викликається з меню View.

[36] На шляху поширення наукових публікацій в WWW стоять не технічні, а економічні та правові проблеми.

[37] Спосіб завантаження файлів за допомогою Netscape був описаний на стор.

[38] Нагадуємо, що довгі імена файлів і подвійні суфікси в DOS і Microsoft Windows 3.1 неприпустимі. Переходьте на Windows 95 / NT або UNIX - і ви назавжди позбавитеся від проблеми з довгими іменами.

[41] Хочеться зауважити, що серед численних прикладів аматорського літературно-художньої творчості в Internet твори Грінспана майже бездоганні як в сенсі англійської мови, так і оформлення, що - на жаль - є великою рідкістю.

[44] Вимовляється: 'я-ху або й'ей-ху.

[45] Їх ще називають павуками (spiders) і, іноді, хробаками (worms). Остання назва не дуже вдало, тому що хробаками називають ще і мережеві віруси.

[46] Одночасно ці програми шукають в документах все посилання на інші URL і ставлять їх в чергу на відвідування. Завдяки цьому роботи можуть автоматично відстежувати появу нових документів в Internet.

[47] Питання про те, як зробити так, щоб пошукові системи проиндексировали створений вами документ, ми розглянемо на стор. 76.

[48] ​​Зазвичай поле для введення ключових слів являє собою білий прямокутник, що виділяється на сірому або кольоровому тлі. Щоб почати друкувати запит в такому полі, перемістіть в нього курсор миші і клацніть її клавішею (в Microsoft Windows) або просто перемістіть в нього курсор миші (в XWindows).

[49] Для пошуку російськомовних документів в кодуванні KOI8-r користувачі Netscape для Windows можуть застосувати наступний трюк "на швидку руку":

Трюк, "зворотний" описаного вище, можуть застосувати для пошуку документів в кодуванні Win1251 користувачі програми Netscape для UNIX (де панує виключно кодування KOI8-r).

[50] Наведений приклад написаний англійською мовою спеціально, щоб на першому етапі навчання читачеві уникнути труднощів, пов'язаних з русифікацією. Про шляхи вирішення проблеми русифікації розказано у відповідному розділі книги (стор. 25 і 65).

[51] Прописні і малі літери в прапорах не розрізняються. Зокрема, можна записати як .

[52] Не плутати використану тут цифру 1 з малої буквою l.

[53] Взагалі-то, в російській мові правильніше було б використовувати термін "абзац". але "параграф" в даному контексті викликає менше плутанини.

[54] Іноді називається неврегульованим списком (unordered list).

[62] Саме від низу до верху, а не зверху вниз, як це прийнято практично у всіх інших графічних форматах.

[63] 8 біт = 1 байт; 2 10 байт = 1 кілобайт, або 1 До

[64] Для порівняння зазначимо, що одна екранна сторінка тексту займає всього близько півтора кілобайт.

[65] Стиснення інформації засноване на частою повторюваності однакових послідовностей біт в графічних файлах. Наприклад, горизонтальна послідовність з пікселів одного кольору може виглядати в двійковому поданні так: 0100010001000100. Замість такої довгої послідовності біт при використанні одного з простих алгоритмів стиснення - так званого Run-Length Encoding - в файл може бути записана коротка підпослідовність 0100 і число її повторень. При записи в форматі GIF застосовуються більш складні та ефективні алгоритми Лемпеля-Зива-Уелча (LZW). на яких також заснована робота більшості програм архівування файлів.

[67] Алгоритми стиснення, що використовуються для запису графіки в форматі JPEG, засновані не тільки на усунення надмірності, але і на особливостях людського зору, що дозволяє відкидати деяку частину інформації без шкоди для її сприйняття оком.

[68] Великий документ, присвячений техніці фотографії, і огляд по сканерів можна знайти за наступними URL:

[71] Units - одиниці виміру при відліку координат. В наявності є таке одиниці: сантиметри (centimeters), дюйми (inches) і пікселі (pels).

[72] Зверніть увагу, що навіть якщо фотографія чорно-біла, то вона містить багато градацій яскравості сірого кольору і монохромне кодування для неї не підходить.

[73] Для перекодування доведеться застосувати відповідну програму, наприклад, CONVERT. про яку йшла мова в примітці [28] на стор. 28.

[75] В США досить поширена практика, при якій за певну плату будь-хто може розмістити свої WWW-документи на комерційних WWW-серверах. Крім того, існують фірми, які беруть на себе обов'язок розробки WWW-документів на замовлення. Оскільки комерційне використання WWW стрімко набирає обертів, подібними послугами часто користуються невеликі фірми і особи, які ведуть приватний бізнес. Ця практика поширюється і у нас в Росії (інформацію про даний тип послуг можна отримати у постачальників послуг Internet, див. Стор. 204).

[76] У всіх університетах США кожен студент і співробітник має доступ до однієї з "великих" університетських машин, зазвичай працюють під управлінням операційної системи UNIX. Доступ до цих машин здійснюється або з терміналів, встановлених в спеціальних комп'ютерних залах, або з терміналів персональних комп'ютерів, що підключаються до університетської мережі, яка, в свою чергу, має вихід в Internet. Студенти і співробітники використовують університетські комп'ютери для навчальних занять, обміну повідомленнями по електронній пошті, доступу до університетських баз даних і для розміщення своїх WWW-документів.

[77] Інформація про WWW-серверах приведена в Додатку (стр. 189).

[78] Нагадуємо, що $ HOME відповідає домашній директорії користувача.

[79] Про FTP см. Прим. 5 на стор. 11 і Додаток стор. 199.

[80] Якщо на вашому персональному комп'ютері встановлена ​​операційна система, що підтримує довгі імена файлів (наприклад, UNIX, OS / 2, MacOS. Windows 95 або Windows NT), і ви використовуєте програми перенесення файлів, розроблені спеціально для цих систем, то складнощів з спотворенням імен файлів при перенесенні в UNIX виникнути не повинно. Якщо ж ви переносите файли з DOS або Windows 3.1. доведеться перевірити і узгодити всі імена файлів між собою на UNIX-машина, так як DOS накладає на імена файлів значно більше обмежень, ніж UNIX (див. стор. 14). Зокрема, файл з нашим навчальним прикладом (див. Стор. 50) під DOS довелося б назвати ex1.htm. і при перенесенні його на UNIX-машина за допомогою деяких FTP-програм він міг отримати ім'я EX1.HTM В цьому випадку його треба перейменувати в ex1.html командою

Крім того, в нашому документі є рядок

[81] При перенесенні в "довічним" режимі файл копіюється "один до одного". При перенесенні в "текстовому" режимі можуть автоматично замінюватися коди, службовці ознакою кінця рядка в текстових файлах. Така заміна буває необхідна, оскільки в різних операційних системах ці коди розрізняються (наприклад, в MS-DOS кожен рядок тексту закінчується кодами 13 та 10, а в UNIX - тільки кодом 10). Зауважимо, що якщо ви перемістіть файли на мові HTML як виконавчі, нічого страшного не станеться, крім можливих ускладнень при їх редагуванні безпосередньо на UNIX-машина в подальшому, але ось перенесення файлів з графікою та інших не-текстових файлів в текстовому режимі (ASCII) їх безнадійно зіпсує.

[82] Для перенесення великого числа файлів, особливо, розміщених в декількох піддиректоріях, рекомендується їх попередня упаковка в один файл - архів (див. Стор. 37). При цьому, формат архівного файлу слід вибирати так, щоб його можна було коректно "розпакувати" на UNIX-машина. Зокрема, на IBM PC під Windows 95 / NT для приміщення файлів в архів можна скористатися програмою WinZip. Створювані цією програмою архіви у форматі PKZIP розпаковуються на UNIX-машина поширеною програмою unzip без спотворення імен файлів і директорій. Щоб правильно використовувати WinZip і unzip. треба уважно вивчити керівництва до цих програм або порадитися з досвідченими користувачами.

[83] Велику колекцію програмних засобів, призначених для розробки WWW-документів, можна знайти в Yahoo:

а також в архіві TUCOWS (див. стор. 37).

[84] Perl - мова програмування, спеціально призначений для роботи з текстовою інформацією. Ця мова, по синтаксису нагадує мову C, включає багато засобів таких утиліт UNIX, як sed, awk, grep і командного процесора shell. Інтерпретатор мови Perl є практично на будь-якій UNIX-машина. Існують також версії інтерпретатора для DOS, Windows 3.x і Windows 95.

[85] What You See Is What You Get - що бачиш, то і отримаєш.

[86] Під проектом ми тут розуміємо групу тісно взаємопов'язаних WWW-документів, що створюються і підтримуваних однією особою або кількома спільно працюють особами. Іноді така група називається Web site.

[88] Про рамках і зображеннях-картах ми розповімо в розділі, присвяченому додаткових засобів подання інформації (стор. 137).

[89] У тому сенсі, що при індексуванні і пошуку не враховуються правила словозміни і наявність різних кодувань кирилиці, а також не проводиться автоматичне перетворення між малими та великими літерами українського алфавіту.

[92] ПРОПИСНІ і малі літери в спеціальних послідовностях розрізняються.

[93] Смуга заголовка вікна (title bar) розташована уздовж верхнього краю вікна програми, що працює під управлінням Windows. OS / 2 або X-Windows. або уздовж верхнього краю дисплея на Apple Macintosh. Вона зазвичай містить назву програми та ім'я поточного документа, з яким ця програма працює.

[94] Про атрибутах прапора . що визначають колірну схему документа, див. стор. 131.

(C) D.N. Rassokhin, A.I. Lebedev

Схожі статті