При використанні HTML відображаються дані логічно не пов'язані з тегами, які використовуються для розмітки, тому програми-аналізатори не можуть використовувати теги для пошуку потрібних фрагментів документа. Крім цього обмеженість набору тегів HTML ускладнює його використання для відображення спеціалізованої інформації (наприклад, математичних формул).
Мова XML привертає до себе багато уваги з боку розробників і користувачів Інтернет. З'являються нові мови, створені на основі XML, виникають Web-сервера, що використовують цю технологію для організації, яка на них інформації. Повні специфікації XML і пов'язаних з ним мов доступні на офіційній сторінці W3C - www.w3.org
HTML є спрощеною версією мови розмітки SGML. Набагато більш простий і зручний, ніж SGML, мова HTML дозволяє визначати оформлення елементів документа і має якийсь обмежений набір інструкцій - тегів, за допомогою яких здійснюється процес розмітки. Інструкції HTML, в першу чергу, призначені для управління процесом виведення вмісту документа на екрані програми-клієнта і визначають цим самим спосіб представлення документа, але не його структуру. В якості елемента гіпертекстової бази даних, описуваної HTML, використовується текстовий файл, який може легко передаватися по мережі з використанням протоколу HTTP. Ця особливість, а також те, що HTML є відкритим стандартом і величезна кількість користувачів має можливість застосовувати можливості цієї мови для оформлення своїх документів, безумовно, вплинули на зростання популярності HTML і зробили його сьогодні головним механізмом подання інформації в Web
Однак сучасні програми потребують не тільки в мові представлення даних на екрані клієнта, але і в механізмі, що дозволяє визначати структуру документа, описувати що містяться в ньому елементи. HTML володіє нескладним набором команд і успішно справляється із завданням опису гіпертекстової інформації, яка відображається екрані браузером. Однак самі відображаються дані не пов'язані з тими тегами, які використовуються для форматування, тому у програм-аналізаторів немає можливості використовувати теги HTML для пошуку потрібних нам фрагментів документа. Тобто зустрівши, наприклад, такий опис
Іншим істотним недоліком HTML можна назвати обмеженість набору його тегів. DTD- правила для HTML визначають фіксований набір дескрипторів і тому в розробника немає можливості вводити власні, спеціальні теги.
Підводячи підсумок всьому сказаному, можна стверджувати, що HTML не в усьому задовольняє повною мірою вимогам, що пред'являються розробниками до мов подібного роду. HTML доповнює мову гіпертекстової розмітки XML, потужний, гнучкий, і зручний мову. У чому ж полягає його гідності?
Термін XML позначає особливий різновид гіпертекстових документів. Чим же погані звичайні текстові документи і що особливого є в XML-документах?
Фактично XML - це спосіб розмітки документів, призначений для формування в документах якоїсь структури і визначення відношень між різноманітними елементами цієї структури. Для створення такої розмітки служать спеціальні інструкції, звані тегами. Теги розташовують між символами <и>. Завдяки наявності тегів стає можливою уніфікована автоматична обробка і форматування XML-документів. Завдяки XML вдається також контролювати правильність даних, що зберігаються в документах, а також встановити єдиний стандарт на структуру документів, в яких можуть міститися довільні дані. XML незамінний при побудові складних інформаційних систем, в яких дуже важливим є питання обміну інформацією між різними споживачами. Завдяки XML можна позбутися багатьох проблем, пов'язаних з несумісністю використовуваних різними компонентами.
Приклад типового XML-документа
Решта рядки мають явно виражену ієрархічну структуру, в якій є один кореневий тег
Залишилося тільки сказати, що означають і для чого потрібні записи, типу type = "datetime" або type = "string" всередині назв тегів
XML - це мова розмітки, що описує цілий клас об'єктів даних, званих XML- документами. Ця мова використовується в якості засобу для опису граматики інших мов і контролю за правильністю складання документів. Тобто сам по собі XML не містить ніяких тегів, призначених для розмітки, він просто визначає порядок їх створення. Таким чином, якщо, наприклад, ми вважаємо, що для позначення елемента rose у документі необхідно використовувати тег
Набір тегів може бути легко розширений. Якщо, припустимо, ми хочемо також вказати, що опис квітки має за змістом йти усередині опису оранжереї, в якій він цвіте, то просто задаємо нові теги і вибираємо порядок їх слідування:
Якщо ми хочемо посадити туди ще кілька квіточок, то повинні внести наступні зміни:
Ще одним з очевидних переваг XML є можливість використання його в якості універсальної мови запитів до сховищ інформації. Сьогодні в глибинах W3C знаходиться на розгляді робочий варіант стандарту XML-QL (або XQL), який, можливо, в майбутньому складе серйозну конкуренцію SQL. Крім того, XML-документи можуть виступати в якості унікального способу зберігання даних, який включає в себе одночасно засоби для розбору інформації й представлення її на стороні клієнта. У цій області одним із перспективних напрямків є інтеграція Java і XML - технологій, що дозволяє використовувати міць обох технологій при побудові машинно-незалежних додатків, що використовують, крім того, універсальний формат даних при обміні інформацією.
XML дозволяє також здійснювати контроль за коректністю даних, що зберігаються в документах, робити перевірки ієрархічних співвідношень усередині документа і встановлювати єдиний стандарт на структуру документів, умістом яких можуть бути самі різні дані. Це означає, що його можна використовувати при побудові складних інформаційних систем, в яких дуже важливим є питання обміну інформацією між різними додатками, що працюють в одній системі. Створюючи структуру механізму обміну інформації на самому початку роботи над проектом, менеджер може позбавити себе в майбутньому від багатьох проблем, пов'язаних з несумісністю використовуваних різними компонентами системи форматів даних.
Також одним з достоїнств XML є те, що програми-обробники XML- документів не складні і вже сьогодні з'явилися і вільно поширюються всілякі програмні продукти, призначені для роботи з XML-документами. XML підтримується сьогодні в Microsoft Internet Explorer 4/0 і в бета-версіях IE5. Було заявлено про його підтримку в наступних версіях Netscape Communicator, СУБД Oracle, DB-2, в додатках MS-Office. Все це дає підстави припускати, що, швидше за все, в найближчому майбутньому XML стане основною мовою обміну інформацією для інформаційних систем, замінивши собою, тим самим, HTML. На основі XML уже сьогодні створені такі відомі спеціалізовані мови розмітки, як SMIL, CDF, MathML, XSL, і список робочих проектів нових мов, що знаходяться на розгляді W3C, постійно поповнюється.