Моделі і типи даних

Модель даних - це деяка абстракція, яка, будучи застосовні до конкретних даних, дозволяє користувачам і розробникам трактувати їх уже як інформацію, тобто відомості, що містять не тільки дані, але і взаємозв'язок між ними. На рис. 2 подано класифікацію моделей даних.

Моделі і типи даних

Мал. 2. Класифікація моделей даних

Крім трьох розглянутих рівнів абстракції при проектуванні БД існує ще один рівень, що передує їм. Модель цього рівня повинна виражати інформацію про предметну область у вигляді, незалежному від використовуваної СУБД. Ці моделі називаються инфологической, або семантичними, і відображають в природною і зручною для розробників та інших користувачів формі інформаційно-логічний рівень абстрагування, пов'язаний з фіксацією і описом об'єктів предметної області, їх властивостей і їх взаємозв'язків.

Інфологічної моделі даних використовуються на ранніх стадіях проектування для опису структур даних в процесі розробки програми, а даталогіческіе моделі вже підтримуються конкретної СУБД.

Документальні моделі даних відповідають уявленню про слабоструктурованої інформації, орієнтованої в основному на вільні формати документів, текстів на природній мові.

Моделі, засновані на мовах розмітки документів, пов'язані, перш за все, зі стандартним спільною мовою розмітки - SGML (Standard Generalized Markup Language), який був затверджений ISO як стандарт ще в 80-х роках. Ця мова призначений для створення інших мов розмітки, він визначає припустимий набір тегів (посилань), їх атрибути і внутрішню структуру документа. Контроль за правильністю використання тегів здійснюється за допомогою спеціального набору правил, званих DTD-описами. які використовуються програмою клієнта при розборі документа. Для кожного класу документів визначається свій набір правил, що описують граматику відповідної мови розмітки. За допомогою SGML можна описувати структуровані дані, організовувати інформацію, що міститься в документах, представляти цю інформацію в деякому стандартизованому форматі. Але зважаючи на деяку свою складність SGML використовувався в основному для опису синтаксису інших мов (найбільш відомим з яких є HTML), і мало хто додатки працювали з SGML-документами безпосередньо.

Набагато більш простий і зручний, ніж SGML, мова HTML дозволяє визначати оформлення елементів документа і має якийсь обмежений набір інструкцій - тегів, за допомогою яких здійснюється процес розмітки. Інструкції HTML в першу чергу призначені для управління процесом виведення вмісту документа на екрані програми-клієнта і визначають цим самим спосіб представлення документа, але не його структуру. В якості елемента гіпертекстової бази даних, описуваної HTML. використовується текстовий файл, який може легко передаватися по мережі з використанням протоколу HTTP. Ця особливість, а також те, що HTML є відкритим стандартом, і величезна кількість користувачів має можливість застосовувати можливості цієї мови для оформлення своїх документів, безумовно, вплинули на зростання популярності HTML і зробили його сьогодні головним механізмом подання інформації в Internet.

Однак HTML сьогодні вже не задовольняє повною мірою вимогам, що пред'являються сучасними розробниками до мов подібного роду. І йому на зміну був запропонований новий мову гіпертекстової розмітки, потужний, гнучкий і, одночасно з цим, зручний мова XML. У чому ж полягають його переваги?

XML (Extensible Markup Language) - це мова розмітки, що описує цілий клас об'єктів даних, званих XML-докумснтамі. Він використовується як засіб для опису граматики інших мов і контролю за правильністю складання документів. Тобто сам по собі XML не містить ніяких тегів, призначених для розмітки, він просто визначає порядок їх створення.

Тезаурусні моделі засновані на принципі організації словників, містять певні мовні конструкції і принципи їх взаємодії в заданій граматиці. Ці моделі ефективно використовуються в системах-перекладачів, особливо багатомовних перекладачів. Принцип зберігання інформації в цих системах і підпорядковується Тезаурусний моделям.

Дескрипторного моделі - найпростіші з документальних моделей, вони широко використовувалися на ранніх стадіях використання документальних баз даних. У цих моделях кожному документу відповідав дескриптор - описувач. Цей дескриптор мав жорстку структуру і описував документ відповідно до тими характеристиками, які потрібні для роботи з документами в розробляється документальної БД. Наприклад, для БД, що містить опис патентів, дескриптор містив назву області, до якої належав патент, номер патенту, дату видачі патенту і ще ряд ключових параметрів, які заповнювалися для кожного патенту. Обробка інформації в таких базах даних велася виключно за дескрипторів, тобто за тими параметрами, які характеризували патент, а не по самому тексті патенту.

Збережені в базі дані мають певну логічну структуру - іншими словами, описуються деякою моделлю представлення даних (моделлю даних), підтримуваної СУБД. До числа класичних відносяться наступні моделі даних:

Крім того, в останні роки з'явилися і стали більш активно впроваджуватися на практиці такі моделі даних:

Розробляються також всілякі системи, засновані на інших моделях даних, які розширюють відомі моделі. У їх числі можна назвати об'єктно-реляційні, дедуктивно-об'єктно-орієнтовані, семантичні, концептуальні та орієнтовані моделі. Деякі з цих моделей служать для інтеграції баз даних, баз знань і мов програмування.

У деяких СУБД підтримується одночасно кілька моделей даних. Наприклад, в системі ІНТЕРБАЗА для додатків застосовується мережевий мова маніпулювання даними, а в інтерфейсі реалізовані мови SQL і QBE.

Схожі статті