Моделі представлення даних - студопедія

Для реалізації основних функцій в ІС використовуються різні принципи опису даних. Ядром будь-якої БД є модель представлення даних, тобто їх інформаційна структура. Модель бази даних - це безліч структур даних і операцій маніпулювання з цими структурами. Якщо БД не містить ніяких зовнішніх даних, в ній все одно є інформація. Ця інформація - структура самої бази. Структура визначає методи занесення даних і зберігання їх в базі.

• об'єктні моделі даних;

• моделі даних на основі записів;

• фізичні моделі даних.

Найбільшого поширення набули моделі даних на основі записів. У них БД складається з декількох записів фіксованого формату і різних типів. Інформаційні моделі даних на основі записів поділяються на:

1) теоретико-графові (ТГ):

2) теоретико-множинні (ТМ):

У теоретико-графових моделях передбачається одночасна обробка тільки одиночних об'єктів даних з БД. Доступ до БД підтримується створенням відповідних прикладних програм з власним інтерфейсом. Механізми доступу до даних і навігації по структурі даних в таких моделях досить складні, особливо в мережевій моделі.

Теоретико-множинні моделі використовують математичний апарат реляційної алгебри (знаковою обробки множин). Дані в таких БД представлені у вигляді сукупностей таблиць, над якими можуть виконуватися операції, сформульовані в термінах реляційної алгебри.

В ієрархічній БД існує впорядкованість елементів у записі. Об'єкти, пов'язані ієрархічними відносинами, утворюють орієнтований граф - дерево. Для цієї структури характерна підпорядкованість об'єктів нижнього рівня об'єктів верхнього рівня (рис. 10.2). Ієрархічну базу даних утворює, наприклад, каталог файлів, що зберігаються на диску, а дерево каталогів - наочна демонстрація її структури.

Перші системи управління базами даних використовували ієрархічну модель даних. Найвідомішою СУБД, що використовує модель даних цього типу, є система фірми IBM - Information Management System (IMS), перша версія якої з'явилася в 1968 році.

Основними інформаційними одиницями в ієрархічній системі даних є сегмент і поле. Поле даних визначається як найменша неподільна одиниця даних, доступна користувачу. Сегмент утворюється з значень полів даних. В ієрархічній моделі вершині графа-дерева відповідає сегмент, а дугам - типи зв'язків «предок-нащадок». Кожен сегмент-нащадок повинен мати в точності одного предка.

Мал. 10.2. ієрархічна БД

В цілому ієрархічна БД складається з упорядкованого набору кількох примірників одного типу дерева. При цьому граф-дерево має такі властивості:

а) є тільки одна вершина графа - корінь, в яку не входить жодне ребро;

б) в вершини n -го рівня заходить одне ребро (n - 1) -го рівня, виходять з цих вершин нуль, один або кілька породжених вершин, званих нащадками;

в) єдиний прохід до породженої вершині лежить через її вихідну вершину;

г) кожен нащадок має тільки одного предка;

д) немає замкнутих петель і циклів;

е) сегмент, у якого немає нащадків, називається листовим сегментом.

При роботі з деревовидної структурою використовуються два методу доступу до всіх вершин всередині дерева: прямий порядок обходу дерева (від корені з низхідним обходом піддерев до потрібного рівня) і зворотний порядок обходу дерева (від n-го рівня з висхідним обходом піддерев до кореня).

Мережева БД відрізняється більшою гнучкістю, тому що в ній існує можливість додатково до вертикальних ієрархічним зв'язкам додати горизонтальні зв'язки. Мережева структура являє собою довільний граф, тут кожен елемент може бути пов'язаний з будь-яким іншим елементом (рис. 10.3).

Мал. 10.3. мережева БД

Довільний граф складається з вершин (вузлів), з'єднаних ребрами. У мережній моделі вузли є об'єктами у вигляді типів записів даних, а ребра - зв'язки між об'єктами. Основна відмінність графових форм представлення даних в мережевій структурі від даних в ієрархічній структурі полягає в тому, що нащадок в графі може мати будь-яке число предків.

Типовим представником СУБД, що використовують мережеву модель даних, є Integrated Database Management System (IDMS) компанії Cullinet Software, Inc. призначена для використання на машинах фірми IBM.

Основними типами структур даних в мережевих моделях є елементи даних, агрегати даних, записи і набори (рис. 10.4).

Мал. 10.4. Основні структури мережевої моделі даних

Елемент даних - це найменша пойменована інформаційна одиниця даних, доступна користувачу.

Агрегат даних - пойменована сукупність елементів даних всередині записи або іншого агрегату.

Запис - кінцевий рівень композиції елементів даних. Кожен запис являє собою іменовану структуру, яка містить один або більше елементів даних.

Тип запису - це сукупність логічно пов'язаних примірників записів. Тип записів моделює деякий клас об'єктів реального світу.

Набір - це пойменована дворівнева ієрархічна структура, яка містить запис власника і записи членів. Набори висловлюють зв'язку між типами записів.

Мережевий граф БД влаштований значно складніше ієрархічного і має наступні властивості:

• БД може містити будь-яку кількість наборів і записів;

• між двома типами записів може бути будь-яка кількість наборів;

• тип запису може бути власником в одних типах наборів і членом в інших типах наборів, а може і не бути членом якогось типу набору;

• тільки один тип запису може бути власником в кожному наборі;

• типи наборів можуть утворювати циклічну структуру;

• один і той же тип запису може бути власником кількох типів наборів і одночасно може бути членом декількох типів наборів.

Недоліком мережевої моделі є складність її реалізації.

Реляційними (від англ. Relation - відношення) є БД, що містять інформацію, організовану у вигляді прямокутних таблиць. Реляційні БД характеризуються простотою структури даних, зручним для користувача табличним поданням і можливістю використання формального апарату алгебри відносин.

Важливим поняттям реляційних моделей даних є сутність. Сутність - це об'єкт будь-якої природи, дані про який зберігаються в БД.

В даний час реляційний підхід до побудови баз даних найбільш поширений. Цей підхід має такі переваги:

• використання порівняно невеликого набору абстракцій, що дозволяють моделювати більшість предметних областей;

• наявність простого математичного апарату, що спирається на теорію множин і математичну логіку і забезпечує теоретичний базис реляційного підходу;

• можливість навігації по БД без знання конкретної фізичної організації даних на зовнішніх носіях.

Реляційні системи не відразу отримали широке поширення. Навіть зараз не існує такої реляційної БД, в якій підтримувалися б все до єдиної можливості реляційної технології. До теперішнього часу основними недоліками реляційної технології є:

• обмеженість реляційних БД при використанні, наприклад, в системах автоматичного проектування (САПР), в яких використовуються дуже складні структури;

• обмежені можливості адекватного відображення семантики предметної області.

Отже, реляційна БД - це кінцевий набір відносин. Відносини використовуються для представлення об'єктів і для подання зв'язків між об'єктами. Кожне відношення - це двовимірна таблиця, що складається з рядків і стовпців, причому рядки відповідають записам, а стовпці атрибутів.

Атрибут - це пойменований стовпець відносини. Властивості об'єкта, його характеристики визначаються значеннями атрибутів.

Хоча поняття «ставлення» і «таблиця» іноді розглядаються як синоніми, їх слід розрізняти: ставленням є не будь-яка таблиця, а лише таблиця, що володіє певними властивостями. Будемо в подальшому викладі вживати термін «таблиця» з урахуванням цього зауваження.

Кожна реляційна таблиця, представляючи двовимірний масив (див. Рис. 10.1), має такі властивості:

• кожен елемент таблиці - один елемент даних;

• всі стовпці однорідні, т. Е. Все елементи в стовпці мають однаковий тип і довжину;

• кожен стовпець має унікальне ім'я;

• однакові рядки в таблиці відсутні;

• порядок проходження рядків і стовпців довільний.

Розглянемо основні властивості полів БД і використовуються типи даних на прикладі реляційної СУБД Microsoft Access. У ній все поля мають такі основні властивості:

• ім'я поля - визначає звернення до даних цього поля, використовується в якості заголовків стовпців таблиць;

• тип поля - визначає тип даних, що містяться в даному полі;

• розмір поля - задає граничну довжину поля (в символах);

• умова на значення - обмеження, яке використовується для перевірки правильності введення даних;

• повідомлення про помилку - текстове повідомлення, що видається при спробі введення в поле помилкових даних;

• обов'язкове поле - властивість, що визначає обов'язковість заповнення даних цього поля;

• індексовані поле - властивість, що прискорює операції з пошуку і сортування записів і перевіряє записи на наявність дублювання даних.

Так як в різних полях можуть зберігатися дані різного типу, то властивості полів залежать від типу даних, що зберігаються. Таблиці баз даних допускають роботу з великою кількістю різних типів даних в порівнянні з іншими програмами стандартних Windows-додатків.

У всіх базах даних реалізований особливий спосіб збереження даних, відмінний від способу збереження даних в файлових системах. У частині операцій, як зазвичай, бере участь операційна система комп'ютера, але деякі операції збереження відбуваються в обхід операційної системи.

Операції зміни структури бази даних, створення нових таблиць або інших об'єктів відбуваються при збереженні файлу бази даних, тобто про ці операції СУБД попереджає користувача. З іншого боку, операції зі зміни змісту даних, що не торкаються структуру бази, виконуються автоматично і без попередження. Всі зміни, що вносяться до таблиці бази, зберігаються на диску без нашого відома, т. Е. Відбувається робота з жорстким диском безпосередньо, поза операційною системою.

Схожі статті