Понятие модели данных, базы данных. Понятие и назначение систем управления базами данных. Основные модели построения баз данных

Ядром любой базы данных есть модель данных. Модель данных представляет собой великое множество структур данных, ограничений целостности и операций манипулирования данными. С помощью модели данных могут быть представленные объекты предметной области, взаимосвязи между ними. Модель данных - это совокупность структур данных и операций их обработки. Современная СУБД базируется на использовании иерархической, сетевой, реляционной и объектно-ориентированной моделях данных, комбинации этих моделей или на некотором их подмножестве.

Рассмотрим три основных типа моделей данных: иерархическую, сетевую, реляционнную и объектно-ориентированную.

Иерархическая модель данных. Иерархическая структура представляет совокупность элементов, связанных между собою по определенным правилам. Объекты, связанные иерархическими отношениями, образовывают ориентированный граф (перевернутое дерево). К основным понятиям иерархической структуры относятся: уровень, элемент (узел), связь. Иерархическую модель организовывает данные в виде древовидной структуры. Узел - это совокупность атрибутов данных, которые описывают некоторый объект. На схеме иерархического дерева узлы имеют вид вершин графа. Каждый узел на более низком уровне связан только с одним узлом, который находится на более высоком уровне. Иерархическое дерево имеет только одну вершину (корень дерева), которая не подчинена никакой другой вершине. Зависимые (подчиненные) узлы находятся на втором, третьем и других уровнях. Количество деревьев в базе данных определяется числом корневых записей.

Сетевая модель данных.

Сетевая модель означает представление данных в виде произвольного графа. Достоинством сетевой и иерархической моделей данных является возможность их эффективной реализации по показателям затрат памяти и оперативности. Недостатком сетевой модели данных является высокая сложность и жесткость схемы БД, построенной на ее основе.

Реляционная модель данных. Понятие реляционный (англ. relation - отношение) связан с разработками известного американского специалиста в области систем баз данных Э.Ф. Кодда. Эти модели характеризуются простотой структуры данных, удобной для пользователя формой представления в виде таблиц и возможностью использования аппарата алгебры отношений и реляционного вычисления для обработки данных.

На языке математики отношение определяется таким образом. Пусть задано n множеств D1,D2, ...,Dn. Тогда R есть отношение над этими множествами, если R есть множеством упорядоченных наборов вида , где d1 - элемент с D1 , d2 - элемент с D2 , ... , dn - элемент с Dn. При этом наборы вида называются кортежами, а множества D1,D2, ...Dn - доменами. Каждый кортеж состоит из элементов, которые выбираются из своих доменов. Эти элементы называются атрибутами, а их значения - значениями атрибутов.

Итак, реляционнная модель ориентирована на организацию данных в виде двумерных таблиц, любая из которых имеет следующие свойства:

Каждый элемент таблицы - это один элемент данных;

Все столбцы в таблицы - однородные, т.е все элементы в столбце имеют одинаковый тип (символьный, числовой и т.п.);

Каждый столбец носит уникальное имя;

Одинаковые строки в таблицы отсутствуют.

Таблицы имеют строки, которые отвечают записям (или кортежам), а столбцы -атрибутам отношений (доменам, полям).

Следующие термины являются эквивалентными:

отношение , таблица, файл (для локальных БД );

кортеж, строка , запись;

атрибут, столбик, поле.

Объектно-ориентированные БД объединяют в себе две модели данных, реляционную и сетевую, и используются для создания крупных БД со сложными структурами данных.

Реляционная БД есть совокупностью отношений, которые содержат всю необходимую информацию и объединенную разными связями.

БД считается нормализованной , если выполняются следующие условия:

Каждая таблица имеет главный ключ;

Все поля каждой таблицы зависят только от главного ключа;

В таблицах отсутствуют группы повторных значений.

Для успешной работы с многотабличными БД, как правило, надо установить между ними связи. При этом пользуются терминами “базовая таблица» (главная) и “подчиненная таблица». Связь между таблицами получается благодаря двум полям, одно из которых находится в базовой таблице, а второе - в подчиненной. Эти поля могут иметь значение, которое повторяются. Если значение в связанном поле записи базовой таблицы и в поле подчиненной совпадают, то эти записи называются связанными.

Существуют четыре типа отношений между таблицами: один к одному , один ко многим, много к одному, много ко многим .

Отношение один к одному означает, что каждая запись в одной таблице соответствует только одной записи в другой таблице.

Отношение один ко многим означает, что одна запись из первой таблицы может быть связана более чем с одной записью из другой таблицы.

Главная таблица – это таблица, которая содержит первичный ключ и составляет часть один в отношении один ко многим .

Внешний ключ – это поле, содержащее такой же тип информации в таблице со стороны много .

Практическая работа

План


База данных (БД)

СУБД



Модель данных

Иерархическая модель базы данных

Сетевая модель базы данных

Строка таблицы - это запись, которая содержит информацию об отдельном объекте таблицы (один ученик).

Структура записей одинакова; совокупность элементов данных, из которых состоит запись, называется полем. Информация записи находится в полях. Поле таблицы - это колонка таблицы.

Одинаковые записи в таблице не допускаются, поскольку во всех записях поля им предоставляют уникальные имена, фамилия СУБД Access позволяет:

Поле должно быть однородным по типу по всем записям в колонке (или текстовые данные, числовые и т.д).

Реляционная модель базы данных, как правило, содержит несколько таблиц, связь между которыми осуществляется с помощью специального поля - ключа .

Примеры реляционных СУБД: dBASE, FoxBase, FoxPro и Access.

Приложение MS Access является системой управления базами данных, которая входит в состав пакета Microsoft Office и предназначена для работы за персональным компьютером или в сети под управлением операционной системы Windows.

База данных СУБД Access является реляционной базой данных, которая состоит из взаимосвязанных двумерных таблиц.

СУБД Access дает возможность:

· Проектировать табличные объекты базы данных;

· Устанавливать связи между таблицами;

· Вводить, хранить, просматривать, сортировать, изменять данные таблицы с использованием аппарата алгебры логики и индексирования;

· Создавать и использовать объекты БД.

Объекты СУБД Access:

Базы данных - файл, который содержит различные объекты сохранения данных.

Таблицы (tables ) - организация хранения данных в виде двумерного массива. Она является основным объектом БД. Остальные - производные от таблицы.

Формы - объекты для отображения данных из таблицы на экране в удобном для просмотра и обработки виде.

Запросы - объекты для выбора и фильтрации данных таблицы по определенным критериям.

Отчет - формирование документа данных из таблицы для печати.

Макросы - описание действий в виде последовательности команд и их автоматического выполнения.

Модули - программы на Visual Basic, которые разрабатывает пользователь для реализации нестандартных процедур.

Обзор реляционной модели данных. Модель «сущность-связь». Понятие отношения, атрибута, ключа, связи. Классификация связей с множественностью и полнотой. Правила построения модели данных предметной области.

Модель "сущность-связь" (ER-модель) (англ. Entity-relationship model или entity-relationship diagram) - модель данных, позволяющая описывать концептуальные схемы с помощью обобщенных конструкций блоков. ER-модель - это метамодель данных, то есть средство описания моделей данных.

ER-модель удобна при проектировании информационных систем, баз данных, архитектур компьютерных приложений и других систем (моделей). С помощью такой модели выделяют существенные элементы (узлы, блоки) модели и устанавливают связи между ними.

Существует ряд моделей для представления знаний. Одним из наиболее удобных инструментов унифицированного представления данных, независимого от реализующего его программного обеспечения, является модель "сущность-связь" (entity - relationship model, ER - model ).

Модель "сущность-связь" основывается на какой-то важной семантической информации о реальном мире и предназначена для логического представления данных. Она определяет значения данных в контексте их взаимосвязи с другими данными. Важным для нас является тот факт, что из модели "сущность-связь" могут быть порождены все существующие модели данных (иерархическая, сетевая, реляционная, объектная), поэтому она является наиболее общей. Любой фрагмент предметной области может быть представлен как множество сущностей, между которыми существует некоторое множество связей.

ER-модель - это одна из наиболее простых визуальных моделей. Она позволяет постичь структуру объекта «крупными мазками», в общих чертах. Такое общее описание структуры называется ER-диаграммой или онтологией выбранной предметной области (area of interest).

Типичные примеры использования ER-модели данных IDEF1x (ICAM DEFinition Language) и dimensional modelling.

Отношение реляционных баз данных .

Отношения реляционной базы данных делятся на два класса: объектные и связные. Объектное отношение хранит данные объекты (экземпляры сущности). В объектном отношении один (или несколько) из атрибутов, однозначно идентифицирующих объект. Такой ключевой атрибут называется (единичным или множественным) ключом отношений или первичным атрибутом. Ключ, как правило, находится в первом столбце. Остальные атрибуты функционально зависят от данного ключа. Ключ может включать несколько атрибутов (сложный ключ). В объектном отношении атрибуты не должны дублироваться. Это основное ограничение в реляционной базе данных для сохранения целостности данных. Связное отношение хранит ключи двух или более объектных отношений, то есть по ключам устанавливаются связи между объектами отношений. Связное отношение может иметь и другие атрибуты, которые функционально зависят от этой связи. Ключи в связных отношениях называются внешними (сторонними) ключами, поскольку они являются первичными ключами других отношений.

Условия и ограничения, которые накладываются на отношения реляционных баз данных на табличном уровне представления, можно сформулировать следующим образом:

· не может быть одинаковых первичных ключей, то есть все строки (записи) должны быть уникальными;

· все строки должны иметь одинаковую типовую структуру;

· имена столбцов таблицы должны быть различны, а значения столбцов должны быть однотиповыми;

· значения столбцов должны быть атомарными, т.е. не могут быть компонентами других отношений;

· должна сохраняться целостность внешних ключей;

· порядок размещения строк в таблице несущественный - он влияет только на скорость доступа к нужной строки.

Обеспечивается поддержка таких типов связей между записями: один ко многим; многие к одному, многие ко многим .

Основные этапы работы с базами данных:

Проектирование таблицы.

После создания нового банка данных с помощью директивы File/New Database (Создать новый банк) или открытие существующего банка с помощью File/Open Database (Открыть банк) на экране в рамках окна Access появляется окно банка данных.

В меню File выберите директиву New (Создать новый объект), а в подменю - опцию Table (Таблица).

Назначение имен полей

Каждая строка спецификации определяет характеристики одного поля записи. В колонку Fіeld Name задается имя поля. Оно может иметь длину до 64 символов и может содержать кириллицу, пробелы и специальные символы, за исключением точек, восклицательного знака и угловых скобок. Естественным ограничением является запрет на наличие в одной таблице двух полей с одинаковыми именами.

Установка типа данного поля

Тип данных вносится в столбец Data Type, причем его можно выбрать из списка доступных типов.

Text. Текстовые поля содержат текст, длина которого не может быть больше 255 символов. Реальная длина поля устанавливается с помощью параметра Fіeld Size (Размер поля)

Memo. В Memo-полях текст длиной до 32000 символов. Поля этого типа данных не могут индексироваться.

Number. Числовые поля содержат произвольные числовые значения. Диапазон допустимых значений определяется параметром Fіeld Size (Размер поля).

Date/Time. Поля даты/времени содержат значения даты и времени в диапазоне от 100 до 9999 года.

Currency. В денежных полях можно хранить числа с точностью до 15 разрядов слева от запятой и четырех десятичных разрядов (обычно достаточно двух) справа от запятой.

Counter. Поле счетчика, содержит число, которое автоматически увеличиваются Access на 1, когда в таблицу добавляется новый блок данных.

Yes/No. В таких полях хранятся значения Yes (Да) или No (Нет). Поля данного типа не могут индексироваться.

OLE Object. В OLE-полях содержатся объекты, такие как, например, Excel-таблица или Microsoft Draw-графика, обработанные OLE-сервером. Размер поля может быть до 128 МБ.

Определение размера поля. Для числовых полей параметр Fіeld Size может иметь одно из следующих значений:

Byte . Хранит числа от 0 до 255 (только целые). Занимает 1 байт.

Іnteger . Хранит числа от -32768 до 32767 (только целые). Занимает 2 байта.

Long Іnteger . Хранит числа от -2147483648 до 2147483647 (только целые). Занимает 4 байта.

Sіngle . Хранит числа с шестиразрядной точностью от 3,402823Е38 до 3.402823Е38. Занимает 4 байта.

Double . Хранит числа с десятиразрядной точностью от -1.79769313486232Е308 до 1,79769313486232Е308. Занимает 8 байтов (стандартная установка).

Определение параметров поля

Характеристики каждого поля определяются рядом параметров. Эти параметры регламентируют способы обработки, хранения и индикации данных.

Fіeld Sіze (Размер поля). Устанавливает максимальную длину текстового поля или способ представления чисел в поле типа Number.

Format (Формат). Определяет способ представления данных. Наряду с определенными форматами допускается использование собственных форматов пользователя.

Decіmal Places (Десятичные разряды). Устанавливает количество разрядов справа от десятичной запятой.

Captіon (Надпись). Определяет надпись, которая будет использоваться в качестве наименования поля в формуляре или отчете. Если для этого параметра не будет задано никакое значение, то, как надпись, будет по умолчанию использовано имя поля.

Default Value (Значение по умолчанию). Устанавливает значение, которое будет автоматически введено в поле при генерации блока данных.

Valіdatіon Rule (Ограничения введения). Правило, которое ограничивает допустимые для ввода в поле данные.

Valіdatіon Text (Сообщение о нарушении). При попытке ввести в поле данные, не удовлетворяющие правилу, сформулированному в Valіdatіon Rule.

Іndexed (Индексированное поле). Признак индексирования.

Добавление и удаление полей

В готовую спецификацию можно вносить изменения. В частности, можно изменять параметры отдельных полей, добавлять поля в запись в нужных местах и удалять лишние. Но при этом стоит постараться внести все исправления в спецификацию до начала заполнения банка данных, потому что попытка изменить параметры полей заполненной базы может вызвать потерю или искажение данных.

1. Если удалить поле, которое содержит данные, то появится предупреждающее сообщение с вопросом о том, действительно ли пользователь хочет выполнить удаление, нажмите на кнопку Cancel.

2. В меню Edit выберите директиву Undo Delete (Отменить удаление). Однако отменить операцию удаления и восстановить исходное состояние таблицы можно только в случае, если после удаления не были сделаны никакие другие изменения в структуре или содержании банка. Access гарантирует возможность отмены, но только для последней выполненной операции.

3. Закройте окно таблицы и нажмите командную кнопку No (Нет) в диалоговом окне запроса о необходимости сохранения изменений. Однако в этом случае будут проигнорированы и все другие изменения, выполненные за этот сеанс работы с таблицей.

Установка первичного ключа

После того как дано определение всем полям, стоит выбрать минимум одно поле для использования как первичный ключ. Объявления первичного ключа препятствует введению повторяющихся блоков данных, поскольку поле таблицы, используемое в качестве первичного ключа, содержит однозначный идентификатор для каждого блока данных. Это поле не может содержать одинаковую величину в двух разных записях.

Первичный ключ может быть определен только в режиме проектирования таблицы. Маркируйте поле, что должно стать полем первичного ключа и вызовите директиву Set Ргімагу Key (Установить ключ) в меню Edit. Маркированная поле немедленно обозначается значком ключа в селекторном столбике (это и есть признак того, что поле объявлено первичным ключом) и соответственно индексируется.

Если к моменту выхода из режима проектирования первичный ключ для создаваемой таблицы не будет объявлен, то Access спросит, стоит ли включить в таблицу поле первичного ключа. Если пользователь ответит положительно (Yes), то Access создаст особое поле с именем ID, в которое для каждого блока данных будет вводиться.

Понятие таблицы, поля, записи. Основные этапы работы с базами данных в среде системы управления базами данных. Отображение модели «сущность-связь» базы данных. Свойства полей, типы данных. Ввод данных в таблицы. Сортировка, поиск и фильтрация данных.

Таблица - это набор именованных полей, в которых описываются свойства объектов.

Таблица предусматривает отражение данных в виде строк и столбцов. Столбец содержит характеристику объектов; строка - совокупность характеристик об одном экземпляре объекта. Записью является строка таблицы базы данных

Поле - столбец таблицы, предназначенный для хранения значений определенного свойства (параметра) объекта.

Запись - строка таблицы. Одна запись содержит данные про отдельный объект, который описывают в базах данных.

СУБД Access позволяет создавать объекты базы данных, в которых будет содержаться информация из различных таблиц. Для этого необходимо установить связь между таблицами. При создании связи будут объединены (связаны) записи в этих таблицах. При этом пользуются условными сроками, говорят о базовой и зависимой таблице. В обеих таблицах должны быть поля, которые имеют одинаковые значения. Тогда связью между таблицами будет эта пара полей (одно - в базовой таблице, второе - в зависимой). Связанные поля могут иметь разные имена, но тип значений этих полей обязательно должен совпадать.

Проектирование баз данных состоит из концептуального, логического и физического этапов. Каждый этап использует свою модель данных.

Существует несколько методов построения концептуальной модели базы данных. Один из наиболее распространенных методов основывается на модели, которая основана на предоставлении предметной области в виде двух типов объектов - сущностей и связей.

Сущность - это объект предметной области, который является множеством элементов. Примеры сущностей - ученики, предметы, кружки. Каждый элемент сущности - это конкретный экземпляр. Сущности представляются в базе данных в виде таблицы. Имя сущности - имя таблицы, характеристики - названия столбцов таблицы, а экземпляры - строки таблицы.

Существует понятие степени связи между сущностями, относящихся к связи.

Степень связи определяет, какое количество экземпляров одной сущности может быть связано с экземплярами другой сущности, принадлежащие к этой связи.

На этапе логического проектирования сущности и связи превращаются в логическую модель данных, построенную по законам логики. Как мы уже упоминали на первом уроке, существует несколько логических моделей данных. Среди них выделяют реляционную, иерархическую и сетевую. Наиболее широко сейчас используется реляционная модель. На английском «relation» - отношение, отсюда и название модели.
Отношение представляется в виде таблицы, состоящей из строк и столбцов. Каждый столбец отношения называют полем, а строку - записью. Названия полей - атрибутов. В отличие от обычной таблицы основное свойство отношения заключается в том, что в нем не должно быть одинаковых записей. Это связано с тем, что отношение отражает название определенного множества объектов, а каждая запись представляет элемент этого множества. Конечно, элементы множества должны быть разными.

Атрибуты (группы атрибутов) обеспечивают уникальность (неповторимость) каждой строки, которая называется ключом отношения. Ключей в отношении может быть несколько.

Существует несколько методов построения концептуальной модели базы данных. Один из наиболее распространенных методов основывается на ER-модели. Эта модель основана на представлении предметной области в виде двух типов объектов - сущностей и связей.

Сущность - это объект предметной области, который является множеством элементов. Примеры сущностей - ученики, предметы, кружки. Каждый элемент сущности - это конкретный экземпляр, например ученик Сидоров или предмет «математика». Как правило, сущности выражаются существительными. Сущности представляются в базе данных в виде таблицы. Имя сущности - имя таблицы, характеристики - названия столбцов таблицы, а экземпляры - строки таблицы. В табл. показано, как понимать основные термины сущности.

Сущность УЧЕНИК - имя сущности.

Мы привыкли, что в таблицу можно помещать любую информацию. Однако таблицы-сущности отличаются от обычных таблиц тем, что в них не может быть двух одинаковых строк.

Например, пусть сущность УЧЕНИК имеет характеристики ФАМИЛИЮ, ИМЯ, ОТЧЕСТВО, ДАТА РОЖДЕНИЯ, ДОМАШНИЙ АДРЕС. Будем записывать это в таком виде: УЧЕНИК (ФАМИЛИЯ, ИМЯ, ОТЧЕСТВО, ДАТА РОЖДЕНИЯ, ДОМАШНИЙ АДРЕС). Примеры экземпляров этой сущности - (Сидоров, Петр, Васильевич, 01.02.1985, ул. Цветочная 33), (Иванова, Ольга, Борисовна 12.05.1986, просп. Победы, 231, кв. 3).

Связи отражают важные для проектируемой базы данных отношения между сущностями. Это связи - ОБУЧАЕТСЯ (ученик в классе), ИЗЛАГАЕТ (учитель предмет для класса в кабинете) и т.п. Как правило, связи выражаются глаголами.

Связь между сущностями можно изобразить в виде линий между конкретными экземплярами. Ниже иллюстрируется связь ПОСЕЩАЕТ между сущностями УЧЕНИК и КРУЖОК. Если сущность можно представить в виде таблицы, то для представления связей нужно создать дополнительные таблицы, в которые помещают информацию о связываемых данных.

Объекты СУБД Access:

Таблица - организация хранения данных в виде двумерного массива. Она является основным объектом БД. Остальные - производные от таблицы.

Форма - помогает создавать интерфейс пользователя, ее используют для ввода, изменения или отображения данных.

Запросы - объекты для выбора и фильтрации данных таблицы по определенным критериям.

Отчет - формирование документа.

Макросы - описание действий в виде последовательности команд и их автоматического выполнения.

Модули - программы на языке Visual Basic, которые разрабатывает пользователь для реализации нестандартных процедур.

Создание таблиц.

Таблицы - это объекты, в которых непосредственно хранятся данные.

Создать таблицу можно, выбрав в окне БД на вкладке Таблица и используя Конструктор или Мастер. Но есть и другие способы (см. табл.).

Для заполнения таблицы необходимо перейти в режим заполнения таблицы, открыв ее.

Заполнение таблиц.

Таблицы состоят из полей и записей. Полями называют столбцы, а записями - строки. Внести запись в таблице означает заполнить строку. Чтобы создать таблицу, необходимо определить ее поля, типы данных этих полей, а иногда некоторые дополнительные свойства этих полей. Не все данные занимают в компьютере одинаковый объем. Для их компактного хранения необходимо четко определить их тип.

Типы данных.

В таблицах Access можно указать типы данных.

ФОРМА ИСПОЛЬЗУЕТСЯ ДЛЯ ОТОБРАЖЕНИЯ
Текст Короткие буквенно-цифровые значения, например фамилия или адрес.
Число Числовые значения, например расстояние. Обратите внимание, что для денежных единиц существует отдельный тип данных.
Денежная единица Денежные значения.
Да/Нет Значение "Да" и "Нет" и поля, содержащие только одно из двух значений.
Дата и врем Значения даты и времени для лет от 100 до 9999.
Форматированный текст Текст или сочетание текста и чисел, которое можно отформатировать с помощью элементов управления цветом и шрифтом.
Вычисляемое поле Результаты вычисления. В расчетах должны использоваться другие поля той же таблицы. Для создания вычислений используется построитель выражений.
Вложения Вложенные в записи базы данных, файлы электронных таблиц, документы, диаграммы и другие типы поддерживаемых файлов, подобно вложений в сообщениях электронной почты.
Гиперссылки Текст или сочетание текста и чисел, которое хранится в виде текста и используется как адрес гиперссылки.
Примечание Длинные фрагменты текста. Поле типа "Примечание" часто используется для хранения подробного описания продукта.
Подстановка Список значений из таблицы или запроса, или набор значений, указанных при создании поля. Поле подстановок можно создать с помощью мастера подстановок. Тип данных в поле подстановок текстовый или числовой, в зависимости от того, какие параметры были выбраны в мастере.

Ввод и редактирование.

Ввод и редактирование данных происходит путем переключения между режимами Представления таблицы и Конструктор.

Несмотря на то, что для ввода данных, особенно в базы данных Access с несколькими пользователями, лучше использовать формы, данные можно вводить и изменять непосредственно в таблице.

Тип данных, которые пользователь может вводить в таблицу, зависит от следующих аспектов.

По умолчанию поля в таблицы содержат определенный тип данных, например текст или числа. Следует вводить тот тип данных, который получает соответствующее поле.

Иначе отображается сообщение об ошибке.

Если к полю применена маска ввода, формат, состоящий из постоянных символов (таких как скобки, точки или дефисы) и специальных символов маски, указывающих, в какие позиции, в каком количестве и какого типа данные можно вводить, может возникнуть необходимость вводить данные в определенном формате.

За исключением вложений и многозначных списков в большинство полей можно вводить только один тип данных. Если неизвестно, может ли поле содержать вложения, просмотрите его свойства. Если поле - многозначный список, отображается флажок рядом с каждым элементом списка.

Понятие языка SQL.

Языковой поддержкой проведения транзакций является, как правило, язык SQL. Языки реляционного исчисления основаны на классическом исчислении предикатов. Они предоставляют пользователю набор правил для написания запросов к базам данных. В таком запросе содержится лишь информация о желаемом результате. На основе запроса система управления базами данных автоматически, путем формирования новых отношений, формирует желаемый результат. Языки реляционного исчисления являются непроцедурными. Первый язык реляционного исчисления ALFA была разработана самим Е.Ф.Коддом.

В настоящее время широкое распространение получил язык SQL (Structured Query Language). Язык SQL был разработан фирмой IBM в середине 70-ых годов, а затем одобрен и поддержан многими компаниями как стандарт языка управления реляционными базами данных. Эта речь была разработана на основе стандарта языка, которая использовалась в системе управления базами данных dBase. Международная федерация по обработке информации (AFIP) и международная организация по стандартизации (ISO) формируют и уточняют стандарты для дальнейших разработок языка SQL. Речь ориентирована на проведение операций с данными, которые подаются в виде логически взаимосвязанной совокупности таблиц. Основным отличием от исходного языка dBase является то, что язык SQL разработан для проведения операций с таблицами, в то время как язык dBase ориентирован на работу с записями.

Функции языка SQL.

Использование концепции операций, ориентированных на табличное представление данных, позволило создать компактный язык SQL с небольшим набором команд. Такой подход позволяет достаточно легко определять, выводить и обновлять информацию в базе данных, упростив программирование сложных запросов. Особенностью команд языка SQL является то, что они в большей степени ориентированы на конечный результат обработки данных, чем на процедуру этой обработки. Система определяет оптимальный путь до вывода данных. Язык SQL - это непроцедурная речь. Полный набор команд языка SQL включает около 30 команд.

Таблица языка SQL представляет собой совокупность строк и столбцов, в которых строкам таблицы соответствуют записи, а колонкам - поля. Кроме обычных таблиц, язык SQL позволяет создавать особый вид таблиц - выборку. Выборка - это подмножество строк и столбцов из одной или нескольких таблиц. Часто выборку называют виртуальной таблицей, поскольку она фактически не содержит данных, а лишь позволяет их воспроизводить. Данные в выборке отражают реальные изменения в соответствующих таблицах и наоборот, изменение данных в обновляемых выборках приводит к изменению этих данных в первичных таблицах.

Эффективное использование команд языка SQL реализуется благодаря использованию и созданию специальной информации, которая позволяет ссылаться на каждую таблицу и выборку. Эта информация содержится в файлах, которые называются каталогами таблиц, которые формируются во время создания базы данных. Каждая команда языка SQL заканчивается “;”. Каждая команда SQL, которая называется предложением, начинается глаголом, которое определяет имя базовой операции. В состав многих команд входят ключевые слова и предложения, которые уточняют выполнения базовых операций. Кроме того, в команду SQL нужно включить данные, которые будут обрабатываться и (или) операции, которые нужно над этими данными выполнить.

Язык SQL оперирует с понятием баз данных, содержащих всю информацию, которая необходима для обработки данных в прикладной программе. В полный состав баз данных SQL входят такие компоненты:

· таблицы - основные структуры данных в базах данных;

· выборки - тип виртуальной таблицы, которая обеспечивает ввод-вывод определенных строк и столбцов из одной или нескольких таблиц;

· синонимы - альтернативные имена таблиц и выборок;

· индексные файлы, которые присоединяются к таблицам для обеспечения быстрого поиска данных и поддержания целостности баз данных;

· каталоги - множество таблиц в каждой базе данных, описывающих базы данных и их содержание.

Развитие языка SQL.

Первый стандарт языка SQL появился в 1989 году (SQL-89) и поддерживался практически всеми коммерческими реляционными системами управления баз данных. Он имел общий характер и допускал широкое трактование. Преимуществами SQL-89 можно считать стандартизацию синтаксиса и семантики операторов выборок и манипулирования данными, а также фиксацию средств ограничения целостности базы данных. Однако в этой версии отсутствуют такие разделы, как манипулирования схемой базы данных и динамический SQL .

Неполнота требований SQL -89 привела к созданию в 1992 году следующей версии языка SQL -92, которая охватывала более широкий диапазон функций: манипулирование структурой базы данных, управление транзакциями и сессиями, динамический SQL. В стандартной версии предполагается три уровня: базовый, промежуточный и полный. Только последние версии систем управления базами данных обеспечивают совместимость с полным стандартом. Работа над совершенствованием этого языка не прекращается. Усовершенствования будут, в первую очередь, проводится в направлении включения механизма триггеров, определении произвольного типа данных.

План

1. Понятие модели данных, базы данных. Понятие и назначение систем управления базами данных.
2. Обзор реляционной модели данных. Модель «сущность-связь». Понятие отношения, атрибута, ключа, связи. Классификация связей с множественностью и полнотой. Правила построения модели данных предметной области.

3. Понятие таблицы, поля, записи. Основные этапы работы с базами данных в среде системы управления базами данных. Отображение модели «сущность-связь» базы данных. Свойства полей, типы данных. Ввод данных в таблицы. Сортировка, поиск и фильтрация данных.

4. Понятие запроса к реляционной базе данных. Понятие о языке запросов SQL.

5. Создание таблиц, форм, запросов и отчетов с помощью мастеров.

6. Обмен данными между СУБД и другими программами, предназначенными для обработки документов. Совместное использование базы данных.

Понятие модели данных, базы данных. Понятие и назначение систем управления базами данных.

База данных (БД) - это структурированная совокупность взаимосвязанных данных определенной предметной области (реальных о6ъектов, процессов, явлений и т.п.).

Примеры: БД о наличии медикаментов; БД в системе расписания самолетов, поездов или БД продажи билетов транспорта; БД документов учащихся школы, картотека отдела кадров или в библиотеки и т.д..

Появление компьютерной техники повысило эффективность работы с базами данных. Доступ к данным и управление ими происходит в среде специального программного пакета - системы управления базами данных (СУБД).

СУБД - это программа, с помощью которой осуществляется хранение, обработка и поиск информации в базах данных.

Организация данных во внутренней сфере характеризуется двумя уровнями - логическим и физическим. Физическая организация данных определяет способ размещения данных непосредственно на машинном носителе. Логическая организация данных на машинном носителе зависит от программных средств, организации и ведения данных во внутренней сфере. Метод логической организации данных определяется используемым типом структур данных и видом модели, которая поддерживается программными средствами.

Модель данных - это совокупность взаимосвязанных структур данных и операций над этими структурами. Для размещения одной и той же информации во внутренней сфере могут быть использованы различные структуры и модели данных. Это зависит от пользователя, от технического и программного обеспечения, определяется сложностью автоматизированных задач и объемом информации.

Существуют такие модели данных: иерархическая, реляционная, постреляционная, многомерная, объектно-ориентированная.

По структуре организации информации в БД различают такие модели баз данных: иерархическая, сетевая и реляционная.

Иерархическая модель базы данных . Эта модель представляет собой структуру данных, которые упорядочены по подчинению от общего к конкретному; напоминает «дерево» (граф), поэтому имеет такие же параметры: уровень, узел, связь. Модель работает по такому принципу: несколько узлов низшего уровня соединяются при помощи связи с одним узлом высшего уровня.

Иерархическая модель базы данных имеет такие свойства: несколько узлов низшего уровня связаны только с одним узлом высшего уровня; дерево иерархии имеет только одну вершину, что не подлежит другой; каждый узел имеет имя собственное, есть только один маршрут от вершины дерева (корневого узла) до любого узла структуры.

Сетевая модель базы данных . Общим видом она похожа на иерархическую. Имеет такие же составляющие структуры, отличается характером отношения между ними. Между элементами структуры произвольное, не ограниченное количество элементов-связь.

Реляционная модель базы данных . (Происхождение названия от латинского слова relatio - отношение). Модель построена на взаимоотношениях между составляющими структуры. Представляет собой одну таблицу или совокупность взаимосвязанных двумерных таблиц.

Реляционная модель создана на основе двухмерной таблицы.

Строка таблицы - это запись, которая содержит и

Для логического представления взаимосвязей объектов базы данных используется информационно-логическая (инфологическая) модель.

Известны три разновидности инфологических моделей баз данных:

· иерархическая;

· сетевая;

· реляционная.

Иерархическая модель данных представляет собой древовидную структуру, где каждому элементу (объекту) соответствует только одна связь с элементом (объектом) более высокого уровня. Примером иерархической модели может служить реестр Windows, демонстрирующий размещение файлов и папок разного уровня вложенности на дисках компьютера, а также генеалогическое дерево.

Достоинствами иерархической модели являются простота и быст­родействие. Запрос к такой базе обрабатывается быстро, поскольку поиск данных происходит по одной из ветвей дерева, опускаясь от родительских объектов к дочерним или наоборот (поиск вверх по дереву обрабатывается дольше).

Если структура данных предполагает более сложные взаимосвязи, чем обычная иерархия, то для организации информации применяют иные модели.

Сетевая модель данных позволяет, в целях объединения родственной информации, обеспечивать связи одних элементов с любыми другими, не обязательно родительскими. Эта модель подобна иерархической и является улучшенным её вариантом.

В сетевой модели данных каждый элемент может иметь более одного порождающего его элемента, а графическое представление модели напоминает сеть. Она допускает усложнение «дерева» без ограничения количества связей, входящих в его вершину.

Особенностью иерархических и сетевых баз данных является задаваемая заранее, ещё на стадии проектирования, жесткая структура записей и наборы отношений, а изменение структуры базы данных требует перестройки всей базы. Кроме того, поскольку логика процедуры выборки данных зависит от физической организации этих данных, то эта модель является зависимой от приложения. Иными словами, если необходимо изменить структуру данных, то может потребоваться и изменение приложения.

Сетевые базы считаются инструментами программистов. Так, например, чтобы получить ответ на запрос: «Какой товар наиболее часто заказывает компания X?», нужно написать некоторый программный код для навигации по базе данных. Реализация пользовательских запросов может затянуться, и к моменту появления запрошенной информации она перестанет быть актуальной.

Реляционная модель достаточно универсальна, она значительно упрощает структуру базы данных и облегчает работу с ней. В реляционной базе данных все данные, доступные пользователю, организованы в виде таблиц. У каждой таблицы имеется свое уникальное имя, соответствующее характеру ее содержимого. Столбцы таблицы, называемые полями , описывают определённые атрибуты информации, например: фамилию, имя, пол, возраст, номер телефона, социальное положение респондентов. Строки реляционной таблицы содержат записи и хранят информацию об одном экземпляре объекта данных, представленного в таблице, например данные об одном человеке. Одинаковых записей в таблице быть не должно.



Основное требование к реляционной базе данных состоит в том, чтобы значения полей (столбцов таблицы) были элементарными и неделимыми информационными единицами (то есть для записи адреса потребуется не одно, а несколько полей, содержащих неделимую информацию – улица, номер дома, номер квартиры). Это позволяет применять для обработки информации математический аппарат реляционной алгебры. Наиболее популярны реляционные СУБД - Access, FoxPro, dBase, Oracle, и др.

В реляционной БД содержится, как правило, несколько таблиц с различными сведениями. Разработчик БД устанавливает связи между отдельными таблицами . При создании связей используют ключевые поля .

После установления связей появляется возможность создания запросов, форм и отчетов, в которые помещаются данные из нескольких связанных между собой таблиц.

Все данные, доступные пользователю в реляционной БД, организованы в виде таблиц-отношений, представляющих собой двумерный массив, где каждая таблица имеет свое уникальное имя, соответствующее характеру ее содержимого.

В настоящее время большинство СУБД использует табличную (реляционную) модель данных.

Достоинства реляционной модели:

· Простота и доступность для понимания конечным пользователем, так как единственной информационной конструкцией является наглядная таблица.

· Полная независимость данных. При изменении структуры БД не требуется значительных изменений в прикладной программе.

Недостатки реляционной модели:

· Предметную область не всегда можно представить в виде совокупности таблиц.

· Низкая скорость обработки запросов по сравнению с другими моделями, а также требование большего объема внешней памяти.

Примером простой реляционной базы данных может служить таблица «Респонденты», где одна строка (запись) - сведения об одном из участников телефонного опроса.


Это БД, основанная на древовидной структуре. По принципу построения она чем-то схожа с файловой системой компьютера. У использования такой модели есть свои достоинства и недостатки, которые будут рассмотрены в этой статье, вместе с подробными примерами.

Виды баз данных

Как известно, различают четыре вида посторения БД:

  • Реляционные - табличные СУБД, где информация представлена в виде строк-столбцов. По этому принципу строятся в "Аксесе", к примеру.
  • Объектно-ориентированные - тесно связаны с в котором идет работа с объектами), и это их главный плюс, но, учитывая их небольшую производительность, они пока значительно уступают в распространенности реляционным.
  • Гибридные - СУБД, вмещающие в себе сразу два указанных выше вида.
  • Иерархические - объект внимания данной статьи. характеризирующиеся древообразной структурой.

Наиболее известным примером иерархической базы данных является продукт, созданный компанией IBM ("АйБиЭм"), под названием Information Management System (переводится как "Информационная система управления"), сокращенно IMS. Первая версия IMS вышла еще в прошлом, двадцатом веке, в шестьдесят восьмом году. Она используется для хранения и контроля данных и поныне.

Принцип построения иерархической модели

Иерархическая модель данных строится по следующему принципу:

  • для каждого узла древовидной структуры ставится в соответствие некий сегмент;
  • под сегментом понимаются поля данных с присвоенным каждому полю именем и выстроенные в один линейный кортеж;
  • еще одно соответствие: один входной и несколько выходных сегментов для каждого исходного поля;
  • для каждого структурного элемента существует одно и только одно место в системе иерархии;
  • древовидная структура начинается с корневого элемента;
  • у каждого подчиненного узла только один предок, но у каждого исходного может быть несколько потомков.

Применение иерархической структуры данных

Иерархическая база данных - это хранилище, применимое для тех систем, которым изначально свойственна древовидная структура. Для них выбирать подобное моделирование - логично.

Пример иерархической базы данных с изначально систематизированными степенями - воинское подразделение, в котором, как известно, четко определены ранги. Также это могут быть сложные механизмы, состоящие из все более упрощающихся к низу иерархии частичек. Для моделирования таких систем и приведения их к виду рассматриваемой БД нет необходимости в декомпозиции. Тем не менее такая ситуация складывается не всегда.

Кроме того, существует тенденция, при которой направленный вниз по структуре запрос проще, чем аналогичный вверх.

Основные операции над БД, построенными на иерархической модели

Структура иерархической базы данных позволяет успешно и практически беспроблемно (в зависимости от навыков и умений) совершать следующие операции (представлены самые основные, список всегда можно расширить мелкими дополнениями):

  • поиск по базе данных того или иного элемента;
  • переход по базе данных - от дерева к дереву;
  • переход по дереву - от ветви к ветви;
  • соответственно, переход по ветвям - поэлементно;
  • работа с записями: вставка новой и/или удаление текущей, копирование, вырезание и т. д.

Обобщенное описание структуры

Термин "древовидная" для описания структуры упоминается в этой статье уже далеко не единожды. Пора рассказать, откуда он произошел. Все потому что иерархическая база данных - это такая БД, которая использует тип данных "дерево". Рассмотрим подробнее, что он из себя представляет.

Это составной тип: в каждый из элементов (узлов) вкладывается несколько последующих (один или более). А начинается все с одного корневого элемента. Суть в том, что каждый из кусочков типа "дерево", является подтипом, тоже "деревом". Много-много разветвленных, и все также упорядоченных структур.

Элементарные типы могут быть простыми и составными, но по существу это всегда записи. Но в простом записи присутствует один а в составном - целая их совокупность.

Иерархической модели свойственен принцип потомков, когда каждый предыдущий сегмент является предком для последующего. Кроме того, потомок по отношению к вышестоящему типу является типом подчиненным, в то время как равнозначные один другому записи считаются близнецами.

Наполнение БД

Основными данными иерархической БД являются значения (числа или символы), которые хранятся в записях. Обходят такую базу данных обычно снизу вверх и слева направо.

Достоинства

Иерархическая база данных - это имеющая корневую папку БД, постепенно разветвляющаяся книзу. Учитывая, что подобная структура весьма схожа с файловой системой, такие базы успешно применяются для выполнения различных операций над данными ЭВМ. Итог: рациональное распределение ее памяти, а также весьма достойные показатели времени, затраченного на работу.

Иерархическая модель идеальна для применения ее для упорядоченной информации.

Недостатки

Однако те же особенности рассматриваемых СУБД, которые стали их основными достоинствами, определяют также и их недостатки. К примеру, громоздкость и сложность логических связей - опытному специалисту при работе с ранее неизвестной базой будет трудно разобраться, а простой пользователь и вовсе в ней "заблудится". Эта сложность понимания приводит к тому, что на самом деле не так много СУБД построены на иерархической модели. Примером иерархической базы данных является, кроме уже описанного продукта компании "АйБиЭм", "Ока" и МИРИС (производство России), а также Data Edge и Team-UP (от зарубежных корпораций).

Примеры

Иерархическая база данных - это многообразие различных уровней, на которых строятся взаимосвязи. Схематично она выглядит как перевернутый граф. Пример иерархической базы данных - любое государственное административное учреждение. Взять, допустим, школу.

На самом верхней уровне будет располагаться "лидер" администрации - директор. В его подчинении завучи, у завучей - преподаватели, который руководят параллелями классов. В каждой параллели энное их количество, а в каждом классе есть некоторое число учеников.

По такому же принципу можно расписать и управление какой-нибудь корпорацией. Глава компании или даже совет директоров на самом верху. Далее - все большее количество подразделений, в каждом из которых действует своя структура. Есть и общие черты: начальник в каждом отделе, его помощник, его секретарь, собственно, офисные сотрудники и так далее.

Применение в ЭВМ

Могут быть и более серьезные области применения. Яркий пример иерархической базы данных- это файловая система. Всем привычный "Проводник" строится в самом ядре операционной системы "Виндоус" именно по такой схеме, так же, как и многие другие файловые менеджеры.

Сетевые базы данных

Существуют:

  • реляционные;
  • иерархические;
  • сетевые базы данных.

Почему мы вновь вспомнили о классификации? Поскольку, в отличие от реляционной, сетевая БД имеет с иерархической схожие черты.

Время вспомнить в базах данных. Есть связи "один-к-одному", "один-ко-многим" и "многие-ко-многим". Нас интересует последняя. В сетевой БД она проявляется следующим образом: у одного узла-наследника может быть сразу несколько предков. Свойство иметь несколько потомков также сохраняется. Можно сказать, что иерархические базы данных, сетевые базы данных сами по себе уже пример такого наследования. Предком в данном случае является именно иерархическая БД, так как принцип построения структуры в сетевых БД остается прежним.

Иерархия и реляционность

Название "реляционная" произошло от английского слова "отношение". Как уже упоминалось в начале статьи, они часто выражаются таблично. Но в предыдущем пункте мы указали, что иерархическая БД также может организовывать связи, значит ли это, что и между этими двумя типами есть некая объединяющая их тонкая ниточка?

Да. Помимо того, что и первый, и второй вид все еще относятся к базам данных, кроме этого признака есть еще одно общее свойство. Например, иерархическую БД (и сетевую заодно с ней) можно выразить в таблице. Суть здесь не в том, в каком виде представить информацию конечному пользователю (это уже вопрос юзабилити интерфейса), но по какому принципу была структурирована информация. Так, четкое деление на отделы со своими начальниками, подразделениями и прочим по-прежнему будет выражено в иерархии, но для удобства занесено в таблицу.

Как отмечалось, инфологическая модель отображает реальный мир в некоторые понятные человеку концепции, полностью независимые от параметров среды хранения данных. Существует множество подходов к построению таких моделей: графовые модели, семантические сети, модель "сущность-связь" и т.д. Наиболее популярной из них оказалась модель "сущность-связь", которая будет рассмотрена в главе 2.

Инфологическая модель должна быть отображена в компьютеро-ориентированную даталогическую модель, "понятную" СУБД. В процессе развития теории и практического использования баз данных, а также средств вычислительной техники создавались СУБД, поддерживающие различные даталогические модели.

Сначала стали использовать иерархические даталогические модели. Простота организации, наличие заранее заданных связей между сущностями, сходство с физическими моделями данных позволяли добиваться приемлемой производительности иерархических СУБД на медленных ЭВМ с весьма ограниченными объемами памяти. Но, если данные не имели древовидной структуры, то возникала масса сложностей при построении иерархической модели и желании добиться нужной производительности.

Сетевые модели также создавались для мало ресурсных ЭВМ. Это достаточно сложные структуры, состоящие из "наборов" – поименованных двухуровневых деревьев. "Наборы" соединяются с помощью "записей-связок", образуя цепочки и т.д. При разработке сетевых моделей было выдумано множество "маленьких хитростей", позволяющих увеличить производительность СУБД, но существенно усложнивших последние. Прикладной программист должен знать массу терминов, изучить несколько внутренних языков СУБД, детально представлять логическую структуру базы данных для осуществления навигации среди различных экземпляров, наборов, записей и т.п. Один из разработчиков операционной системы UNIX сказал "Сетевая база – это самый верный способ потерять данные".

Сложность практического использования иерархических и и сетевых СУБД заставляла искать иные способы представления данных. В конце 60-х годов появились СУБД на основе инвертированных файлов, отличающиеся простотой организации и наличием весьма удобных языков манипулирования данными. Однако такие СУБД обладают рядом ограничений на количество файлов для хранения данных, количество связей между ними, длину записи и количество ее полей.

Сегодня наиболее распространены реляционные модели, которые будут подробно рассмотрены в главе 3.

Физическая организация данных оказывает основное влияние на эксплуатационные характеристики БД. Разработчики СУБД пытаются создать наиболее производительные физические модели данных, предлагая пользователям тот или иной инструментарий для поднастройки модели под конкретную БД. Разнообразие способов корректировки физических моделей современных промышленных СУБД не позволяет рассмотреть их в этом разделе.

Модели организации баз данных

1. Иерархический подход к организации баз данных. Иерархические базы данных имеют форму деревьев с дугами-связями и узлами-элементами данных. Иерархическая структура предполагала неравноправие между данными – одни жестко подчинены другим. Подобные структуры, безусловно, четко удовлетворяют требованиям многих, но далеко не всех реальных задач.

2. Сетевая модель данных. В сетевых БД наряду с вертикальными реализованы и горизонтальные связи. Однако унаследованы многие недостатки иерархической и главный из них, необходимость четко определять на физическом уровне связи данных и столь же четко следовать этой структуре связей при запросах к базе.

3. Реляционная модель. Реляционная модель появилась вследствие стремления сделать базу данных как можно более гибкой. Данная модель предоставила простой и эффективный механизм поддержания связей данных.

Во-первых , все данные в модели представляются в виде таблиц и только таблиц. Реляционная модель – единственная из всех обеспечивает единообразие представления данных. И сущности, и связи этих самых сущностей представляются в модели совершенно одинаково – таблицами . Правда, такой подход усложняет понимание смысла хранящейся в базе данных информации, и, как следствие, манипулирование этой информацией.

Избежать трудностей манипулирования позволяет второй элемент модели – реляционно-полный язык (отметим, что язык является неотъемлемой частью любой модели данных, без него модель не существует). Полнота языка в приложении к реляционной модели означает, что он должен выполнять любую операцию реляционной алгебры или реляционного исчисления (полнота последних доказана математически Э.Ф. Коддом). Более того, язык должен описывать любой запрос в виде операций с таблицами, а не с их строками. Одним из таких языков является SQL.

Третий элемент реляционной модели требует от реляционной модели поддержания некоторых ограничений целостности. Одно из таких ограничений утверждает, что каждая строка в таблице должна иметь некий уникальный идентификатор, называемый первичным ключом . Второе ограничение накладывается на целостность ссылок между таблицами. Оно утверждает, что атрибуты таблицы, ссылающиеся на первичные ключи других таблиц, должны иметь одно из значений этих первичных ключей.

4. Объектно-ориентированная модель. Новые области использования вычислительной техники, такие как научные исследования, автоматизированное проектирование и автоматизация учреждений, потребовали от баз данных способности хранить и обрабатывать новые объекты – текст, аудио- и видеоинформацию, а также документы. Основные трудности объектно-ориентированного моделирования данных проистекают из того, что такого развитого математического аппарата, на который могла бы опираться общая объектно-ориентированная модель данных, не существует. В большой степени поэтому до сих пор нет базовой объектно-ориентированной модели. С другой стороны, некоторые авторы утверждают, что общая объектно-ориентированная модель данных в классическом смысле и не может быть определена по причине непригодности классического понятия модели данных к парадигме объектной ориентированности. Несмотря на преимущества объектно-ориентированных систем – реализация сложных типов данных, связь с языками программирования и т.п. – на ближайшее время превосходство реляционных СУБД гарантировано.

5.3.3 Модели данных и концептуальное моделирование

Выше уже упоминалось, что схема создается с помощью некоторого языка определения данных. На самом деле она создается на основе языка определения данных конкретной целевой СУБД, являющегося языком относительно низкого уровня; с его помощью трудно описать требования к данным так, чтобы созданная схема была доступна пониманию пользователей самых разных категорий. Чтобы достичь такого понимания, требуется составить описание схемы на некотором, более высоком уровне, которое будем называть моделью данных. При этом под моделью данных мы будем понимать интегрированный набор понятий для описания данных, связей между ними и ограничений, накладываемых на данные в пределах некоторой предметной области.

Модель является представлением объектов и событий предметной области, а также существующих между ними связей. Модель данных можно рассматривать как сочетание трех указанных ниже компонентов.

· Структурная часть, т.е. набор правил, по которым может быть построена база данных.

· Управляющая часть, определяющая типы допустимых операций с данными (сюда относятся операции обновления и извлечения данных, а также операции изменения структуры базы данных).

· Набор ограничений поддержки целостности данных, гарантирующих корректность используемых данных.

Цель построения модели данных заключается в представлении данных в понятном виде. Если такое представление возможно, то модель данных можно будет легко применить при проектировании базы данных. Для отображения архитектуры ANSI-SPARC можно определить следующие три связанные модели данных:

· внешнюю модель данных, отображающую представления каждого существующего в организации типа пользователей;

· концептуальную модель данных, отображающую логическое (или обобщенное) представление о данных, независимое от типа выбранной СУБД;

· внутреннюю модель данных, отображающую концептуальную схему определенным образом, понятным выбранной целевой СУБД.

В литературе предложено и опубликовано достаточно много моделей данных. Они подразделяются на три категории: объектные (object-based) модели данных, модели данных на основе записей (record-based) и физические модели данных. Первые две используются для описания данных на концептуальном и внешнем уровнях, а последняя - на внутреннем уровне.

Объектные модели данных. При построении объектных моделей данных используются такие понятия как сущности, атрибуты и связи. Сущность - это отдельный элемент (сотрудник, изделие, понятие или событие) предметной области, который должен быть представлен в базе данных. Атрибут - это свойство, которое описывает некоторый аспект объекта и значение которого следует зафиксировать, а связь является ассоциативным отношением между сущностями. Ниже перечислены некоторые наиболее общие типы объектных моделей данных.

    • Модель типа "сущность-связь", или ER-модель (Entity-Relationship model).
    • Семантическая модель.
    • Функциональная модель.
    • Объектно-ориентированная модель.

В настоящее время ER-модель стала одним из основных методов концептуального проектирования баз данных. Объектно-ориентированная модель расширяет определение сущности с целью включения в него не только атрибутов, которые описывают состояние объекта, но и действий, которые с ним связаны, т.е. его поведение. В таком случае говорят, что объект инкапсулирует состояние и поведение.

Модели данных на основе записей. В модели на основе записей база данных состоит из нескольких записей фиксированного формата, которые могут иметь разные типы. Каждый тип записи определяет фиксированное количество полей, каждое из которых имеет фиксированную длину. Существует три основных типа логических моделей данных на основе записей: реляционная модель данных (relational data model), сетевая модель данных (network data model) и иерархическая модель данных (hierarchical data model).