Разработка базы данных.
Составление моделей.
Нормализация
Даталогическая модель данных представляет собой отображение связей между элементами данных. Модель данных — это набор соглашений по способам представления сущностей, связей, агрегатов, системы классификации. Кроме этого каждая модель данных определяет особенности выполнения основных операций над данными: добавление, удаление, модификация и выборка. Связь — ассоциации между сущностями, при которой… Читать ещё >
Разработка базы данных. Составление моделей. Нормализация (реферат, курсовая, диплом, контрольная)
Обработка информации является основой решения многих задач. Поэтому и создаются базы данных для того, чтобы упростить обработку информации. А для создания базы данных используются системы управления базами данных.
Система управления базами данных (СУБД) — объединение языковых и программных средств; для создания, управления и общего или специального применения базы данных многими пользователями.
База данных (БД) — совокупность специальным образом систематизированных данных, которые содержатся в памяти вычислительной системы, и отображает состояние объектов и их взаимосвязи в анализируемой предметной области.
Приложения разрабатываются для облегчения и автоматизирования рутинных операций и действия БД. Приложение — программа или совокупность программ, которые обеспечивают автоматизацию обработки информации для прикладной задачи. Приложения могут создаваться в среде или вне среды СУБД — с помощью систем программирования, использующие средства доступа к БД. Приложения, разработанные в среде СУБД, часто называют «приложениями СУБД», а приложения, разработанные вне СУБД, — внешними приложениями.
После описания предметной области переходим к инфологическому моделированию БД.
Цель инфологического моделирования является обеспечение более естественного представления для человека информации, которые будут содержаться в создаваемой базе. Поэтому инфологическую модель данных строится на доступном для пользователей и удобном разработчиков языке. Известны следующие средства создания внешних моделей: семантические сети; язык инфологического моделирования; ER-диаграммы; модель «сущность-связь» (Entity-Relationship model).
Модель «сущность-связь» разработана Ченом (Chen) в1976 году для упрощения концептуального проектирования баз данных. На ее основе разрабатывается большинство современных подходов к проектированию баз данных [5].
Структура БД определяется положенной на его основу — моделью данных. Модель — это множество графических диаграмм с небольшим числом разнородных компонентов.
Основными компонентами ER — модели являются сущность, связь и атрибут.
Сущность — объект, информацию о котором необходимо хранить в базе данных. Сущностями могут быть люди, места, рейсы, вкус, цвет и т. д.
Связь — ассоциации между сущностями, при которой каждый экземпляр одной сущности ассоциирован свободным (произвольным) числом экземпляров другой сущности. Связь существует только между двумя разными сущностями или между сущностью и ею самой. В зависимости от степени связи различают следующие иды связей:
Связь 1:1 (один-к-одному) — все поля связи основной и дополнительной таблиц являются ключевыми. Так как значения в ключевых полях в обеих таблицах не повторяются, гарантируется однозначное соответствие записей этих таблиц. Сами таблицы становятся равноправными.
Связь 1: М (один-ко-многим) — записи основной таблицы соответствует несколько записей вспомогательной таблицы.
Связь М:1 (многое-к-одному) — одна или несколько записей основной таблицы ставятся в соответствие одна запись дополнительной таблицы.
Связь М: М (многие ко многим) — несколько записей основной таблицы соответствует несколько записей дополнительной таблицы.
Элементарной единицей структуры понятия, которая служит для уточнения, идентификации, классификации, числовой характеристики или выражения состояния сущности является атрибут. Атрибут — свойство, характеризующее сущность. Название атрибута должно быть неповторимым для конкретного типа сущности. Но может быть схожим для разноречивого типа сущностей (например, цвет может быть определен для многих сущностей: собака, автомобиль, дым и т. д.). Атрибуты используются для определения того, какая информация должна быть собрана о сущности [7].
Для установления связей между таблицами нужен первичный ключ. Первичный ключ (ключ отношения, ключевой атрибут) — атрибут отношения, однозначно идентифицирующий каждый его из его кортежей. При установлении связей между таблицами упрощает доступ к данным. Связывание таблиц при выполнении таких операций, как поиск, просмотр, выборка и другие обеспечивает возможность обращения к произвольным полям связанных записей. Это минимизирует количество обращений к таблицам данных.
В проектирования информационных систем предметная область рассматривается в виде трех представлений:
- 1. представление предметной области в том виде, как она реально существует;
- 2. как ее воспринимает человек (как воспринимает проектировщик);
- 3. как она может быть описана с помощью символов.
ER-модель представляет собой конструкцию, которая сама по себе не предписывает никаких графических средств её визуализации. В качестве стандартной графической нотации, с помощью которой можно визуализировать ER-модель, была предложена диаграмма сущность-связь (ER-диаграмма)[9].
После инфологической модели строится даталогическая модель.
Даталогическая модель данных представляет собой отображение связей между элементами данных. Модель данных — это набор соглашений по способам представления сущностей, связей, агрегатов, системы классификации. Кроме этого каждая модель данных определяет особенности выполнения основных операций над данными: добавление, удаление, модификация и выборка.
Особое внимание при построении модели уделяют целостности и отсутствию избыточности данных, то есть одни и те же данные не повторялись. 9].
Нормальная форма в реляционной модели данных— свойство отношения (точки зрения избыточности), которая может привести к логическим ошибкам в выборке или при изменения данных. Другими словами, под нормальной формой иногда понимают совокупность требований (правил), которым должна соответствовать отношение.
Отношение — множество, которое не содержит одинаковых элементов — кортежей.
Нормализация — процесс преобразования базы данных к нормальным формам. Она предназначена для приведения структуры базы данных к виду, которая будет обеспечивать минимальную избыточность данных. Конечной целью нормализации является уменьшение потенциальной противоречивости хранимой в БД информации [4].
Избыточность устраняется с помощью декомпозиции отношений таким образом, чтобы в каждом отношении хранились только первичные факты (то есть факты, не выводимые из других хранимых фактов)[5].
Выделяют следующую последовательность нормальных форм:
- — первая нормальная форма (1НФ);
- — вторая нормальная форма (2НФ);
- — третья нормальная форма (3НФ);
- — усиленная третья нормальная форма, или нормальная форма Бойса — Кодда (БКНФ);
- — четвертая нормальная форма (4НФ);
- — пятая нормальная форма (5НФ). [3]
Таблица находится в первой нормальной форме, если каждый её атрибут атомарен, то есть атрибут содержит одно значение. Таким образом, не существует 1НФ таблицы, в полях которых могут храниться списки значений. Для приведения таблицы к 1НФ разбиваем таблицу на несколько отдельных таблиц [6].
Таблица находится во второй нормальной форме, если она находится в первой нормальной форме, и при этом любой её атрибут, который не входит в состав первичного ключа, функционально полно зависит от первичного ключа. При этом, нужно учитывать, что неключевой атрибут не находится в функциональной зависимости от какой-либо из входящих в него атрибутов (частей). Другими словами, в 2НФ нет неключевых атрибутов, зависящих от части составного ключа и выполняются условия 1НФ. 6].
Таблица находится в третьей нормальной форме (3НФ), если она находится во второй нормальной форме и при этом любой ее неключевой атрибут зависит только от первичного ключа [6].
Таким образом, отношение находится в 3НФ тогда и только тогда, когда оно находится во 2НФ и отсутствуют транзитивные зависимости неключевых атрибутов от ключевых.
Транзитивной зависимостью неключевых атрибутов от ключевых называется следующая зависимость: A > B и B > C, А транзитивно зависит от С, где A — набор ключевых атрибутов (ключ), B и С — различные множества неключевых атрибутов [6].
При решении практических задач в большинстве случаев третья нормальная форма является достаточной. Процесс проектирования реляционной базы данных, заканчивается приведением к 3НФ [6].
Для создания таблиц и запросов будет использоваться SQL (англ. structured query language — «структурированный язык запросов») язык запросов, применяемый для создания, модификации и управления данными в произвольной реляционной базе данных, управляемой соответствующей системой управления базами данных (СУБД).
Чтобы создать базу данных и достичь поставленной нами цели, нужны программы, которые описаны в следующем пункте.