Помощь в написании студенческих работ
Антистрессовый сервис

Разработка базы данных. 
Составление моделей. 
Нормализация

РефератПомощь в написанииУзнать стоимостьмоей работы

Даталогическая модель данных представляет собой отображение связей между элементами данных. Модель данных — это набор соглашений по способам представления сущностей, связей, агрегатов, системы классификации. Кроме этого каждая модель данных определяет особенности выполнения основных операций над данными: добавление, удаление, модификация и выборка. Связь — ассоциации между сущностями, при которой… Читать ещё >

Разработка базы данных. Составление моделей. Нормализация (реферат, курсовая, диплом, контрольная)

Обработка информации является основой решения многих задач. Поэтому и создаются базы данных для того, чтобы упростить обработку информации. А для создания базы данных используются системы управления базами данных.

Система управления базами данных (СУБД) — объединение языковых и программных средств; для создания, управления и общего или специального применения базы данных многими пользователями.

База данных (БД) — совокупность специальным образом систематизированных данных, которые содержатся в памяти вычислительной системы, и отображает состояние объектов и их взаимосвязи в анализируемой предметной области.

Приложения разрабатываются для облегчения и автоматизирования рутинных операций и действия БД. Приложение — программа или совокупность программ, которые обеспечивают автоматизацию обработки информации для прикладной задачи. Приложения могут создаваться в среде или вне среды СУБД — с помощью систем программирования, использующие средства доступа к БД. Приложения, разработанные в среде СУБД, часто называют «приложениями СУБД», а приложения, разработанные вне СУБД, — внешними приложениями.

После описания предметной области переходим к инфологическому моделированию БД.

Цель инфологического моделирования является обеспечение более естественного представления для человека информации, которые будут содержаться в создаваемой базе. Поэтому инфологическую модель данных строится на доступном для пользователей и удобном разработчиков языке. Известны следующие средства создания внешних моделей: семантические сети; язык инфологического моделирования; ER-диаграммы; модель «сущность-связь» (Entity-Relationship model).

Модель «сущность-связь» разработана Ченом (Chen) в1976 году для упрощения концептуального проектирования баз данных. На ее основе разрабатывается большинство современных подходов к проектированию баз данных [5].

Структура БД определяется положенной на его основу — моделью данных. Модель — это множество графических диаграмм с небольшим числом разнородных компонентов.

Основными компонентами ER — модели являются сущность, связь и атрибут.

Сущность — объект, информацию о котором необходимо хранить в базе данных. Сущностями могут быть люди, места, рейсы, вкус, цвет и т. д.

Связь — ассоциации между сущностями, при которой каждый экземпляр одной сущности ассоциирован свободным (произвольным) числом экземпляров другой сущности. Связь существует только между двумя разными сущностями или между сущностью и ею самой. В зависимости от степени связи различают следующие иды связей:

Связь 1:1 (один-к-одному) — все поля связи основной и дополнительной таблиц являются ключевыми. Так как значения в ключевых полях в обеих таблицах не повторяются, гарантируется однозначное соответствие записей этих таблиц. Сами таблицы становятся равноправными.

Связь 1: М (один-ко-многим) — записи основной таблицы соответствует несколько записей вспомогательной таблицы.

Связь М:1 (многое-к-одному) — одна или несколько записей основной таблицы ставятся в соответствие одна запись дополнительной таблицы.

Связь М: М (многие ко многим) — несколько записей основной таблицы соответствует несколько записей дополнительной таблицы.

Элементарной единицей структуры понятия, которая служит для уточнения, идентификации, классификации, числовой характеристики или выражения состояния сущности является атрибут. Атрибут — свойство, характеризующее сущность. Название атрибута должно быть неповторимым для конкретного типа сущности. Но может быть схожим для разноречивого типа сущностей (например, цвет может быть определен для многих сущностей: собака, автомобиль, дым и т. д.). Атрибуты используются для определения того, какая информация должна быть собрана о сущности [7].

Для установления связей между таблицами нужен первичный ключ. Первичный ключ (ключ отношения, ключевой атрибут) — атрибут отношения, однозначно идентифицирующий каждый его из его кортежей. При установлении связей между таблицами упрощает доступ к данным. Связывание таблиц при выполнении таких операций, как поиск, просмотр, выборка и другие обеспечивает возможность обращения к произвольным полям связанных записей. Это минимизирует количество обращений к таблицам данных.

В проектирования информационных систем предметная область рассматривается в виде трех представлений:

  • 1. представление предметной области в том виде, как она реально существует;
  • 2. как ее воспринимает человек (как воспринимает проектировщик);
  • 3. как она может быть описана с помощью символов.

ER-модель представляет собой конструкцию, которая сама по себе не предписывает никаких графических средств её визуализации. В качестве стандартной графической нотации, с помощью которой можно визуализировать ER-модель, была предложена диаграмма сущность-связь (ER-диаграмма)[9].

После инфологической модели строится даталогическая модель.

Даталогическая модель данных представляет собой отображение связей между элементами данных. Модель данных — это набор соглашений по способам представления сущностей, связей, агрегатов, системы классификации. Кроме этого каждая модель данных определяет особенности выполнения основных операций над данными: добавление, удаление, модификация и выборка.

Особое внимание при построении модели уделяют целостности и отсутствию избыточности данных, то есть одни и те же данные не повторялись. 9].

Нормальная форма в реляционной модели данных— свойство отношения (точки зрения избыточности), которая может привести к логическим ошибкам в выборке или при изменения данных. Другими словами, под нормальной формой иногда понимают совокупность требований (правил), которым должна соответствовать отношение.

Отношение — множество, которое не содержит одинаковых элементов — кортежей.

Нормализация — процесс преобразования базы данных к нормальным формам. Она предназначена для приведения структуры базы данных к виду, которая будет обеспечивать минимальную избыточность данных. Конечной целью нормализации является уменьшение потенциальной противоречивости хранимой в БД информации [4].

Избыточность устраняется с помощью декомпозиции отношений таким образом, чтобы в каждом отношении хранились только первичные факты (то есть факты, не выводимые из других хранимых фактов)[5].

Выделяют следующую последовательность нормальных форм:

  • — первая нормальная форма (1НФ);
  • — вторая нормальная форма (2НФ);
  • — третья нормальная форма (3НФ);
  • — усиленная третья нормальная форма, или нормальная форма Бойса — Кодда (БКНФ);
  • — четвертая нормальная форма (4НФ);
  • — пятая нормальная форма (5НФ). [3]

Таблица находится в первой нормальной форме, если каждый её атрибут атомарен, то есть атрибут содержит одно значение. Таким образом, не существует 1НФ таблицы, в полях которых могут храниться списки значений. Для приведения таблицы к 1НФ разбиваем таблицу на несколько отдельных таблиц [6].

Таблица находится во второй нормальной форме, если она находится в первой нормальной форме, и при этом любой её атрибут, который не входит в состав первичного ключа, функционально полно зависит от первичного ключа. При этом, нужно учитывать, что неключевой атрибут не находится в функциональной зависимости от какой-либо из входящих в него атрибутов (частей). Другими словами, в 2НФ нет неключевых атрибутов, зависящих от части составного ключа и выполняются условия 1НФ. 6].

Таблица находится в третьей нормальной форме (3НФ), если она находится во второй нормальной форме и при этом любой ее неключевой атрибут зависит только от первичного ключа [6].

Таким образом, отношение находится в 3НФ тогда и только тогда, когда оно находится во 2НФ и отсутствуют транзитивные зависимости неключевых атрибутов от ключевых.

Транзитивной зависимостью неключевых атрибутов от ключевых называется следующая зависимость: A > B и B > C, А транзитивно зависит от С, где A — набор ключевых атрибутов (ключ), B и С — различные множества неключевых атрибутов [6].

При решении практических задач в большинстве случаев третья нормальная форма является достаточной. Процесс проектирования реляционной базы данных, заканчивается приведением к 3НФ [6].

Для создания таблиц и запросов будет использоваться SQL (англ. structured query language — «структурированный язык запросов») язык запросов, применяемый для создания, модификации и управления данными в произвольной реляционной базе данных, управляемой соответствующей системой управления базами данных (СУБД).

Чтобы создать базу данных и достичь поставленной нами цели, нужны программы, которые описаны в следующем пункте.

Показать весь текст
Заполнить форму текущей работой