Обзор баз данных и их классификация

РефератПомощь в написанииУзнать стоимостьмоей работы

Временные, или темпоральные базы данных — это базы, хранящие данные, привязанные ко времени и имеющие средства управления такой информацией. Главное отличие темпоральных систем управления базами данных (СУБД) от обычных реляционных СУБД заключается в том, что для любого объекта, который был создан в момент времени t1 и был удален в момент времени t2, сохраняются все его состояния в этом временном… Читать ещё >

Обзор баз данных и их классификация (реферат, курсовая, диплом, контрольная)

Классификация БД по модели данных:

1. Реляционная модель данных — это абстракция данных, которая представляет данные в базу данных в виде набора таблиц, которые называются отношениями. Каждая таблица имеет имя и содержит специальный верхний ряд и конечное число строк данных. Каждая запись в верхней строке таблицы называется атрибутом. Число атрибутов в отношении называют его арностью или размером — термины, которые используются как синонимы. Имя отношения вместе с верхней строкой называется схемой.

Также существует бесконечная реляционная модель данных, которая является расширением реляционной модели данных в бесконечных таблицах.

2. Иерархическая модель данных — это модель данных, где используется представление базы данных в виде древовидной (иерархической) структуры, состоящей из объектов (данных) различных уровней.

Между объектами существуют связи, каждый объект может включать в себя несколько объектов более низкого уровня. Такие объекты находятся в отношении предка (объект более близкий к корню) к потомку (объект более низкого уровня), при этом возможна ситуация, когда объект-предок не имеет потомков или имеет их несколько, тогда как у объекта-потомка обязательно только один предок. Объекты, имеющие общего предка, называются близнецами.

Первые системы управления базами данных использовали иерархическую модель данных.

3. Сетевая модель данных — логическая модель данных, являющаяся расширением иерархического подхода, строгая математическая теория, описывающая структурный аспект, аспект целостности и аспект обработки данных в сетевых базах данных. К основным понятиям сетевой модели базы данных относятся: уровень, элемент (узел), связь. Узел — это совокупность атрибутов данных, описывающих некоторый объект. На схеме иерархического дерева узлы представляются вершинами графа. В сетевой структуре каждый элемент может быть связан с любым другим элементом. Сетевые базы данных подобны иерархическим, за исключением того, что в них имеются указатели в обоих направлениях, которые соединяют родственную информацию. Несмотря на то, что эта модель решает некоторые проблемы, связанные с иерархической моделью, выполнение простых запросов остается достаточно сложным процессом. Также, поскольку логика процедуры выборки данных зависит от физической организации этих данных, то эта модель не является полностью независимой от приложения. Другими словами, если необходимо изменить структуру данных, то нужно изменить и приложение.
4. Объектные базы данных — это модель работы с объектными данными.

Такая модель баз данных, несмотря на то, что она существует уже много лет, считается новой. И её создание открывает большие перспективы, в связи с тем, что использование объектной модели баз данных легко воспринимается пользователем, так как создается высокий уровень абстракции. Объектная модель идеально подходит для трактовки такого рода объектных данных как изображение, музыка, видео, разного вида текст.

5. Объектно-ориентированная база данных (ООБД) — база данных, в которой данные моделируются в виде объектов, их атрибутов, методов и классов.

Объектно-ориентированные базы данных обычно рекомендованы для тех случаев, когда требуется высокопроизводительная обработка данных, имеющих сложную структуру.

В манифесте ООБД предлагаются обязательные характеристики, которым должна отвечать любая ООБД. Их выбор основан на 2 критериях: система должна быть объектно-ориентированной и представлять собой базу данных.

Обязательные характеристики.

1. Поддержка сложных объектов. В системе должна быть предусмотрена возможность создания составных объектов за счет применения конструкторов составных объектов. Необходимо, чтобы конструкторы объектов были ортогональны, то есть любой конструктор можно было применять к любому объекту.
2. Поддержка индивидуальности объектов. Все объекты должны иметь уникальный идентификатор, который не зависит от значений их атрибутов.
3. Поддержка типов и классов. Требуется, чтобы в ООБД поддерживалась хотя бы одна концепция различия между типами и классами. (Термин «тип» более соответствует понятию абстрактного типа данных. В языках программирования переменная объявляется с указанием ее типа. Компилятор может использовать эту информацию для проверки выполняемых с переменной операций на совместимость с ее типом, что позволяет гарантировать корректность программного обеспечения. С другой стороны класс является неким шаблоном для создания объектов и предоставляет методы, которые могут применяться к этим объектам. Таким образом, понятие «класс» в большей степени относится ко времени исполнения, чем ко времени компиляции.
4. Поддержка наследования типов и классов от их предков. Подтип, или подкласс, должен наследовать атрибуты и методы от его супертипа, или суперкласса, соответственно.
5. Перегрузка в сочетании с полным связыванием. Методы должны применяться к объектам разных типов. Реализация метода должна зависеть от типа объектов, к которым данный метод применяется. Для обеспечения этой функциональности связывание имен методов в системе не должно выполняться до времени выполнения программы.
6. Вычислительная полнота. Язык манипулирования данными должен быть языком программирования общего назначения.
7. Набор типов данных должен быть расширяемым. Пользователь должен иметь средства создания новых типов данных на основе набора предопределенных системных типов. Более того, между способами использования системных и пользовательских типов данных не должно быть никаких различий.
6. Временные, или темпоральные базы данных — это базы, хранящие данные, привязанные ко времени и имеющие средства управления такой информацией. Главное отличие темпоральных систем управления базами данных (СУБД) от обычных реляционных СУБД заключается в том, что для любого объекта, который был создан в момент времени t1 и был удален в момент времени t2, сохраняются все его состояния в этом временном интервале [t1, t2], тогда как в обычной СУБД существует только текущее на конкретный момент времени состояние объекта. Таким образом, в темпоральной базе данных хранится история изменений состояний объекта, и пользователь может получить информацию о состоянии записи в базе данных в любой момент времени из указанного промежутка.
7. Географические базы данных связаны с представлением объектов и явлений, происходящих на поверхности Земли. Географические объекты включают в себя страны, города, дороги, реки, горы, железнодорожные и телефонные линии сети, погодные условия и т. д. Представления баз данных принимают форму различных типов карт или различных видов графиков, которые выражают некоторые отношения между географическими объектами.

Пространственные базы данных включают в себя географические базы данных, но имеют более общий характер, потому что они могут быть связаны не со строго географическими явлениями. Например, пространственные базы данных могут хранить информацию об астрономической информации, такую, как галактики и звезды вселенной или макет интегральной схемы. Несмотря на это незначительное различие, термины, географические базы данных и базы пространственных данных, часто используются как взаимозаменяемые. Кроме того, термин географическая информационная система (ГИС) стал популярными вместо географической системы баз данных. Географическая информационная система или геоинформационная система (ГИС) — это информационная система, обеспечивающая сбор, хранение, обработку, анализ и отображение пространственных данных и связанных с ними непространственных, а также получение на их основе информации и знаний о географическом пространстве.

Считается, что географические или пространственные данные составляют более половины объема всей циркулирующей информации, используемой организациями, занимающимися разными видами деятельности, в которых необходим учет пространственного размещения объектов. ГИС ориентирована на обеспечение возможности принятия оптимальных управленческих решений на основе анализа пространственных данных.

Также существует пространственно-временная база данных, в которой одновременно поддерживается одно или более измерений в аспектах как пространства, так и времени.

8. Базы данных изображений.

Многие приложения, такие как медицинская диагностика и военная целевая идентификация, требуют поиска от большой базы данных изображения тех изображений, которые подобны новому изображению камеры. Это требует следующих задач:

* Аффинно-инвариантная мера сходства: когда плоский объект фотографируется с разных ракурсов фотографического изображения являющимися аффинными преобразованиями друг друга. Следовательно, если изображение хранится в базе данных изображений, а другой изображение видно камерой, причем оба изображения показывают один и тот же объект, там должна быть аффинно-инвариантная мера сходства между парами изображений.
* Эффективное индексирование: эффективное индексирование важно, когда база данных изображений содержит большое количество изображений. Сочетание этих двух задач трудно. В целом компьютерное исследование видения сосредотачивается на первой и пренебрегает второй, а исследование базы данных сосредоточено на второй и пренебрегает первой.

Исследователи компьютерного зрения предложили несколько аффинно-инвариантных мер подобия между парами картинок, например, минимальная мера расстояния Хаусдорфа, геометрическая техника хеширования и подобия меры на основе наименьших квадратов расстояния. Ни одна из этих мер не приводит к эффективному индексированию.

Исследователям баз данных предлагается эффективные методы индексирования на основе следующих свойств: формы или контура, цвет и цветной гистограммы, отнести реляционные графы, которые представляют пространственные отношения между объектами с помощью графа, и различные коэффициенты сжатия изображения. Ни одно из этих свойств не является аффинно-инвариантным.

9. Геномные базы данных.

GDB (Genome Data Base) крупнейшая база данных по структуре генома человека, созданная и поддерживаемая в университете Джонса Гопкинса (Балтимор, США). Кроме известных последовательностей нуклеотидов генома человека в ней хранится вся получаемая информация о генетических маркерах, зондах и контигах, ассоциированных с генетическими заболеваниями. Проводятся работы по включению в базу данных результатов физического картирования генома. Поддерживается база данных по менделевскому наследованию у человека, которая представляет собой каталог наследуемых признаков и наследственных заболеваний человека. [20].

Классификация БД по среде физического хранения:

· БД во вторичной памяти (традиционные): средой постоянного хранения является периферийная энергонезависимая память (вторичная память) — как правило, жёсткий диск. В оперативную память СУБД помещает лишь кэш и данные для текущей обработки;
· БД в оперативной памяти (in-memory databases): все данные находятся в оперативной памяти;
· БД в третичной памяти (tertiary databases): средой постоянного хранения является отсоединяемое от сервера устройство массового хранения (третичная память), как правило, на основе магнитных лент или оптических дисков. Во вторичной памяти сервера хранится лишь каталог данных третичной памяти, файловый кэш и данные для текущей обработки; загрузка же самих данных требует специальной процедуры.

Классификация по содержимому:

Примеры:

· Географическая
· Историческая
· Научная
· Мультимедийная.

Классификация БД по степени распределённости:

· Централизованная, или сосредоточенная: БД, полностью поддерживаемая на одном компьютере.
· Распределённая: БД, составные части которой размещаются в различных узлах компьютерной сети в соответствии с каким-либо критерием.
o Неоднородная: фрагменты распределённой БД в разных узлах сети поддерживаются средствами более одной СУБД
o Однородная: фрагменты распределённой БД в разных узлах сети поддерживаются средствами одной и той же СУБД.
o Фрагментированная, или секционированная: методом распределения данных является фрагментирование (партиционирование, секционирование), вертикальное или горизонтальное.
o Тиражированная: методом распределения данных является тиражирование.

Классификация БД по способу доступа к данным:

· БД с локальным доступом;
· БД с удаленным (сетевым) доступом.

Системы централизованных БД с сетевым доступом предполагают различные архитектуры подобных систем:

— файл-сервер;
— клиент-сервер.

Архитектура файл-сервер предполагает выделение одной из машин сети в качестве центральной (сервер файлов). На такой машине хранится совместно используемая централизованная БД. Все другие машины сети выполняют функции рабочих станций, с помощью которых поддерживается доступ пользовательской системы к централизованной базе данных. Файлы БД в соответствии с пользовательскими запросами передаются на рабочие станции, где в основном и производится обработка. Пользователи могут также создавать на рабочих станциях локальные БД, которые используются ими монопольно.

В архитектуре клиент-сервер подразумевается, что помимо хранения централизованной БД центральная машина (сервер БД) должна обеспечивать выполнение основного объема обработки данных. Запрос на данные, выдаваемый клиентом (рабочей станцией), порождает поиск и извлечение данных на сервере. Извлеченные данные (но не файлы) передаются по сети от сервера к клиенту.

Показать весь текст

Заполнить форму текущей работой