Поиск идентичных объектов

РефератПомощь в написанииУзнать стоимостьмоей работы

Второй метод хеширования предложен А. П. Ершовым и называется открытой адресацией. Он предполагает наличие закольцованного массива для т записей и наличие понятия пустой записи. После этого для поступившего запроса х вычисляется значение хеш-функции /i (x), и если оно равно г, то просматривается с г-ой позиции массив записей пока запись х будет найдена или пока не встретится пустая запись. Если… Читать ещё >

Поиск идентичных объектов (реферат, курсовая, диплом, контрольная)

В данном разделе мы будем рассматривать задачу поиска идентичных объектов, которая в том или ином виде встречается во всех информационных системах и базах данных. Задача поиска идентичных объектов состоит в поиске в информационном массиве объекта, идентичного объекту-запросу.

Для задачи поиска идентичных объектов в рамках АДВмодели (алгебраическое дерево вычислений) [66] справедлива логарифмическая теоретико-информационная нижняя оценка сложности для худшего случая [70]. Поэтому считается, что бинарный поиск является оптимальным по порядку для задачи поиска идентичных объектов, и это как бы закрывает проблему, но несмотря на это имеется много работ, посвященных исследованию алгоритмов поиска идентичных объектов в худшем случае [7, 71]. Связано это, во-первых, с проблемой поддержки сбалансированности бинарного дерева при операциях вставки и удаления, а во-вторых, с тем, что бинарный поиск хорош только тогда, когда целиком вся библиотека помещается во внутренней памяти (внутренний поиск [23]), если же библиотека вся или частично расположена на внешних носителях (внешний поиск [23]), то эффективность бинарного поиска сразу падает. Также много работ, посвященных изучению алгоритмов поиска идентичных объектов, имеющих хорошие временные характеристики в среднем [17, 77, 80]. Связаны они в основном с методом хеширования, на котором мы остановимся чуть подробнее.

Хеширование предполагает наличие хеш-функции. Хешфункция h (y) определена на множестве записей X и переводит его в множество {1, ттг}, где т — параметр хеш-функции.

Обычно используется два основных метода хеширования. Первый — предложенный А. Думи [77] и называемый методом цепочек, предполагает наличие га списков. Тогда для поступившего запроса х (он же запись) вычисляется значение хешфункции h (x)y и если оно равно г, то просматривается г-ый список и в нем ищется запись х. Если это поиск с занесением, то в случае неудачного поиска запись х добавляется к г-ому списку.

Второй метод хеширования предложен А. П. Ершовым [17] и называется открытой адресацией. Он предполагает наличие закольцованного массива для т записей и наличие понятия пустой записи. После этого для поступившего запроса х вычисляется значение хеш-функции /i (x), и если оно равно г, то просматривается с г-ой позиции массив записей пока запись х будет найдена или пока не встретится пустая запись. Если это поиск с занесением, то в случае неудачного поиска на место встреченной пустой записи помещается запись х.

Методы хеширования хороши тем, что при удачном выборе хеш-функции, равномерно рассеивающей поступающие записи, время поиска в среднем будет очень малым. Вместе с тем Д. Кнут [23, стр. 641−642) усматривает три основных недостатка метода хеширования.

а) После неудачного поиска мы знаем лишь то, что нужной записи нет, тогда как с помощью бинарного поиска мы обнаруживаем ближайших соседей ненайденной записи, что часто бывает важно во многих приложениях.
б) Часто довольно трудно распределить память под хеш-таблицу. Если выделить слишком мало, то она может переполниться, и потребуется тягостное «рехеширование «. Если выделить слишком много, то это расточительно.
в) «Наконец, при использовании методов хеширования нужно свято верить в теорию вероятностей, ибо они эффективны лишь в среднем, а худший случай просто ужасен!» — цитата из Д. Кнута [23, стр. 642]. Поэтому они не всегда подходят для работы в реальном масштабе времени, например, для управления движением транспорта, поскольку на карту постелены человеческие жизни. Алгоритмы, использующие сбалансированные деревья, гораздо безопаснее, ведь они имеют гарантированную верхнюю границу времени поиска.

В данном разделе предлагается метод поиска идентичных объектов, который в среднем эффективен, как хорошие методы хеширования, то есть обеспечивает мгновенное решение, а в худшем случае такой же, как метод бинарного поиска, и плюс к этому не обладает недостатком а), то есть в случае неудачного поиска выходит к ближайшим соседям ненайденной записи, что позволяет использовать этот алгоритм для решения задач о близости.

Опишем формально задачу поиска идентичных объектов.

Пусть нам дано множество Х_у на котором задано отношение линейного порядка X, то есть такое бинарное отношение на X х X, которое для любых х_уу_у z 6 X удовлетворяет условиям.

Рассмотрим следующий тип задач поиска Sid = {X_yX_ypid)_y где отношение поиска pid есть отношение идентичности, то есть.

Тип Sid будем называть типом поиска идентичных объектов.

Показать весь текст

Заполнить форму текущей работой

Другие работы

Пример практического использования методов корреляционного анализа

Важнейшим параметром структуры трикотажа, обусловливающим расход полотна на единицу изделия, а следовательно, и себестоимость изготовления изделий, является поверхностная плотность у, г/м2. Требуется установить аналитическую зависимость поверхностной плотности у трикотажа платированных футерованных переплетений, вырабатываемого на крутовязальной машине модели FIHN фирмы «Орицио», от длины нитей…

Реферат

Подробнее...

Диффузионный процесс, или процесс Ито. Интеграл Ито, формула Ито

Рассмотрим важный частный случай применения формулы Ито, связанный с выводом уравнений для математического ожидания и дисперсии случайного процесса, удовлетворяющего линейному стохастическому дифференциальному уравнению. Значение процессов указанного типа заключается в том, что таковыми являются случайные процессы стоимости портфелей, составленных из финансовых активов различного типа, например…

Реферат

Подробнее...

Высокотемпературное обезвреживание газов

Термический метод обезвреживания получил более широкое распространение, так как некоторые вредные примеси трудно или невозможно полностью нейтрализовать другими методами из-за сложности их состава, низкой концентрации, а также из-за отсутствия эффективных средств улавливания. Он заключается в том, что все органические вещества полностью окисляются кислородом воздуха при высокой температуре…

Реферат

Подробнее...

Методика исследования мелких ловушек

Для постепенного опустошения дозиметрических ловушек образец облучался при комнатной температуре тестовой дозой, и при последующем нагреве регистрировалась ТЛ с пиком при 350 К. При этом нагрев осуществлялся до температуры 420 К, соответствующей началу дозиметрического максимума, и затем температура увеличивалась «с шагом» 10 К. Интенсивность рентгенолюминесценцииизмерялась в момент облучения…

Реферат

Подробнее...

Выбор и составление расчётной схемы электрической сети и схемы замещения

Рисунок 3.1 Принципиальна расчетная схема электрической сети Источниками для питания подстанции 110/10 кВ «Южная» являются шины высокого напряжения подстанции «Тобольская» 110/35/10 кВ. Электроэнергия от источников питания к подстанции передаётся по двум одноцепным воздушным линиям электропередачи. На подстанции установлены два трансформатора ТДН — 16 000 /110. Рисунок 3.2 Схема замещения…

Реферат

Подробнее...

Генератор развертки. Изучение сложения взаимноперпендикулярных колебаний с помощью электронного осциллографа

Следовательно, пятно будет совершать колебания вдоль оси у. Вследствие световой инерции экрана и способности глаза сохранять некоторое время световое восприятие, на экране будет видна вертикальная линия. Если же напряжение на горизонтально отклоняющих пластинах, одновременно с изменением исследуемого напряжения, возрастает по линейному закону: Если напряжение на горизонтально отклоняющих…

Реферат

Подробнее...

Введение. Расчет высокочастотного резонатора

В данной курсовой работе рассматриваются исходные для расчета данные, рассчитываются размеры резонатора по заданной резонансной частоте и типу колебания. После чего, требуется построить картину силовых линий электрической и магнитной составляющей поля и расположить возбудители в требуемых местах. Расчет размеров резонатора По значению, продольному индексу рабочего колебания, значению…

Реферат

Подробнее...

Закрепление изображения. Химические аспекты фотографии

С увеличением температуры раствора фиксирование ускоряется. Предел повышения температуры определяется степенью задубленности светочувствительного слоя фотоплёнок. Фиксирующие растворы различают по их составу и действию. Они бывают слабощелочными, нейтральными, кислыми, кислодубящими, кислодубящими быстрыми. Чернобелые фотоплёнки в большинстве случаев обрабатывают в кислодубящих фиксирующих…

Реферат

Подробнее...

Функции и компоненты типового обеспечения АСУТП

В целом АСУТП включает в себя техническое, программное, информационное обеспечение как основу системы и организационное обеспечение, регламентирующее участие персонала в работе АСУТП. Информационные функции (мониторинг) включают в себя сбор значений переменных процесса, их хранение, отображение в подходящей для человека форме и передача на следующие уровни системы. Информационное обеспечение…

Реферат

Подробнее...

Выбор типа реактора

Реактор для получения аллилового спирта представляет собой вертикальную проточную колонну. Для регулирования температуры в зоне реакции, проходящей с поглощением тепла, средняя часть аппарата выполнена в виде трубчатки 2. В межтрубное пространство подаются топочные газы. Режимная температура поддерживается при помощи регуляторов, установленных на линиях обратных газов, выходящих из реактора…

Реферат

Подробнее...

Приготовление раствора заданной концентрации смешиванием растворов более высокой и более низкой концентрации

Выполнение опыта. Приготовить 250 мл 10% раствора хлорида натрия, имея в своем распоряжении 15% и 5% раствор NaCl. Так, для получения 100 г 36% раствора достаточно смешать 60 г 44% раствора и 40 г 24% раствора. Показывает, в каком массовом соотношении следует смешать исходные растворы. ПРИМЕР 2. Приготовить 100 г 36% раствора H3PO4, смешав 44% и 24% растворы этой кислоты. Следовательно…

Реферат

Подробнее...

Проверка действия независимых расцепителей автоматов

Для проверки действия независимого расцепителя измеряется минимальное напряжение надёжного отключения автомата этим расцепителем, которое не должно превышать 50% номинального. Включение автоматического выключателя бытового назначения после осуществления его дистанционного отключения с помощью независимого расцепителя производят вручную. Вторичные цепи и элементы при питании от отдельного…

Реферат

Подробнее...

Типовые схемы управления электроприводами

Нереверсивный магнитный пускатель (рис. 6.12) включает в себя электромагнитный контактор КМ с двумя встроенными в него тепловыми реле защиты КК, кнопки управления SB1 (Пуск) и SB2 (останов, стоп АД). Также произойдет остановка двигателя в случае срабатывания одного из тепловых реле. В этом случае разорвется цепь питания катушки контактора КМ контактами тепловых реле КК. Электрический ток потечет…

Реферат

Подробнее...

Тепловой режим системы теплоснабжения

Эквивалентный внутренний и наружный диаметры канала равны: Гдекоэффициент теплопроводности покровного слоя бризола. Удельные потери тепла неизолированными теплопроводами: Температуру воздуха в канале определяем по выражению: Коэффициент теплопроводности основного слоя изоляции. Прокладка трубопровода надземная (в каналах). Диаметр теплопроводов м. Диаметр изоляции м. Эффективность тепловой…

Реферат

Подробнее...