Показатели надежности вычислительной системы кластерной архитектуры
Если для выполнения требуемой функции достаточно работоспособности хотя бы одного узла, то все состояния, кроме состояния с отказом всех узлов, могут быть отнесены к работоспособным. При рассмотрении кластера как системы массового обслуживания дополнительным условием работоспособности системы может быть обеспечение при выполнении требуемой функции условий стационарности. Представим каждый узел… Читать ещё >
Показатели надежности вычислительной системы кластерной архитектуры (реферат, курсовая, диплом, контрольная)
Определим основные показатели надежности для невосстанавливаемых компьютерных систем кластерной архитектуры.
Рассмотрим простейшую реализацию кластера, включающую п идентичных компьютерных узлов при сбалансированном распределении входного потока на все работоспособные узлы. Диаграмма состояний и переходов при представлении простейшего кластера моделью размножения и гибели имеет вид, приведенный на рис. 10.32.
По диаграмме на рис. 10.32 составляем систему алгебраических уравнений:
Решив приведенную систему уравнений (используя средства компьютерной математики), найдем все искомые вероятности состояний.
Если для выполнения требуемой функции достаточно работоспособности хотя бы одного узла, то все состояния, кроме состояния с отказом всех узлов, могут быть отнесены к работоспособным. При рассмотрении кластера как системы массового обслуживания дополнительным условием работоспособности системы может быть обеспечение при выполнении требуемой функции условий стационарности. Представим каждый узел кластера системой массового обслуживания типа М/М/1 с бесконечной очередью.
При требовании стационарности режима обслуживания входного потока значение минимального числа работоспособных узлов кластера d, при котором возможен стационарный режим обслуживания запросов, находится из условия (Av/d) < 1, где v — среднее время обслуживания запроса, Л — интенсивность потока запросов.
Таким образом, суммируя работоспособные состояния с количеством работоспособных узлов не меньше d, получим стационарный коэффициент готовности кластера как
Коэффициент сохранения эффективности кластера, если эффективность определить величиной, обратной среднему времени пребывания запросов в системе, можно вычислить как
где Еп и Ej — показатели эффективности кластера в исходном состоянии при исправности п узлов и при исправности i узлов.
При представлении узла кластера в виде системы массового обслуживания типа М/М/1 с реализацией равномерного распределения потока запросов на i работоспособных узлов среднее время пребывания запросов в узле вычислим как.
Рис. 10.32. Диаграмма состояний и переходов простейшего кластера.
где v — среднее время обслуживания запроса; Л — интенсивность потока запросов.
Таким образом, для кластера имеем.
Для систем ответственного назначения, для которых требуется готовность к выполнению требуемой функции в произвольный момент времени t поступления запроса и безотказность задействованных во время решения задачи tx ресурсов, надежность оценивается, но коэффициенту оперативной готовности.
При оценке вероятности успешного выполнения задачи по коэффициенту оперативной готовности необходимо учитывать время выполнения задачи ?, организацию вычислительного процесса (в том числе резервирование вычислений,) и возможность застать в момент поступления запроса кластер в одном из работоспособных состояний, характеризующихся различной эффективностью функционирования с различным запасом обеспечения надежности.
Рассмотрим некоторые варианты организации вычислительного процесса.
Вариант В1: во время решения задачи затребованной к выполнению в момент t, формируется некоторый поток запросов, время выполнения которых значительно меньше ?,. Требуется, чтобы во время решения задачи все запросы были выполнены, т. е. за время решения задачи необходима безотказность хотя бы одного узла кластера.
Вариант В2: в момент t в кластер поступает некоторый функциональный запрос, который направляется в очередь одного из узлов, результаты выдаются с кластера сразу после завершения обслуживания запроса. Если во время ожидания или выполнения запроса узел отказывает, то имеет место отказ в решении функциональной задачи (обслуживании запроса).
Вариант ВЗ: в момент t в кластер поступает некоторый функциональный запрос, который направляется в очередь одного из узлов, результаты выдаются с кластера через время ?, (время ?, должно быть больше времени до получения результатов вычислений в узле). Запрос теряется в случае отказа выполняющего его узла, на стадии ожидания в очереди, обслуживания или ожидания считывания результатов вычислений.
Вариант В4: в момент t поступает некоторый функциональный запрос, который направляется в очередь k узлов (d < к < «), считается успешно выполненным, если за время ?, до считывания результатов не отказывает хотя бы один из к узлов, принимающих запрос к резервированному выполнению.
Вариант В5: в момент t в кластер поступает некоторый функциональный запрос, который направляется в очередь на обслуживание к узлов. Результаты выдаются с кластера сразу после завершения обслуживания запроса хотя бы в одном узле, безотказном во время ожидания и выполнения запроса.
Вариант В6. в момент t в кластер поступает некоторый функциональный запрос, который направляется в очередь одного из узлов, результаты выдаются с кластера сразу после обслуживания запроса. Допустимая задержка обслуживания запросов ?, достаточно велика, и если во время пребывания запроса в узле он отказывает, то запрос направляется на повторное выполнение в очередь одного из работоспособных узлов и т. д. до получения результата с безотказного узла.
Для варианта В1 коэффициент оперативной готовности определяем исходя из того, что за время решения задачи ?, должен не отказать хотя бы один из узлов, работоспособных к моменту поступления запроса на выполнения требуемой задачи:
при этом безотказность узла за время tx решения задачи вычисляется как Pip,) «ехр (-Х.,).
Для варианта В2 коэффициент оперативной готовности определяется как вероятность того, что к моменту поступления запроса имеется хотя бы d работоспособных узлов, и после распределения запроса в очередь одного из них этот узел не откажет во время ожидания и выполнения запроса:
где 7' — среднее время пребывания запросов в кластере из i работоспособных узлов.
Для варианта ВЗ коэффициент оперативной готовности определяется как вероятность того, что к моменту поступления запроса имеется хотя бы d работоспособных узлов, а после распределения запроса в очередь одного из них этот узел не откажет. Причем узел, выполняющий запрос, должен не отказать как во время ожидания и выполнения запроса, так и во время хранения результатов до их считывания в момент времени Г,. Таким образом, узел, выполняющий запрос, должен не отказывать в интервале времени tv т. е.
Для варианта В4 вероятность успешного безотказного резервированного обслуживания рассматриваемого запроса (коэффициент оперативной готовности) при кратности резервирования запросов k (k < d) вычисляется как.
где p (tx) = ехр (-А.,).
Если кратность резервированного обслуживания запросов зависит от числа работоспособных узлов в момент поступления запроса, то.
Для варианта В5 коэффициент оперативной готовности определяем, исходя из того, что за время 7'резервированного обслуживания запроса должен не отказать хотя бы один из узлов, работоспособных к моменту поступления запроса на выполнение требуемой задачи, т. е.
Заметим, что резервированное обслуживание запросов с кратностью резервирования к увеличивает интенсивность потока запросов в к раз, поэтому среднее время пребывания запросов в одном из i узлов, работоспособных в момент поступления запроса:
И, соответственно с учетом того, что при 6-кратном резервировании запросов минимальное число узлов (I, при котором условие стационарности обслуживания запросов выполняется, находится из условия.
Если кратность резервированного обслуживания запросов зависит от числа работоспособных узлов в момент поступления запроса, то.
Для варианта В6 коэффициент оперативной готовности определяем, исходя из того, что за допустимое время решения задачи ?, должен не отказать хотя бы один из узлов, работоспособных к моменту поступления запроса на выполнение запроса. Таким образом, для наихудшего случая обслуживания с повторами из-за отказов узлов во время нахождения в них запросов искомый коэффициент можно оценить по формуле (10.6). Вероятность обслуживания запроса без повтора выполнения запроса из-за отказов во время решения задачи может быть оценена по формуле (10.7).