Структурная и функциональная отказоустойчивость компьютерных систем
Отказоустойчивость вычислительного процесса с поддержкой его непрерывности после отказа компьютера возможна при возобновлении прерванного вычислительного процесса на других компьютерах системы или с использованием ресурсов других компьютеров. Непрерывность вычислительного процесса в условиях отказов может достигаться при резервированном выполнении задач на нескольких компьютерах. Для… Читать ещё >
Структурная и функциональная отказоустойчивость компьютерных систем (реферат, курсовая, диплом, контрольная)
Отказоустойчивость как способность систем сохранять работоспособность в условиях отказов для компьютерных и инфокоммуникационных систем и сетей имеет определенную специфику. Она обусловлена тем, что работоспособность компьютера определяется не только исправностью его устройств, но и способностью обеспечить непрерывность, своевременность и устойчивость вычислительного процесса.
Устойчивость вычислительного процесса должна поддерживаться не только при внутренних отказах компьютеров, но и при внешних деструктивных воздействиях, препятствующих корректной реализации вычислительного процесса, в том числе своевременности получения результатов.
С учетом указанной особенности отказоустойчивость компьютерных и инфокоммуникационных систем и сетей разделима на структурную и функциональную [15].
Под структурной отказоустойчивостью компьютерной системы понимается способность системы сохранять работоспособность конфигурации аппаратно-программных средств в условиях их отказов и сбоев. Таким образом, она подразумевает потенциальную способность (готовность) системы к сохранению работоспособности (к требуемому функционированию) после возникновения (накопления) отказов аппаратно-программных средств.
Структурная отказоустойчивость может достигаться реконфигурацией системы при ее возможной деградации, проявляющейся в снижении качества функционирования и (или) потере ресурсов обеспечения (запаса) надежности (снижении кратности резервирования).
Под функциональной отказоустойчивостью компьютерной системы понимается способность системы к своевременному и безошибочному выполнению требуемых функционатьных задач в условиях сбоев, отказов, а возможно, и внешних случайных или злонамеренных деструктивных воздействий.
Деструктивные воздействия, приводящие к нарушению своевременности вычислительного процесса, могут проявляться в преднамеренном увеличении интенсивности запросов к ресурсам системы или увеличению этой интенсивности некоторыми случайными внешними причинами.
Функциональная отказоустойчивость в компьютерной системе может быть разделена на отказоустойчивость вычислительного процесса и отказоустойчивость по готовности к выполнению требуемых функций.
Для отказоустойчивости вычислительного процесса в системе после отказа требуется обеспечение корректного продолжения (завершения) вычислительного процесса, прерванного отказом, возможно с использованием ресурсов других компьютеров или иных ресурсов системы. При этом при отказах может потребоваться обеспечение непрерывности вычислительного процесса.
Под непрерывностью вычислительного процесса понимается продолжение выполнения инициализированного процесса после отказов — без нарушения во времени выдачи требуемой последовательности результатов (воздействий для управляющей системы).
Отказоустойчивость вычислительного процесса с поддержкой его непрерывности после отказа компьютера возможна при возобновлении прерванного вычислительного процесса на других компьютерах системы или с использованием ресурсов других компьютеров. Непрерывность вычислительного процесса в условиях отказов может достигаться при резервированном выполнении задач на нескольких компьютерах. Для инфокоммуникационных сетей непрерывность вычислительного процесса может поддерживаться при многопутевой маршрутизации (когда реализуется доставка копий пакетов по нескольким зависимым или независимым маршрутам) и при резервированной передаче пакетов через агрегированные каналы при требовании безошибочной доставки адресату хотя бы одной копии пакета.
Сохранение устойчивости вычислительного процесса может сопровождаться реконфигурацией системы или достигаться при предоставлении требуемых для реализации процесса ресурсов по запросам, передаваемым через сеть.
Надежность вычислительного процесса при накоплении отказов может достигаться в результате перераспределения функциональных запросов. Перераспределение запросов (перемещение вычислительного процесса на выполнение в другие компьютеры) системы приводит к замедлению вычислительного процесса из-за необходимости обмена информацией для организации точек возврата, восстанавливающих вычислительный процесс.
Восстановление вычислительного процесса при сохранении его непрерывности возможно при хранении результатов в памяти, одновременно доступной для отказавшего компьютера и компьютера, выделяемого для возобновления прерванного отказами вычислительного процесса.
Отказоустойчивость компьютерной системы с возобновлением вычислительного процесса возможна также при резервировании вычислительного процесса на разных узлах компьютерной системы. Резервирование вычислительного процесса обеспечивает его непрерывность при условии безотказности (сохранения работоспособности) хотя бы одного из узлов, задействованных в резервированном выполнении вычислений.
Функциональная отказоустойчивость по сохранению функциональности без гарантированного корректного завершения вычислительного процесса направлена на обеспечение работоспособности системы по выполнению набора требуемых функций (при допустимости потери в системе результатов выполнения функций отказавших компьютеров).
Отказоустойчивость по выполнению требуемых функций может поддерживаться в компьютерных системах из многофункциональных модулей.
(компьютерных узлов), в которых каждый модуль выделяется на выполнение определенных функций при условии, что вся совокупность модулей обеспечивает реализацию полного набора функций.
Отказоустойчивость компьютерных систем из многофункциональных модулей может обеспечиваться:
- • при функциональной реконфигурации, предполагающей после потери некоторыми модулями способности выполнения возложенных на них функций перераспределение функций, закрепляемых за модулями;
- • при динамическом распределении потока запросов с учетом функциональных возможностей модулей, постепенно теряемых при функциональной деградации системы, которая происходит при накоплении отказов.