Задачи оптимального оценивания
Задачи оптимального оценивания могут быть описаны следующим образом. Имеется случайный процесс x (t), моделирующий движение системы. Процесс x (t) непосредственному наблюдению, под которым понимается возможность измерения, недоступен. Измеряется другой связанный с x (t) процесс у (t) — Требуется по результатам наблюдения процесса y (t) на отрезке построить оптимальную в квадратическом смысле… Читать ещё >
Задачи оптимального оценивания (реферат, курсовая, диплом, контрольная)
Задачи оптимального оценивания могут быть описаны следующим образом. Имеется случайный процесс x (t), моделирующий движение системы. Процесс x (t) непосредственному наблюдению, под которым понимается возможность измерения, недоступен. Измеряется другой связанный с x (t) процесс у(t) — Требуется по результатам наблюдения процесса y (t) на отрезке [О, Т] построить оптимальную в квадратическом смысле оценку вектора х (т). В зависимости от конкретного значения аргумента т принято различать:
- • задачу фильтрации, если т = Т;
- • задачу экстраполяции, если т > Т;
- • задачу интерполяции, если т < Г.
Получим решение задачи фильтрации для случая, когда движение системы x (t) и процесс наблюдения за ним у (г) описываются системами линейных стохастических дифференциальных уравнений:
В уравнениях (3.37), (3.38) вектор x (t) е Rn, y (.t) е Rm, матрицы Л, a, S> ао — заданы, измеримы, ограничены и имеют соответствующие порядки, через? и обозначены взаимно независимые винеровские процессы, не зависящие от случайного гауссовского вектора х0, параметры распределения которого равны.
В уравнении (3.37) Т > 0 — произвольный фиксированный момент времени. Предполагается, что матрица a0(t) не вырождена при любом t е [О, Т]- Обозначим через m (f), D (t) соответственно условное математическое ожидание и матрицу ковариации вектора х (Т) при условии, что на отрезке [О, Т] измерена реализация у (t). Известно, что т (Т) есть наилучшая в среднеквадратическом смысле оценка величины х (Т), a D (J) представляет собой матрицу ковариации разности х (Г) — т (Т). Установим формулу для т (Г) и D{T). Обозначим через |3,(Т) векторы из Rn, у которых г-я компонента равна единице, а все остальные равны нулю. Определим на отрезке [О, Т] векторы a,(t) как решение системы уравнений
Входящее в систему (3.39) управление u;(t) должно доставлять минимум квадратическому функционалу.
где N = g0gо, JVa =стст'. Умножим систему (3.37) слева на a[(t), а систему для a[(t) — справа на x (t), сложим полученные уравнения и проинтегрируем в пределах от 0 до Т. С учетом начальных условий для х (0) и а,(Т) получаем
Возведем обе части последнего равенства в квадрат и вычислим затем математическое ожидание. Из независимости величин х (0), i;0
и свойств стохастических интегралов Ито вытекает, что.
Таким образом, функция и,(0, при которой будет реализована наилучшая в среднеквадратическом смысле линейная оценка (3.41) величины x,(t), будет одновременно доставлять минимум функционалу 1(и, а,), т. е. будет оптимальным управлением в задаче (3.39), (3.40).
Найдем выражение для оптимального управления и минимального значения функционала (3.40) в задаче (3.39), (3.40). Получим ее решение, рассматривая задачу (3.39), (3.40) как частный случай задачи.
(3.13), (3.15) при a = 0. Сделаем для этого замену переменных s = T-t,
a,(s) = a,(Ts), 0 < 5 < T. Запишем уравнения для a,(s). В силу системы.
(3.39) имеем
Функционал (3.40) принимает вид.
Решение задач вида (3.40), (3.43) дают формулы (3.21)—(3.23) при <�т = 0, в соответствии с которыми имеем.
Здесь матрица P (s) удовлетворяет уравнению.
Но в силу выражения (3.41) минимальное значение функционала.
(3.40) равно диагональному элементу d1((T) матрицы D (T), поэтому, с учетом выражения (3.44) и определения векторов (3;(Т), диагональные элементы матриц D (T) и Р (0) также равны. Пусть i, j — два произвольных индекса. Ясно, что оптимальная оценка суммы х,(Т) + х;(Т) равняется
Отсюда и из определения матрицы D (T) следует.
Запишем теперь другое выражение для оптимальной оценки суммы Х;(Т) + Xj (T). С этой целью повторим рассуждения от формулы (3.39) до (3.41), всюду заменяя a,(t) на a,•,(!). Вектор ay(t) определяется как решение системы (8.3) с граничным условием ау (Т)= (3,(Г) + 3;(Т) — В результате вместо выражения (3.41) получим
Решение задачи о минимуме функционала (3.48) будет даваться формулами (3.42)—(3.46), в которых всюду надлежит а, заменить на (Ху, а (3, заменить на Р, + Р-. Значит, в силу формулы (3.44) получим.
Отсюда из формул (3.48) и (3.47) вытекает, что.
при любых i, j. Из последнего равенства следует, что.
Введем матрицу D (t) = Р (Т — t). Ясно, что ввиду формулы (3.46) D (0) = D0. Кроме того, в силу произвольности числа Г в формуле (3.49) матрица D (t) при любом t > О представляет собой матрицу ковариации условного распределения x (t) при условии, что на отрезке [0, t] наблюдается вектор (3.38). Из формулы (3.46) вытекает уравнение для матрицы D (t):
Обратимся теперь к уравнению оптимальной оценки. В силу формулы (3.41) оптимальная оценка ш,(Т) компоненты х,(Т) вектора х (7) равняется
С учетом формулы (3.45) запишем формулу (3.51) в виде.
Уравнение для вектор-строки a,' (t) в силу формулы (3.39) и (3.45) имеет вид.
Обозначим через a (t) квадратную матрицу размером п хп, в качестве i-й строки которой взята вектор-строка a' (t). Тогда формулу (3.52) можно переписать в виде.
Здесь т (Т) обозначен вектор с координатами (т1(Г),…, тп(Т)). Напомним теперь формулу Коши для решения обыкновенного дифференциального уравнения
Решение этого уравнения представимо в виде формулы Коши.
Матрица Коши z (t, s) определяется соотношениями.
Сравнивая формулу (3.54) с выражениями (3.55), (3.56), заключаем, принимая во внимание уравнения (3.53), что формула (3.54) есть формула Коши для решения m (t) уравнения.
Уравнения (3.50), (3.57) для вектора оптимальной оценки m (t) и матрицы ковариации D (t) представляют собой уравнения фильтра Калмана.
При выводе уравнения оптимальной фильтрации (3.50), (3.57) предполагалось, что т0=Мг (0) = 0. Покажем, что при произвольном значении т0 формулы оптимального фильтра имеют тот же самый вид, но начальное условие для уравнения (3.57) будет иметь вид m (0) = mo.
Сделаем в уравнении (3.57) замену переменных x (t) = z (t, 0)-x1(t), где z (f, 0) определяется соотношением (3.56). Получим.
Далее для получим
Наконец, обозначая наблюдаемую величину через имеем
Задача фильтрации (3.58), (3.59) относятся к типу, изученному выше. Матрица ковариации D2(t) вектора x2(t) описывается уравнением вида (3.50), которое в нашем случае будет выглядеть так:
Но D (t) = z (t, 0) D2(t)-z'(t, 0). Отсюда и из выражений (3.56), (3.60) следует уравнение (3.50). Действительно,.
Уравнение для оценки m2(t) вектора x2(t) по результатам наблюдения y2(s), 0.
На основании определения вектора x2(t) имеем
Значит,
Соотношения (3.61), (3.62) представляют собой фильтр Калмана при произвольном значении математического ожидания т0 вектора х0.