Помощь в написании студенческих работ
Антистрессовый сервис

Использование регрессионных моделей при анализе результатов «разрозненного» эксперимента

РефератПомощь в написанииУзнать стоимостьмоей работы

О распределении экспериментальных точек в нормализованном пространстве параметров в первом приближении можно судить по величине их радиус-вектора Rj. При заданной величине Rи наличии адекватного уравнения регрессии, построенного по всем достоверным экспериментальным точкам в зонах сгущения точек, величина dY будет иметь минимальные, а в зонах редкого расположения точек — максимальные значения… Читать ещё >

Использование регрессионных моделей при анализе результатов «разрозненного» эксперимента (реферат, курсовая, диплом, контрольная)

При обобщении результатов «разрозненного» эксперимента (представляющих собой накопленные при изучении некоторого явления экспериментальные данные, полученные разными исследователями без применения методов теории планирования эксперимента) стараются в первую очередь получить адекватное уравнение регрессии, связывающее искомую функцию с определяющими параметрами х1;хк. Чаще всего уравнение регрессии ищется в виде.

Использование регрессионных моделей при анализе результатов «разрозненного» эксперимента.

где z = (ZjCxj, …, х*)г2(х" xk)…zm(xlt хк)) — вектор (семейство) аппроксимирующих функций, выбранных заранее и зависящих от определяющих параметров х1; …, хк, каждый набор которых можно рассматривать как точку в fc-мерном.

( bi Л.

Ъ2

евклидовом пространстве параметров: В = • — неизвест;

I Ьт

ные параметры (коэффициенты уравнения регрессии).

При этом исходные экспериментальные данные, представляющие собой значения искомой функцииу в п различающихся экспериментальных точках (х1;…, хк)], j = 1,…, п, характеризуются матрицами.

Использование регрессионных моделей при анализе результатов «разрозненного» эксперимента.

где.

Использование регрессионных моделей при анализе результатов «разрозненного» эксперимента.

где Оу — дисперсия экспериментального определения у (приКак показано, например, в [49, 50], наилучшими линейными оценками для неизвестных параметров являются.

Использование регрессионных моделей при анализе результатов «разрозненного» эксперимента.

является информационной матрицей Фишера нимается постоянной во всей исследуемой области пространства параметров).

Наилучшие линейные оценки В (2.48) совпадают с оценками по МНК. Выражение (2.46) является наилучшей линейной оценкой исследуемой функции у в произвольной точке (jfj, При этом дисперсия величины у (дисперсия поверхности отклика, т. е. погрешность оценки / по адекватному уравнению регрессии) в этой точке.

Использование регрессионных моделей при анализе результатов «разрозненного» эксперимента.

оказывается наименьшей по сравнению с дисперсиями при других возможных линейных оценках величины у. Из соотношений (2.46), (2.49) и (2.50) видно, что погрешность уравнения регрессии существенно зависит от вида аппроксимирующих функций Zj, а также от положения точки (х, …, xk)j в пространстве параметров. Обычно на границах области пространства параметров и в зонах редкого расположения точек погрешность достигает максимальных значений.

Как показано в [44], сумма относительных дисперсий поверхности отклика dy = d.y/dy, взятая по всем точкам плана.

(или по всем экспериментальным точкам в случае «разрозненного» эксперимента), равна.

Использование регрессионных моделей при анализе результатов «разрозненного» эксперимента.

Из этого соотношения видно, что погрешность уравнения регрессии в точках, совпадающих с экспериментальными, изменяется прямо пропорционально количеству членов т в уравнении регрессии. Другими словами, погрешность оценки у по адекватному уравнению регрессии будет тем меньше, чем меньше в нем число членов. (Это объясняется тем, что при заданном количестве экспериментальных точек п точность определения коэффициентов Ь( в уравнении регрессии увеличивается при уменьшении их количества т.) Из сказанного следует, что из двух адекватных уравнений регрессии предпочтение следует отдать составленному из меньшего количества членов.

Величину dyi можно рассматривать как меру информативности экспериментальной точки. Действительно, если dyj (т.е. погрешность уравнения регрессии) в данной точке (х1; …, хп) невелико, дополнительное испытание в этой точке малоинформативно и его вряд ли следует проводить. Напротив, при повышенной величине dyJ дополнительное испытание в этой точке позволит уточнить исследуемую зависимость (т.е. информативность испытания будет высокой). Используя значение dyj в качестве критерия информативности предстоящего испытания, можно заранее исключить проведение ненужных малоинформативных испытаний. Кроме того, величину d? можно использовать для выявления ошибок в имеющемся экспериментальном материале, для анализа распределения экспериментальных точек в пространстве параметров, а также при планировании дополнительных экспериментальных исследований, завершающих «разрозненный» эксперимент.

Рассмотрим более детально указанные возможности.

Для выявления накопленных ошибок в экспериментальных данных можно поступать следующим образом. Используя адекватное уравнение регрессии, построенное по всем экспериментальным точкам, оценивают отклонения действительных значений уот расчетных по уравнению регрессии, т. е. величину Ду;. = у- - у,. Если в некоторой экспериментальной точке значение Аувелико, а погрешность уравнения регрессии dyj мала, то можно считать, что данная экспериментальная точка ошибочная и ее следует исключить из обобщения. Если при повышенном значении Ду, значение dYj в некоторой точке велико, нет основания считать эту точку ошибочной, она характеризуется повышенной информативностью и ее исключение из рассмотрения явно нецелесообразно, но, если при этом отклонение Ду; очень велико, эту точку также можно считать ошибочной [49].

С учетом сказанного ранжируем все экспериментальные точки по параметру промаха.

Использование регрессионных моделей при анализе результатов «разрозненного» эксперимента.

Точки, в которых значение этого параметра больше некоторого критического значения, следует исключить из рассмотрения как ошибочные. Ошибочные точки прежде всего исключаются в середине пространства параметров, где, как правило, число экспериментальных точек при «разрозненном» эксперименте бывает велико, а их информативность мала. Это может повысить надежность уравнения регрессии, достроенного только по оставшимся наиболее достоверным и информативным точкам, что, в частности, объясняется относительным влиянием оставшихся точек на формирование уравнения регрессии.

Уравнение регрессии строится при этом последовательными приближениями. Сначала находится адекватное уравнение регрессии, например, шаговым регрессионным методом по всем экспериментальным точкам. Далее определяются отклонения Ду;-, а также величины dYJ и кщ во всех экспериментальных точках. Затем производится выбраковка ошибочных точек и находится окончательный вид уравнения регрессии с учетом только наиболее достоверных экспериментальных точек.

Пример 2.19

Анализ распределения экспериментальных точек в пространстве параметров, накопленных в авиационном газотурбостроении по профильным потерям в дозвуковых турбинных решетках. В работе [50] были собраны и систематизированы экспериментальные по потерям в 130 турбинных решетках, исследованных при различных значениях в диапазоне ^тод = 0,54−1 (всего 454 экспериментальные точки). Было получено адекватное уравнение регрессии вида.

Использование регрессионных моделей при анализе результатов «разрозненного» эксперимента.

где 2; — некоторые простейшие функции определяющих параметров, в качестве которых были приняты (рис. 2.6):

Схема турбинной решетки [50].
Рис. 2.6. Схема турбинной решетки [50].

Рис. 2.6. Схема турбинной решетки [50].

Применительно к уравнению (2.53) во всех экспериментальных точках была рассчитана величина d ?, а также безразмерный радиус-вектор в нормализованном пространстве параметров.

Использование регрессионных моделей при анализе результатов «разрозненного» эксперимента.

Зависимость dyj от Rp а также изменение величины dy ср, осредняющей нанесенные точки, показаны на рис. 2.7.

Видно, что дисперсия поверхности отклика dy увеличивается по мере удаления от центра пространства параметров, где она минимальна и составляет dymin ~ (0,02 — 0,04)ау, что значительно превышает точку оценки у. Это свидетельствует, в частности, о малой информативности экспериментальных точек, расположенных в средней части пространства параметров [50].

На границах пространства параметров (в частности, при R} ~ 5) среднее и максимальное значения dy соответственно равны dycp ~ 0,025а2, dymax ~ 0,35а2.

Эти значения в 3—4 раза больше дисперсии поверхности отклика в точках оптимального плана, расположенных равномерно по поверхности гиперсферы й, «5 при том же их количестве п = 454, равной в соответствии с (2.51),.

Использование регрессионных моделей при анализе результатов «разрозненного» эксперимента.

При этом в произвольной внутренней точке пространства параметров дисперсия поверхности отклика принимала бы значения dy < dyom (см. пунктирную линию на рис. 2.7).

Зависимость d от й, [50].

Рис. 2.7. Зависимость drj от й, [50].

На фигуре нанесен также допустимый уровень дисперсии dy доп ~ 0,22, соответствующий при сту ~ 0,01 среднеквадратической погрешности оценки у по уравнению регрессии а (ц) ~ 0,005.

Малоинформативные точки в средней части пространства параметров представляют, очевидно, малую практическую ценность. Действительно, в табл. 2.24 приведены результаты построения уравнения регрессии вида (2.53) по всем п = 454 экспериментальным точкам (вар. 1) и по наиболее информативным точкам, для которых dy > 0,08, п = 219 (вар. 2) и dy > dycf>,

Таблица 2.24. Результаты построения уравнения [50].

Вариант

Условие

N

1 я.

1 s.

dy > 0.

0,92.

0,0083.

dY > 0,08.

0,89.

0,0088.

dy > dyФ

0,87.

0,0096.

п = 190 (вар. 3). Видно, что уравнения регрессии, построенные по 219 или даже по 190 наиболее информативным точкам, только незначительно уступают в точности уравнению регрессии, построенному по всем 454 экспериментальным точкам [50].

При разработке новых конструкций газовых турбин иногда возникает вопрос о необходимости экспериментального исследования вновь проектируемых решеток. Оценку целесообразности или нецелесообразности предстоящего испытания можно провести с помощью информационной матрицы Фишера, составленной по накопленным к настоящему времени данным.

С этой целью для интересующей нас решетки следует рассчитать значение dy по формуле (2.50) и значение ее радиус-вектора Rj. Поскольку значение Хгш является одной из координат (2.54), значения dy и будут изменяться в зависимости от л.год (обычно каждая решетка исследуется при работе на различных X тод).

Вычисленные значения dy) в зависимости от Rотражены на графике (см. рис. 2.7) для схемы, представленной на рис. 2.6. В частности, подробные расчеты dyj от Я, для трех проектируемых решеток с параметрами представлены в табл. 2.25. На рис. 2.7 нанесена также зависимость значения dy ср от R, по имеющимся экспериментальным данным.

Таблица 2.25. Параметры трех проектируемых решеток для расчета зависимости d, от R,

Решетка

Р°*.

Рз.

Стах.

t

dj

d2

l, мм

^ГОД.

31,4.

0,17.

0,67.

0,1.

0,09.

35,5.

0,6-ь 1,1.

28,2.

0,113.

0,81.

0,09.

0,08.

50,3.

33,6.

0,6-Ь 1,1.

0,15.

0,73.

0,08.

0,05.

63,3.

0,6-ь 1,1.

Видно, что для решеток 1 и 2 дисперсия оценок у по уравнению регрессии невелика и близка к средним значениям этой величины dycp. Это означает, что информативность этих решеток в диапазоне А.тод = 0,6-ь1,1 невелика, так что проведение их экспериментальных исследований нецелесообразно.

Для решетки 3 значения дисперсии оценок у примерно в два раза выше средних значений этой величины по имеющимся экспериментальным данным, а также выше dyAon. Кроме того, эта решетка находится вблизи границы исследованной области факторного пространства, что свидетельствует о повышенной информативности этой решетки и о целесообразности ее экспериментального исследования.

Вычисление dy для проектируемой решетки следует проводить и в случаях, когда ее экспериментальное исследование не предполагается, а лишь производится оценка профильных потерь в ней по уравнению регрессии. В этом случае значение dy позволяет судить о достоверности вычисленного значения потерь.

При обработке результатов «разрозненного» эксперимента необходимо убедиться в отсутствии «белых пятен» большой протяженности в имеющихся данных. Если значение dy в этих зонах особенно велико, следует провести дополнительные экспериментальные исследования. При планировании подобных завершающих исследований необходимо, во-первых, оценить распределение экспериментальных точек в пространстве параметров; во-вторых, провести предварительную оценку объема дополнительных испытаний; в-третьих, разработать рациональную стратегию проведения испытаний.

О распределении экспериментальных точек в нормализованном пространстве параметров в первом приближении можно судить по величине их радиус-вектора Rj. При заданной величине Rи наличии адекватного уравнения регрессии, построенного по всем достоверным экспериментальным точкам в зонах сгущения точек, величина dY будет иметь минимальные, а в зонах редкого расположения точек — максимальные значения. Иными словами, точки, для которых при Rj = const дисперсия dyj имеет повышенное значение, расположены в наименее исследованных областях пространства параметров.

По мере увеличения Rj возможность существования малоисследованной области, а также информативность экспериментальных точек увеличиваются. Учитывая эти обстоятельства, оценим распределение точек в первую очередь вблизи поверхности пространства параметров, а также необходимость и объем дополнительных (завершающих) испытаний [49, 50]. С этой целью:

  • 1. Используя полученное уравнение регрессии и информационную матрицу Фишера М0, определим информативность (значения dyj) точек, равномерно расположенных по поверхности пространства параметров. Проще всего для этой цели использовать точки, задаваемые планом полного факторного эксперимента при линейном планировании. Другими словами, используя М0, определим информативность эксперимента в точках, задаваемых факторным планом.
  • 2. Если информативность во всех точках плана не превышает допускаемой погрешности оценки функции у по уравнению регрессии, «белые пятна» вблизи поверхности пространства параметров отсутствуют, и надобности в дополнительных экспериментальных исследованиях нет. Если в некоторых точках факторного плана дисперсия dy намного превышает допустимые значения, необходимо в пг наиболее информативных точках запланировать дополнительный эксперимент.
  • 3. В предположении, что вид уравнения регрессии остается неизменным, рассчитывается информационная матрица Фишера Мг с учетом п1 дополнительных точек.
  • 4. По этой матрице снова оценивается информативность всех точек факторного плана, а затем в п2 наиболее информативных точках планируется проведение дополнительных экспериментов.
  • 5. Полагая, что вид уравнения регрессии остается неизменным, рассчитывается информационная матрица Фишера М2 с учетом П! + п2 дополнительных точек.

Далее расчеты повторяются по п. 4 и 5 до тех пор, пока информативность во всех точках плана не уменьшится до приемлемого значения. В результате расчетов оценивается потребное количество экспериментальных точек и их расположение в пространстве параметров.

При непосредственном проведении дополнительных экспериментальных исследований следует использовать принцип последовательности. В этом случае п. 3 в предыдущих рассуждениях выполняется лишь после проведения испытаний п1 наиболее информативных точках в получения нового оптимального уравнения регрессии по всем точкам, включая п, дополнительных точек. Последующие этапы дополнительных исследований также выполняются лишь после проведения эксперимента в точках, выбранных для исследования регрессии и корректировки информационной матрицы Фишера с учетом вновь полученных данных.

Использование изложенной методики при обобщении результатов «разрозненного» эксперимента позволяет оценить достоверность экспериментальных точек и их распределение в пространстве параметров, а также целесообразность и объем дополнительных завершающих исследований.

Показать весь текст
Заполнить форму текущей работой