Помощь в написании студенческих работ
Антистрессовый сервис

Исследование статистической зависимости давления идеального газа от его температуры при изохорном процессе

КурсоваяПомощь в написанииУзнать стоимостьмоей работы

Подставив соответствующие значения в полученные формулы, и решив систему уравнений, мы получим искомую функцию параболической регрессии Эти формулы используются для линейной и параболической регрессий, затем сравнивают полученные результаты и находят наименьшие среди полученных результатов. Та регрессия, у которой будут наименьшие оценки, более точно отражает распределение точек на диаграмме… Читать ещё >

Исследование статистической зависимости давления идеального газа от его температуры при изохорном процессе (реферат, курсовая, диплом, контрольная)

Исследование статистической зависимости давления идеального газа от его температуры при изохорном процессе

1. Теоретическая часть

В данной работе исследуется зависимость давления идеального газа от его температуры при изохорном процессе с помощью методов математической статистики.

Идеальный газ — математическая модель газа, в которой предполагается, что потенциальной энергией молекул можно пренебречь по сравнению с их кинетической энергией. Между молекулами не действуют силы притяжения или отталкивания, соударения частиц между собой и со стенками сосуда абсолютно упруги, а время взаимодействия между молекулами пренебрежимо мало по сравнению со средним временем между столкновениями.

Давление газа на стенку сосуда — суммарный импульс, переданный за единицу времени отдельными частицами при столкновениях со стенкой.

Температура — физическая величина, характеризующая тепловое состояние системы и связанная со средней кинетической энергией молекул.

Давление газа и температура зависят от нескольких факторов, обе величины связаны с движением частиц (молекул газа), следовательно, зависимость статистическая. Количество молекул очень велико, скорости и направления движения молекул совершенно хаотичны. Целесообразно рассматривать связь со средними значениями скоростей, что значит принять между величинами X и Y корреляционную зависимость.

Обычно в любой области науки при изучении двух величин проводятся эксперименты, и задача состоит в том, чтобы на основании экспериментальных точек выявить функциональную зависимость.

Так как зависимость корреляционная, задача состоит в том, чтобы приближённо свести корреляционную связь к функциональной с помощью подбора такой функции, которая максимально возможно была бы близка к экспериментальным точкам. Такая функция называется функцией регрессии.

Обычно вид самой функции угадывается, но она зависит от некоторых параметров. Задача статистического и корреляционного анализа состоит в нахождении этих параметров. Для этого и используется метод наименьших квадратов.

Приведем основные определения и понятия из курса теории вероятностей и математической статистики, которые будут задействованы и использованы в данной работе.

Математическая статистика — наука, которая занимается обработкой данных. Во многих своих разделах математическая статистика опирается на теорию вероятностей, позволяющую оценить надежность и точность выводов, делаемых на основании ограниченного статистического материала (выборки).

Статистика — это наука, которая занимается получением, обработкой, а также анализом данных и публикацией информации, характеризующей количественные закономерности жизни общества в неразрывной связи с их качественным содержанием. В более узком смысле статистика — это совокупность данных о каком-либо процессе или явлении. Задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов. Установление закономерностей, которым подчинены массовые случайные явления, основано на изучении методами теории вероятностей статистических данных — результатов наблюдений.

Выборочной совокупностью (выборкой) называют совокупность случайно отобранных объектов.

Генеральной совокупностью называют совокупность объектов, из которых производится выборка.

Для того чтобы по данным выборки можно было судить об изучаемом признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно его представляли; т. е. выборка должна быть репрезентативной (представительной). В силу закона больших чисел можно утверждать, что выборка будет репрезентативной, если ее осуществлять случайно: каждый объект выборки отобран случайно из генеральной совокупности, если все объекты имеют одинаковую вероятность попасть в выборку.

Репрезентативность — главное свойство выборки, состоящее в близости ее характеристик (состава, средних величин и т. д.) к соответствующим характеристикам генеральной совокупности, из которой отобрана выборка.

Таким образом, статистическими методами пользуются для выявления закономерностей наблюдений и для проверки соответствия построенных теорий реальных явлений с их фактическим протеканием.

Как уже было сказано выше, существует тесная связь между математической статистикой и теорией вероятностей.

Объемом совокупности называют число объектов этой совокупности.

Теория вероятностей — раздел математики, в котором по данным вероятностям одних случайных событий находят вероятности других событий, связанных каким-либо образом с первыми. Теория вероятностей изучает также случайные величины и случайные процессы. Одна из основных задач теории вероятностей состоит в выяснении закономерностей, возникающих при взаимодействии случайных факторов.

У нас имеется выборка случайных значений, объем которой равен

Случайной называют величину, которая в результате испытания примет одно и только одно возможное значение, наперед не известное и зависящее от случайных причин, которые заранее не могут быть учтены. Случайные величины бывают двух видов: дискретные и непрерывные.

Дискретной называют случайную величину, возможные значения которой есть отдельные изолированные числа, которые эта величина принимает с определенными вероятностями.

Наблюдаемые значения случайной величины называются вариантами. Частотой называется число, которое показывает, сколько раз встречается данный вариант. Относительной частотой называется отношение частоты к объему выборки n.

Математическим ожиданием M (X) дискретной случайной величины называют сумму произведений всех ее возможных значений на их вероятности. Если дискретная случайная величина принимает счетное множество возможных значений, то:

Дисперсией дискретной случайной величины называют математическое ожидание квадрата отклонения случайной величины от ее математического ожидания:

Средним квадратичным отклонением случайной величины X называют квадратный корень из дисперсии:

Модой называют варианту, которая имеет наибольшую частоту.

Медианой называют варианту, которая делит вариационный ряд на две части, равные по числу вариант.

Начальным моментом порядка k случайной величины X называют математическое ожидание величины Xk:

В частности, начальный момент первого порядка равен математическому ожиданию:

Центральным моментом порядка k случайной величины X называют математическое ожидание величины :

В частности, центральный момент первого порядка равен нулю:

центральный момент второго порядка равен дисперсии:

центральный момент третьего порядка равен:

Исправленной выборочной дисперсией называют произведение выборочной дисперсии на исправитель:

Выборочным исправленным средним квадратичным отклонением называют квадратный корень от исправленной выборочной дисперсии:

Корреляционное поле и корреляционная таблица являются вспомогательными средствами при анализе выборочных данных. При нанесении на координатную плоскость двумерных выборочных точек получают корреляционное поле. Для численной обработки результатов обычно группируют и представляют в форме корреляционной таблицы. В каждой клетке корреляционной таблицы приводятся численности тех пар (X, Y), компоненты которых попадают в соответствующие интервалы группировки по каждой переменной.

Корреляция — вероятностная (статистическая) зависимость между величинами, не имеющая, вообще говоря, строго функционального характера.

Корреляционным моментом случайных величин X и Y называют математическое ожидание произведения отклонений этих величин

.

Для вычисления корреляционного момента используют формулу:

Две случайные величины Y и X называются коррелированными, если их корреляционный момент отличен от 0; Y и X называются некоррелированными величинами, если их корреляционный момент равен 0.

Коэффициентом корреляции случайных величин X и Y называют отношение корреляционного момента к произведению средних квадратических отклонений этих величин

.

Гистограммой частот называется столбчатая диаграмма, состоящая из прямоугольников, основаниями которых служат частичные интервалы длиной h, а высоты равны отношению (плотность частоты).

Гистограммой нормированных относительных частот называется диаграмма, на которой изображены столбцы, при этом ось Х — это интервалы, а ось Y — это относительная частота встречаемости:

Полигоном частот называется ломаная, отрезки которой соединяют точки. Для построения полигона на оси абсцисс откладывают варианты, а на оси ординат — соответствующие им частоты .

Полигоном относительных частот называют ломаную, отрезки которой соединяют точки. Для построения полигона на оси абсцисс откладывают варианты, а на оси ординат — соответствующие им относительные частоты .

Функцией распределения называют функцию, определяющую вероятность того, что случайная величина Х в результате испытания примет значение, меньшее х:

Функцией распределения выборки является эмпирическая функция распределения.

Эмпирической функцией распределения называют функцию, определяющую для каждого значения х относительную частоту события Х < х:

где — число вариант, меньших х; n — объем выборки.

2. Регрессионный анализ

Регрессия — зависимость среднего значения какой-либо величины Y от другой величины X. Понятие регрессии в некотором смысле обобщает понятие функциональной зависимости y = f (x). Только в случае регрессии одному и тому же значению x в различных случаях соответствуют различные значения у.

Регрессионный анализ заключается в определении аналитического выражения связи, в которой изменение одной величины (называемой зависимой или результативным признаком) обусловлено влиянием одной или нескольких независимых величин (факторов).

По форме зависимости различают:

1. линейную регрессию, которая выражается уравнением прямой:

2. нелинейную (параболическую):

Исследование линейной регрессии:

Определим коэффициенты линейной функции методом наименьших квадратов. Для этого составим сумму Для того чтобы эта сумма была минимальной, необходимо, чтобы ее частные производные по параметрам A и B были равны нулю Раскрыв скобки, мы получим Выразим a и b

Одним из важнейших методов определения зависимости между X и Y является метод наименьших квадратов. Видя общее расположение точек, можно предположить, что эта зависимость линейная. Количество прямых, проходящих через заданную совокупность точек, бесконечно. Выберем оптимальную из них. Для этого суммарное отклонение между теоретическими и экспериментальными точками должно быть минимальным. Это отклонение мы найдем с помощью функции Метод нахождения минимального отклонения и есть метод наименьших квадратов. Это суммарное отклонение зависит от коэффициентов, а и b функции Y, поэтому эти коэффициенты должны быть минимальными, то есть производная функции в этих точках равны нулю:

Найдя частные производные и приравняв их нулю, получим следующую систему уравнений Решив эту систему, мы найдем наилучший набор этих параметров. Эта теоретическая кривая с параметрами, которые определяются методом наименьших квадратов, и будет искомой линией — линией линейной регрессии.

Исследование параболической регрессии:

В этом случае уравнение регрессии Y на X имеет вид:

где a, b и c — неизвестные параметры.

Найдем такие p, q, r, при которых парабола наименее уклоняется от точек (Xi, Yi). Сделаем это методом наименьших квадратов. Для того чтобы сумма квадратов отклонений была наименьшей, необходимо, чтобы выполнялись три условия (по числу неизвестных коэффициентов) После преобразований уравнения примут следующий вид:

Подставив соответствующие значения в полученные формулы, и решив систему уравнений, мы получим искомую функцию параболической регрессии Эти формулы используются для линейной и параболической регрессий, затем сравнивают полученные результаты и находят наименьшие среди полученных результатов. Та регрессия, у которой будут наименьшие оценки, более точно отражает распределение точек на диаграмме рассеивания.

3. Обработка исходных данных

Дана выборка (объема n=100) зависимости числа (Y) от числа (X).

Табл. 1. Исходные данные

X

Y

X

Y

X

Y

X

Y

X

Y

15,000

40,500

4,780

15,300

13,500

46,400

15,700

47,400

19,200

61,200

0,212

8,010

1,360

16,000

6,620

24,900

13,500

36,700

3,540

6,660

17,900

74,100

4,940

26,800

18,400

56,000

16,600

48,200

4,640

13,600

7,680

31,600

12,300

41,500

1,760

8,970

12,100

30,900

9,600

29,200

18,000

54,200

4,640

17,000

12,400

55,500

15,000

49,700

7,480

22,100

14,900

45,000

5,180

15,000

11,200

41,700

12,200

28,000

6,540

27,100

13,400

40,600

1,870

3,160

14,600

53,400

8,060

34,200

1,100

1,920

0,358

2,840

6,620

20,900

1,440

2,820

17,600

68,300

19,400

61,100

0,994

— 4,620

8,060

28,600

11,000

32,200

19,700

57,600

4,520

19,100

9,780

40,000

8,160

23,700

17,800

60,000

9,980

34,300

8,780

27,500

5,000

19,400

6,760

31,600

8,980

35,900

16,400

46,200

3,540

27,500

6,680

36,300

13,800

56,900

10,600

36,600

17,800

57,600

16,700

52,700

17,700

55,700

3,140

19,800

16,800

61,400

5,420

34,300

9,700

37,700

1,990

8,180

6,260

22,400

2,700

9,400

6,980

12,400

1,970

6,150

19,700

64,400

10,800

27,700

7,580

12,400

5,980

26,700

17,100

49,200

7,160

20,400

6,280

25,700

12,300

37,700

4,220

13,600

6,140

25,800

10,800

35,100

7,540

22,200

4,060

18,900

1,060

19,500

3,240

9,660

0,652

12,900

3,980

13,800

0,244

13,500

9,920

37,200

8,040

38,900

9,720

40,900

14,300

45,200

4,860

12,300

17,100

58,000

6,700

25,800

12,600

40,500

10,000

37,300

9,480

35,000

9,340

22,100

9,560

39,200

Основные характеристики выборки Числовые характеристики X:

1) M*(x) =9,19 470;

2) D*(x) = 30,1964;

3) S2(x) = 30,50 141;

4) ?*(x) = 5,49 512

5) s*(x) = 5,52 281;

6)

7)

8) начальные и центральные моменты первого, второго и третьего порядков:

Числовые характеристики Y:

1) M*(y) = 31,6405;

2) D*(y) =305,57 007;

3) S2(y) =308,65 664;

4) ?*(y) = 17,48 056;

5) s*(y) = 17,56 863;

6) начальные и центральные моменты первого, второго и третьего порядков:

Корреляционный момент и коэффициент корреляции :

Из Полученного значения коэффициента корреляции следует прямая связь между исследуемыми величинами, т. к. оно положительно. Так как принимает значение близкое к (1), то X и Y зависимы. При увеличении X увеличивается Y.

Построим диаграмму рассеивания для данных значений X и Y:

Рис. 1. Диаграмма рассеивания

4. Корреляционный анализ

Для корреляционного анализа данные удобнее представить в виде корреляционной таблицы. Область попадания точек разбиваем на 7 интервалов по X и 7 по Y. В первой строке таблицы укажем средние значения интервалов для Y, а в первом столбце — средние значения интервалов по X. На пересечении строк и столбцов находятся частоты наблюдаемых пар значений признаков.

Табл. 2. Корреляционная таблица

X Y

1,286

12,2486

23,4943

34,74

45,986

57,231

68,477

nx/n

1,604

0,14

4,388

0,16

7,172

0,20

9,956

0,17

12,74

0,10

15,524

0,10

18,308

0,13

ny/n

0,06

0,18

0,25

0,22

0,12

0,14

0,03

С помощью корреляционной таблицы мы сможем найти оценки для X:

где, = 9, 260;

=28,73 556;

= 33,52 482;

=5,36 056;

=5,79 006.

С помощью корреляционной таблицы найдем числовые характеристики Y:

где, =31,36 626;

= 299,72 195;

= 349,675 608;

= 17,31 248;

= 18,69 962.

Используя данные корреляционной таблицы, построим гистограммы, полигоны и графики эмпирических функций распределения для X и Y (см. рис. 2 — рис. 7):

Рис. 2. Гистограмма относительных частот по X

Рис. 3. Гистограмма относительных частот по Y

Рис. 4. Полигон относительных частот по X

Рис. 5. Полигон относительных частот по Y

Рис. 6. Эмпирическая функция распределения по X

Рис. 7. Эмпирическая функция распределения по Y

5. Регрессионный анализ

Линейная регрессия

Для нахождения коэффициентов a и b методом наименьших квадратов были посчитаны следующие необходимые параметры:

= 11 473,98048;

= 919,47;

=38 067,15706;

= 3164,05.

В нашем случае коэффициенты, а и b соответственно равны:

.

Следовательно, первое уравнение линейной регрессии для нашей выборки имеет вид:

y = x .

Для нахождения коэффициентов с и d методом наименьших квадратов были посчитаны следующие необходимые параметры:

= 130 669,13150;

= 919,47;

= 38 067,15706;

= 3164,05.

В нашем случае коэффициенты c и d соответственно равны:

.

Следовательно, второе уравнение линейной регрессии для нашей выборки (см. рис. 8) имеет вид:

x = 0,29424y — 0,9 047.

Рис. 8. Линейная регрессия

Параболическая регрессия

Для нахождения коэффициентов p, q и r методом наименьших квадратов были посчитаны следующие необходимые параметры:

2 575 510,37568;

165 006,98099;

= 11 473,98048;

538 674,01185;

= 919,47;

= 38 067,15706;

= 3164,05.

В нашем случае коэффициенты p, q и r соответственно равны:

, .

Следовательно, уравнение параболической регрессии для нашей выборки (см. рис. 9) имеет вид:

.

Рис. 9. Параболическая регрессия

Таким образом, мы выяснили, что:

1. Зависимость между X и Y близка к линейной.

2. Зависимость между X и Y близка к квадратичной.

3. При этом обе кривые — прямая и парабола — практически не отклоняются от точек выборки (X, Y), но все-таки точнее выборку описывает параболическая регрессия.

Теоретически утверждалось, а теперь подтвердилось на практике, что чем больше степень уравнения регрессии, тем точнее график. Это легко заметить на рисунках. Но трудность вычислений возрастает неимоверно; если, чтобы найти уравнение линейной регрессии приходилось решать систему из двух уравнений, включающих неприятные суммы, то для параболической — уже из трех, для кубической — из четырех.

Для данной выборки существует закономерность; в уравнениях регрессий, по мере возрастания степени уравнений n, коэффициенты перед переменными в этой степени стремятся к нулю. Это позволяет сделать вывод, что построение регрессий высших степеней не дало бы нам ощутимого улучшения результата.

Рассмотрим статистику, которая показывает отклонение значений от

.

Проверим гипотезы и Значения, вычисленные с использованием соответствующих статистик и должны быть меньше значения. Статистика используется для проверки гипотезы о линейной зависимости, и показывает, насколько величины отклоняются от линии регрессии. Вычисляем

.

Аналогично для гипотезы используем статистику, которая, соответственно, показывает отклонение от квадратной регрессии. Видим

.

Из того, что и меньше следует, что гипотезы верны.

Проверим гипотезу о нормальном распределении признака Х. Для этого будем сравнивать эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормального распределения) частоты. При уровне значимости ?=0,05 требуется проверить нулевую гипотезу: генеральная совокупность распределена нормально.

В качестве критерия проверки нулевой гипотезы примем случайную величину По таблице критических точек распределения ?2 по заданному уровню значимости? и числу степеней свободы k = s — 3 ищем критическую точку (?; k)

Если < - нет оснований отвергнуть нулевую гипотезу.

Если > - нулевую гипотезу отвергают.

Для нахождения теоретических частот разделим выборку на s=7 частичных интервалов, как это было сделано для корреляционной таблицы, нормируем случайную величину Х, вычисляем теоретические вероятности Рi попадания Х в интервал (xi; xi+1) по функции Лапласа и, наконец, найдем теоретические частоты nтеор.

Табл. 3. Вычисление теоретических частот нормального распределения X

nэксп

Xi

Xi+1

Zi

Zi+1

Фi

Фi+1

Pi

nтеор

?2

0,212

2,996

— 1,68 788

— 1,16 853

— 0,5

— 0,379

0,121

12,1

0,29 835

2,996

5,78

— 1,16 853

— 0,64 919

— 0,379

— 0,2422

0,1368

13,68

0,39 345

5,78

8,564

— 0,64 919

— 0,12 984

— 0,2422

— 0,0517

0,1905

19,05

0,4 738

8,564

11,348

— 0,12 984

0,389 512

— 0,0517

0,1517

0,2034

20,34

0,54 846

11,348

14,132

0,389 512

0,90 886

0,1517

0,3186

0,1669

16,69

2,68 161

14,132

16,916

0,90 886

1,428 209

0,3186

0,4236

0,105

10,5

0,2 381

16,916

19,7

1,428 209

1,947 558

0,4236

0,5

0,0764

7,64

3,76 042

7,75 347

Наблюдаемое значение = 7,75 347. Критическое значение (0,05; 4) = 9,5. Выполняется <, следовательно, нет оснований отвергнуть нулевую гипотезу.

6. Доверительные интервалы

Рассмотренные ранее, ,, ,, ,, являются точечными оценками, но наряду с ними при изучении выборки используются интервальные оценки, так как полезно не только построить оценку, но и охарактеризовать величину возможной при её использовании ошибки.

Интервальной называют оценку, которая определяется двумя числами — концами интервала. Интервальные оценки позволяют установить точность и надежность оценок.

Величина характеризует точность оценки, если выполняется неравенство, где — оценка некоторого параметра генеральной совокупности. Надежностью (доверительной вероятностью) оценки по называют вероятность, c которой осуществляется неравенство. Наиболее часто задают надежность, равную 0,95; 0,9; 0,999.

Доверительным называют интервал, , который покрывает известный параметр с заданной надежностью .

Рассмотрим доверительный интервал для математического ожидания генеральной совокупности. Известен объем выборки n = 100; = 9,1947, = 31,6405, исправленное выборочное среднеквадратичное отклонение, .

Найдем доверительный интервал для оценки неизвестного математического ожидания по X и Y с надежностями = 0,95; 0,99; 0,999.

Если наблюдаемая случайная величина имеет нормальное распределение, но ее среднеквадратичное отклонение нам неизвестно, то мы можем построить доверительный интервал по распределению Стьюдента с степенями свободы, то есть должно быть справедливо неравенство:

;

где определим по заданным и. Это соотношение выражает доверительный интервал для, определяемый с помощью распределения Стьюдента.

Найдем доверительные интервалы для математического ожидания X.

При;: 8,11 223 < < 10,27 517.

При; 7,76 982 < < 10,61 959.

При; 7,32 247 < < 11,6 693.

Заключение

диаграмма регрессия давление газ В курсовой работе был проведен статистический анализ зависимости в 100 экспериментах от. Производя этот анализ, мы использовали не только аналитические функции, но и графические данные.

В результате было научно доказано, что при изохорном процессе с увеличением температуры увеличивается давление.

Зависимость давления от температуры при изохорном процессе близка к линейной и к квадратичной. Однако видно, что разница между значениями статистик небольшая. С практической точки зрения удобнее приближать точки выборки и к прямой. Тем самым, был доказан закон Шарля, частный случай уравнения идеального газа Менделеева — Клапейрона, одного из фундаментальных понятий в термодинамике.

1 Гмурман, В. Е. Теория вероятностей и математическая статистика. Учебное пособие для вузов. — М.: Высшая школа, 2001.

2 Гмурман, В. Е. Руководство по решению задач по теории вероятностей и математической статистике. Учебное пособие для вузов. — М.: Высшая школа, 1979.

3 Баврин, И. И. Теория вероятностей и математическая статистика — М.: Высшая школа, 2005.

4 Кремер, Н. Ш. Теория вероятностей и математическая статистика — Учебник для втузов. — 2-е изд. — М.: ЮНИТИ — ДАНА, 2004.

5 Сивухин, Д. В. Общий курс физики. Том II. Термодинамика и молекулярная физика. 5-е изд., испр. — М.: Физматлит, 2005.

Показать весь текст
Заполнить форму текущей работой