Помощь в написании студенческих работ
Антистрессовый сервис

Исследование потока количества транспортных событий на железных дорогах Украины

СтатьяПомощь в написанииУзнать стоимостьмоей работы

Перед тем как подвергнуть результаты наблюдений соответствующей статистической обработке, необходимо убедиться, что они действительно образовывают случайную выборку, т. е. есть стохастически независимыми. В нашем случае x1, …, xm (m=12) случайные величины, которые определяют число транспортных событий в m=12 месяцах (на протяжении года). Для проверки утверждения о независимости воспользуемся… Читать ещё >

Исследование потока количества транспортных событий на железных дорогах Украины (реферат, курсовая, диплом, контрольная)

Исследование потока количества транспортных событий на железных дорогах Украины

УДК 519.246:656.2.08

Мойсеенко В.И., Бородай Г. П., Лазарев А. В. Исследование потока количества транспортных событий на железных дорогах Украины // Сб. науч. работ. _ Донецк: ДонИЖТ, 2010. _ Вып. №

Исследован поток количества транспортных событий на железных дорогах Украины. С помощью критерия серий, который основан на медиане выборки, критерия квадратов последовательных разностей (критерий Аббе) и критерия Крускала-Уоллиса сделан вывод, что исследуемый поток владеет стационарностью и отсутствием последействия на протяжении 2005;2009гг. Кроме этого, этот поток распределен по нормальному закону. Полученные результаты дали возможность спрогнозировать количество транспортных событий на будущее.

Ил. _ 6, табл. _ 6, список лит. _ 9 наим.

UDC 519.246:656.2.08

Mojseenko V.I., Borodaj G.P., Lazarev A.V. Investigation of the flow of traffic events on the railways of Ukraine // Collection of scientific works. _ Donetsk: DonIRT, 2010. _ Digest №.

Investigated the flow of traffic events on the railways of Ukraine. With the help of the runs test, which is based on the median of the sample, the criterion of the squares of successive differences (Abbe criterion) and the Kruskal-Wallis test was concluded that the investigated flow is stationary and has no after-effect during 2005 to 2009. In addition, this flow are normally distributed. The results obtained made it possible to predict the number of transport events in the future.

Ill. _ 6, the table _ 6, the list of lit. _ 9 names/

Анализ состояния проблемы и постановка задачи

Каждое железнодорожно-транспортная событие (ЗТП) можно и следует рассматривать как своего рода научный эксперимент, который спонтанно осуществился, планомерная постановка которого потребовала бы значительных финансовых, временных и эмоциональных затрат. 1]

Тщательное расследование каждой ЗТП, накопление, следующая обработка и систематизация соответствующих данных позволяют установить закономерности явлений и процессов, которые протекают в исследуемых объектах. Целью такого исследования есть разработка рекомендаций для усовершенствования технологических процессов, устранение недостатков и противоречий в нормативных документах, формулирование задачи оптимизации транспортного процесса и отыскание их нетрадиционных решений.

Анализ последних исследований и публикаций

Исследование любых потоков данных выполняется во многих областях науки и техники. Поток количества транспортных событий на железной дороге исследован пока недостаточно. Этот вопрос рассматривается в работах [2, 3]

Отдельные исследования указывают на существование закономерностей изменения численности нарушений по годам в виде уравнения второго порядка [3]:

Месячные реализации, по данным указанных авторов и результатов исследования сходов подвижного состава с рельсов имеют случайный характер и представляют собой реализации x1, x2, … xn случайного процесса. Исходя из этого сформулирована гипотеза о нормальной закон распределения случайной переменной xi месячных реализаций.

При решении научно-практических задач, связанных с моделированием ЗТП и формированием количественных оценок опасностей сильное важное значение имеют такие свойства случайных переменных, как стационарность, ординарность и отсутствие или наличие последействия В работе Сокола Э. М. показано, что за период 1994;1995 лет реализации данных по сходам подвижного состава могут рассматриваться как дискретная вероятностная величина с пуасоновским законом распределения. Автор допускает наличие стационарности и отсутствия последействия потока данных, которые являются важными характеристиками при прогнозировании вероятностных величин. Также следует признать, что данные для исследования взяты только по Львовской железной дороге и, возможно, не учитывают тенденцию других железных дорог и Укрзализныци в целом.

Поэтому в на основе выборки количества транспортных событий по Укрзализныци за 1995;2003 года проверены гипотезу о нормальном распределении вероятностной величины количества нарушений в продолжение месяца.

В указанных работах акцентируется внимание на определении законов распределения вероятностных величин. Вопрос исследования потоков данных не приобрели надлежащую научную поддержку. Вследствие этого надлежащим образом не исследовано влияние человеческого фактора и качества управления областью на количество транспортных событий, поэтому эта проблема есть актуальной как в научному, так и в практическом плане.

Формулирование цели статьи. Целью статьи являются определения закономерностей и тенденций обращения потока количества транспортных событий.

Изложение основного материала

Рассмотрим численные характеристики реализаций ЗТП по годам и месяцам имея на внимании данные официальной статистики. Характер поведения количественных показателей отдельных видов нарушений имеет максимум в конце девяностых годов двадцатого столетия со следующим спадом в 2001;2008 годах и стабилизацией на протяжении последних пяти лет, рисунки 1−2.

Рисунок 1 — Изменения численности катастроф и аварий Рисунок 2 — Общая численность ЗТП и их среднее количество через сутки Максимум функции наблюдается в 1995 году, а потом с каждым годом количество транспортных событий уменьшается. Таким образом можно сделать вывод, что распределение ЗТП по годам имеет постоянную тенденцию к уменьшению их количества и их реализации не являются случайными Начиная с 2004 года наблюдается относительно постоянная тенденция характера поведения реализаций численности нарушений по годам. Рассмотрим более подробно период с 2005 по 2009 года. Рассмотрим поведение месячных реализаций нарушений, исследуя развертывание данного процесса на протяжении года. Численные данные, которые приведены в таблицы 1 и характер их поведения (рисунок 3) дают предыдущее основание считать их случайными реализациями.

В связи с этим авторами сформулированное предположение относительно случайного характера этих реализаций ЗТП, кроме того считается, что поток событий в 2005;2009 гг. есть стационарным (однородным), и не имеет последействия (выборка є действительно случайной реализацией независимых случайных величин).

Рисунок 3 — Распределение количества ЗТП по месяцам года Таблица 1

Распределение количества транспортных событий по месяцам

Год

Месяц

январь

февраль

март

апрель

май

июнь

июль

август

сентябрь

октябрь

ноябрь

декабрь

Проверка независимости ряда наблюдений

Перед тем как подвергнуть результаты наблюдений соответствующей статистической обработке, необходимо убедиться, что они действительно образовывают случайную выборку, т. е. есть стохастически независимыми. В нашем случае x1, …, xm (m=12) случайные величины, которые определяют число транспортных событий в m=12 месяцах (на протяжении года). Для проверки утверждения о независимости воспользуемся данными таблицы 1. Будем считать наблюдение случайной величины в разные года, как n реализаций xi n=4,5,6. Для проверки независимости используем 2 критерия:

_ критерий серий, основанный на медиане выборки;

_ критерий квадратов последовательных разностей (критерий Аббе) [5, 7].

Критерий серий, основанный на медиане выборки [5]

Рассмотрим три периода времени возникновения ЗТП: 2006;2009 гг., 2005;2009 гг., 2004;2009 гг. и для каждого из них применим критерий серий, который основан на медиане выборки.

Первый период с 2006 г. по 2009 гг. Количество элементов выборки n = 48, медиана выборки xmed = 71.5

Таблица 2

Распределение количества транспортных событий по месяцам в 2006;2009 гг.

Год

Месяц

Кол.

серий

Элементы, для которых xi > xmed подчеркнуты. Серией является последовательность подряд расположенных подчеркнутых или не подчеркнутых элементов вариационного ряда. Количество серий обозначается ?(n), а длина наиболее длинной серии ?(n). В таблице 2 ?(n) = ?(48) = 23, ?(n) = 5. По критерию серий проверяется одновременное выполнение неровностей [5]

(1)

которые при n = 48 выполняются:

23 > 17.78

5 < 5.5947.

Таким образом, можно сделать вывод, что гипотеза о независимости выборки с 48 элементов таблицы 2 не отвергается.

Рассмотрим второй период с 2005 по 2009гг. Количество элементов выборки n = 60, медиана выборки xmed = 73.5

Таблица 3

Распределение количества ЗТП по месяцам в 2005;2009гг.

Год

Месяц

Кол.

серий

?(n) = ?(60) = 27, ?(n) = ?(n) = 6. Неравенства (1) при n = 60:

Т.е. критерий независимости выполняется не в полной мере из-за ошибочность второй неравенства. Полученные результаты указывают на то, что численные данные не подтверждают уверенно выдвинутую гипотезу.

Рассмотрим последний период с 2004 по 2009гг. Количество элементов выборки n = 72, медиана выборки xmed = 74

железнодорожный безопасность критерий закономерность Таблица 4

Распределение количества ЗТП по месяцам в 2004;2009 гг.

Год

Месяц

Кол.

серий

74

74

74

74

74

Элементы выборки, которые равняются xmed = 74 вычеркиваются. ?(n) = ?(72) = 25, ?(n) = ?(n) = 7. Неравенства (1) при n = 72:

не выполняются. Таким образом, можно сделать вывод, что гипотеза о независимости не может быть принята и отвергается.

Проведенные расчеты по критерию серий, основанным на медиане выборки, для трех периодов указывают на то, что гипотеза о независимости ряда наблюдений в 2004;2009гг. отвергается, в 2005;2009гг. не подтверждается уверенно, а в 2006;2009гг. не отвергается.

Проверим независимость ряда наблюдений ЗТП по критерию квадратов последовательных разностей (критерий Аббе) [5, 7]

Выборка, которая исследуется, выбирается из нормальной генеральной совокупности. Это будет доказано позднее. Для проверки стохастической независимости реализаций ЗТП с помощью данного критерия вычисляют величину [5]

где Если окажется, что, то гипотеза о стохастической независимости результатов измерения отвергается. При этом величина для n>60 исчисляется по формуле [5]

(2)

где uб — б-квантиль нормального распределения:

u0.001=3.09,

u0.01=2.326,

u0.05=1.645.

Величина при n?60 для трех уровней значимости ?=0,001, ?=0,05, ?=0,01 предоставленные в таблицы 4.9.

Значение q2(n), s'2(n), г (n) исчислялись по помощи PASCAL программ, которые разработаны авторами.

1) Рассмотрим первый период с 2006 г. по 2009 гг., когда n=48, тогда Таким образом можно сделать вывод, что гипотеза о независимости выборки с 48 элементов таблицы 2 принимается (не противоречит результатам эксперимента).

2) Рассмотрим второй период с 2005 по 2009 гг., когда n=60, тогда Таким образом гипотеза о независимости отвергается, поскольку неравенство выполняется.

3) Рассмотрим последний период с 2004 по 2009 гг., когда n=72. За формулой (2) вычисляем

Дальше находим

Таким образом гипотеза о независимости отвергается, поскольку неравенство равно как в п. 2 выполняется.

Проведенные расчеты по критерию Аббе позволяют сделать вывод о том, что в периоде 2006;2009гг. гипотеза о независимости выборки принимается; в периоде 2005;2009гг. гипотеза отвергается; в периоде 2004;2009гг. гипотеза отвергается.

В дальнейшем переходим к проверке стационарности потока реализации нарушений безопасности

У стационарного потока случайные величины x1, …, xm (m=12) имеют один и тот же закон распределения. Для проверки этого утверждения используется выборка из таблицы 1. Гипотеза о стационарности потока (однородность выборки) проверяется с помощью критерия Крускала-Уоллиса [6], основанного на статистике

(3)

В данном случае k — количество совокупностей есть количество лет наблюдений k = 5, 6, 7; n t — число наблюдений в избирателе из совокупности t; n t =12; - среднее значение рангов для совокупности t. доказано, что статистика (3) распределенная приблизительно как с k-1 степенями свободы.

С помощью разработанных авторами PASCAL программ происходит построение вариационного ряда, сортировка выборки, назначение рангов и вычисление статистики Крускала-Уоллиса для k = 5, 6, 7 лет:

а) рассмотрим первый период k = 5, 2005;2009гг. N = 5*12=60. Результаты работы программы Kr59.PAS приведенные в таблицы 5.

Таблица 5

Результаты работы программы Kr59.PAS

Реализация

Количество ЗТП, xi

Ранг, ri

Реализация

Количество ЗТП, xi

Ранг, ri

Реализация

Количество ЗТП, xi

Ранг, ri

1.0

21.5

40.0

2.0

21.5

42.0

3.0

21.5

43.0

4.0

24.0

45.5

5.0

25.0

45.5

6.0

28.0

45.5

7.5

28.0

45.5

7.5

28.0

48.0

9.0

28.0

49.0

10.0

28.0

50.0

11.0

31.0

51.5

12.0

32.0

51.5

13.0

33.0

53.5

14.5

34.0

53.5

14.5

35.5

55.0

16.5

35.5

56.0

16.5

37.0

57.0

18.0

38.0

58.5

19.0

40.0

58.5

21.5

40.0

60.0

KW=3.9109 sr=1830 rt2=97.7

rt[1]=266.0 rt[2]=361.0 rt[3]=396.0 rt[4]=390.5 rt[5]=416.5

Вычисленное по выборке значение критерия Крускала-Уолліса (3) KW=3.9109. Число степеней свободы k-1=4. Поскольку KW=3.9109 значительно меньше взятых из таблицы значений критерия ч2, а именно значений:

это предположение о стационарности выборки есть правильным;

б) рассмотрим следующий период k=6, 2004;2009гг., N=6*12=72. С помощью программы Kr49.PAS получим: KW=11.7718, сумма рангов sr=2628, rt2=423.7, суммы рангов за 2004;2009гг. rt[i]=249.5, 361.5, 471.0, 508.5, 502.5, 535.0, i=1,…, 6… Число степеней свободы k-1=5. Поскольку KW=11.7718, а ч25,0.1=9.24 ч25,0.05=11.1 ч25,0.01=15.1, то гипотеза принимается для уровня значимости б=0.01 и отвергается для ?=0.1 и ?=0.05;

в) в конце концов третий период k=7, 2003;2009, N=7*12=84. С помощью программы Kr39.PAS получили KW=24.6543, сумма рангов sr=3570, rt2=215.5, суммы рангов в 2003;2009гг.: rt[i]=351.0, 479.5, 598.0, 628.0, 630.5, 667.5, i=1,…, 7… Поскольку KW=24.0543 значительно больше ч26,0.1=10.6 ч26,0.05=12.6 ч26,0.01=16.8, то гипотеза о стационарности отвергается.

Таким образом по результатам вычислений по критерию Крускала-Уолліса виборки 2005;2009гг и 2004;2009гг являются стационарными, а в виборки 2003;2009гг. гипотеза о стационарности отвергается.

Возникает вопрос о том, какой вид имеет закон распределения случайной величины x1, …, xm (m=12) когда есть k=5 совокупностей реализаций этой случайной величины. Интервал изменения этой случайной величины (43;120) разбиваем на 8 промежутков равной длины ?=10 и вычисляем число элементов виборки, которые попали в i-и промежуток i=1,., 8 (с помощью таблицы 5) и помещаем их в таблицу 6.

Таблица 6

Вычисление количества элементов в i-интервале

Интервал

41;50

51;60

61;70

71;80

81;90

91;100

101;110

111;120

Количество элементов

n1=5

n2=8

n3=14

n4=16

n5=7

n6=4

n7=4

n8=2

По данным таблицы 6 строим гистограму.

Гистограма (рисунок 4) напоминает график нормального закона. Естественно возникает предположение о том, что случайная величина, которая исследуется, распределенная по нормальному закону .

С помощью разработанной авторами PASCAL программы, начальными данными которой есть границы промежутков разбивки из таблицы 6 и числа ni — количество элементов в i-му промежутка (i=1,…, 8) по критерию ч2 проверена гипотеза о нормальном распределении виборки 2005;2009гг. Число степеней свободы

k=8_ 1_ 2=5

Получено

ч2виб=4.47, s=17.48.

Рисунок 4 — Гистограма распределения случайной величины ЗТП Таким образом, поскольку ч2виб значительно меньше ч25,0.1=9.24 ч25,0.05=11.1 ч25,0.01=15.1, то считаем, что гипотеза о нормальном законе выполняется.

В связи с вышеизложенным можно рассмотреть вопрос прогнозирования количества ЗТП

Это можно сделать двумя путями, а именно:

_ параболическая аппроксимация количества транспортных событий;

_ кусково-линейная аппроксимация кривой количества ЗТП.

Сначала рассмотрим параболическую аппроксимацию количества ЗТП. Начальными данными является количество ЗТП по месяцам каждого года с 2005 по 2009 года. Кривую количества транспортных событий (рисунок 5) получено методом наименьших квадратов с помощью пакету MathCad.

Примененная кусков-полиномиальная аппроксимация кривой с помощью полиномов второй степени, т. е. парабол на 5 отрезках года Полученная кривая может быть использована для прогнозирования количества транспортных событий в любом месяце.

Рисунок 5 — Характеристика изменения количества транспортных событий в 2005 _ 2009 г.

Рассмотрим прогнозирование количества ЗТП КЗТП и оценим погрешность прогноза. Поскольку понятие доверительной области определяется лишь для прямых регрессии, то применим кусков-линейную аппроксимацию кривой количества ЗТП и построим для каждой с прямых доверительные области (рисунок 6). Наибольший размер доверительной области будет характеризовать погрешность.

Прямые регрессии и границы доверительных областей вычислены с помощью разработанной авторами PASCAL программы.

Коэффициенты корреляции r характеризуют точность линейной аппроксимации по четырем участкам. Наиболее низкий коэффициент корреляции на третьем участке r = _0.4622, где наблюдается наибольший разброс значений количества ЗТП, а наибольший r = 0.8571 на четвертом участке, где разброс значений наименьший (рисунок 6).

Рисунок 6 — Кусков-линейная аппроксимация кривой количества ЗТП и доверительные области для четырех участков:

1 _ верхняя доверительная граница;

2 _ кусков-линейная аппроксимация;

3 _ нижняя доверительная граница;

4 _ значение границ доверительной области, вычисленные за (4);

5 _ реализации количества ЗТП в 2005;2009 гг.

Вычислим границы области надежности 1-е (доверительной области) для прямой регрессии y = в01x, что есть такими [9]:

(4)

где в0, в1 — коэффициенты прямой регрессии,

— среднее значение величины x,

Sx2 — дисперсия величины x,

Se2 — остаточная дисперсия,

tе(n-2) — значение критерия Стьюдента для соответствующего числа точек n.

Границы доверительной области представляют собой гиперболы, расположенные симметрично относительно прямой регрессии (рисунок 6). Вычисления сделаны для уровня значимости е = 0.05 и надежности 1 _ е = 0.95. Доверительные области для четырех участков изображенные на рисунке 6. С вероятностью p = 0.95 прямые соответствующего участка находятся между гиперболами.

Относительная погрешность прогноза не превышает отношения длины доверительного интервала для крайней точки участка к ординате прямой в этой точке. Так, в январе относительная погрешность д = (77−69)/77 = 0,103, т. е. 10.3%; в апреле целесообразно вычислить погрешность как среднюю погрешностей по левую сторону и по правую сторону

т.е. 15.5%. Наибольшая относительная погрешность наблюдается в сентябре

т.е. 18.4%, а наименьшая в декабре

д = (107−99)/107 = 0.074, т. е. 7.4%.

Таким образом, относительная погрешность прогнозирования не превышает 18.4%.

Вывод

Таким образом, за результатом вычислений критериев: серий, который основан на медиане выборки, квадратов последовательных разностей (критерий Аббе) и критерия Крускала-Уоллиса можно сделать вывод, который выборка ЗТП в 2006;2009гг. есть стационарной и независимой, выборка за 2005;2009 гг. есть стационарной и «частично независимой», а выборка за 2004;2009гг. _ стационарной, но зависимой. Можно приближенно считать выборку 2005;2009гг. стационарной и независимой. Гипотеза о нормальном законе распределения выборки 2005;2009гг выполняется.

На основании полученных результатов можно сделать вывод, что поток количества ЗТП владеет стационарностью и отсутствием последействия на протяжении 2005;2009гг. и распределенный по нормальному закону. Это дает основания прогнозировать количество ЗТП на будущее. Дальнейшим направлением работы являются исследования поведения нарушений по отдельным областям железнодорожного транспорта и, в частности, устройств и систем железнодорожной автоматики.

Список литературы

1. Сокол Э. Н. Судебная железнодорожно-транспортная экспертиза: настоящее и будущее // Железнодорожный Транспорт Украины. — 1997. — № 2−3. — С. 67−72.

2. Сокол Э. Н. Сходы с рельсов и столкновения подвижного состава (Судебная экспертиза. Элементы теории и практики). Монография. 2 издание, дополненное. — К.: Транспорт Украины, 2004. — 368 с.

3. Мойсеєнко В.И., Головко О. В. Анализ и программирование стана безопасности движения поездов // Зб. наук. работ. — Донецк: Донизд, 2005. — Вип. № 4. — С.5−12.

4. Анализ состояния безопасности движения на железных дорогах Украины в 2009 году / [Укрзализныця. Главное управление безопасности движения и экологии]. — К.: Транспорт Украины, 2010. — 98 с.

5. Айвазян С. А. и др. Прикладная статистика: Основы моделирования и первичная обработка данных. Справочное изд. / С. А. Айвазян, И. С. Енюков, Л. Д. Мешалкин. — Г.: Финансы и статистика, 1983. — 471 с.

6. Джонсон Н. Статистика и планирование эксперимента в технике и науке. Методы обработки данных. / Н. Джонсон, Ф. Лион. — Г.: Мир, 1980. — 610 с.

7. Большев Л. Н. Таблицы математической статистики. / Л. Н. Большев, Н. В. Смирнов. — Г.: Наука, 1968. — 473 с.

8. Сборник задач по математике для втузов. Специальные курсы. / [Вуколов Э.А., Ефимов А. В., Земсков В. Н. и др.]; под ред. А. В. Ефимова — М.: Наука, 1984. — 585 с.

9. Эконометрика: учебн. [для студ. высш. уч. завед.] / [Елисеева И.И., Курышева С. В., Костеева Т. В. и др.]; под ред. И. И. Елисеевой. — Г.: Финансы и статистика, 2003. — 344 с.

Показать весь текст
Заполнить форму текущей работой