Повторение отдельных фрагментов курса по теории вероятностей
Где х0 — начало (нижняя граница) модального интервала; 6 — величина модального интервала; пМп — частота модального интервала; п~ — частота интервала, предшествующего модальному; п4 — частота интервала, следующего за модальным. Частоты, как и выше, везде могут быть заменены на относительные частоты, выраженные либо в процентах, либо в долях. Статистики, отвечающие основным параметрам одномерного… Читать ещё >
Повторение отдельных фрагментов курса по теории вероятностей (реферат, курсовая, диплом, контрольная)
- 1. Функция плотности одномерного распределения и функция распределения для одномерных непрерывных и дискретных распределений; связь этих функций друг с другом; основные параметры любого[1] одномерного распределения — математическое ожидание, мода, медиана и другие квантили, дисперсия.
- 2. Площадь под кривой функции плотности как оценка вероятности попадания значения случайной величины в соответствующий отрезок.
- 3. Выборочное представление функции плотности распределения признака (непрерывного и дискретного): частотная таблица, полигон, гистограмма (в том числе с неравными интервалами). Различие стоящих за выбором полигона и гистограммы предположений о распределении признака внутри каждого интервала. Анализ моделей, заложенных в указанных способах выборочного представления случайной величины, их различие: при использовании полигона предполагаем, что все попавшие в интервал значения сосредоточены водной точке (важно, что при построении графика на оси* может быть выбрана любая точка интервала, т. е. что выбор такой точки — тоже модельное предположение); при использовании гистограммы считаем, что распределение в каждом интервале равномерно; гистограмму имеет смысл рассчитывать только для непрерывного признака. Проблема построения выборочной функции плотности для непрерывного признака: разбиение диапазона изменения признака на интервалы, отнесение «стыка» соседних интервалов к одному из концов, пропущенные данные. Цели заполнения пропусков. Способы такого заполнения: средним арифметическим (может быть, с учетом значений других признаков) или другими средними, равномерно по всем градациям, пропорционально получившимся частотам. Модели, стоящие за каждым названным подходом к заполнению пропущенных значений.
- 4. Выборочное представление функции распределения (кумулята): частотная таблица, полигон и гистограмма.
- 5. Статистики, отвечающие основным параметрам одномерного распределения: среднее арифметическое, дисперсия, мода, медиана и другие квантили. Медиану необходимо уметь считать двумя способами: как середину вариационного ряда и с помощью кумуляты. То же для других квантилей. Снова обратить внимание на модель, заложенную в методе.
Напомним основные формулы для расчета медианы и моды[2]:
где jc0 — начало (нижняя граница) медианного интервала; 6 — величина медианного интервала; п — объем выборки (или 100%, либо 1); пм — частота (или относительная частота в процентах, либо в долях), накопленная до медианного интервала; пЫе — частота (относительная частота либо в процентах, либо в долях) медианного интервала;
где х0 — начало (нижняя граница) модального интервала; 6 — величина модального интервала; пМп — частота модального интервала; п~ — частота интервала, предшествующего модальному; п4 — частота интервала, следующего за модальным. Частоты, как и выше, везде могут быть заменены на относительные частоты, выраженные либо в процентах, либо в долях.
- 6. Функция плотности и функция распределения двумерных случайных величин. Основной параметр двумерного распределения — коэффициент корреляции.
- 7. Выборочное представление функции плотности двумерной случайной величины (частотная таблица, или таблица сопряженности). Маргинальные частоты, их связь с одномерными распределениями рассматриваемых признаков. Статистика, отвечающая генеральному коэффициенту корреляции.
Напомним формулу для вычисления последней названной статистики:
Кроме того, напомним важное свойство коэффициента корреляции: он измеряет только линейную связь. Это означает, что если он равен I или —1, отвечающие нашим объектам точки рассматриваемого двумерного признакового пространства лежат на прямой линии, т. е. между признаками имеется точная линейная связь (прямая или обратная). А вот если г — 0, то это означает не отсутствие связи вообще, а только отсутствие линейной связи. Нелинейная же связь при этом может быть и весьма сильной.
8. Понятие случайной выборки. Ее построение с помощью таблицы случайных чисел.
- [1] На самом деле, не совсем любого, поскольку существуют распределения, не имеющие конечных моментов (напомним, что математическое ожидание — этопервый момент распределения, дисперсия — второй и т. д.).
- [2] Рабочая книга социолога/отв. ред. Г. В. Осипов. М.: Наука, 1983. С. 161—162.(Мы при водим только те формулы, которые обычно не даются в курсе теории вероятностей.)