МегаПредмет

ПОЗНАВАТЕЛЬНОЕ

Сила воли ведет к действию, а позитивные действия формируют позитивное отношение


Как определить диапазон голоса - ваш вокал


Игровые автоматы с быстрым выводом


Как цель узнает о ваших желаниях прежде, чем вы начнете действовать. Как компании прогнозируют привычки и манипулируют ими


Целительная привычка


Как самому избавиться от обидчивости


Противоречивые взгляды на качества, присущие мужчинам


Тренинг уверенности в себе


Вкуснейший "Салат из свеклы с чесноком"


Натюрморт и его изобразительные возможности


Применение, как принимать мумие? Мумие для волос, лица, при переломах, при кровотечении и т.д.


Как научиться брать на себя ответственность


Зачем нужны границы в отношениях с детьми?


Световозвращающие элементы на детской одежде


Как победить свой возраст? Восемь уникальных способов, которые помогут достичь долголетия


Как слышать голос Бога


Классификация ожирения по ИМТ (ВОЗ)


Глава 3. Завет мужчины с женщиной


Оси и плоскости тела человека


Оси и плоскости тела человека - Тело человека состоит из определенных топографических частей и участков, в которых расположены органы, мышцы, сосуды, нервы и т.д.


Отёска стен и прирубка косяков Отёска стен и прирубка косяков - Когда на доме не достаёт окон и дверей, красивое высокое крыльцо ещё только в воображении, приходится подниматься с улицы в дом по трапу.


Дифференциальные уравнения второго порядка (модель рынка с прогнозируемыми ценами) Дифференциальные уравнения второго порядка (модель рынка с прогнозируемыми ценами) - В простых моделях рынка спрос и предложение обычно полагают зависящими только от текущей цены на товар.

Проверка гипотезы о значении вероятности.Критерий для проверки гипотезы о вероятности события.





Пример 4.1

Для непрерывной случайной величины задана плотность распределения. Требуется построить графики плотности вероятности и функции распределения, определив предварительно параметр A.

 

8. Функция распределения F(х) случайной величины и ее свойства.

Каждая случайная величина полностью определяется своей функцией распределения.

Если  .- случайная величина, то функция F(x) = F (x) = P( < x) называется функцией распределения случайной величины  . Здесь P( < x) - вероятность того, что случайная величина  принимает значение, меньшее x.

Важно понимать, что функция распределения является “паспортом” случайной величины: она содержит всю информация о случайной величине и поэтому изучение случайной величины заключается в исследовании ее функции распределения, которую часто называют просто распределением.

Функция распределения любой случайной величины обладает следующими свойствами:

  • F(x)определена на всей числовой прямой R;
  • F(x)не убывает, т.е. если x1 x2, то F(x1) F(x2);
  • F(- )=0, F(+ )=1,т.е. и ;
  • F(x) непрерывна справа, т.е.

9. Основные числовые характеристики случайной величины. Математическое ожидание и его свойства.

Основные числовые характеристики дискретных и непрерывных случайных величин: математическое ожидание, дисперсия и среднее квадратическое отклонение. Их свойства и примеры.Закон распределения (функция распределения и ряд распределения или плотность веро-ятности) полностью описывают поведение случайной величины. Но в ряде задач доста-точно знать некоторые числовые характеристики исследуемой величины (например, ее среднее значение и возможное отклонение от него), чтобы ответить на поставленный во-прос. Рассмотрим основные числовые характеристики дискретных случайных величин.Математическим ожиданиемдискретной случайной величины называ-ется сумма произведений ее возможных значений на соответствующие им вероятности:

М(Х) = х1р1 + х2р2 + … + хпрп . (7.1)

Если число возможных значений случайной величины бесконечно, то , если полученный ряд сходится абсолютно.Замечание 1. Математическое ожидание называют иногда взвешенным средним, так как оно приближенно равно среднему арифметическому наблюдаемых значений случайной величины при большом числе опытов.Замечание 2. Из определения математического ожидания следует, что его значение не меньше наименьшего возможного значения случайной величины и не больше наибольше-го.Замечание 3. Математическое ожидание дискретной случайной величины есть неслучай-ная (постоянная) величина. В дальнейшем увидим, что это же справедливо и для непре-рывных случайных величин.

10. Начальные и центральные моменты и связь между ними.Некоторые числовые характеристики одномерных случайных величин: начальные и центральные моменты, мода, медиана, квантиль, коэффициенты асимметрии и эксцесса. Числовые характеристики двумерных случайных величин: начальные и центральные моменты. Корреляционный момент и коэффициент корреляции. Коррелированность и зависимость случайных величин.

Начальным моментом порядка kслучайной величины Х называется матема-тическое ожидание величины Xk:

νk = M (Xk).

В частности, ν1 = М(Х), ν2 = М(Х2). Следовательно, дисперсия D(X) = ν2 – ν1².

Центральным моментом порядка kслучайной величины Х называется мате-матическое ожидание величины (Х – М(Х))k:



μk = M((Х – М(Х))k).

В частности, μ1 = M(Х – М(Х)) = 0, μ2 = M((Х – М(Х))2) = D(X).

Связь между центральными и начальными моментами достаточно проста: m1=0, m2=m2-m12, m3=m3-3m2m1+2m13, m4=m4-4m1m3+6m12m2-3m14, и т.д. Соответственно, для случайных величин с нулевыми средними значениями начальные моменты равны центральным моментам.

11. Дисперсия случайной величины и ее свойства.

Диспе́рсия случа́йной величины́ — мера разброса данной случайной величины, то есть её отклонения от математического ожидания. В статистике часто употребляется обозначение или . Квадратный корень из дисперсии, равный , называется среднеквадратичным отклонением, стандартным отклонением или стандартным разбросом. Стандартное отклонение измеряется в тех же единицах, что и сама случайная величина, а дисперсия измеряется в квадратах этой единицы измерения.

Из неравенства Чебышёва следует, что случайная величина удаляется от её математического ожидания на более чем k стандартных отклонений с вероятностью менее 1/k². Так, например, как минимум в 75 % случаев случайная величина удалена от её среднего не более чем на два стандартных отклонения, а в примерно 89 % — не более чем на три.Свойства

· Дисперсия любой случайной величины неотрицательна:

  • Если дисперсия случайной величины конечна, то конечно и её математическое ожидание;
  • Если случайная величина равна константе, то её дисперсия равна нулю: D[a] = 0. Верно и обратное: если D[X] = 0, то X = M[X] почти всюду;
  • Дисперсия суммы двух случайных величин равна:

, где — их ковариация;

  • Для дисперсии произвольной линейной комбинации нескольких случайных величин имеет место равенство:

, где ;

  • В частности, D[X1 + ... + Xn] = D[X1] + ... + D[Xn] для любых независимых или некоррелированных случайных величин, так как их ковариации равны нулю;

Пример. Пусть случайная величина имеет стандартное непрерывное равномерное распределение на то есть её плотность вероятности задана равенством

Тогда математическое ожидание квадрата случайной величины

и математическое ожидание случайной величины

Тогда дисперсия случайной величины

12. Нормальный закон распределения. Свойства плотности нормального закона.

Нормальное распределение, также называемое гауссовским распределением или распределением Гаусса — распределение вероятностей, которое задается функцией плотности распределения:

где параметр μ — среднее значение (математическое ожидание) случайной величины и указывает координату максимума кривой плотности распределения, а σ² — дисперсия.

Нормальное распределение играет важнейшую роль во многих областях знаний, особенно в статистической физике. Физическая величина, подверженная влиянию значительного числа независимых факторов, могущих вносить с равной погрешностью положительные и отрицательные отклонения, вне зависимости от природы этих случайных факторов, часто подчиняется нормальному распределению, поэтому из всех распределений в природе чаще всего встречается нормальное (отсюда и произошло одно из названий этого распределения вероятностей).

Нормальное распределение зависит от двух параметров — смещения и масштаба, то есть является с математической точки зрения не одним распределением, а целым их семейством. Значения параметров соответствуют значениям среднего (математического ожидания) и разброса (стандартного отклонения).

Стандартным нормальным распределением называется нормальное распределение с математическим ожиданием 0 и стандартным отклонением 1. Свойства:

Если случайные величины X1 и X2 независимы и имеют нормальное распределение с математическими ожиданиями μ1 и μ2 и дисперсиями и соответственно, то X1 + X2 также имеет нормальное распределение с математическим ожиданием μ1 + μ2 и дисперсией .

13. Определение вероятности попадания нормальной случайной величины X в заданный интервал. Правило трех сигм.

При рассмотрении нормального закона распределения выделяется важный частный случай, известный как правило трех сигм.

Запишем вероятность того, что отклонение нормально распределенной случайной величины от математического ожидания меньше заданной величины D:

 

Если принять D = 3s, то получаем с использованием таблиц значений функции Лапласа:

 

Т.е. вероятность того, что случайная величина отклонится от своего математического ожидание на величину, большую чем утроенное среднее квадратичное отклонение, практически равна нулю.

Это правило называется правилом трех сигм.

Не практике считается, что если для какой – либо случайной величины выполняется правило трех сигм, то эта случайная величина имеет нормальное распределение.

14. Нормированный нормальный закон распределения

Стандартным нормальным распределением называется нормальное распределение с математическим ожиданием 0 и стандартным отклонением 1.

Нужно найти!!

15.Определение вероятности попадания нормированной нормальной случайной величины в заданный интервал.
Вероятность попадания значений случайной величины в заданный интервал определяется как площадь под кривой функции для этого интервала . Следовательно, значение функции распределения плотности вероятности не соответствует вероятности заданного значения случайной величины , поскольку значение интеграла для одинаковых пределов равно нулю.
У центральной нормированной величины все нечетные начальные моменты равны 0
Функция Лапласа
Функцией Лапласа называется функция вида
Свойства:
1) при z>0 функция Лапласа определяет вероятность попадания нормальной случайной величины с параметрами
MX=0
DX=1
в интервале (0, z)
2)
3) - функция нечетная
Функция Лапласа табулирована. Функция Лапласа используется для выполнения событий вида для произвольных нормальных величин .
Для нормированного нормального распределения имеются специальные
таблицы, определяющие вероятность попадания случайной величины И в
промежуток нормированного отклонения ±u, т.е. р (- и < И < и).
Это соответствует вероятности попадания случайной величины х в
промежуток μσ ± uσ , т.е. р (μ – uσ < х < μ + uσ) или р (-uσ < х – μ < uσ). Так,
например, если u=1, то р (-1σ < х – μ < 1σ) = 0, 683 это значит, что вероятность
попадания случайной величины х отклонившейся от своего среднего μ более, чем
на ±σ равна 0,683.

16. Эмпирические аналоги параметров генеральной совокупности
Эмпирические распределения представляют собой распределения элементов выборки по значениям изучаемого признака. Построение эмпирических распределений - необходимый этап применения статистических методов.
Эмпирические данные представляют собой данные, полученные в ходе эксперимента.
По эмпирическим данным, представляющим собой выборку из некоторой генеральной совокупности , оценивают параметры , позволяющие описать всю генеральную совокупность , определить интервал, в котором с заданным уровнем доверия находится истинное значение оцениваемого параметра , а затем проверяют те или иные утверждения и делают выводы о свойствах всей генеральной совокупности .
Эмпирическая функция распределения — Выборочная (эмпирическая) функция распределения в математической статистике это приближение теоретической функции распределения, построенное с помощью выборки из него.

17. Понятие точечной и интервальной оценок.Основные свойства точечных оценок: несмещенность, состоятельность и эффективность.
Точечная оценка - это число, вычисляемое на основе наблюдений, предположительно близкое к оцениваемому параметру.
(это точечная оценка, сходящаяся по вероятности. )
Точечная оценка предполагает нахождение единственной числовой величины, которая и принимается за значение параметра.
Интервальная оценка - оценка представляемая интервалом значений, внутри которого с задаваемой исследователем вероятностью находится истинное значение оцениваемого параметра. Интервал в интервальной оценке называется ДОВЕРИТЕЛЬНЫМ ИНТЕРВАЛОМ, задаваемая исследователем вероятность называется ДОВЕРИТЕЛЬНОЙ ВЕРОЯТНОСТЬЮ.
Несмещенность — свойство оценок при фиксированном $n$. Означает это свойство отсутствие ошибки «в среднем», т.е. при систематическом использовании данной оценки.
Свойство состоятельности означает, что последовательность оценок приближается к неизвестному параметру при увеличении количества данных. Понятно, что при отсутствии этого свойства оценка совершенно «несостоятельна» как оценка.
Если существует такая несмещённая оценка параметра , что для любой другой несмещённой оценки того же параметра выполняется неравенство , то оценка называется эффективной оценкой параметра .

18. Интервальная оценка математического ожидания.
Интервальная оценка генерального среднего ( математического ожидания ) производится на основе распределения Стьюдента (при числе наблюдений не более 50—60) или на основе гипотезы о нормальном распределении (при большем числе наблюдений).
Интервальная оценка характеризуется двумя числами – концами интервала, внутри которого предположительно находится истинное значение параметра.
Интервальной называют оценку, которая определяется двумя числами – концами интервала. Интервальная оценка позволяет установить точность и надежность оценок, а сами интервалы в этом случае называются доверительными.
Доверительным интервалом называется интервал, построенный с помощью случайной выборки из распределения с неизвестным параметром, такой, что он содержит данный параметр с заданной вероятностью α.
В педагогике наиболее распространенным является оценка математического ожидания a случайной величины X, распределенной по нормальному закону, при известном среднем квадратическом отклонении σ.

19. Интервальная оценка дисперсии.
Для оценки генеральной дисперсии применяется распределение c2. Интервал, в котором с заданной вероятностью находится генеральный параметр, называется доверительным интервалом, сама такая вероятность — доверительной вероятностью. В медицинских исследованиях используют три порога доверительной вероятности b: 0,95; 0,99; 0,999. Чем точнее требуется результат, тем большим порогом задается исследователь и тем шире (при прочих равных условиях) получается доверительный интервал. В статистике наряду с понятием доверительной вероятности употребляется термин «уровень значимости». Соответственно применяются три уровня значимости 0,05; 0,01 и 0,001.

20. Интервальная оценка вероятности.

"Хорошей" точечной оценкой вероятности р события А является частость p=m\n, где n - общее число испытаний, а событие А может произойти с вероятностью р или не произойти с вероятностью q=1-p (последовательность испытаний Бернулли). Интервальная оценка зависит от объема выборки n.
Интервальная оценка вероятности для большого числа испытаний Бернулли
Так как А - случайное событие, то m - число появлений А в n испытаниях - тоже случайно.
Интервальная оценка вероятности при малом числе n испытаний Бернулли
Законом распределения числа Х события А в n испытаниях в данном случае является биномиальный закон распределения

Частость как точечная оценка вероятности события

Обозначим через р неизвестную вероятность появления случайного события А в единичном испытании.

Приближенное значение вероятности р определяется в виде

, (2.44)

где - частость появления события А в n испытаниях;

m - число появления события А в n испытаниях.

Серия независимых испытаний, в каждом из которых событие А происходит с вероятностью q=1-p, является последовательностью испытаний Бернулли.

Теорема. Пусть m - число наступлений события А в n независимых испытаниях, р - вероятность наступления события А в каждом из испытаний. Тогда - состоятельная, несмещенная и эффективная оценка вероятности р.

2.2.9. Интервальная оценка вероятности события

"Хорошей" точечной оценкой вероятности р события А является частость , где n - общее число испытаний, а событие А может произойти с вероятностью р или не произойти с вероятностью q=1-p (последовательность испытаний Бернулли).

Интервальная оценка для р задается в виде

P(p1<p<p2)=1-α,

где (p1, p2) - границы интервала для вероятности р, отвечающие надежности 1-α, α - уровень значимости.

Интервальная оценка зависит от объема выборки n.

2.2.10. Интервальная оценка вероятности для большого числа испытаний Бернулли

Так как А - случайное событие, то m - число появлений А в n испытаниях - тоже случайно.

При выполнении условий (грубых), что n порядка нескольких десятков, а np>10, распределение величины m в силу локальной и интегральной теорем Муавра-Лапласа близко к нормальному распределению с математическим ожиданием, равным np, и дисперсией, равной npq, т. е.

.

При делении m на n его распределение не изменяется, изменяются только его параметры. Поэтому при большом n распределение частости , так же как и распределение частоты m, близко к нормальному, но с математическим ожиданием

(2.45)

и дисперсией

. (2.46)

Таким образом, при большом числе n испытаний Бернулли и распределение величины близко к нормальному с нулевым математическим ожиданием и нулевой дисперсией.

Из условия

(2.47)

определяются границы в виде

; (2.48)

 

. (2.49)

Отсюда получается, что частость определяет значение неизвестной вероятности с точностью

.

Пример. Событие А в серии из n=100 испытаний Бернулли произошло m=78 раз. Найти интервальную оценку для вероятности р события А с надежностью 0.9.

Решение. Точечная оценка =78/100=0.78 для P=0.9; Zα/2=1.64;

 

21. Основные понятия статистической проверки гипотез.

1. Понятие статистической гипотезы. Основные этапы проверки гипотезы.

Под статистической гипотезой понимают всякое высказывание о генеральной совокупности (случайной величине), проверяемое по выборке (по результатам наблюдений).

Не располагая сведениями о всей генеральной совокупности, высказанную гипотезу сопоставляют по определенным правилам, с выборочными сведениями и делают вывод о том, можно принять гипотезу или нет.

Процедура сопоставления высказанной гипотезы с выборочными данными называется проверкой гипотезы.

Рассмотрим этапы проверки гипотезы и используемые при этом понятия.

Этап 1. Располагая выборочными данными и руководствуясь конкретными условиями рассматриваемой задачи, формулируют гипотезу Но, которую называют основной или нулевой, и гипотезу Н1 конкурирующую с гипотезой Н0. Термин «конкурирующая» означает, что являются противоположными следующие два события:

по выборке будет принято решение о справедливости для генеральной совокупности гипотезы Н0;

по выборке будет принято решение о справедливости для генеральной совокупности гипотезы Н1.

Гипотезу H1 называют также альтернативной. Например, если нулевая гипотеза такова: математическое ожидание равно 5,- то альтернативная гипотеза может быть следующей: математическое ожидание меньше 5, что записывается следующим образом:

Этап 2. Задаются вероятностью  , которую называют уровнем значимости. Поясним ее смысл.

Решение о том, можно ли считать высказывание Н0 справедливым для генеральной совокупности, принимается по выборочным данным, т. е. по ограниченному ряду наблюдений, следовательно, это решение может быть ошибочным. При этом может иметь место ошибка двух родов:

отвергают гипотезу Но, или, иначе, принимают альтернативную гипотезу H1, тогда как на самом деле гипотеза Н0 верна; это ошибка первого рода;

принимают гипотезу Н0 , тогда как на самом деле высказывание Но неверно, т. е. верной является гипотеза Н1 это ошибка второго рода.

Так вот уровень значимости —это вероятность ошибки первого рода, т. е.

вероятность того, что будет принята гипотеза Н1 , если на самом деле в генеральной совокупности верна гипотеза Но. Вероятность  задается заранее малым числом, используют некоторые стандартные значения: 0,05; 0,01; 0,005; 0,001. Например, =0,05 означает следующее: если гипотезу Но проверять по каждой из 100 выборок одинакового объема, то в среднем в 5 случаях из 100 мы совершим ошибку первого рода.

Вероятность ошибки второго рода обозначают , т. е.

—вероятность того, что будет принята гипотеза Но, если на самом деле верна гипотеза Н1.

Этап 3. Находят величину  такую, что:

ее значения зависят от выборочных данных, т. е. для которой справедливо равенство

- ее значения позволяют судить о «расхождении выборки с гипотезой Н0»;

- и которая, будучи величиной случайной в силу случайности выборки, подчиняется при выполнении гипотезы Но некоторому известному закону распределения.

Величинуназывают критерием.

Этап 4. Далее рассуждают так. Так как значения критерия позволяют судить о «расхождении выборки с гипотезой Но», то из области допустимых значений критерия  следует выделить подобласть  таких значений, которые свидетельствовали бы о существенном расхождении выборки с гипотезой Но и, следовательно, о невозможности принять гипотезу Но.

Подобласть  называют критической областью.

Допустим, что критическая область выделена. Тогда руководствуются следующим правилом: если вычисленное по выборке значение критерия  попадает в критическую область, то гипотеза Но отвергается и принимается гипотеза Н1. При этом следует понимать, что такое решение может оказаться ошибочным:

на самом деле гипотеза Но может быть справедливой. Таким образом, ориентируясь на критическую область, можно совершить ошибку первого рода, вероятность которой задана заранее и равна . Отсюда вытекает следующее требование к критической области :

вероятность того, что критерийпримет значениеизкритической области  , должна быть равна заданному числу , т. е.

Но критическая область данным равенством определяется неоднозначно. Действительно, представив себе график функции плотности f (х) критерия  , нетрудно понять, что наоси абсцисс существует бесчисленное множество областей-интервалов таких, что площади построенных на них криволинейных трапеций равны . Поэтому кроме требования

выдвигается следующее требование: критическая область  должна быть расположена так, чтобы при заданной вероятности  ошибки первого рода вероятность  ошибки второго рода была минимальной.

Возможны три вида расположения критической области (в зависимости от вида нулевой и альтернативной гипотез, вида и распределения критерия ):

правосторонняя критическая область (рис.а) , где критическая точка

определяется из условия:

левосторонняя критическая область(рис.б) , где критическая точка

определяется из условия :

двусторонняя критическая область (рис.в), где критические точки

,

называемые двусторонними, определяются из условий

И называются двусторонними критическими точками.

Этап 5. В формулу критерия

вместо Х1, Хг, …, Хп подставляют конкретные числа, полученные в результате п наблюдений, и подсчитывают числовое значение чис критерия.

Если чис попадает в критическую область , то гипотеза Но отвергается и принимается гипотеза Н1.

Если чис не попадает в критическую область, гипотеза Но не отвергается.

 

 

22. Проверка гипотезы о значении математического ожидания.

Проверка гипотезы о значении математического ожидания нормально распределенной случайной величины Пусть нулевая гипотеза H0 состоит в том, что математическое ожидание a нормальной распределенной случайной величины X равно некоторому заданному значению a0. А альтернативной гипотезой H1является гипотеза о том, что aa0. Будем при этом пока предполагать, что параметр (среднее квадратическое отклонение величины X) известен. Такая задача будет, например, актуальной для станка-автомата, изготавливающего в массовом количестве некоторые детали, размер a0 которых задан. Если станок настроен правильно, то размер X изготавливаемых им деталей будет случайной величиной, распределенной нормально с известным математическим ожиданием a = a0и известным средним квадратическим отклонением , определяемым классом точности станка. Но если станок настроен неправильно, у него будет a ≠ a0. Отобрав из продукции станка некоторую совокупность деталей и обмерив их, можно попытаться узнать, верна ли гипотеза H0 о том, что a=a0, или она должна быть отклонена в пользу альтернативной гипотезы H1, утверждающей, что a ≠ a0.

Итак, гипотеза H сформулирована. Попробуем найти критерий ее правильности или неправильности.

 

 

 

 

-kкр

 

kкр

 

K = - a0

 

 

 

 

 

 

Пусть выборочная средняя , являющаяся точечной оценкой генеральной средней = a, из выборки найдена. Предположим, что гипотеза H0верна, то есть что = a = a0. В качестве случайной величины K, с помощью которой будем проверять гипотезу H0, возьмем нормально распределенную случайную величину K = - a0, математическое ожидание которой, если верна гипотеза H0, равно нулю. Выберем некоторый уровень значимости α. Если гипотеза H0 верна, то отклонение K = - a0 от нуля должно быть невелико, то есть практически должно находится в некоторых границах (-kкр; kкр). А выход его за эти границы следует считать опровержением гипотезы H0. То есть оставшиеся вне интервала (-kкр; kкр) участки числовой оси Оkмы будем считать критической областью – областью непринятия гипотезы H0. При условии справедливости H0 ее непринятие – это ошибка первого рода. Поэтому вероятность попадания значения kвеличины K = - a0 в критическую область должна быть равна вероятности совершить ошибку первого рода, то есть должна равняться принятому уровню значимости α. А вероятность попадания значения k в область (-kкр; kкр) принятия гипотезы H0 тогда должна быть равна γ = 1-α (см. рис. 6.4).

Очевидно, что чем меньше будет выбран уровень значимости α, то есть чем меньшей будет установлена вероятность совершить ошибку первого рода – отвергнуть нулевую гипотезу Н0, если она верна, тем шире должен быть интервал (-kкр; kкр) принятия этой гипотезы. При α = 0 должна быть вообще исключена возможность отвергнуть проверяемую гипотезу H0, если она верна. Но тогда в любом случае ее нужно принять. А это будет, согласно рис. 3.4, если заштрихованной области непринятия гипотезы H0 не будет вообще. То есть когда (-kкр; kкр) = (- ∞; ∞).

Итак, подведем итог. При заданном α ≠ 0 гипотеза Н0 должна быть отвергнута, если экспериментальное значение k=kэксп нормально распределенной случайной величины К = - a0 окажется вне интервала (-kкр; kкр). И она же может быть принята, если k=kэксп попадет в интервал (-kкр; kкр).

Согласно рис. 6.4 имеем:

(6.39)

Сравнивая это равенство с равенством

, (6.40)

вытекающем из равенства (6.29), если в последнем заменить на a0 и на , получим

, (6.41)

откуда

, где (6.42)

После нахождения kкр находятся области принятия и непринятия гипотезы Н0:

1) Если kэксп = - гипотезу H0 принимаем.

2) Если kэксп = - гипотезу H0 отвергаем.

Примечание 1. Если неизвестно, то при достаточно большой выборке (n>30) можно заменить в приведенных выше формулах на её точечную оценку .

Примечание 2. Если неизвестно и выборка небольшая (n<30), то тогда в качестве критерия К проверки гипотезы Н0используют случайную величину

, (6.43)

имеющую распределение Стьюдента с k = n-1 степенями свободы (сравните с (6.34)). А областью принятия гипотезы Н0 считается интервал , в который с вероятностью γ = 1 попадает экспериментальное значение tэксп случайной величины Т :

(6.44)

Величину , соответствующую данным значениям α и k = n – 1, находят по таблице критических точек распределения Стьюдента (см. Приложение, таблица 4). Кстати, по этой же таблице по и k = n – 1 находят tγ, входящее в равенство (6.35).

Примечание 3. В качестве гипотезы, альтернативной гипотезе H0, могла быть принята не гипотеза H1: aa0, а гипотеза H1: a> a0 или гипотеза H1: a< a0. Тогда критическая область непринятия гипотезы H0 была бы не двусторонней, как на рис. 6.4, а односторонней с одной критической точкой kкр, определяемой соответственно неравенствами p(kкр <kэксп <¥)=α или p(-¥<kэксп < kкр)=α. Соответствующие изменения при проверке гипотезы H0(а именно, при нахождении табличного значения kкр ) продумайте самостоятельно (или посмотрите ниже примечание 2 к пункту 3.5).

Пример 1. Выборочным путем исследовались 30 молочных пакетов, в которых, согласно их маркировке, должно содержаться 0,5 л. = 500 мл. молока. Получено следующее статистическое распределение выборки:

 

хi (мл.) 480 – 490 490 – 500 500 – 510 510 – 520
ni

 

Проверить при уровне значимости α = 0,05 нулевую гипотезу H0 о том, что автомат, заполняющий пакеты, настроен правильно (на норму 500 мл.), при альтернативной гипотезе H1, что станок настроен неправильно.

Решение. Пусть X (мл.) – реальное количество молока в пакете (X – случайная величина). Различие её значений для разных пакетов связано с действием большого числа случайных факторов, поэтому по теореме Ляпунова (глава 2, §4) можно считать, что она распределена нормально с некоторыми параметрами a = M (X) и σ = σ (X). Если гипотеза H0 верна (автомат настроен правильно), то a = 500 мл. А если гипотеза H0 неверна, то верна альтернативная гипотеза H1: a ≠ 500 мл.

Найдем числовые характеристики выборки – выборочную среднюю и выборочную дисперсию . Для этого сначала приведем статистическое распределение выборки от интервального вида к дискретному:

 

хi (мл.)
ni

 

Используя теперь формулы (1.5) – (1.7), получим:

≈ 497,7; ≈ 100,2

Далее, с помощью формулы (2.15) найдем исправленную выборочную дисперсию и исправленное выборочное среднее квадратическое отклонение

 

А теперь рассмотрим нормально распределенную случайную величину K= - a0, экспериментальное (выборочное) значение которой при = 497,7 и a0 = 500 равно k = kэксп = -2,3.

Если считать объем выборки n = 30 большим (хотя мы условились считать его большим лишь при n > 30), то область (-kкр; kкр) принятии гипотезы H0 можно найти, найдя kкр по формуле (3.4), в которой нужно заменить на . С учетом имеющихся данных находим:

kкр =

Итак, интервал принятия гипотезы H0 для значения случайной величины K= = - a0 таков: - 3,7 < K< 3.7. Так как kэксп = -2,3 принадлежит этому интервалу, то у нас нет оснований при заданном уровне значимости α = 0,05 отвергать нулевую гипотезу H0 о том, что автомат по разливу молока в пакеты настроен правильно.

Кстати, если величину α уменьшить, то интервал принятия гипотезы H0 расширится, а значит, будет еще больше оснований эту гипотезу не отвергать.

А теперь, для сравнения, проведем проверку гипотезы H0, считая объем n = 30 выборки небольшим, то есть используя формулы (3.5) и (3.6). Сначала найдем экспериментальное значение tэксп. величины T:

После этого по таблице 4 Приложения для α = 0,05 и k= n – 1 = 29 найдем критическое значение tкр распределения Стьюдента: tкр = 2,045. Таким образом, областью принятия гипотезы H0 является интервал

(- tкр ; tкр) = (-2,045; 2,045).

И так как tэксп. = -1,24HHHHHHрРРваьйлуоатфыгу

содержится в этом интервале, то у нас нет оснований отвергать гипотезу H о том, что автомат по разливу молока в пакеты настроен правильно.

 

23. Проверка гипотезы о значении генеральной дисперсии.Сравнение двух дисперсий
нормальных генеральных совокупностей

На практике задача сравнения дисперсий возникает, если требуется сравнить точность приборов, инструментов, самих методов измерений и т.д. Очевидно, предпочтительнее тот прибор, инструмент и метод, который обеспечивает наименьшее рассеяние результатов измерений, т.е. наименьшую дисперсию.
Пусть необходимо проверить гипотезу о том, что две независимые выборки получены из генеральных совокупностей Х и Y с одинаковыми дисперсиями σх2 и σy2. Для этого используется F-критерий Фишера.
Порядок применения F-критерия следующий:
1. Принимается предположение о нормальности распределения генеральных совокупностей. При заданном уровне значимости α формулируется нулевая гипотеза Н0: σх2y2 о равенстве генеральных дисперсий нормальных совокупностей при конкурирующей гипотезе Н1: σх2 > σy2.
2. Получают две независимые выборки из совокупностей Х и Y объемом nx и ny соответственно.
3. Рассчитывают значения исправленных выборочных дисперсий sх2 и sy2 (методы расчета рассмотрены в 4.4). Большую из дисперсий (sх2 или sy2) обозначают s12, меньшую – s22.
4. Вычисляется значение F-критерия по формуле Fнабл= s12/s22.
5. По таблице критических точек распределения Фишера-Снедекора, по заданному уровню значимости α и числом степеней свободы ν1=n1–1, ν2=n2–1 (ν1 – число степеней свободы большей исправленной дисперсии), находится критическая точка Fкр(σ,ν1, ν2).
Отметим, что в таблице П.7 приведены критические значения одностороннего F-критерия. Поэтому, если применяется двусторонний критерий (Н1: σх2≠σy2 ), то правостороннюю критическую точку Fкр (α/2, n1, n2) ищут по уровню значимости α/2 (вдвое меньше заданного) и числам степеней свободы n1 и n2 (n1–число степеней свободы большей дисперсии). Левостороннюю критическую точку можно и не отыскивать.
6. Делается вывод: если вычисленное значение F–критерия больше или равно критическому (FнаблFкр), то дисперсии различаются значимо на заданном уровне значимости. В противном случае (Fнабл < Fкр) нет оснований для отклонения нулевой гипотезы о равенстве двух дисперсий.
Задача 3.5. Расход сырья на единицу продукции по старой технологии составил:

Расход сырья хi
Число изделий mi


По новой технологии:

Расход сырья yi
Число изделий ni


Предположив, что соответствующие генеральные совокупности X и Y имеют нормальные распределения, проверить, что по вариативности расход сырья по новой и старой технологиям не отличаются, если принять уровень значимости α = 0,1.
Решение. Действуем в порядке, указанном выше.
1. Будем судить о вариативности расхода сырья по новой и старой технологиям по величинам дисперсий. Таким образом, нулевая гипотеза имеет вид Н0: σх2 = σy2. В качестве конкурирующей примем гипотезу Н1х2 ≠ σy2, поскольку заранее не уверены в том, что какая-либо из генеральных дисперсий больше другой.
2–3. Найдем выборочные дисперсии. Для упрощения вычислений перейдем к условным вариантам:
ui=xi – 307, vi= yi – 304.
Все вычисления оформим в виде следующих таблиц:

ui mi miui miui2 mi(ui+1)2   vi ni nivi nivi2 ni(vi+1)2
–3 –3   –1 –2
 
 
Σ  
            Σ
Контроль: Σ miui2+2Σ miui+m=13+2+9=24   Контроль: Σnivi2+2Σnivi+n =34+20+13=67
           


Найдем исправленные выборочные дисперсии:

4. Сравним дисперсии. Найдем отношение большей исправленной дисперсии к меньшей:
.
5. По условию конкурирующая гипотеза имеет вид σх2 ≠ σy2, поэтому критическая область двусторонняя и при отыскании критической точки следует брать уровни значимости, вдвое меньше заданного.
По таблице П.7 по уровню значимости α/2 = 0,1/2 = 0,05 и числам степеней свободы ν1=n1–1=12, ν2=n2–1=8 находим критическую точку Fкр(0,05; 12;8)=3,28.
6. Так как Fнабл. < Fкр то гипотезу о равенстве дисперсий расхода сырья при старой и новой технологиях принимаем.
Выше, при проверке гипотез предполагалось нормальность распределения исследуемых случайных величин. Однако специальные исследования показали, что предложенные алгоритмы весьма устойчивы (особенно при больших объемах выборок) по отношению к отклонению от нормального распределения.

 

Проверка гипотезы о значении вероятности.Критерий для проверки гипотезы о вероятности события.

Пусть проведено п независимых испытаний (п — достаточно большое число), в каждом из которых некоторое событие А появляется с одной и той же, но неизвестной вероятностью р, и найдена относительная частота появлений А в этой серии испытаний. Проверим при заданном уровне значимости α нулевую гипотезу Н0, состоящую в том, что вероятность р равна некоторому значению р0.

Примем в качестве статистического критерия случайную величину

, (19.1)

имеющую нормальное распределение с параметрами M(U) = 0, σ(U) = 1 (то есть нормиро-ванную). Здесь q0 = 1 — p0. Вывод о нормальном распределении критерия следует из теоремы Лапласа (при достаточно большом п относительную частоту можно приближенно считать нормально распределенной с математическим ожиданием р и средним квадрати-ческим отклонением ).

Критическая область строится в зависимости от вида конкурирующей гипотезы.

1) Если Н0: р = р0, а Н1: р ≠ р0, то критическую область нужно построить так, чтобы вероятность попадания критерия в эту область равнялась заданному уровню значимости α. При этом наибольшая мощность критерия достигается тогда, когда критическая область состоит из двух интервалов, вероятность попадания в каждый из которых равна . Поскольку U симметрична относительно оси Оу, вероятность ее попадания в интервалы (-∞; 0) и (0; +∞) равна 0,5, следовательно, критическая область тоже должна быть симметрична относительно Оу. Поэтому икр определяется по таблице значений функции Лапласа из условия , а критическая область имеет вид .

Замечание. Предполагается, что используется таблица значений функции Лапласа, заданной в виде , где нижний предел интегрирования равен 0, а не -∞. Функция Лапласа, заданная таким образом, является нечетной, а ее значения на 0,5 меньше, чем значения стандартной функции Ф(х) (см. лекцию 6).

Далее нужно вычислить наблюдаемое значение критерия:

. (19.2)

Если |Uнабл| < uкр, то нулевая гипотеза принимается.

Если |Uнабл| > uкр, то нулевая гипотеза отвергается.

2) Если конкурирующая гипотеза Н1: р > p0, то критическая область определяется неравенством U > uкр, то есть является правосторонней, причем р(U > uкр) = α. Тогда . Следовательно, икр можно найти по таблице значений функции Лапласа из условия, что . Вычислим наблюдаемое значение критерия по формуле (19.2).

Если Uнабл < uкр, то нулевая гипотеза принимается.

Если Uнабл > uкр, то нулевая гипотеза отвергается.

3) Для конкурирующей гипотезы Н1: р < p0 критическая область является левосторонней и задается неравенством U <- uкр, где икр вычисляется так же, как в предыдущем случае.

Если Uнабл > - uкр, то нулевая гипотеза принимается.

Если Uнабл < - uкр, то нулевая гипотеза отвергается.

Пример. Пусть проведено 50 независимых испытаний, и относительная частота появления события А оказалась равной 0,12. Проверим при уровне значимости α = 0,01 нулевую гипотезу Н0: р = 0,1 при конкурирующей гипотезе Н1: р > 0,1. Найдем Критическая область является правосторонней, а икр нахо-дим из равенства Ф(икр) = Из таблицы значений функции Лапласа определяем икр = 2,33. Итак, Uнабл < uкр, и гипотеза о том, что р = 0,1, принимается.

25. Проверка гипотезы о равенстве математических ожиданий двух совокупностей.Критерий для проверки гипотезы о математическом ожидании.

Пусть генеральная совокупность Х имеет нормальное распределение, и требуется проверить предположение о том, что ее математическое ожидание равно некоторому числу а0. Рассмотрим две возможности.

1) Известна дисперсия σ2 генеральной совокупности. Тогда по выборке объема п найдем выборочное среднее и проверим нулевую гипотезу Н0: М(Х) = а0.

Учитывая, что выборочное среднее является несмещенной оценкой М(Х), то есть М() = М(Х), можно записать нулевую гипотезу так: М() = а0. Для ее проверки выберем критерий

. (19.3)

Это случайная величина, имеющая нормальное распределение, причем, если нулевая гипотеза справедлива, то М(U) = 0, σ(U) = 1.

Выберем критическую область в зависимости от вида конкурирующей гипотезы:

- если Н1: М() ≠ а0, то икр: , критическая область двусторонняя, , и, если |Uнабл| < uкр, то нулевая гипотеза принимается; если |Uнабл| > uкр, то нулевая гипотеза отвергается.

- если Н1: М() > а0, то икр: , критическая область правосторонняя, и, если Uнабл < uкр, то нулевая гипотеза принимается; если Uнабл > uкр, то нулевая гипотеза отвергается.

- если Н1: М() < а0, то икр: , критическая область левосторонняя, и, если Uнабл > - uкр, то нулевая гипотеза принимается; если Uнабл < - uкр, то нулевая гипотеза отвергается.

2) Дисперсия генеральной совокупности неизвестна.

В этом случае выберем в качестве критерия случайную величину

, (19.4)

где S — исправленное среднее квадратическое отклонение. Такая случайная величина имеет распределение Стьюдента с k = n — 1 степенями свободы. Рассмотрим те же, что и в предыдущем случае, конкурирующие гипотезы и соответствующие им критические области. Предварительно вычислим наблюдаемое значение критерия:

. (19.5)

- если Н1: М() ≠ а0, то критическая точка tдвуст.кр. находится по таблице критических точек распределения Стьюдента по известным α и k = n — 1.

Если | Tнабл | < tдвуст.кр., то нулевая гипотеза принимается.

Если | Tнабл | > tдвуст.кр., то нулевая гипотеза отвергается.

- если Н1: М() > а0, то по соответствующей таблице находят tправост.кр.(α, k) — критичес-кую точку правосторонней критической области. Нулевая гипотеза принимается, если

Tнабл < tправост.кр..

- при конкурирующей гипотезе Н1: М() < а0 критическая область является левосторон-ней, и нулевая гипотеза принимается при условии Tнабл > - tправост.кр.. Если Tнабл < - tправост.кр.., нулевую гипотезу отвергают.

 

26. Проверка гипотезы о равенстве вероятностей нескольких совокупностей.

27. Корреляционный анализ. Парный, коэффициент корреляции его назначение и свойства.





©2015 www.megapredmet.ru Все права принадлежат авторам размещенных материалов.