МегаПредмет

ПОЗНАВАТЕЛЬНОЕ

Сила воли ведет к действию, а позитивные действия формируют позитивное отношение


Как определить диапазон голоса - ваш вокал


Игровые автоматы с быстрым выводом


Как цель узнает о ваших желаниях прежде, чем вы начнете действовать. Как компании прогнозируют привычки и манипулируют ими


Целительная привычка


Как самому избавиться от обидчивости


Противоречивые взгляды на качества, присущие мужчинам


Тренинг уверенности в себе


Вкуснейший "Салат из свеклы с чесноком"


Натюрморт и его изобразительные возможности


Применение, как принимать мумие? Мумие для волос, лица, при переломах, при кровотечении и т.д.


Как научиться брать на себя ответственность


Зачем нужны границы в отношениях с детьми?


Световозвращающие элементы на детской одежде


Как победить свой возраст? Восемь уникальных способов, которые помогут достичь долголетия


Как слышать голос Бога


Классификация ожирения по ИМТ (ВОЗ)


Глава 3. Завет мужчины с женщиной


Оси и плоскости тела человека


Оси и плоскости тела человека - Тело человека состоит из определенных топографических частей и участков, в которых расположены органы, мышцы, сосуды, нервы и т.д.


Отёска стен и прирубка косяков Отёска стен и прирубка косяков - Когда на доме не достаёт окон и дверей, красивое высокое крыльцо ещё только в воображении, приходится подниматься с улицы в дом по трапу.


Дифференциальные уравнения второго порядка (модель рынка с прогнозируемыми ценами) Дифференциальные уравнения второго порядка (модель рынка с прогнозируемыми ценами) - В простых моделях рынка спрос и предложение обычно полагают зависящими только от текущей цены на товар.

Тема №2«Нахождение точечных и интервальных оценок параметров распределения»





Цель:научиться определять точечные и интервальные статистические оценки генеральных параметров нормального распределения по выборочным данным генеральной совокупности.

Краткие теоретические сведения:

Статистической оценкой(статистикой) неизвестного параметра qраспределения генеральной совокупности называют функцию результатов наблюдений q* .

Статистическая оценка q* является случайной величиной.

Оценка, определяемая одним числом, зависящим от выборочных данных, называется точечной.

Требования, предъявляемые к точечным статистическим оценкам:

1) состоятельность (стремление по вероятности к оцениваемому параметру при ),

2) несмещённость (отсутствие систематических ошибок при любом объёме выборки (q*) = q),

3) эффективность (среди всех возможных оценок эффективная оценка обладает наименьшей дисперсией).

Точечные оценки генеральных параметров нормально распределённой совокупности:

Генеральный параметр Точечная оценка
- выборочная средняя
- исправленная дисперсия
- исправленное среднеквадратическое отклонение

Интервальной оценкой называют оценку, которая определяется двумя числами – концами интервала.

Интервальные оценки позволяют установить точность и надёжность точечной оценки.

Точностью оценки называется отклонение по модулю q* от q.

Предельной ошибкой выборки называется максимально допустимое по модулю отклонение q* от q.

Надёжностью (доверительной вероятностью) оценки q* называют вероятность , с которой осуществляется неравенство |q-q*|< . Обычно = 0,95; 0,99; 0,999…

Вероятность того, что неизвестный параметр не попадёт в интервал |q-q*|< , равна - уровню значимости.

Доверительным называется интервал (q*- ;q*+ ), который покрывает неизвестный параметр с заданной надёжностью .

Интервальные оценки параметров нормального распределения:

1) Доверительный интервал для математического ожидания при известной дисперсии .

, где находят из таблицы функции Лапласа, учитывая .

2) Доверительный интервал для математического ожидания при неизвестной дисперсии .

Рис.:
, где находят из таблицы коэффициентов Стьюдента.

3) Доверительный интервал для дисперсии при известном .

< < , где - находят из таблицы распределения при 1- , - находят при с числом степеней свободы .

4) Доверительный интервал для дисперсии при неизвестном .

, где - находят из таблицы распределения при 1- , - находят при с числом степеней свободы .

Пример 1. Вычислить несмещённые оценки параметров генеральной совокупности по выборочным данным: 64 63 71 68 73 71 74 73 70 75 68 67 73.

Решение.

,

,

,

.

Пример 2. Найти доверительные интервалы для математического ожидания, дисперсии и стандартного отклонения при уровне значимости 0,05, если из генеральной совокупности сделана выборка, используемая в примере 1.

Решение. Используем данные из примера 1 для нахождения доверительного интервала для математического ожидания при неизвестной дисперсии:

,

где

.

Используем данные из примера 1 для нахождения доверительного интервала для дисперсии при неизвестном математическом ожидании:

,

где = ( )= =4,4 и =

.

Контрольные вопросы:

1. Статистическая оценка неизвестного параметра теоретического распределения.



2. Точечная оценка.

3. Требования к точечным оценкам: несмещённость, состоятельность, эффективность.

4. Генеральная и выборочная средняя.

5. Генеральная и выборочная дисперсии.

6. Поправочный коэффициент. Исправленная выборочная дисперсия.

7. Генеральное среднеквадратическое отклонение и его точечная оценка.

8. Оценка дисперсии и СКО выборочной средней.

9. Интервальная оценка неизвестного параметра генеральной совокупности.

10. Доверительная вероятность и уровень значимости.

11. Доверительный интервал.

12. Правило нахождения доверительного интервала.

13. Доверительный интервал для математического ожидания при известной дисперсии .

14. Доверительный интервал для математического ожидания при неизвестной дисперсии .

15. Доверительный интервал для дисперсии при известном .

16. Доверительный интервал для дисперсии при неизвестном .

Контрольные задания:

1. При проверке успеваемости факультета были выборочно протестированы 50 обучаемых, распределившихся по результатам тестирования следующим образом ( - балл, - количество обучаемых с данным баллом):

Найти средний балл.

2. Некто N собрал следующий статистический материал, касающийся дистанции при его общении с другими людьми в течение недели:

Вид общения Расстояние (см) Относительная частота
Интимное 0-45 0,3
Персональное 45-120 0,2
Социальное 120-400 0,1
Публичное 400-750 0,4

Найти выборочную среднюю дистанции общения.

3. Найти разброс среднего балла в задании 1 тестирования 50 студентов.

4. Найти оценку разброса скорости чтения, распределение, которой представлено в таблице, предварительно определив относительную частоту средней скорости чтения.

Скорость слов в 1 мин низкая 250-300 средняя 300-450 быстрая сверхбыстрая
Относительная частота 0,1 ? 0,4 0,05

5. Найти несмещённые оценки генеральной средней, дисперсии и среднеквадратического отклонения генеральной совокупности по выборке объема 12: 289, 208, 259, 243, 232, 210, 251, 246, 224, 239, 220, 211.

6. Имеется выборка объема: 127, 124, 155, 129, 77, 147, 65, 109, 145, 141. Определить дисперсию и среднеквадратическое отклонение выборочной средней.

7. Для исследования доходов населения города, составляющего 20 тыс. человек, по схеме собственно-случайной бесповторной выборки было отобрано 1000 жителей. Результаты приведены в таблице:

Доход, у.е. Менее 500 500-1000 1000-1500 1500-2000 2000-2500 Свыше 2500
Количество Человек, тыс.

а) вероятность того, что средний месячный доход жителя города отличается от среднего дохода его в выборке не более чем на 45 у.е.; б) границы, в которых с вероятностью заключен средний месячный доход, в) объём выборки, для которой те же доверительные границы имели бы место с доверительной вероятностью 0,9973.

8. Случайная величина имеет нормальное распределение с известным средним квадратическим отклонением =3. Найти доверительные интервалы для оценки неизвестного математического ожидания а по выборочным средним =24,5, если объём выборки и задана надёжность оценки .

9. Количественный признак генеральной совокупности распределён нормально. По выборке объёма найдены выборочная средняя =20,2 и исправленное среднее квадратическое отклонение . Оценить неизвестное математическое ожидание при помощи доверительного интервала с надёжностью 0,95.

10. Для 9 претендентов на должность руководителя была проведена оценка профессионального показателя , характеризующего способность руководить людьми. Считая показатель распределённым по нормальному закону со средним квадратическим отклонением усл. ед., определить с надёжностью доверительный интервал для истинного среднего квадратического отклонения показателя .

Задания для домашней работы:

1. Найти оценки генеральных средней, дисперсии и среднего квадратического отклонения, если совокупность задана таблицей распределения:

6,76 6,78 6,80 6,82 6,84

2. Вычислить несмещённые оценки параметров генеральной совокупности по выборочным данным. По желанию можно составить вариационный ряд по значениям:

71 71 69 74 75 70 78 66 69 74 81 73 74

3. Из генеральной совокупности извлечена выборка объема :

-0,5 -0,4 -0,2 0,2 0,6 0,8 1,2 1,5

Оценить с надежностью 0,95 математическое ожидание нормально распределённого признака генеральной совокупности с помощью доверительного интервала.

4. Найти доверительные интервалы для математического ожидания, дисперсии и среднего квадратического отклонения при доверительной вероятности 0,95, если из генеральной совокупности сделана выборка:

67 70 69 68 74 72 66 66 74 69 72 78 67

 

 

Тема №3 «Проверка статистических гипотез»

Цель:научиться проверять статистические гипотезы о равенстве дисперсий и математических ожиданий нормальных генеральных совокупностей, научиться применять критерий - Пирсона, - критерий Колмогорова, - критерий Колмогорова – Смирнова, для сравнения эмпирического распределения с теоретическим.

 

Краткие теоретические сведения:

Статистической называют гипотезу о виде неизвестного распределения, или о параметрах известных распределений.

Нулевой (основной) называют выдвинутую гипотезу .

Конкурирующей (альтернативной) называют гипотезу , которая противоречит нулевой.

Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза.

Ошибка второго рода состоит в том, что будет принята неправильная гипотеза.

Вероятность совершить ошибку второго рода – уровень значимости .

Статистическим критерием называют случайную величину , которая служит для проверки нулевой гипотезы.

Наблюдаемым значением называют значение критерия, вычисленное по выборкам.

Критической областью называют совокупность значений критерия, при которой нулевую гипотезу отвергают.

Область принятия гипотезы – совокупность значений критерия, при котором гипотезу принимают.

Если принадлежит критической области – гипотезу отвергают, если принадлежит области принятия гипотезы – гипотезу принимают.

Критическими точками называют точки, отделяющие критическую область от области принятия гипотезы.

Критические точки ищут, исходя из требования, что при условии справедливости нулевой гипотезы, вероятность того, что критерий попадет в критическую область, была равна принятому уровню значимости.

Для каждого критерия имеются соответствующие таблицы, по которым находят критическую точку, удовлетворяющую этому требованию.

Когда найдена, вычисляют по данным выборок и, если > (правосторонняя критическая область), < (левосторонняя), < < , < (двусторонняя), то отвергается.

Сравнение двух дисперсий нормальных генеральных совокупностей:

Пусть и распространены нормально. По независимым выборкам с объемами, соответственно равными и , извлеченным из этих совокупностей, найдены исправленные выборочные дисперсии и . Требуется по исправленным дисперсиям при заданном уровне значимости проверить нулевую гипотезу .

1) выдвигаем конкурирующую гипотезу ( ),

2) находим ,

3) по таблице критических точек Фишера – Снедекора находим ( ), где , и - объём выборки, которой соответствует , - ,

4) если , то принимаем нулевую гипотезу, в противном случае – альтернативную.

Сравнение двух математических ожиданий нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы:

Пусть и распределены нормально, их дисперсии неизвестны. По выборкам объемов и найдены выборочные средние и и исправленные дисперсии и . По уровню значимости требуется проверить , то есть значимо или незначимо различаются средние. Предполагаем (если есть основание) дисперсии одинаковы или сравниваем их.

1) выдвигаем конкурирующую гипотезу ( ), [ ],

2) находим ,

3) находим по таблице критических точек Стьюдента и симметричную ей ,

4) если ( ), [ ], то принимаем нулевую гипотезу.

Если закон распределения генеральной совокупности неизвестен, то соответствующие критерии, используемые для установления этого закона, называются непараметрическими.

Дисперсионный анализ применяют, чтобы установить, оказывает ли существенное влияние некоторый качественный фактор , который имеет уровней на изучаемую величину . Или, фактически, проверяют гипотезу о равенстве математических ожиданий наблюдаемых значений на каждом из уровней.

Идея дисперсионного анализа состоит в сравнении «факторной дисперсии», порожденной воздействием фактора, и «остаточной дисперсии», обусловленной случайными причинами.

Если различия между дисперсиями значимо, то фактор оказывает существенное влияние на , в этом случае математические ожидания наблюдаемых значений на каждом уровне (групповые средние) различаются также значительно.

Пусть на действует фактор , который имеет постоянных уровней. Будем предполагать, что число наблюдений (испытаний) на каждом уровне равно . Тогда наблюдалось значений признака , где – номер испытания, – номер уровня фактора.

Результаты наблюдений оформляются в виде таблицы:

№ испытания Уровни фактора
… … … …

Далее рассчитываем остаточную и факторную дисперсии по формулам:

,

 

, ,

 

, .

Гипотеза о значимости фактора принимается, если , где уровень значимости, и отвергается, если (смотрите сравнение двух дисперсий нормальных генеральных совокупностей).

Пример. Произведено 10 испытаний, из них 4 на первом уровне фактора, 4 – на втором и 2 – на третьем.

№ испытания Уровни фактора
 
 

 

Методом дисперсионного анализа при уровне значимости 0,01 проверить нулевую гипотезу о равенстве математических ожиданий. Предполагается, что выборки извлечены из нормальных совокупностей с одинаковыми дисперсиями.

Решение.

 

44942-40960=3982,

 

 

=44272-40960=3312,

 

Qост=3982-3312=670.

 

S2факт= , S2ост= .

 

, .

Так как Fнабл>Fкр – нулевую гипотезу о равенстве математических ожиданий отвергаем, следовательно, принимаем гипотезу о значимости фактора.

- критерий Пирсона:

Критерий согласия Пирсона служит для проверки гипотезы о предполагаемом законе распределения. Сравнивается эмпирическое распределение с теоретическим, но возможно и сравнение двух эмпирических распределений.

1) выдвигаем гипотезу о том, что данное эмпирическое распределение подчиняется конкретному закону,

2) находим , где и - эмпирические и теоретические частоты,

то есть определяем меру расхождения эмпирических и теоретических частот,

3) для выбранного уровня значимости по таблице - распределения находим критическую точку , где , - число интервалов эмпирического распределения, - число параметров теоретического распределения,

4) если < , то частоты расходятся незначительно, а, следовательно, нет оснований отвергать нулевую гипотезу.

Критерий Колмогорова:

Имеет то же назначение что и критерий Пирсона.

1) выдвигаем гипотезу о том, что данное эмпирическое распределение подчиняется конкретному закону,

2) строим эмпирическую функцию распределения и предполагаемую теоретическую ,

3) находим , где ,

4) по таблице критических точек для данного уровня значимости находим ,

5) если , то принимаем нулевую гипотезу.

Критерий Колмогорова – Смирнова:

Служит для проверки гипотез об однородности выборки – то есть гипотез о том, что рассматриваемые выборки извлечены из одной о той же генеральной совокупности. Сравниваются две эмпирические функции распределения.

1) выдвигаем гипотезу о том, что выборки однородны,

2) находим , где - эмпирические функции распределения, построенные по двум выборкам объемов и ,

3) при находим в специальных таблицах, при совпадает со статистикой Колмогорова ,

4) если < , то принимаем нулевую гипотезу, то есть выборки однородны.

 

Контрольные вопросы:

1. Понятие статистической гипотезы.

2. Нулевая и конкурирующая гипотезы.

3. Ошибки 1-го и 2-го рода.

4. Понятие статистического критерия. Наблюдаемое значение критерия.

5. Критическая область, область принятия гипотезы. Критические точки.

6. Основной принцип проверки нулевой гипотезы.

7. Статистический критерий для проверки гипотезы . Закон его распределения.

8. Статистический критерий для проверки гипотезы .

9. Понятие о дисперсионном анализе.

10. Назначение - критерия Пирсона.

11. Наблюдаемое и критическое значения критерия Пирсона.

12. Алгоритм сравнения эмпирического распределения с теоретическим с помощью критерия Пирсона.

13. Назначение - критерия Колмогорова.

14. Наблюдаемое и критическое значения критерия Колмогорова.

15. Алгоритм сравнения эмпирического распределения с теоретическим с помощью критерия Колмогорова.

16. Назначение - критерия Колмогорова – Смирнова.

17. Наблюдаемое и критическое значения критерия Колмогорова - Смирнова.

18. Алгоритм сравнения двух эмпирических распределений с помощью критерия Колмогорова.

Контрольные задания:

1. По двум независимым выборкам объёмов и , извлечённым из нормальных генеральных совокупностей и , найдены исправленные выборочные дисперсии =11,41 и =6,52. При уровне значимости 0,05 проверить нулевую гипотезу о равенстве генеральных дисперсий при конкурирующей гипотезе .

2. По двум независимым малым выборкам, объёмы которых соответственно равны и , извлечённым из нормальных генеральных совокупностей и , найдены выборочные средние , и исправленные дисперсии и При уровне значимости 0,05 проверить нулевую гипотезу , при конкурирующей .

3. Имеются следующие данные о числе сданных экзаменов в сессию студентами-заочниками:

Число сданных экзаменов
Число студентов

На уровне значимости 0,05 проверить гипотезу о том, что случайная величина Х – число сданных студентами экзаменов – распределена по биномиальному закону, используя критерий Пирсона.

4. Имеются следующие данные о засоренности партии семян клевера семенами сорняков:

Число семян в одной пробе
Число проб

На уровне значимости 0,05 проверить гипотезу о том, что случайная величина Х – число семян сорняков – распределена по закону Пуассона, используя критерий Пирсона.

5. В выборке из здоровых лиц мужского пола, студентов технических и военно-технических вузов в возрасте от 19 до 22 лет, средний возраст 20 лет, проводился тест Люшера в 8 -цветном варианте. Установлено, что жёлтый цвет предпочитается испытуемыми чаще, чем отвергается. Можно ли утверждать, что распределение жёлтого цвета по 8 позициям у здоровых испытуемых отличается от равномерного распределения? Экспериментальные данные наблюдаемых частот попадания жёлтого цвета на каждую из восьми позиций представлены в таблице.

Позиции жёлтого цвета
Наблюдаемые частоты

Задания для домашней работы:

1. По двум выборкам при уровне значимости 0,05 проверить сначала гипотезу о равенстве дисперсий и, если она принимается, то затем гипотезу о равенстве математических ожиданий:

73 69 66 74 72 76 75 72 72 64 68 73 68

68 69 71 60 80 72 72 69 69 75 72 71 69

2. Используя критерий Пирсона, при уровне значимости 0,05 установить, случайно или значимо расхождение между эмпирическими частотами и теоретическими , которые вычислены исходя из гипотезы о нормальном распределении генеральной совокупности

 

 





©2015 www.megapredmet.ru Все права принадлежат авторам размещенных материалов.