Средство анализа «Парный двухвыборочный t-тест для средних» надстройки «Пакет анализа» MS Excel Это средство анализа служит для проверки гипотезы о равенстве средних парных наблюдений, когда наблюдения собраны в пары, и нужно исследовать разницу между ними. Для проверки необходимо заполнить диалоговое окно, приведенное на рис.4.14., назначение всех полей очевидно. Результат работы представлен на рис.4.15. Сравните полученные результаты с результатами, полученными вручную.  Рис.4.14 Диалоговое окно средства анализа «Парный двухвыборочный t-тест для средних» надстройки «Пакет анализа» MS Excel  Рис.4.15. Результат работы средства анализа «Парный двухвыборочный t-тест для средних» надстройки «Пакет анализа» MS Excel ЗАДАНИЕ Задача 1 Проверка гипотезы о согласии выборочных данных с нормальным законом распределения. Имеется выборка объема n изнепрерывно распределенной генеральной совокупности. Требуется проверить гипотезу, состоящую в том, что выборочные данные получены из нормально распределенной генеральной совокупности. Варианты заданий взять из лабораторной работы № 3. Решение задачи 1 приведено выше (см. пример 4.2) . Задача 2 Текст задачи в зависимости от варианта приведен ниже. Пример задачи 2 В рабочей книге MS Excel Лечебницы.xls содержатся статистические данные, связанные с работой городских и загородных лечебниц, собранные Отделом здравоохранения штата Нью-Мексико. Фрагмент этой книги приведен на рис. 4.16.  Рис.4.16 Фрагмент рабочего листа Excel с исходными данными для задачи 2 Выяснить, есть ли разница между доходами городских и загородных лечебниц. Решение Выдвигаем гипотезу H0: средние значения доходов городских и загородных лечебниц выборок равны, альтернативная гипотеза H1 : доходы не равны. Чтобы проверить эту гипотезу с помощью t-критерия, необходимо выполнить ряд операций: 1. Разделить всю выборку на две части: для городских и для загородных лечебниц. Считать эти выборки самостоятельными; 2. Выяснить, имеют ли эти выборки одинаковую дисперсию, если «да», то перейти к пункту 3, в противном случае перейти к пункту 4; 3. Применить двухвыборочный t-тест с одинаковыми дисперсиями; 4. Применить двухвыборочный t-тест с различными дисперсиями. Пункт 1. Для разделения выборки воспользоваться командой Данные Сортировка. Результат приведен на рис.4.17. В интервале строк 59:76 содержатся данные, относящиеся к городским лечебницам. В интервале строк 77:110 - данные, относящиеся к загородным лечебницам.  Рис.4.17 Фрагмент рабочего листа Excel с данными для задачи 2 после сортировки Пункт 2. Для проверки предположения, что эти выборки имеют одинаковую дисперсию, воспользуемся критерием Фишера. Выдвигаем гипотезу H0: дисперсии выборок равны, альтернативная гипотеза H1: дисперсии не равны. Воспользуемся надстройкой MS Excel «Пакет анализа» «Двухвыборочный F-тест для дисперсии». Результат расчета приведен на рис. 4.18.  Рис.4.18. Фрагмент рабочего листа MS Excel с данными для проверки равенства дисперсий Поскольку (вычисленное значение критерия не большекритического), то принимается гипотеза H0 (дисперсии выборок равны). Отсюда следует, что можно применить двухвыборочный t-тест с одинаковыми дисперсиями. Выдвигаем гипотезу H0:средние арифметические значения выборок равны, альтернативная гипотеза H1: эти значения не равны. Воспользуемся надстройкой MS Excel «Пакет анализа» «Двухвыборочный t-тест с одинаковыми дисперсиями»; результат работы приведен на рис. 4.19.  Рис. 4.19. Фрагмент рабочего листа MS Excel с данными для проверки равенства средних В качестве следует рассматривать двустороннее значение. Так как , , то , следовательно, гипотеза H0 отклоняется, гипотеза H1- принимается. Из этого делаем вывод о том, что средние значения доходов городских и загородных лечебниц различны. Варианты заданий Вариант 1 В рабочей книге MS Excel Лечебницы.xls содержатся статистические данные о работе городских и загородных лечебниц, собранные Отделом здравоохранения штата Нью-Мексико. Определите, есть ли статистически значимая разница между количеством коек в загородных и городских лечебницах. Вариант 2 В рабочей книге MS Excel Лечебницы.xls содержатся статистические данные о работе городских и загородных лечебниц, собранные Отделом здравоохранения штата Нью-Мексико. Верно ли утверждение, что загородные лечебницы используются реже, чем городские? Указание. В качестве характеристики использования лечебницы ввести переменную «Дней_на_койку», равную отношению количества «Лечебные дни» к значению «Койки» для загородных и городских лечебниц. Вариант 3 В рабочей книге MS Excel Лечебницы.xls содержатся статистические данные о работе городских и загородных лечебниц, собранные Отделом здравоохранения штата Нью-Мексико. Верно ли утверждение, что загородные лечебницы имеют более низкий объем заработной платы, чем городские? Вариант 4 В рабочей книге MS Excel Лечебницы.xls содержатся статистические данные о работе городских и загородных лечебниц, собранные Отделом здравоохранения штата Нью-Мексико. Верно ли утверждение, что объем расходов в загородных лечебницах ниже, чем в городских? Указание. В качестве характеристики объем расходов с учетом разницы в размерах лечебницы ввести переменную «Расход_на_койку», равную отношению количеству «Расходы» к значению «Койки» для загородных и городских лечебниц. Вариант 5 В рабочей книге MS Excel ПреподКолледж.xls содержатся данные о заработной плате преподавателей колледжа. Верно ли утверждение, что преподаватели–женщины получают в среднем меньшую зарплату по сравнению с преподавателями-мужчинами? Вариант 6 В рабочей книге MS Excel ПреподКолледж.xls содержатся данные о заработной плате преподавателей колледжа. Верно ли утверждение, что при поступлении на работу преподаватели со степенью получают в среднем большую зарплату, чем преподаватели без степени? Вариант 7 В рабочей книге MS Excel ПреподКолледж.xls содержатся данные о заработной плате преподавателей колледжа. Верно ли утверждение, что поступающие на работу преподаватели со степенью имеют в среднем больший возраст по сравнению с поступающими на работу преподавателями без степени? Вариант 8 Рабочая книга MS Excel ПреподЗатраты.xls содержит сведения о заработной плате учителей и затратах в общественных школах в пересчете на одного ученика. Верно ли утверждение, что в средняя зарплата учителя в северных районах отличается от средней зарплаты учителя в остальных районах ? Вариант 9 Рабочая книга MS Excel ПреподЗатраты.xls содержит сведения о заработной плате учителей и затратах в общественных школах в пересчете на одного ученика. Верно ли утверждение, что средние затраты в общественных школах в пересчете на одного ученика в южных районах отличаются от средних затрат в остальных районах? Вариант 10 Рабочая книга MS Excel ПреподЗатраты.xls содержит данные о заработной плате учителей и затратах в общественных школах в пересчете на одного ученика. Верно ли утверждение, что средняя зарплата учителя в западных районах отличается от средней зарплаты учителя в остальных районах? Вариант 11 Рабочая книга MS Excel ПреподЗатраты.xls содержит данные о заработной плате учителей и затратах в общественных школах в пересчете на одного ученика. Верно ли утверждение, что средние затраты в общественных школах в пересчете на одного ученика в западных районах отличаются от средних затрат в остальных районах? Вариант 12 В 1970 году распределение спортсменов среди спортивных команд (драфт) было организовано с помощью лотереи: 366 возможных дат рождения спортсменов были помещены во вращающийся барабан и даты были выбраны случайным образом последовательно одна за другой. Первая выбранная дата получила номер 1, вторая – 2 и т.д. В рабочей книге MS Excel Драфт.xls содержатся данные о полученных таким образом номерах драфта. Верно ли что утверждение, спортсмены, родившиеся во второй половине года, в среднем имеют более низкие значения драфта, чем спортсмены, родившиеся в первой половине года? Вариант 13 В 1970 году распределение спортсменов среди спортивных команд (драфт) было организовано с помощью лотереи: 366 возможных дат рождения спортсменов были помещены во вращающийся барабан, и даты были выбраны случайным образом последовательно одна за другой. Первая выбранная дата получила номер 1, вторая – 2 и т.д. В рабочей книге MS Excel Драфт.xls содержатся данные о полученных таким образом номерах драфта. Верно ли что утверждение, спортсмены, родившиеся во второй половине месяца в среднем имеют более низкие значения драфта, чем спортсмены, родившиеся в первой половине месяца? Вариант 14 Рабочая книга MS Excel Кредиты.xls содержит данные об отказах в выдаче кредита для 20 кредитных учреждений в зависимости от расы получателя кредита и уровня его дохода. Предполагается, что кредитные учреждения гораздо чаще отказывают представителям национальных меньшинств. Проверьте обоснованность этого утверждения. Вариант 15 Рабочая книга MS Excel Кредиты.xls содержит сведения об отказах в выдаче кредита для 20 кредитных учреждений в зависимости от расы получателя кредита и уровня его дохода. Предполагается, что кредитные учреждения гораздо реже отказывают клиентам с высоким уровнем доходов. Проверьте обоснованность этого утверждения. Вариант 16 Рабочая книга MS Excel Кредиты.xls содержит данные об отказах в выдаче кредита для 20 кредитных учреждений в зависимости от расы получателя кредита и уровня его дохода. Есть ли основание предполагать, что для представителей национальных меньшинств не существует дискриминации? Список литературы 1. Гмурман В.Е. Теория вероятностей и математическая статистика, изд.9. - М.: Высшая школа, 2003, с.480. 2. Господариков А.П. и др. Математический практикум. Ч.5. Теория вероятности и математическая статистика. Теория функций комплексного переменного. Операционное исчисление. Теория поля. - СПб: СПГГИ(ТУ), 2003, с.187 3. Бер К., Кэйри П. Анализ данных с помощью Microsoft Excel. - М.: Вильямс, 2004, с. 560. ОГЛАВЛЕНИЕ Введение ………………………………………………………………………..3 Лабораторная работа 3: Изучение базовых понятий математической статистики 4 3.1. Базовые понятия. 4 3.2. Диаграмма типа “ящик с усами”. 14 3.3. Статистические выводы: оценки и проверка гипотез. 19 3.4. Надстройка «Пакет анализа» MS Excel 23 Задание. 26 Лабораторная работа 4: Проверка статистических гипотез. 33 4.1. Базовые понятия. 33 4.2. Критерий Фишера. 42 4.3. Критерий Стьюдента ( t-критерий) 47 Задание. 57 Задача 1. 57 Задача 2. 57 Список литературы.. 64 |