Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Критерии проверки гипотез об однородности. Руководство по применению

Покупка
Основная коллекция
Артикул: 645799.04.01
Доступ онлайн
от 300 ₽
В корзину
В руководстве рассматриваются вопросы применения статистических критериев, ориентированных на проверку гипотез об однородности законов, которым принадлежат анализируемые выборки, об однородности средних (о равенстве математических ожиданий), об однородности дисперсий (о равенстве дисперсий сравниваемых выборок). Указываются недостатки и преимущества различных критериев, рассматривается применение критериев в условиях нарушения стандартных предположений. Приводятся таблицы, содержащие процентные точки и модели распределений статистик, необходимые для корректного применения критериев. Настоящее издание содержит описание более широкого множества критериев. Предлагаются построенные модели предельных распределений статистик для некоторых выборочных критериев однородности законов. Следование рекомендациям обеспечит корректность и повысит обоснованность статистических выводов при анализе данных. Рассчитана на специалистов, в той или иной степени сталкивающихся в своей деятельности с вопросами статистического анализа данных, с обработкой результатов экспериментов, применением статистических методов для анализа различных аспектов и тенденций окружающей действительности. Будет полезна инженерам, научным сотрудникам, специалистам различного профиля (медикам, биологам, социологам, экономистам и др.), преподавателям вузов, аспирантам и студентам.
115
Лемешко, Б. Ю. Критерии проверки гипотез об однородности. Руководство по применению : монография / Б.Ю. Лемешко. — 2-е изд., перераб. и доп. — Москва : ИНФРА-М, 2021. — 248 с. — (Научная мысль). — DOI 10.12737/986695. - ISBN 978-5-16-016336-9. - Текст : электронный. - URL: https://znanium.com/catalog/product/986695 (дата обращения: 02.06.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.

            НАУЧНАЯ МЫСЛЬ


СЕРИЯ ОСНОВАНА В 2008 ГОДУ



Б.Ю. ЛЕМЕШКО

КРИТЕРИИ ПРОВЕРКИ ГИПОТЕЗ ОБ ОДНОРОДНОСТИ РУКОВОДСТВО ПО ПРИМЕНЕНИЮ

МОНОГРАФИЯ
2-е издание, переработанное и дополненное



znanium.com

Москва
ИНФРА-М 2021
УДК 519.2(075.4)
ББК 22.172

     Л44



     Рецензенты:
        Попов А.А., доктор технических наук, профессор;
        Селезнев В.А., доктор физико-математических наук, профессор




      Лемешко Б.Ю.
Л44 Критерии проверки гипотез об однородности. Руководство по применению : монография / Б.Ю. Лемешко. — 2-е изд., перераб. и доп. — Москва : ИНФРА-М, 2021. — 248 с. — (Научная мысль). — DOI 10.12737/986695.

         ISBN 978-5-16-016336-9 (print)
         ISBN 978-5-16-108633-9 (online)

          В руководстве рассматриваются вопросы применения статистических критериев, ориентированных на проверку гипотез об однородности законов, которым принадлежат анализируемые выборки, об однородности средних (о равенстве математических ожиданий), об однородности дисперсий (о равенстве дисперсий сравниваемых выборок). Указываются недостатки и преимущества различных критериев, рассматривается применение критериев в условиях нарушения стандартных предположений.
          Приводятся таблицы, содержащие процентные точки и модели распределений статистик, необходимые для корректного применения критериев.
          Настоящее издание содержит описание более широкого множества критериев. Предлагаются построенные модели предельных распределений статистик для некоторых выборочных критериев однородности законов.
          Следование рекомендациям обеспечит корректность и повысит обоснованность статистических выводов при анализе данных.
          Рассчитана на специалистов, в той или иной степени сталкивающихся в своей деятельности с вопросами статистического анализа данных, с обработкой результатов экспериментов, применением статистических методов для анализа различных аспектов и тенденций окружающей действительности. Будет полезна инженерам, научным сотрудникам, специалистам различного профиля (медикам, биологам, социологам, экономистам и др.), преподавателям вузов, аспирантам и студентам.

                                                  УДК 519.2(075.4) ББК 22.172






ISBN 978-5-16-016336-9 (print)
ISBN 978-5-16-108633-9 (online)

© Лемешко Б.Ю., 2017
© Лемешко Б.Ю., 2021,


с изменениями
ОГЛАВЛЕНИЕ

ПРЕДИСЛОВИЕ.............................................5
ВВЕДЕНИЕ................................................8
1. ОБЩИЕ СВЕДЕНИЯ О ПРОВЕРКЕ СТАТИСТИЧЕСКИХ ГИПОТЕЗ.................................11
2. КРИТЕРИИ ПРОВЕРКИ ОДНОРОДНОСТИ ЗАКОНОВ
РАСПРЕДЕЛЕНИЯ.......................................18
  2.1. КритерийСмирнова................................20
  2.2. Критерий Лемана-Розенблатта.....................29
  2.3. Критерий Андерсона-Дарлинга.....................35
  2.4. Многовыборочный критерий Андерсона-Дарлинга.....40
  2.5. Критерии однородности Жанга.....................48
  2.6. Двухвыборочные критерии при анализе k выборок...60
     2.6.1. k-выборочный критерий Смирнова (max)....61
     2.6.2. k-выборочный критерий Лемана-Розенблатта (max) 66
     2.6.3. k-выборочный критерий Андерсона-Дарлинга (max) ... 70
  2.7. Критерий однородности //........................73
  2.8. Примерыприменения...............................76
  2.9. Выводы по разделу...............................80
3. КРИТЕРИИ ПРОВЕРКИ ОДНОРОДНОСТИ СРЕДНИХ ...84
  3.1. Параметрические критерии однородности средних...85
     3.1.1. Критерий сравнения двух выборочных средних при
     известных дисперсиях..............................85
     3.1.2. КритерийСтьюдента..........................86
     3.1.3. Критерий сравнения двух выборочных средних при
     неизвестных и неравных дисперсиях.................86
     3.1.4. F-критерий однородности средних............89
     3.1.5. k-выборочный вариант критерия Стьюдента....90
     3.1.6. Об устойчивости параметрических критериев..91
  3.2. Непараметрические критерии однородности средних.95
     3.2.1. Критерии Уилкоксона и Манна-Уитни..........95
     3.2.2. Критерий Краскела-Уаллиса..................97
     3.2.3. КритерийВандерВардена......................98
     3.2.4. Критерий Фишера-Йэйтса-Терри-Гёфдинга...100
     3.2.5. Многовыборочный критерийВандерВардена...101
  3.3. Сравнительный анализ мощности критериев........102
  3.4. Выводыпоразделу................................112
4. КРИТЕРИИ ПРОВЕРКИ ОДНОРОДНОСТИ ДИСПЕРСИЙ.............................................115
  4.1. Параметрические критерииоднородностидисперсий..118
     4.1.1. Критерий Бартлетта.........................118
     4.1.2. КритерийКокрена............................122
     4.1.3. КритерийХартли.............................124
     4.1.4. КритерийЛевене.............................126
     4.1.5. КритерийФишера.............................132
     4.1.6. КритерийНеймана-Пирсона....................133
     4.1.7. КритерийО'Брайена..........................136
     4.1.8. Критерий Линка.............................139
     4.1.9. КритерийНьюмана............................140
     4.1.10. КритерийБлиса-Кокрена-Тьюки...............142
     4.1.11. КритерийКадуэлла-Лесли-Брауна.............144
     4.1.12. Z-критерийОверолла-Вудворда...............146
     4.1.13. Модифицированный2 критерий................147
     4.1.14. КритерийМиллера...........................150
     4.1.15. КритерийЛайарда...........................152
  4.2. Непараметрические критерииоднородностидисперсий.153
     4.2.1. КритерийАнсари-Бредли......................153
     4.2.2. КритерийМуда...............................155
     4.2.3. Критерий Сижела-Тьюки......................157
     4.2.4. КритерийКлотца.............................159
     4.2.5. КритерийКейпена............................161
     4.2.6. k-выборочный критерий Флайне-Киллина.......162
  4.3. Сравнительный анализ мощности критериев.........166
  4.4. Мощность критериев при нарушении предположения о нормальности...................................... 177
  4.5. Критерий Кокрена при законах, отличных от нормального... 183
  4.6. Что надо учитывать при выборе критерия однородности дисперсий?...........................................184
  4.7. О вычислении достигнутого уровня значимости.....186
  4.8. Применениекритериевв «нестандартных» условиях...188
  4.9. Выводыпоразделу.................................193
ЗАКЛЮЧЕНИЕ.............................................197
Библиографический список...............................198
Приложение.............................................207
ПРЕДИСЛОВИЕ

   Необходимость проверки гипотез об однородности законов распределения вероятностей, об однородности средних или однородности дисперсий очень часто возникает в различных приложениях, когда хотят убедиться в неизменности (или наоборот в изменении) статистических свойств некоторого объекта, процесса и т.п. после целенаправленного изменения фактора или факторов (методики, технологии и т.д.), неявным образом влияющих на исследуемый объект. В прикладной математической статистике накопился достаточно обширный арсенал критериев (параметрических и непараметрических), предназначенных для проверки гипотез того или иного вида.
   В качестве критериев проверки однородности законов для анализа 2-х выборок привычно используют критерии Смирнова, Лемана-Розенблатта, Андерсона-Дарлинга-Петитта, %². При большем числе сравниваемых выборок могут применяться k -выборочные варианты критериев: k -выборочный критерий Андерсона-Дарлинга, 3 варианта критериев Жанга, критерий однородности %², варианты k -выборочных критериев, предусматривающие многократное использование двухвыборочных критериев.
   Для проверки гипотез об однородности средних могут использоваться классические критерии (варианты критерия Стьюдента и F -критерий), в основе которых лежит предположение о принадлежности выборок нормальным законам, или применяться непараметрические критерии, свободные от этого предположения (Уилкоксона, Манна-Уитни, Краскела-Уаллиса и др.).
   Арсенал критериев, ориентированных на проверку гипотез об однородности дисперсий наиболее внушительный. Это длинный и возможно неполный ряд параметрических критериев (Бартлетта, Кокрена, Фишера, Хартли, Неймана-Пирсона, О’Брайена, Левене, Лайарда, Миллера, Линка, Ньюмана, Блисса-Кокрена-Тьюки, Кадуэлла-Лесли-Брауна, Z-критерий Оверолла-Вудворда, модифи
цированный Z-критерий), в обосновании которых решающая роль принадлежит стандартному предположению о принадлежности анализируемых выборок нормальным законам. Это достаточно представительный перечень непараметрических критериев, предназначенных для проверки однородности характеристик рассеяния (Ансари-Бредли, Муда, Сижела-Тьюки, Кейпена, Клотца, Флайне-Киллина).
   Применяемое множество критериев создавалось на протяжении практически столетия интенсивного развития математической статистики. Однако до сих пор не сформировалось устойчивого мнения о том, какие из этого множества критериев наиболее предпочтительны при проверке соответствующих гипотез? Какие критерии обладают большей мощностью? Какие достоинства или недостатки связаны с отдельными критериями?
   Давно известно, что параметрические критерии проверки однородности средних достаточно устойчивы к нарушению стандартного предположения о нормальности. Выводы могут оставаться корректными при значительных отклонениях наблюдаемого закона от нормального. Однако у устойчивости параметрических критериев есть вторая сторона медали: их преимущество в мощности по сравнению с непараметрическими критериями весьма незначительно.
   В свою очередь параметрические критерии проверки однородности дисперсий, за редким исключением, чрезвычайно чувствительны к малейшим отклонениям от нормальности, что негативно отражается на корректности статистических выводов. В то же время в основной массе параметрические критерии имеют заметное преимущество в мощности перед непараметрическими. Причём преимущество в мощности сохраняется за параметрическими критериями и в условиях нарушения предположения о нормальности (если только выборки не принадлежат законам с “тяжёлыми хвостами”). По этой причине очень желательно иметь возможность корректного применения параметрических критериев в условиях нарушения стандартного предположения о нормальности. Для реализации такой возможности необходимо лишь знание
распределений статистик критериев в таких нестандартных условиях, что в настоящее время, благодаря использованию компьютерных технологий и имитационного моделирования, отнюдь не является неразрешимой задачей.
   Данное руководство подготовлено с учетом наших исследований, проведенных в предшествующих работах и непосредственно при формировании его содержания. Исследования позволили провести сравнительный анализ мощности групп критериев относительно различных альтернатив, позволили указать на нюансы применения или существенные недостатки некоторых критериев, проявляющиеся при проверке гипотез.
   Нельзя утверждать, что в каждом из разделов настоящего руководства проанализированы абсолютно все существующие критерии, предназначенные для проверки гипотез определённого вида, по-видимому, наиболее упоминаемые и чаще используемые. И всё-таки хочется надеяться, что настоящая книга, как и предшествующие [86, 87, 88, 112] окажет реальную помощь специалистам, заинтересованным в корректности проводимого статистического анализа.
   Я очень признателен своим коллегам и ученикам (Лемешко С.Б., Горбуновой А.А., Сатаевой Т.С., Веретельниковой И.В., Новиковой А.Ю.), внёсшим заметный вклад в уточнение знаний о свойствах критериев, что позволило подготовить и расширить данное руководство.
   Значительная часть исследований, способствующих подготовке руководства, проведена при поддержке Министерства образования и науки РФ в рамках выполнения государственной работы «Обеспечение проведения научных исследований» (№ 1.4574.2017/6.7) и проектной части государственного задания (проект (№ 1.1009.2017/4.6).


                                           Б.Ю. Лемешко апрель 2020
ВВЕДЕНИЕ

   Необходимость в проверке гипотез об однородности выборок случайных величин очень часто возникает в различных приложениях при решении задач статистического анализа результатов экспериментальных исследований.
   При этом речь может идти или о проверке гипотез об однородности законов распределения вероятностей, соответствующих анализируемым выборкам, или об однородности математических ожиданий, или об однородности дисперсий. Естественно, что наиболее полные выводы могут быть получены на основании решения первой задачи. Однако исследователя в большей степени может интересовать ответ на вопрос об отсутствии (наличии) возможных отклонений в средних значениях анализируемых выборок или в характеристиках рассеяния результатов измерений.
   Задача проверки гипотезы об однородности законов, соответствующих к выборкам, формулируется следующим образом. Имеется к выборок
       x11, x12, ■■■, x1 «J , x21, x22, ■■■, x2n2 , ' •', xk 1, xk2, •••’ xkik ,

где nₜ- объём i -й выборки, i = 1, k. Проверяется гипотеза о том, что все выборки извлечены из одной и той же генеральной совокупности, т. е.
Hо : F1(x) = F₂(x) =...=Fₖ(x) = F(x)
при любом x. Конкурирующая гипотеза может иметь вид
H1: F( x) * Fj (x)
для некоторых i * j, i, j < k ■
   Как правило, критерии проверки гипотезы об однородности законов непараметрические.
   При проверке гипотезы об однородности средних (о равенстве математических ожиданий) предполагается, что анализируемые выборки принадлежат какому-то одному закону: неизвестному в случае непараметрических критериев и известному в случае параметрических. Проверяемая гипотеза имеет вид
Ho: Mi = M2 =--- = Mk
при конкурирующей гипотезе
H1: M/1 ' M г ₂ ,

где неравенство выполняется хотя бы для некоторой пары индексов /1, г 2 ■
   Для проверки гипотез о равенстве математических ожиданий может использоваться ряд параметрических критериев, применение которых, как правило, опирается на стандартное предположение о принадлежности анализируемых выборок нормальным законам, а также непараметрические критерии, свободные от этого предположения. В то же время следует иметь в виду, что применение непараметрических критериев базируется на предположении, что законы, которым принадлежат сравниваемые выборки, могут отличаться только параметрами сдвига.
   В критериях проверки однородности дисперсий проверяемая гипотеза о постоянстве дисперсий k выборок имеет вид
;/_’_’         _2
Н 0- а1 = а2 = ■■■ = аk ,

а конкурирующая с ней гипотеза
2    2
Нi: а /1 ^ а/ 2,

где неравенство выполняется, по крайней мере, для одной пары индексов /1, i₂ ■
   Для проверки такого рода гипотез может использоваться значительный перечень классических параметрических критериев. Обоснованное применение этих критериев требует выполнения стандартного предположения о принадлежности анализируемых выборок нормальному закону.
   В случае непараметрических аналогов речи о принадлежности выборок нормальным законам не идёт. Однако предполагается, что анализируемые выборки принадлежат пусть неизвестному, но одному и тому же виду закона с одинаковыми математическими ожиданиями. Именно тогда обеспечивается корректность применения критериев.
   У исследователя, стоящего перед проблемой выбора критерия, несмотря на обилие публикаций, возникает множество вопросов, так
как остается не ясным, в каких случаях применение какого критерия предпочтительней.
   В случае критериев проверки гипотез об однородности законов распределений, перечень которых достаточно узок, специалиста может интересовать, насколько хорошо при ограниченных объёмах выборок распределения статистик хорошо описываются предельными распределениями? Или какой из критериев является более мощным (лучше распознаёт альтернативы)?
   Такие же вопросы возникают относительно критериев проверки гипотез о средних, где мы имеем множество критериев (параметрических и непараметрических), но нет четких указаний и сведений о преимуществе тех или иных, например, о степени устойчивости параметрических критериев к отклонениям от стандартного предположения о нормальности, о результатах сравнения мощности параметрических и непараметрических критериев. Отсутствие указаний не позволяет в конкретной ситуации выбрать наиболее мощный критерий. По некоторым параметрическим критериям проверки гипотез о средних имеется информация об относительной устойчивости распределений статистик к отклонениям наблюдаемого закона от нормального [103, 100]. По другим критериям это требует дополнительных исследований.
   Параметрические критерии проверки гипотез о дисперсиях, наоборот, весьма чувствительны к любым отклонениям от предположений, в условиях которых они были получены. И также отсутствует или противоречива информация о мощности соответствующих критериев [77, 101, 35].
   Множества критериев, построенных для проверки гипотез о равенстве математических ожиданий или о равенстве дисперсий, заметно шире множества критериев проверки однородности законов. Поэтому проблема выбора наиболее предпочтительного критерия стоит более остро. Особенно важна объективная информация относительно свойств критериев проверки гипотез об однородности дисперсий (об однородности характеристик рассеяния).
1. ОБЩИЕ СВЕДЕНИЯ О ПРОВЕРКЕ СТАТИСТИЧЕСКИХ ГИПОТЕЗ

   С каждым из используемых для проверки гипотезы H₀ критериев связана статистика S, которая представляет собой некоторую меру для измерения вероятности соответствия (несоответствия) анализируемых выборок проверяемой гипотезе H₀. В силу случайности извлекаемых выборок случайными оказываются и значения статистики S, вычисляемые в соответствии с этими выборками. При справедливости проверяемой гипотезы H₀ статистика S подчиняется некоторому распределению G(S\H0).
   Схема проверки гипотезы заключается в следующем. Область определения статистики разбивается на два подмножества, одно из которых представляет собой критическую область, попадание в которую при справедливости H₀ маловероятно. При попадании *                              **
вычисленного по выборке значения S статистики S в критическую область проверяемая гипотеза H₀ отклоняется (отвергается). В противном случае считается, что нет оснований для отклонения гипотезы H₀.
   Заметим, что неотклонение гипотезы H₀ в процессе проверки не означает, что она справедлива. Результат проверки свидетельствует лишь о том, что реальное положение вещей, возможно, не очень сильно отличается от предполагаемого состояния, соответствующего H 0.
   С другой стороны, справедливая гипотеза H₀ может быть отклонена и эти самым совершена ошибка 1-го рода. При проверке гипотез вероятность ошибки 1-го рода а (уровень значимости), как правило, задают, допуская тем самым возможность отклонения H₀ и возможность такой ошибки.
   При построении критериев стремятся к использованию одномерных статистик, что упрощает построение критической области. При этом критерии могут быть правосторонними, левосторонними и двусторонними, что определяет построение критической области.
Все критерии проверки однородности, как правило, являются правосторонними или двусторонними.
   В случае правостороннего критерия граница критической области (критическое значение) S'₁_ₐ , определяется уравнением

                     да
a = f g(s\H0)ds = 1 _G(Si_ₐ|H0),            (1.1)
                    Si_ₐ

где g(s|Hо) - условная плотность распределения статистики при справедливости H₀.
   Для используемых на практике критериев в благоприятных случаях известны асимптотические (предельные) распределения G(S\Hо) соответствующих статистик при условии справедливости гипотезы H₀. В тех ситуациях, когда распределения статистик существенно зависят от объёмов выборок n, информация о законе распределения статистики бывает представлена таблицей процентных точек (квантилей распределения G(S|Hо)). Критическое значение S1_ₐ вычисляют в соответствии с G(S|Hо) или берут из соответствующей таблицы процентных точек.
   В случае правостороннего критерия в принятой практике статистического анализа обычно полученное значение статистики S* сравнивают с критическим значением S1_ₐ при заданном уровне значимости a . Проверяемую гипотезу H₀ отклоняют, если S* >S| ₐ (см. рис. 1.1).
   Больше информации о степени соответствия выборки теоретическому закону можно почерпнуть из достигнутого уровня значимости pᵥₐiᵤₑ - вероятности возможного превышения полученного значения статистики при справедливости H₀:
да
Pvalue = P{ S > S } = f g (s\H o) ds = 1 _ G (S |Ho). (1.2)
S *
Именно эта вероятность позволяет судить о том, насколько хорошо анализируемые выборки согласуются с проверяемой гипотезой, так как по существу представляет собой вероятностную меру истинности
Доступ онлайн
от 300 ₽
В корзину