Книжная полка Сохранить
Размер шрифта:
А
А
А
|  Шрифт:
Arial
Times
|  Интервал:
Стандартный
Средний
Большой
|  Цвет сайта:
Ц
Ц
Ц
Ц
Ц

Критерии проверки отклонения от экспоненциального закона. Руководство по применению

Покупка
Основная коллекция
Артикул: 737176.01.01
Доступ онлайн
от 424 ₽
В корзину
Монография рассчитана на специалистов, в той или иной степени сталкивающихся в своей деятельности с вопросами статистического анализа данных, с обработкой результатов экспериментов, применением статистических методов для анализа различных аспектов и тенденций окружающей действительности. В руководстве рассматриваются вопросы применения статистических критериев, ориентированных на проверку гипотезы о принадлежности анализируемой выборки экспоненциальному (показательному) закону распределения. Указываются недостатки и преимущества различных критериев. Приводятся оценки мощности критериев и результаты сравнительного анализа критериев, а также таблицы, содержащие процентные точки и модели распределений статистик, необходимые для применения критериев. Следование рекомендациям обеспечит корректность и повысит обоснованность статистических выводов при анализе данных. Будет полезна инженерам, научным сотрудникам, специалистам различного профиля (медикам, биологам, социологам, экономистам, и др.), сталкивающимся в своей деятельности с необходимостью статистического анализа результатов экспериментов, а также преподавателям вузов, аспирантам и студентам.
24
Лемешко, Б. Ю. Критерии проверки отклонения от экспоненциального закона. Руководство по применению : монография / Б.Ю. Лемешко, П.Ю. Блинов. — Москва : ИНФРА-М, 2021. — 352 с. — (Научная мысль). — DOI 10.12737/1097477. - ISBN 978-5-16-016328-4. - Текст : электронный. - URL: https://znanium.com/catalog/product/1097477 (дата обращения: 03.06.2024). – Режим доступа: по подписке.
Фрагмент текстового слоя документа размещен для индексирующих роботов. Для полноценной работы с документом, пожалуйста, перейдите в ридер.

НАУЧНАЯ МЫСЛЬ
СЕРИЯ ОСНОВАНА В 2008 ГОДУ





Б.Ю. ЛЕМЕШКО
П.Ю. БЛИНОВ





                КРИТЕРИИ
                ПРОВЕРКИ ОТКЛОНЕНИЯ ОТ ЭКСПОНЕНЦИАЛЬНОГО ЗАКОНА




РУКОВОДСТВО ПО ПРИМЕНЕНИЮ

МОНОГРАФИЯ






znanium.com

Москва
ИНФРА-М 2021
УДК 519.23(075.4)
ББК 22.172
     Л44


    Рецензенты:                                                           
    Попов А.А., доктор технических наук, профессор, профессор ка-         
    федры теоретической и прикладной информатики Новосибирского           
    государственного технического университета;                           
    Селезнев В.А., доктор физико-математических наук, профессор, за-      
    ведующий кафедрой инженерной математики Новосибирского госу-          
    дарственного технического университета                                
    Лемешко Б.Ю.                                                          
Л44 Критерии проверки отклонения от экспоненциального закона. Ру-         
    ководство по применению : монография / Б.Ю. Лемешко, П.Ю. Бли-        
    нов. --- Москва : ИНФРА-М, 2021. --- 352 с. --- (Научная мысль). ---  
    DOI 10.12737/1097477.                                                 
    ISBN 978-5-16-016328-4 (print)                                        
    ISBN 978-5-16-108625-4 (online)                                       
    Монография рассчитана на специалистов, в той или иной степени стал-   
    кивающихся в своей деятельности с вопросами статистического анализа   
    данных, с обработкой результатов экспериментов, применением статисти- 
    ческих методов для анализа различных аспектов и тенденций окружающей  
    действительности.                                                     
    В руководстве рассматриваются вопросы применения статистических       
    критериев, ориентированных на проверку гипотезы о принадлежности      
    анализируемой выборки экспоненциальному (показательному) закону       
    распределения. Указываются недостатки и преимущества различных кри-   
    териев.                                                               
    Приводятся оценки мощности критериев и результаты сравнительного      
    анализа критериев, а также таблицы, содержащие процентные точки и мо- 
    дели распределений статистик, необходимые для применения критериев.   
    Следование рекомендациям обеспечит корректность и повысит обосно-     
    ванность статистических выводов при анализе данных.                   
    Будет полезна инженерам, научным сотрудникам, специалистам раз-       
    личного профиля (медикам, биологам, социологам, экономистам, и др.),  
    сталкивающимся в своей деятельности с необходимостью статистического  
    анализа результатов экспериментов, а также преподавателям вузов, аспи-
    рантам и студентам.                                                   

УДК 519.23(075.4)
ББК 22.172


ISBN 978-5-16-016328-4 (print)
ISBN 978-5-16-108625-4 (online)

© Лемешко Б.Ю., Блинов П.Ю., 2021
Оглавление


Предисловие ................................................ 6
ВВЕДЕНИЕ ................................................... 7

1.   ОБЩИЕ ПОЛОЖЕНИЯ ...................................... 10
     1.1.  Общие сведения о проверке статистических гипотез . 10
     1.2.  Проверяемая гипотеза при проверке показательности и виды критериев ................................. 16
     1.3.  Конкурирующие гипотезы, рассматриваемые при проверке показательности ......................... 17
2.   КРИТЕРИИ ПРОВЕРКИ ПРИНАДЛЕЖНОСТИ ВЫБОРОК     ПОКАЗАТЕЛЬНОМУ ЗАКОНУ ..........................24
     2.1.  Критерий Шапиро-Уилка (Shapiro-Wilk test)........24
     2.2.  Критерий Фросини (Frocini test)................. 28
     2.3.  Корреляционный критерий экспоненциальности ..... 30
     2.4.  Критерий  Кимбера-Мичела (Kimber-Michael test) . 35
     2.5.  Критерий  Фишера (Fisher test).................. 37
     2.6.  Критерий  Гнеденко (Gnedenko test) ............. 40
     2.7.  Критерий  Харриса (Harris test) ................ 45
     2.8.  Критерий  Бартлетта-Морана (Bartlett test)...... 49
     2.9.  Критерий  Пиэтра (Pietra test) ................. 53
     2.10. Критерий  Эппса-Палли (Epps-Pulley test) ....... 57
     2.11. Критерий Холландера-Прошана (Hollander-Proshan
           test) .......................................... 59
     2.12. Критерий наибольшего интервала.................. 61
     2.13. Критерий Кочара (Kochartest) ................... 64
     2.14. Критерий Климко-Антла-Радемакера-Рокетта (Klimko test)..................................... 67
     2.15. Критерий Гринвуда (Greenwood test).............. 69
     2.16. Критерий Эпштейна (Epstein test) ............... 69
     2.17. Критерий Дешпанде (Deshpande test).............. 73
     2.18. Обобщенный критерий Морана ..................... 80
     2.19. Критерий Морана (Moran test / Tchirina test) ... 80
     2.20. Критерий Вонга-Вонга (Wong and Wong test)....... 82
     2.21. Критерии Хегази-Грина (Hegazy-Green tests) ..... 84
2.22. Критерий Мадукайфе (Madukaife test)............. 90
     2.23. Критерий Лоренца (Lorenz test) ................. 93
     2.24. Критерий Кокса-Оукса (Cox-Oakes test)............95
     2.25. Критерий Джексона (Jackson test) ............... 98
     2.26. Критерий Джини (Gini test)..................... 100
     2.27. Критерий Аткинсона (Atkinson test)............. 103
     2.28. Критерий Садепура (Sadeghpour test) ........... 112
     2.29. Критерий Тико (Tiko test)...................... 117
     2.30. Критерий Клара (Klar test) .................... 121
     2.31. Критерий Хензе (Henze test) ................... 125
     2.32. Критерий Барингхауса-Хензе (Baringhaus-Henze test) ........................................... 134
     2.33. L-критерий Хензе-Мейнтаниса (Henze-Meintanis
           L-test)........................................ 139
     2.34. W-критерии Хензе-Мейнтаниса (Henze-Meintanis
           W-tests) ...................................... 143
     2.35. Критерий Фортиана-Гране (Fortiana-Grane test) . 149
     2.36. Критерий Монтазери-Тораби (Montazeri-Torabi
           test) ......................................... 153
     2.37. Критерий Тораби (Torabi tests) ................ 158
     2.38. Интегральный критерий типа L² ................. 162
     2.39. О критериях, основанных на характеризациях
           экспоненциального закона .................... 165
3.   СРАВНИТЕЛЬНЫЙ АНАЛИЗ МОЩНОСТИ КРИТЕРИЕВ ПРОВЕРКИ ЭКСПОНЕНЦИАЛЬНОСТИ .................. 168
     3.1.  Ранжирование критериев по мощности относительно гипотез Hi-Н₃......................................168
     3.2.  Сравнительный анализ мощности критериев по всем рассмотренным конкурирующим гипотезам ............. 176
     3.3.  Рейтинг специальных критериев экспоненциальности ................................ 180
4.   НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ СОГЛАСИЯ ПРИ ПРОВЕРКЕ ЭКСПОНЕНЦИАЛЬНОСТИ ........................ 183
     4.1.  Критерий Колмогорова .......................... 184
     4.2.  Критерий Купера ............................... 188
     4.3.  Критерий Крамера-Мизеса-Смирнова .............. 191
     4.4.  Критерий Ватсона .............................. 193
4.5. Критерий Андерсона-Дарлинга...................196
     4.6. Критерии Жанга .............................. 198
     4.7. Сравнение мощности непараметрических критериев
согласия ................................ 204
5.   КРИТЕРИИ СОГЛАСИЯ ТИПА ХИ-КВАДРАТ ПРИ ПРОВЕРКЕ ЭКСПОНЕНЦИАЛЬНОСТИ ....................... 207
     5.1. Критерий согласия х2 Пирсона..................207
     5.2. Критерий согласия Никулина-Рао-Робсона ...... 217
6.   НЕКОТОРЫЕ ВОПРОСЫ ПРИМЕНЕНИЯ ..................... 221
     6.1. О вычислении достигнутого уровня значимости . 221
     6.2. О влиянии ошибок округления на распределения
статистик критериев ..................... 223

Заключение ............................................ 233
Библиографический список............................... 234
Приложение А........................................... 245
Предисловие

   Для проверки гипотезы о принадлежности выборки показатель -ному (экспоненциальному) закону может использоваться множество специальных критериев, предназначенных только для проверки этой гипотезы, ряд непараметрических критериев согласия, и критерии типа /2. Пожалуй, это самый обширный перечень критериев, ориентированных на проверку одного вида гипотезы.
   Это множество критериев создавалось на протяжении более чем столетия, однако до сих пор не сформировалось устойчивого мнения о том, какие из них наиболее предпочтительны.
   Данное руководство подготовлено с учетом предшествующих наших исследований и исследований, проведенных в процессе его подготовки. Нельзя утверждать, что в нём проанализированы все существующие критерии, предназначенные для проверки отклонения распределения от экспоненциального закона, но, по-видимому, большая их часть.
   Хочется надеяться, что настоящее руководство, как и предшест-вующие книги [128, 129, 130, 131, 147], окажет реальную помощь специалистам, заинтересованным в корректности проводимого статистического анализа, позволит ориентироваться среди множества критериев и осмысленно применять их в процессе анализа.
   Я очень признателен своим коллегам и ученикам (Лемешко С.Б., Рогожникову А.П., Блинову П.Ю.), внёсшим заметный вклад в уточнение знаний о свойствах критериев и в разработку программного обеспечения, что позволило подготовить данное руководство.
   Значительная часть исследований, способствующих подготовке руководства, проведена при поддержке Министерства науки и высшего образования РФ в рамках выполнения государственной работы «Обеспечение проведения научных исследований» (№ 1.4574.2017/6.7) и проектной части государственного задания (проект (№ 1.1009.2017/4.6).
ВВЕДЕНИЕ

   Показательный (экспоненциальный) закон является популярной моделью в приложениях распределения. Показательный закон часто используется в задачах статистическом анализа, особенно при построении моделей выживаемости в биологии и медицине (ремиссии заболеваний, времена смерти), а также в в задачах анализа надежности в технических приложениях, где рассматриваются случайные выборки данных типа времени жизни [55] или времена отказов определенных объектов или устройств [47].
   Гипотеза об экспоненциальности эквивалентна гипотезе о том, что наблюдаемому случайному процессу соответствует постоянная интенсивность отказов. И если наблюдается пуассоновский процесс, то времена между наступлениями событий подчиняются показательному закону распределения. Среди процессов, генерирующих пуассоновские потоки, можно указать испускание радиоактивных частиц [121], землетрясения [33], отказы оборудования [81] и т.п.
   Методы прикладной математической статистики наиболее сильно продвинулись за последние сто лет. Это определялось востребованностью соответствующего аппарата в приложениях и, не в последнюю очередь, развитием и использованием вычислительной техники. За это время рассмотрено и исследовано множество вероятностно-статистических моделей, методов построения этих моделей и оценивания их параметров. Предложен уже огромный перечень критериев, предназначенных для проверки различных статистических гипотез. Нередко для решения одной задачи (проверки одного вида гипотезы) предлагается использование ряда различных методов (критериев), приводящих к различным выводам. Например, для проверки гипотезы о принадлежности наблюдаемой выборки нормальному (равномерному, показательному и т.п.) закону, как правило, может использоваться порядка 2-х десятков критериев, построенных специально для этих целей, а также более десятка параметрических и непараметрических критериев согласия. И всё равно появляются новые критерии, базирующиеся на определённых характеристиках или свойствах законов распределения вероятностей.
   Статистики применяемых критериев согласия “измеряют” отклонение эмпирического закона распределения от теоретического с
использованием различных мер. При проверке сложных гипотез параметры теоретических законов могут оцениваться различными методами. Для одних критериев предельные или асимптотические распределения статистик, соответствующие справедливой проверяемой гипотезе бывают известны. Для других такие распределения зависят от объёмов выборок n, а информация об этих распределениях представлена лишь таблицами критических значений для ограниченного числа значений n, что затрудняет применение критериев. Порой отсутствует информация о достоинствах и недостатках конкретных критериев, а иногда такая информация не соответствует действительности. Реальные свойства критериев и распределения статистик при ограниченных объёмах выборок часто существенно отличаются от асимптотических. На корректность формируемых статистических выводов может влиять факт грубого округления анализируемых данных. Для обоснованного выбора конкретного критерия, как правило, не хватает результатов сравнительного анализа мощности критериев.
    В последние годы, помимо предложений новых критериев, исследователи акцентируют внимание на сравнительном анализе существующих критериев проверки статистических гипотез. Эти исследования имеют большое значение для практики, так как в значительной мере раскрывают достоинства и недостатки отдельных критериев. Часто сравнительный анализ сопровождает предложение нового критерия, имея целью продемонстрировать определённые преимущества предлагаемого критерия. Однако ни один пример сравнительного анализа не выявил наилучшего критерия. Попытки сравнительного анализа зачастую сопровождаются методами статистического моделирования и отличаются точностью моделирования, количеством рассмотренных ситуаций и рассмотренных критериев.
    Первый сравнительный анализ критериев показательности был проведен в 70-х годах прошлого столетия. В 1978 вышла работа [32], посвященная данной тематике. Результаты ещё одного сравнительного анализа критериев экспоненциальности были опубликованы в [6]. Позднее сравнительный анализ критериев показательности был представлен в работе [43]. Из последних, работ касающихся сравнительного анализа критериев проверки показательности необходимо отметить работы 2018-го [100] и 2019-го годов [71]. В этих
статьях можно также найти информацию о двух больших группах критериев показательности, которые практически не были рассмотрены в настоящем руководстве. Это критерии, основанные на оценках энтропии и интегральные критерии, некоторые из которых предложены и исследованы в работах [78, 80, 101, 102, 114]. Некоторые метологические вопросы применения критериев показательности рассмотрены в [115]
    Наши предыдущие результаты, связанные со сравнительным анализом критериев показательности представлены в работах [14,15,110].
    При подготовке настоящего руководства множество рассматриваемых критериев показательности исследовалось методами статистического моделирования. При исследовании распределений статистик соответствующих критериев и оценке их мощности количество имитационных экспериментов, осуществляемых при статистическом моделировании, как правило, принималось равным 1 660 000. Такое количество экспериментов позволяет, с одной стороны, проследить качественную картину, отражающую изменение распределений статистик в зависимости от различных факторов, с другой -обеспечить приемлемую точность получаемых оценок мощности и искомых вероятностей. Моделирование проводилось в развиваемой программной системе «Интервальная статистика» ISW [138].
1.    ОБЩИЕ ПОЛОЖЕНИЯ

    1.1.  Общие сведения о проверке статистических гипотез

   С каждым из используемых для проверки гипотезы H₀ критериев связана статистика S, которая представляет собой некоторую меру для измерения вероятности соответствия (несоответствия) анализируемых выборок проверяемой гипотезе H₀. В силу случайности извлекаемых выборок случайными оказываются и значения статистики S, вычисляемые в соответствии с этими выборками. При справедливости проверяемой гипотезы H₀ статистика S подчиняется некоторому распределению G(S |Но).
   Схема проверки гипотезы заключается в следующем. Область определения статистики разбивается на два подмножества, одно из которых представляет собой критическую область, попадание в которую при справедливости Н₀ маловероятно. При попадании вычисленного по выборке значения S* статистики S в критическую область проверяемая гипотеза Н₀ отклоняется (отвергается). В противном случае считается, что нет оснований для отклонения гипотезы Н₀.
   Заметим, что неотклонение гипотезы Н₀ в процессе проверки не означает, что она справедлива. Результат проверки свидетельствует лишь о том, что реальное положение вещей, возможно, не очень сильно отличается от предполагаемого состояния, соответствующего Н 0.
   С другой стороны, справедливая гипотеза Н₀ может быть отклонена и эти самым совершена ошибка 1-го рода. При проверке гипотез вероятность ошибки 1-го рода а (уровень значимости), как правило, задают, допуская тем самым возможность отклонения Н₀ и возможность такой ошибки.
   При построении критериев стремятся к использованию одномерных статистик, что упрощает построение критической области. При этом критерии могут быть правосторонними,
левосторонними и двусторонними, что определяет построение критической области.
   Все критерии проверки однородности, как правило, являются правосторонними или двусторонними.
   В случае правостороннего критерия граница критической области (критическое значение) S 1_а, определяется уравнением
                     да
а = f g(s\H0)ds = 1 _G(Si_ₐ|H0),            (1.1)
                   S1_ₐ
где g(s|Hо) - условная плотность распределения статистики при справедливости H₀.
   Для используемых на практике критериев в благоприятных случаях известны асимптотические (предельные) распределения G(S\Hо) соответствующих статистик при условии справедливости гипотезы H₀. В тех ситуациях, когда распределения статистик существенно зависят от объёмов выборок n, информация о законе распределения статистики бывает представлена таблицей процентных точек (квантилей распределения G(S\Hо)). Критическое значение S1 а вычисляют в соответствии с G(S\Hо) или берут из соответствующей таблицы процентных точек.
   В случае правостороннего критерия в принятой практике статистического анализа обычно полученное значение статистики S* сравнивают с критическим значением S1_ₐ при заданном уровне значимости а . Проверяемую гипотезу H₀ отклоняют, если S* > а (см. рис. 1.1).
   Больше информации о степени соответствия выборки теоретическому закону можно почерпнуть из достигнутого уровня значимости pᵥₐiᵤe _ вероятности возможного превышения полученного значения статистики при справедливости H₀:
да
          Pvaiue = P{ S > S } = f g (s\H o) ds = 1 _ G (S |Ho). (1.2)
S *
Именно эта вероятность позволяет судить о том, насколько хорошо анализируемые выборки согласуются с проверяемой гипотезой, так как
по существу представляет собой вероятностную меру истинности нулевой гипотезы (см. рис. 1.2). Проверяемую гипотезу H₀ не отвергают, если P{S > S*} > а.


Рис. 1.1. Плотность распределения статистики при справедливости гипотезы Hо и критическое значение для правостороннего критерия

Рис. 1.2. Плотность распределения статистики при справедливости гипотезы Hо и достигнутый уровень значимости
В случае двустороннего критерия критическая область состоит из двух частей. И проверяемая гипотеза Hq отклоняется, если S* < Sₐ/2 или S* > S₁_ₐ/2 (см. рис. 1.3). А достигнутый уровень значимости в этом случае определяется соотношением

Pvalue = 2min{G(S*|Hq),1 -G(S*|Hq)} .        (1.3)

Puc. 1.3. Плотность распределения статистики при справедливости гипотезы Hq и критические значения для двустороннего критерия

    Задачи оценивания параметров и проверки гипотез опираются на выборки независимых случайных величин. Случайность самой выборки предопределяет, что возможны и ошибки в результатах статистических выводов. С результатами проверки гипотез связывают ошибки двух видов: ошибка первого рода состоит в том, что отклоняют гипотезу Hq , когда она верна; ошибка второго рода состоит в том, что принимают (не отклоняют) гипотезу Hq , в то время как справедлива конкурирующая гипотеза H1. Уровень значимости a задает вероятность ошибки первого рода. Обычно, используя
Доступ онлайн
от 424 ₽
В корзину