Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Асимптотическое разложение d-риска Заикин Артем Александрович

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Заикин Артем Александрович. Асимптотическое разложение d-риска: диссертация ... кандидата Физико-математических наук: 01.01.05 / Заикин Артем Александрович;[Место защиты: ФГБУН Санкт-Петербургское отделение Математического института имени В.А. Стеклова Российской академии наук], 2017.- 127 с.

Содержание к диссертации

Введение

Глава 1. Разложение апостериорного распределения 20

1.1. Разложение апостериорного распределения с фиксированным центрированием параметра 22

1.2. Разложение апостериорного распределения параметра, центрированного у -состоятельной оценкой 36

Глава 2. Асимптотика необходимого объема выборки при d-гарантийном различении двух гипотез 64

2.1. Постановка задачи на отыскание необходимого объема выборки 64

2.2. Асимптотика необходимого объема выборки 66

Глава 3. Приложение к d-гарантийному контролю качества по альтернативному признаку 81

3.1. Введение 81

3.2. Уточнение асимптотических формул для необходимого объема выборки при ограничениях на вероятности ошибок первого и второго рода 83

3.3. Асимптотическое разложение d-рисков при контроле по альтернативному признаку 97

3.4. Сравнение классического и апостериорного подходов к проблеме контроля качества по альтернативному признаку 109

Глава 4. Асимптотическая d-оптимальность оценки максималь ного правдоподобия 114

4.1. Постановка задачи 114

4.2. Условия регулярности и некоторые леммы 115

4.3. Асимптотическая d-оптимальность оценки максимального прав

доподобия 119

Заключение 123

Список литературы

Введение к работе

Актуальность темы исследования. Существует ряд задач по применениям математической статистики, в которых имеется реальная последовательность статистических экспериментов с полученными результатами наблюдений случайных выборок и принятых решений относительно параметра вероятностной модели. Это задачи контроля качества, медицинской диагностики, анализа активности генов, исследования характеристик большого числа малых областей и т.д. Каждому статистическому эксперименту соответствует значение параметра, которое допускает трактовку как реализация случайного элемента. Качество решающей функции относительно значений этого параметра в байесовской статистике обычно определяется с помощью априорного риска. Априорный риск является интегральным показателем качества решающей функции, в то время как для многих задач, особенно связанных с проверкой гипотез, требуются более тонкие характеристики. Одной из таких характеристик является d-риск, описанный Л.Н.Болыпевым и представляющий собой условное среднее значение потерь относительно сг-алгебры, порожденной решающей функцией.

Актуальность математических задач, решаемых в диссертации, объясняется в первую очередь практической важностью использования процедур статистического вывода, гарантирующих заданные ограничения на функцию d-риска. Когда существует реальная последовательность статистических экспериментов, и когда естественно и, в большей степени, необходимо применять байесовские методы, выполнение ограничений на классическую функцию риска не решает проблему гарантийности статистического вывода по существу. В таких случаях надо гарантировать заданные ограничения не на среднюю величину потерь при фиксированном значении выводного параметра, а на среднюю величину потерь среди статистических экспериментов, завершившихся принятием решения одного и того же решения d. Построение оптимальной, в том или ином смысле, d-гарантийной процедуры зачастую связано с большими трудностями вычислительного характера. Естественно поставить вопрос о построении асимптотически оптимальных d-гарантийных процедур. Поскольку функция d-риска представляет собой условное математическое ожидание от апостериорного риска, асимптотический анализ поведения функции d-риска не возможен без соответствующего анализа апостериорного распределения.

Асимптотический анализ апостериорного распределения является основным инструментом байесовской статистики, с помощью которого решаются задачи построения асимптотически оптимальных статистических решений и асимптотического анализа их риска. Основным результатом, на который опирается большинство таких исследований, является теорема Бернштейна-фон

Мизеса, которая состоит в асимптотической нормальности апостериорного распределения. Точности этого утверждения бывает недостаточно, и приходится прибегать к асимптотическим разложениям апостериорного распределения.

В современной литературе было предложено несколько асимптотических разложений апостериорного распределения, имеющих различные условия применимости, виды разложений и характеристики остатков.

Как теорема Бернштейна-фон Мизеса, так и асимптотические разложения допускают различные центрирования параметра. Полученные до сих пор разложения используют центрирование оценкой максимального правдоподобия, что затрудняет их применение для задач, связанных с вычислением асимптотики d-риска. Центрирование фиксированным (истинным) значением параметра представляется более удобным для вычисления d-риска в задаче проверки параметрических гипотез. Одной из интересных задач, решенных в диссертации, является задача выделения класса центрирующих функций, для которых справедливо асимптотическое разложение.

Важной принципиальной особенностью применения утверждений асимптотического характера при анализе поведения d-риска является требование равномерности остатков асимптотик и разложений апостериорного распределения. Поэтому актуальной задачей является также доказательство необходимой равномерности для полученных разложений.

Цели и задачи диссертационной работы: Целью диссертационной работы является построение асимптотик и разложений d-риска для процедур оценивания и проверки гипотез и применение полученных асимптотик для решения смежных проблем, таких как нахождение приближения оценок с равномерно минимальным d-риском и нахождение асимптотики необходимого объема выборки для d-гарантийных процедур проверки гипотез.

Методология и методы исследования. Методы, используемые в диссертации, по большей части опираются на работы Ибрагимова и Хась-минского [], ]. Говоря конкретно, вывод асимптотического разложения апостериорного распределения опирается на результат этих статей относительно вероятностей больших отклонений статистики отношения правдоподобия. Это позволяет применять разложения Тейлора отношения правдоподобия в нужной области параметрического пространства.

Определение у^-состоятельности, а также некоторые замечательные утверждения о классе у^-состоятельных оценках были взяты из работ Ле Кама, в частности, из ].

Полученные асимптотики апостериорного распределения и апостериорного риска применяются для нахождения асимптотик d-риска в задачах проверки гипотез и оценивания параметра. В случае проверки гипотез, однако, оптимальное решающее правило известно, и, таким образом, возможно на-

прямую вычислить d-риск, используя разложение апостериорного распределения параметра, центрированного точкой разделения гипотез. Для задачи оценивания распределение произвольной оценки неизвестно, поэтому приходится использовать грубые оценки d-риска, получаемые из его приближения апостериорным риском. Здесь уже используется разложение апостериорного распределения параметра, центрированного у^-состоятельной оценкой. Класс у^-состоятельных оценок здесь используется как класс оценок, для которых справедлива используемая асимптотика.

Основные результаты:

В диссертации проводится построение новое асимптотическое разложение апостериорного распределения параметра, отличительной чертой которого является центрирование истинным значением параметра. Приводится асимптотическое разложение апостериорного распределения параметра, центрированного произвольной у^-состоятельной оценкой. Для последнего разложения доказывается равномерная сходимость относительно истинных значений параметра распределения.

В диссертации выведена асимптотическая формула для необходимого объема выборки при d-гарантийном различении гипотез, аналогичная ], при несколько иных условиях на вероятностную модель и доказательство которой опирается на результаты, полученные в диссертации.

Для схемы испытаний Бернулли выводится асимптотика дефекта размера оптимального критерия в классе нерандомизированных критериев. Для рандомизированного критерия приводится асимптотическое (по величине области безразличия) разложение необходимого объема выборки. Для этого же критерия строятся асимптотические разложения для d-рисков до порядка п ' включительно. Критерий, гарантирующий ограничения на вероятности ошибок первого и второго рода и критерий, гарантирующий ограничения на d-риски сравниваются на основе величины области безразличия и параметров априорного распределения.

Сформулировано определение оценки с асимптотически равномерно минимальным d-риском и доказано, что оценка максимального правдоподобия является таковой в классе у^-состоятельных оценок параметра.

Научная новизна. Асимптотическое разложение апостериорного распределения параметра, центрированного произвольной у^-состоятельной оценкой, является обобщением разложения Джонсона [5] в том смысле, что оценка максимального правдоподобия является у^-состоятельной оценкой.

Разложение d-рисков для проверки гипотез в схеме испытаний Бернулли является первым полученным асимптотическим разложением d-риска.

Предложен новый подход к построению оценок с асимптотически равномерно минимальным d-риском, в частности, предложен новый метод к доказательству того, что оценка максимального правдоподобия имеет асимптоти-

чески равномерно минимальный d-риск.

Теоретическая и практическая значимость. Асимптотическое разложение апостериорного распределения является важным шагом для получения стохастических разложений оценок при больших объемах наблюдений. См. в связи с этим статью Бурнашева ], а также статьи [7], ], в которых применяются разложения апостериорного риска, легко получаемые из разложения апостериорного распределения.

Определение оценки с асимптотически равномерно минимальным d-рис-ком является новым в своем роде определением оптимальности, относящейся к d-риску. Оно может быть использовано для формулировки новых определений оптимальности и получения связанных с ними результатов, в том числе и для неасимптотических случаев.

Для проверки гипотез в схеме испытаний Бернулли получено несколько результатов, касающихся поведения необходимого объема выборки, вероятностей ошибок и величины d-рисков в зависимости от значений параметров и вида проверяемых гипотез.

Степень достоверности и апробация результатов. Основные результаты диссертации докладывались на следующих конференциях: Международная научная конференция студентов, аспирантов и молодых учёных «Ломоносов-2015»; Двенадцатая международная Казанская летняя научная школа-конференция «Теория функций, ее приложения и смежные вопросы»; Международная конференция по алгебре, анализу и геометрии и их приложениям. Был сделан также доклад на городском семинаре Санкт-Петербурга по теории вероятностей и математической статистике.

Публикации. Материалы диссертации опубликованы в статьях ], [10], [] и в тезисах конференций ], ].

Структура и объем диссертации. Диссертация состоит из введения, 4 глав, заключения и библиографии. Общий объем диссертации 127 страниц. В диссертации содержится 3 рисунка и 1 таблица. Библиография включает 37 наименований.

Разложение апостериорного распределения параметра, центрированного у -состоятельной оценкой

Результат об асимптотической нормальности апостериорного распределения известен давно как теорема Бернштейна-фон Мизеса. В данной главе этот результат уточняется, подобно тому, как это делается в работах Джонсона [12], Гусева [13], Гоша [14] и Вэнга [15]. Однако, в диссертации разложение делается центрированием не посредством оценки максимального правдоподобия, а центрированием выводным параметром и у -состоятельной оценкой, что позволяет, в отличие от известных разложений, использовать полученные разложения для асимптотического анализа d-риска.

В этой главе выводятся асимптотические разложения для апостериорных распределений и апостериорных рисков. Глава разделена на две части. Первая часть посвящена выводу разложения апостериорного распределения и апостериорных моментов параметра, центрированного истинным значением параметра. Вторая часть посвящена выводу разложения апостериорного распределения и апостериорных моментов параметра, центрированного произвольной у -состоятельной оценкой. Начнем с описания статистической задачи, в рамках которой проводятся все дальнейшие построения в диссертации.

Пусть (X, 21) — измеримое пространство с заданным на нем семейством вероятностных мер {Р#, 0 Є О С Ш}. Предполагается, что у распределения Р# существует плотность р(х\в) = dPo/dv по некоторой сг-конечной мере v, на 21. В статистическом эксперименте наблюдается выборкаX = (Xi,X2, ...,ХП), элементы которой являются отображениями в пространство (Х,21,Р#). Значение параметра 9 неизвестно и является реализацией случайной величины $, имеющей абсолютно непрерывную функцию распределения G с плотностью д{9) по лебеговской мере. Пусть G — некоторое измеримое (по мере Лебега) подмножество числовой прямой. Всюду далее мы будем предполагать, что апри 21 орная плотность д{9) задана так, что д{9) 0 для всех 9 Є Q. Предполагается, что функция р(х\9) задана всюду на X х G и измерима относительно прямого произведения о--алгебр 21 8) 23, где 23 — борелевская сигма-алгебра на G. Основным вероятностным пространством, использующимся в работе, будет (X00 х 0,21 (g) 23, Р), где Р согласовано с условными распределениями Р# и распределением G. Для упрощения записи будем записывать совместное распределение выборки X и параметра $ тем же символом Р, а условное распределение выборки при фиксированном параметре 9 как Р#. Соответствующие вероятностным мерам Р# и Р математические ожидания обозначаются символами Е# и Е соответственно. Плотность выборки X из Р# записывается как рп(хМ)\в) = П?=іР(а#), (п) = (жі, , жп). В данной главе изучаются асимптотические свойства функции апостериорного распределения, определенного для всех А Є 23 по формуле ,, , fApn(X\9)g(9)d9 , ч P, EAX) = WH« (L1) Приведем следующие обозначения, которые используются на протяжении всей главы. Пусть 9$ — некоторая точка множества G, и пусть ( ) \ т — ) 1пр(ж0), 1т(х) = 1т{х\0о), Ат(9) = 2_ lm(%i\9), Аго = Аго( о г=1 го 7Гго(6 )=(- ) ІП#(0), 7Гт = 7Гт(90] Zn(6,h) = PnK /V ;, 0 + hyfceQ. Рп \хЩ9) Zn h)= рп{хЩ9) ) 6 + hl Как обычно, равенство Un = Ор(1), означает, что последовательность случайных величин Un,n 1, равномерно плотна (ограничена по вероятности), т.е. Ує О ВС 0: supP(/n С) є. 1.1. Разложение апостериорного распределения с фиксированным центрированием параметра

В этом параграфе рассматривается задача нахождения асимптотического разложения апостериорного распределения по степеням п 1 2. В качестве центра сосредоточения выбирается фиксированная (истинная) точка о- Другими словами, для заданного целого М 0 указать такие функции Нт yz}x n ) Ш х Xп ь- Ш, что для любого є О, существует С 0 такое, что для всех z Cn-(M+l)/2 sup Р#0 Un v " є, м Р (у/й( & - в0) z\X)-J2 п-т/2Нт (z, X) m=0 supP 0{Fm(z,X) СгГт/2\ є, 0 m M. Отметим, что в приведенных здесь соотношениях параметр вероятностной меры Р#0 фиксирован, поэтому можно говорить, что центрирование ведется истинным значением параметра 9$.

Перечислим условия, на плотность наблюдений и априорную плотность, при которых будет решаться задача построения указанного разложения. Легко заметить, что эти условия в большей степени повторяют условия статьи Гусева [13]. В отличие от [13] д есть функция плотности, а не некая весовая функция. Будем называть совокупность всех ниже перечисленных условий как Ю)б 0(М), где во — некоторая внутренняя точка G, а М 0 — некоторое целое число.

Условие 46 до сих пор не вводилось в предыдущих работах по разложениям апостериорного распределения. Здесь оно введено для удобства записи асимптотической дисперсии (в варианте, представленном в теореме 1.1 этой главы, в качестве асимптотической дисперсии используется обратная информация Фишера I (во), в то время как возможно использование соответствующего выборочного момента — п 1 Х Г=і (хі\во), как, например, это было сделано Джонсоном [12]).

Постановка задачи на отыскание необходимого объема выборки

Пусть, как и раньше, M(A\m)s2) есть нормальное распределение со средним т и дисперсией s2, вычисленное на борелевском множестве А С К, а Ф(х\т} s2) и ( (:rm,s2) — соответствующие функция распределения и плотность, вычисленные в точке х. Символами Ф(х) и (р(х) без параметров будем обозначать функции распределения и плотности стандартного нормального закона.

Нам понадобится следующее утверждение, доказательство которого можно найти в [10], теорема 10.1. Определение дифференцируемости вероятностной модели в среднем квадратичном можно найти там же, с. 93.

Лемма 2.1 (Теорема Бернштейна-фон Мизеса) Пусть в точке в вероятностная модель дифференцируема в среднем квадратичном, 1(9) О, д(9) О и непрерывна в этой точке. Пусть, далее, существует критерий фп такой, что для всех 5 О Еефп(Х) 0, sup Eu(l - фп(Х)) 0. \и-в\ 5 Тогда р (М - 0) Є -Х) - Я (уЩ{А - К{в)))

Сразу заметим, что условия предыдущей леммы выполнены для всех точек 9 Є О для вероятностной модели, удовлетворяющей условиям 1-9. Это следует из существования равномерно состоятельной оценки максимального правдоподобия (см. [26], теорема 4.3, замечание 4.1), что обеспечивает существование критерия, фигурирующего в условиях леммы. Дифференцируемость в среднем квадратичном следует из условий 4 и 6.

Таким образом, в условиях 1D)Q0 справедливо представление Д(Х) = Ф(Л„(0) + Qn(0)) + 8п,в, (2.3) где Рб»( п,б» є) - 0 при всех є 0 для 9 в окрестности 6Q. Однако, следует сказать, что этого утверждения недостаточно для аппроксимации распределения -R(X) по всему классу мер Рб ,# Є в. Именно, для \9 — 6Q\ М при некотором М 0 сходимости 5Пув к нулю по вероятности недостаточно, и требуется оценка вероятностей больших уклонений для апостериорного распределения. Следующая лемма содержит необходимое нам утверждение.

Лемма 2.2. При выполнении условий Шо0 для любых А 0, а 0 существует константа Са, которая зависит только от а, такая что Рв (Д(Х) А 2а) СаА а при всех у/п(9о — 9) А, и Рв (R(X) 1 - А 2а) СаА а при всех 9 — 9о п 112А. Доказательство. Докажем первую формулу в утверждении леммы. Вторая получится формальной заменой -R(X) на 1 — -R(X) из первой. Обозначим Ап{9) = л/п(9о — 9). Имеем Ап{9) А, и і L A ,nZJe,h)g{e + n-ll2h)dh Р, (Л(Х) А-) = Р. ( Х + ЩІ h h \ j Zn(0,h)g(o + Ve\ I Zn(9,h)g[9 + —)dh A-a\ + \h An(6) + Pf j Zn(9,h)g (в + - =j dh A -a Для первого слагаемого согласно лемме 1.1 справедливо: Ро\ f Zn(e,h)g(e + =)dh A-a\ Рв\ J Zn{9, h)g (в + ±=\dh An(9) -a KafiAn(9) -\ (2.4) \ Ап{Є) ) где Kafi — некоторая константа, зависящая только от а и в. Нам необходимо показать, что Ка Ап{в) а КаА а для некоторой константы Ка. Так как для любого М 0 супремум sup Kaj оо, A/ 00-0 M то остается доказать неравенство для 6Q — 6 М. Для доказательства ограниченности супремума в этой области обратимся к доказательству теоремы 2.3 статьи [23]. Из леммы 2.8 работы [23] следует, что для всехТУ 0 можно найти числа щ и MQ 0, что для п щ при \h\ у/пМо P0{Zn(e,h) \h\-N) \h\ N. Из условия 3 следует, что числа MQ И Щ не зависят от в. Таким образом, в области во — в MQ константа Ка не зависит от 9, что следует из леммы 2.9 статьи [23] (здесь уже потребуется условие 11). Поэтому можно принять Ка = ЯЩ А/у/Е во_в Ка в, И Ка ОО. Для того, чтобы ограничить второе слагаемое в правой части (2.4), заметим, что f Zn(e,h)g(e + =)dh J Zn(e,h)g(e + =)dh, -А а так что J Zn(0,h)g(o + k\dh А а\ В0А 2\ п что следует из леммы 3.1 статьи [24]. При этом величина Вв = С sup 1{9 + к/фь) 0 h A-a при некоторой константе С 0. По условию 11 величина Вд В при некотором В, и поэтому не зависит от 9. Итак, если выбрать Са = тах(Ка, В), то из приведенных выкладок следу ет утверждение леммы. Лемма 2.3. ([26], замечание 4-1, стр. 55). Если выполнены условия 1, 8, 9, то SUp6o 6»( ) 0.

При выполнении условия 5 функция Нп(с\9) непрерывна по с Є [0; 1] для всех 9 є G. Доказательство. Зададим два числа 9 и в . Имеем: \Нп(с\9) - Нп(с\9 ) (Pn(X\9)-Pn(X\9 ))dv R(X) c j\pn{X\9)-pn{X\9 )\du Р12\Х\0) -Р12\Х\9 )\ (р1 2{Х\9) +р1 2{Х\9 Квадрат последнего выражения можно оценить с помощью неравенства Коши-Буняковского: р1!\Х\9)-р1!\Х\9!))[р1!\Х\9)+р1!\Х\9!)) dv) p12{X\9)-p12{X\9 ) )2dv J (p12{X\9) +p12{X\9 ) )2dv 4 22(0, ff). Вследствие леммы 2.3 расстояние по Хеллингеру непрерывно по в всюду в G. Учитывая, что согласно условию 1 G — компакт, а также то, что последнее выражение не зависит от с, мы получим искомую равномерность. Что касается непрерывности по с, это следует из непрерывности функ ции Л(Х). В самом деле, из непрерывностир(х\9) по х следует непрерывность по жі,... , хп интеграла вида F(A, х\,..., хп) = JA YYi=iP(xi\0)g(9)d9. Так как -R(X) = F(Gi, жі,..., xn)/F(0, Жі,..., xn), то R(x\,..., xn) также непрерывна Отсюда следует, что Нп(с\9) непрерывна по с, как функция рас пределения непрерывного преобразования случайных величин, имеющих непре рывное распределение.

Следующая лемма описывает поведение распределения Л(Х) вблизи во, то есть при 9 Є [9Q — Мпп 1 2] Оо + МпП-1 2], Мп — оо. Заметим, что необходимость учета возможности стремления Мп - сю с ростом п, доставляла основную сложность при доказательстве асимптотической нормальности апостериорного распределения и при построении асимптотических разложений в предыдущей главе (см. в связи с этим также доказательство утверждения леммы 2.1, [10], глава 10). В то же время классические теоремы о локальной асимптотической нормальности (см., например, [29], глава 2) описывают лишь случай ограниченных Мп.

Уточнение асимптотических формул для необходимого объема выборки при ограничениях на вероятности ошибок первого и второго рода

Результаты предыдущего пункта позволяют построить асимптотику ТОН нерандомизированного критерия, если в качестве критической константы ис 91 пользовать Сп(а), в которой Сп(а) = v/no"oF0-n(l - а) + n/io, a F-n(l - а) -главный член в разложении Корниша-Фишера (3.4). При этом пренебрегается возможная ошибка (3.8) в определении критической константы. Вероятность ошибки второго рода при критической константе Сп (а) равна ҐЩ-тщЛ = Ac»(a) + 0.5j+0.5-nAii і + 0(п-3/2. Мы должны найти такое п, чтобы удовлетворялось Fi;n (Cn(a) - n\i\j\fnu\) (3. По аналогии с постоянной Cn(a) определим константу Сп(1 - (3) = [Сп{1 -(3) - 0.5J+1, гдеСп(1- (3) = y/na"iF1-r[(/3)+n/ii. Объем наблюденийп(а,(3) определяется как наименьшее п, удовлетворяющее неравенству (см. [35]) Сп((3) Cn(a). Переходя к непрерывной переменной п, получаем уравнение для асимптотической оценки ТОН п(а,(3): Сп(а) - Сп(1 - 13) + 1 - {Сп(а) + 0.5} + {Сп(1 - 13) - 0.5} = 0, (3.12) где {а} означает дробную часть числа а. Положим (п = 1 - {Cn(a)+0.5} + {Cn(l- f3)- 0.5}. При известном значении п, можно было бы выписать решение (5) из статьи [35], измененное с учетом

Основная теорема статьи [35] утверждает, что для критериев, основанных на статистике, имеющей строго монотонную функцию распределения, можно с помощью формулы (3.13) аппроксимировать значение ТОН с точностью до единицы. В нашем случае предположение о монотонности функции распределения не выполняется. В то же время это предположение вводилось для определения функции квантилиі7 " (є). В нашем случае Сп(є) однозначно определяет квантиль для любого 0 є 1. Однако это не исчерпывает всех проблем дискретного распределения. Во-первых, функцию Сп(є) нельзя считать всюду непрерывной функцией аргумента п (в связи с присутствием п в п), что затрудняет использование асимптотических методов обращения уравнения относительно?!. Во-вторых, уравнение (3.12) может иметь не одно решение, в том смысле что для некоторых п, больших ТОН, условия (3.1) могут не выполняться. Однако имеет место следующее утверждение.

Теорема 3.2. Существует такая положительная константа А , что при всех А А значение ТОН п(а, /3) нерандомизированного критерия не превосходит величины а2 2(6 + 2) 2ca-(b + 2f Л Ь — Л — + 1. А2 А а2 Доказательство. Пусть (п = ( - фиксированное. Тогда в силу основной теоремы статьи [35] уравнение (3.12) имеет единственный кореньп (), полученный с помощью (3.13) с (п = (. При этом \п (() — п(()\ 1, когда А Д (С), где п(() - «истинное» значение ТОН при (п = , а А (С) некоторое число, которое, вообще говоря, зависит от ( Є [0;2]. Однако, [0; 2] - компакт, и судя по решению (3.13) п (() является непрерывной функцией (. Следовательно, можно найти положительную константу А А (С) при любом ( Є [0; 2].

Далее, ті (С) будучи многочленом второй степени, достигает своего максимума при Ц Аа2 а4 Если учесть, что при уменьшении А переменные а, Ь ведут себя как константы, то ( 2 при достаточно малых А. Так что заменой гі (() на меньшее п (2) получаем утверждение теоремы. 3.2.3. Аппроксимация НОВ для рандомизированного критерия с использованием разложения Корниша-Фишера Применим метод статьи Володина [35] для нахождения НОВ рандомизированного критерия. Представим функцию распределения Gn статистики % = (Т + U — пц) / (у/па) в терминах Fn - нормированной функции биномиального распределения:

Для вычисления обратной функции G теперь уже можно применить разложение Корниша-Фишера. Вывод разложения опирается на разложение Тейлора функции Ф(х + ( — х)) относительно точки ж, где - нормальная (0,1) случайная величина, а х - статистика, относительно которой строится разложение (в нашем случае это %). Т.е. для справедливости разложения требуется близость распределений х и , а используемая в данном случае статистика % не является асимптотически нормальной в условиях центральной предельной теоремы. Однако слагаемое U/(y/na) мало при достаточно больших п, а значит, ряд Тейлора для Ф(х + ( — х)) будет сходиться при достаточно малых А = р\ — ро. Опуская длинные выкладки (более подробно о разложении см., например, [36, п. 6.25]), получим представление + Ї0& + I (Л ЗАе) + 72 (А? 4Л + Ше) ) + 0(?ГЗ/2) (3 15) От разложения (3.4) последнее выражение отличается лишь на величину Л, + 2 ф)л 24?ш2 Выпишем теперь аналог уравнения (3.12) для рандомизированного критерия. Здесь удобнее будет применить уравнение, использованное в [35] (уравнение немного изменено в целях использования в тер)ах статистики %): п= ( с0}пі1 - а) - viGijniP) \ ,3 1б, У Mi - M0 J Подставляя полученные разложения (3.15) для G n в (3.16), получаем уравнение для определения асимптотики НОВ, аналогичное (4) в [35]. Наконец, используя представление (3.13), получаем асимптотическое разложение 24а0 24ai) Аналогично работе [37] можно сформулировать следующее утверждение: Теорема 3.3. Пусть п - необходимый объем выборки рандомизированного критерия, п получено из формулы (3.17). Тогда существует такое число А , что для всех А = р\ — р0 А выполняется \п — п \ 1 Судя по численным результатам, границы, полученные здесь (с использованием теоремы 3.2 и теоремы 3.17), довольно грубо оценивают разницу с = с + г, г = — Ь (,) — (,). По всей видимости, п, соответствующее ТОН , убывает вместе с , но медленнее чем (). В численных расчетах для построения адекватной границы (, ) — (, ) было достаточно применить 0.5. Приведем таблицы, демонстрирующие эффект рандомизации в редукции ТОН и точность полученной в теореме 3.3 формулы.

Условия регулярности и некоторые леммы

Используя условие 8, можно применить лемму Андерсона (см. [26], лемма 10.2, с. 217), в силу которой F (I 0, 2 ( ) ) F(l /in(rf), a(d) ) (4.6) для всех d. Из (4.5) и (4.6) следует, что Р (Rsn(X) R (6n) - n rl2 ) -+ 1. (4.7) Условное распределение Р(-\5п) регулярно для измеримых оценок 5п параметрического пространства С 1 (см., например, [28], с.379). Поэтому из (4.7) следует, что Р (П5п(бп) Д ($„) - п-г 2 ) -+ 1. (4.8) Подставим оценку # в функцию !Zsn(-), и, комбинируя (4.4) и (4.8), получим, что Р (я „ fa) Щп (X) - п-г/2 ) -+ 1. Более того, найдется такая последовательность еп — 0, что Р (я „ (#») Щп (Or) - епгГг 2 ) -+ 1. Существование такой последовательности обосновывается тем, что для сходимости по вероятности к нулю некоторых величин Yn можно найти такую последовательность еп — 0, что Р(1 єп) — 0. Такая последовательность еп находится из выражений (4.4) и (4.5), из которых, собственно, и следует результат.

Поэтому, полагая єп = єпп т 2, мы получим требуемый результат. Ограничение на класс С(г) неприятно, однако само свойство д/п-состо-ятельности само по себе может восприниматься как оптимальное свойство. Например, оценки максимального правдоподобия и байесовская принадлежат классу С(оо) при довольно широких условиях (в частности, при условиях 1-8). Эта проблема, в сущности, заключается в том, что не доказано, что оценка с равномерно минимальным і-риском принадлежит классу С при сколько-нибудь широких условиях, что, однако, весьма вероятно. Тогда можно было бы сделать утверждение о том, что оценка#п является оценкой с асимптотически равномерно минимальным і-риском среди всех измеримых оценок параметра 9. Более того, можно было бы утверждать, что сама оценка максимального правдоподобия сходится к оценке с равномерно минимальным і-риском со скоростью пГ1 2.

В случае, когда G ограничено, можно сузить класс оценок, в котором вп оптимальна.

Теорема 4.2. Пусть выполнены условия 1-8 и пусть О ограничено. Тогда найдется последовательность еп = о(1), такая, что оценка максимального правдоподобия вп является оценкой с еп-асимптотически равномерно минимальным d-риском в классе оценок С.

По сути свойство 5п Є С(г) использовалось только при получении (4.5) с помощью леммы 4.2. Обозначим рп{в\К) функцию апостериорной плотности относительно меры Лебега. Для ограниченного G и любой оценки 5п для некоторого М имеем \6п — 9\г М, и RSn(X)-n-r/2F(l\,in(5n),o-2n(5n) ) Vn(Sn) (Т1(6Г. 8п + П П Дп( У vl($n) 8п + п п 6„ - в\ЧФ в / \5п-в\гр(в\Х)о1в- . гп в в М р(в\Х)-ір[0 в оів, где if — нормальная функция плотности. Последнее выражение согласно лемме 4.1 стремится к нулю по вероятности (стремление к нулю по вариации равно 122 сильно стремлению к нулю интеграла от модуля разности плотностей). Поэтому найдется такая последовательность п, что - 0. snW--r/2 ( \n(n),2n(n) ) Таким образом, получен аналог выражения (4.5), в котором скорость стремления к нулю равна не ( Г/ ), а (1). Повторяя рассуждения теоремы 4.1, можно получить Р [Кб» [n) Щп \п) - п) - 1, что и является утверждением теоремы.

По большому счету, разница в утверждениях теорем 4.1 и 4.2 заключается в доказуемой скорости сходимости апостериорного риска $п(Х) к нулю. Это не слишком правильно, поскольку в конечном счете необходимо сравнивать риски оценок, которые могут существенно отличаться от апостериорных. Отсюда и получается утверждение теоремы 4.2, которое, несмотря на то, что к рассмотрению принимаются оценки с «худшими» асимптотическими свойствами, значительно слабее утверждения теоремы 4.1.

Здесь также уместно сравнение с оценками с равномерно минимальным риском (минимизирующим Rjn() = Ео(,п)), которые существуют только в классе несмещенных оценок (или, обобщенно, оценок с одинаковым смещением). Однако в случае оценок с равномерно минимальным риском совершенно очевиден пример вырожденной оценки п = 0, для которой R (о) = 0, так что ограничение на класс оценок весьма естественно. Для случая d-риска такой пример пока неизвестен. Для двух различных вырожденных оценок вообще непонятно, как сравнивать их d-риски.