Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Разработка метода и алгоритмов рекуррентного построения распределений вероятностей конечных случайных множеств Лукьянова Наталья Александровна

Разработка метода и алгоритмов рекуррентного построения распределений вероятностей конечных случайных множеств
<
Разработка метода и алгоритмов рекуррентного построения распределений вероятностей конечных случайных множеств Разработка метода и алгоритмов рекуррентного построения распределений вероятностей конечных случайных множеств Разработка метода и алгоритмов рекуррентного построения распределений вероятностей конечных случайных множеств Разработка метода и алгоритмов рекуррентного построения распределений вероятностей конечных случайных множеств Разработка метода и алгоритмов рекуррентного построения распределений вероятностей конечных случайных множеств Разработка метода и алгоритмов рекуррентного построения распределений вероятностей конечных случайных множеств Разработка метода и алгоритмов рекуррентного построения распределений вероятностей конечных случайных множеств Разработка метода и алгоритмов рекуррентного построения распределений вероятностей конечных случайных множеств Разработка метода и алгоритмов рекуррентного построения распределений вероятностей конечных случайных множеств Разработка метода и алгоритмов рекуррентного построения распределений вероятностей конечных случайных множеств Разработка метода и алгоритмов рекуррентного построения распределений вероятностей конечных случайных множеств Разработка метода и алгоритмов рекуррентного построения распределений вероятностей конечных случайных множеств Разработка метода и алгоритмов рекуррентного построения распределений вероятностей конечных случайных множеств Разработка метода и алгоритмов рекуррентного построения распределений вероятностей конечных случайных множеств Разработка метода и алгоритмов рекуррентного построения распределений вероятностей конечных случайных множеств
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Лукьянова Наталья Александровна. Разработка метода и алгоритмов рекуррентного построения распределений вероятностей конечных случайных множеств: диссертация ... кандидата Физико-математических наук: 05.13.18 / Лукьянова Наталья Александровна;[Место защиты: ФГАОУВО Национальный исследовательский Томский государственный университет], 2017.- 147 с.

Содержание к диссертации

Введение

Глава 1. Конечные случайные множества и их распределения 17

1.1 Конечные случайные множества и способы их представления 18

1.1.1 Функции множества 20

1.1.2 Распределения вероятностей конечного случайного множества 21

1.1.3 Распределения вероятностей конечного случайного множества, заданного на подмножестве носителя 27

1.2 Достаточные условия существования распределений вероятностей конечных случайных множеств 29

1.3 Уточнение границ Фреше для распределений вероятностей конечного случайного множества 35

1.3.1 Распределение вероятностей П-го рода 35

1.3.2 Распределение вероятностей V-ro рода 41

1.4 Выводы по первой главе 44

Глава 2. Метод рекуррентного построения распределений вероятностей конечных случайных множеств на основе ассоциативных функций 46

2.1 Ассоциативные функции 47

2.2 Построение функций множества на основе ассоциативных функций 50

2.3 Построение распределений вероятностей П-го рода на основе ассоциативных функций

2.3.1 Ассоциативная функция AF(a, Ь) = а Ь 55

2.3.2 Ассоциативная функция AF(a, Ь) = min{a, b} 56

2.3.3 Ассоциативная функция AF(a, Ь) = тах{а + Ъ — 1,0} 59

2.3.4 Ассоциативная функция AF(a,b) = a b 64

a+b-ab

2.3.5 Однопараметрическое семейство функций Франка 69

2.4 Построение распределений вероятностей V-го рода на основе двойственных ассоциативных функций 79

2.5 Выводы по второй главе 90

Глава 3. Численные методы и комплекс программ для исследования распределений конечных случайных множеств 91

3.1 Алгоритмы рекуррентного построения распределений на основе ассоциативных функций 91

3.1.1 Общий алгоритм реализации рекуррентного метода с произвольной ассоциативной функцией 92

3.1.2 Модификации общего алгоритма для конкретных ассоциативных функций 95

3.1.3 Анализ алгоритмов

3.2 Описание комплекса программ 101

3.3 Численная аппроксимация эмпирических распределений теоретическими распределениями при исследовании лекарственной устойчивости y больных туберкулёзом 105

3.4 Выводы по третьей главе 111

Заключение 112

Список литературы 113

Приложение А Демонстрационные примеры 131

Приложение Б Структура и основные функции комплекса программ 142

Список таблиц 145

Список иллюстраций 146

Список условных обозначений

Введение к работе

Актуальность и степень разработанности темы исследования. В многомерном анализе данных актуальны задачи моделирования случайных объектов произвольной природы. Такие задачи возникают во многих практических областях, например, в медицине – при прогнозировании осложнений, возможных у пациента по множеству диагностических симптомов; в экономике – для исследования потребительского спроса и т.п. Изложение вероятностных и статистических результатов этих задач можно вести на языке конечных случайных множеств. Под конечным случайным множеством понимается случайный элемент со значениями из совокупности всех подмножеств некоторого конечного множества M. При этом множество M называется носителем конечного случайного множества. Носителем может быть конечное множество объектов числовой или нечисловой природы. Основной объект диссертационного исследования — конечные случайные множества с носителем в виде множества случайных событий. Конечные случайные множества с такими носителями можно рассматривать в качестве математической модели сложных объектов и систем, когда число описываемых их признаков конечно и появление любого из этих признаков представляется как случайное событие. Например, в анализе лекарственной устойчивости при лечении туберкулеза в роли моделируемого объекта выступает больной с конечным множеством лекарственных препаратов, используемых при его лечении. Если число признаков равно N, то возможное число различных состояний объекта равно 2N. Если каждому из этих состояний соответствует некоторая вероятность появления, то набор всех 2N вероятностей задает при определенных условиях распределение конечного случайного множества.

На начальной стадии статистических исследований одной из важных задач является представление результатов наблюдений в виде, наиболее удобном для обработки, хранения и принятия решения. Если в условиях конкретной задачи можно исходить из предположения о том, что данная выборка имеет распределение вероятностей по какому-либо закону с известными N маргинальными вероятностями событий, то в таком случае можно перейти от хранения массива с 2N значениями к хранению N значений маргинальных вероятностей и закону распределения конечного случайного множества. Помимо удобства в хранении это позволит избавиться от необходимости повторных исследований; получить альтернативную выборку, ее можно будет сгенерировать по имеющемуся закону распределения; упростить получение вероятностных характеристик случайного множества.

Многие актуальные проблемы формулируются в терминах теории случайных множеств, и многие методы решения, развиваемые в рамках этой теории, оказываются вполне пригодными для использования.

Исследования случайных множеств начинаются с классических работ G. Choquet,D. G. Kendall и G. Matheron. В работах этих авторов понятие случайного множества определяется различными способами в зависимости от используемого носителя и соответствующей ему структуре множества значений: замкнутое, открытое, непустое компактное, выпуклое случайное множество и другие. Случайные множества с различными типами носителей изучены в работах И. Молчанова, H. T. Nguyen, О. Ю. Воробьева, А. И. Орлова, D. Stoyan, J. Serra, L. Santalo, Р. В. Амбарцумяна, P. Diggle и другие.

Основные теоретические результаты исследования конечных случайных множеств с носителем в виде множества случайных событий принадлежат О. Ю. Воробьеву (1976–2016 гг.). В рамках разработанного им случайно-множественного подхода в работах A. A. Новоселова, Э. Н. Валендик, И. В. Барановой, А. О. Воробьева, Е. Е. Голденок, Т. В. Куприяновой, Е. Г. Тягловой, А. Ю. Фомина, К. А. Белова, Д. В. Семеновой были поставлены и решены многие прикладные задачи различного характера: социально-экономические (анализ потребительского спроса, портфельный анализ, банковский скоринг, анализ финансовых рисков), экологические и медицинские (прогнозирование распространения лесных пожаров, анализ уровня заболеваемости в зависимости от районов проживания).

На сегодняшний день основной проблемой, ограничивающей практическое применение случайно-множественного подхода, является проблема размерности. В общем случае количество параметров, задающих распределения вероятностей конечного случайного множества, зависит от мощности носителя. Увеличение количества признаков в носителе влечет экспоненциальный рост размерности распределения. Тем не менее современные приложения требуют повышения мощности носителя и увеличения объема выборки данных для построения статистической оценки параметров распределения. Однако эти факторы значительно увеличивают время формирования и исследования этих распределений. Техническая сложность хранения и работы со всеми 2N вероятностями распределения конечного случайного множества является одной из самых острых проблем. Подходы к решению проблемы снижения числа параметров, необходимых для описания распределений вероятностей конечных случайных множеств, на сегодняшний день представлены лишь отдельными работами с использованием среднемерного и энтропийных методов построения распределений вероятностей конечных случайных множеств для ряда конкретных экономических приложений. Проблема размерности по-прежнему остается актуальной научной задачей и требует новых подходов и методов для ее решения. При случайно-множественном моделировании сложных объектов и систем востребованы процедуры построения конечных случайных множеств с заданными законами распределения. К настоящему времени уже из-

вестны и используются на практике порядка двадцати распределений вероятностей конечных случайных множеств. Однако расширение области применения случайно-множественного моделирования требует увеличения спектра законов распределений. Решению этих проблем посвящено настоящее диссертационное исследование.

Цели и задачи исследования. Целью исследования является разработка метода и алгоритмов рекуррентного построения распределений вероятностей конечных случайных множеств.

Для достижения цели были поставлены и решены следующие задачи.

  1. Выявить достаточные условия существования распределений вероятностей II-го и V-го рода конечных случайных множеств.

  2. Исследовать известные семейства ассоциативных функций и разработать метод рекуррентного построения распределений вероятностей конечных случайных множеств на основе ассоциативных функций.

  3. Разработать алгоритмы реализации метода рекуррентного построения распределений вероятностей конечных случайных множеств на основе ассоциативных функций и выполнить анализ их эффективности.

  4. Создать комплекс проблемно-ориентированных программ, реализующий алгоритмы рекуррентного построения распределений вероятностей конечных случайных множеств на основе ассоциативных функций, позволяющий моделировать и исследовать распределения вероятностей конечных случайных множеств, выполнять вычислительные эксперименты.

Научная новизна результатов, представленных в диссертации.

  1. Разработан новый метод представления распределений вероятностей конечных случайных множеств на основе ассоциативных функций. Данный метод осуществляет рекуррентное построение распределений вероятностей через меньшее число параметров. По сравнению с известными среднемерным и энтропийными методами предложенный метод позволяет получать набор распределений вероятностей конечных случайных множеств, структура зависимостей событий которых описывается только параметром используемой ассоциативной функции. Предложенный метод позволяет получать новые классы распределений вероятностей конечных случайных множеств.

  2. Впервые доказаны достаточные условия существования распределений вероятностей II-го и V-го рода конечных случайных множеств. Эти условия служат обоснованием области применимости метода рекуррентного построения распределений вероятностей конечных случайных множеств.

  3. Модифицированы известные границы Фреше для вероятностей пересечений и объединений случайных событий, уточняющие необходимые и достаточные условия существования распределений вероятностей II-го и V-го рода конечного случайного множества.

4. Разработан алгоритм рекуррентного построения распределений вероятностей конечных случайных множеств для произвольной ассоциативной функции и его модификации для четырех конкретных ассоциативных функций, реализованные в виде комплекса проблемно-ориентированных программ и позволяющие проводить предобработку данных для реальных прикладных задач и вычислительных экспериментов.

Соответствие паспорту специальности. Диссертационная работа соответствует области исследования специальности 05.13.18 — Математическое моделирование, численные методы и комплексы программ по п.1 «Разработка новых математических методов моделирования объектов и явлений» (пункт 1 научной новизны), п.2 «Развитие качественных и приближенных аналитических методов исследования математических моделей» (пункты 1–3 научной новизны), п.4 «Реализация эффективных численных методов и алгоритмов в виде комплексов проблемно-ориентированных программ для проведения вычислительного эксперимента» (пункты 3–4 научной новизны).

Положения и результаты, выносимые на защиту.

  1. Метод рекуррентного построения распределений вероятностей конечных случайных множеств на основе ассоциативных функций и обоснование области его применимости.

  2. Достаточные условия существования распределений вероятностей II-го и V-го рода и уточненные границы Фреше.

  3. Алгоритм рекуррентного построения распределений вероятностей конечных случайных множеств для произвольной ассоциативной функции и его модификации для четырех конкретных ассоциативных функций.

  4. Комплекс проблемно-ориентированных программ для моделирования и исследования распределений конечных случайных множеств.

Методы исследования. Для решения поставленных задач и доказательства сформулированных утверждений применены методы математического моделирования, теории вероятностей и математической статистики, теории случайных множеств и ассоциативных функций.

Ассоциативные функции хорошо известны и используются в теориях неопределенности, таких как нечеткая логика, теория копул и другие. В работе ассоциативные функции впервые применены для построения распределений вероятностей конечных случайных множеств.

Теоретическая значимость работы. Работа носит преимущественно теоретический характер. Предложенный метод рекуррентного построения распределений вероятностей конечных случайных множеств на основе ассоциативных функций позволяет определить аналитический вид и условия существования для ряда распределений вероятностей конечных случайных множеств. Полученные теоретические результаты могут быть использованы для

дальнейшего расширения и изучения новых распределений вероятностей конечных случайных множеств. Работа имеет важное значение для развития теории случайных множеств.

Практическая значимость работы. Предложенный метод позволяет проводить предобработку входных данных в виде распределений вероятностей конечных случайных множеств и их характеристик для моделирования реальных медицинских и экономических систем. Разработанный комплекс алгоритмов и программ может быть использован в научных исследованиях для изучения свойств конечных случайных множеств, а также в учебном процессе при изучении методов построения стохастических моделей с помощью конечных случайных множеств.

Достоверность полученных результатов. Достоверность теоретических результатов диссертационной работы подтверждается строгими математическими доказательствами. Предложенный в диссертации метод рекуррентного построения распределений вероятностей конечных случайных множеств на основе ассоциативных функций теоретически обоснован. Данный метод позволил получить ранее известные распределения конечных случайных множеств с независимо-точечной, вложенной и непересекающейся структурой зависимостей событий, а также и новые классы распределений вероятностей конечных случайных множеств на основе однопараметрических семейств ассоциативных функций Франка, Али-Михаэля-Хака, Гумбеля, Клейтона, Джо.

Использование результатов диссертации. Результаты диссертации применяются в учебном процессе Сибирского федерального университета для подготовки бакалавров и магистров по направлениям «Прикладная математика и информатика», «Математика. Компьютерные науки», а также Красноярского государственного медицинского университета им. проф. В.Ф.Войно-Ясенецкого для подготовки специалистов направления «Медицинская кибернетика». Имеются акты об использовании.

Личное участие автора в получении результатов, изложенных в диссертации. Автор лично участвовал в получении всех результатов, изложенных в работе, а именно в разработке и исследовании метода рекуррентного построения распределений вероятностей конечных случайных множеств на основе ассоциативных функций, выводе всех формул, доказательстве всех представленных в диссертации теорем, разработке алгоритмов и представленного комплекса проблемно-ориентированных программ.

Апробация работы. Основные положения работы и отдельные ее вопросы докладывались и обсуждались на следующих конференциях и семинарах международного и всероссийского уровня: III IASTED International Conference on Automation, Control, and Information Technology (ACIT 2010), г. Новосибирск, 15–18 июня 2010 г.; II, IV International Conference «Problems of Cybernetics

and Informatics», г Баку, 2010, 2012 гг.; Международная конференция «Теория вероятностей и ее приложения», посвященная 100-летию со дня рождения Б.В. Гнеденко, г. Москва, 26–30 июня 2012 г.; IX–X Российские конференции с международным участием «Новые информационные технологии в исследовании сложных структур», пос. Катунь Алтайского края, 2012, 2014 гг.; IV Congress of the Turkic World Mathematical Society, г. Баку, 1–3 июля 2011 г.; XIV Applied Stochastic Models and Data Analysis International Conference (ASMDA 2011), г. Рим, 7–10 июня 2011 г.; Республиканская научно-практическая конференция «Статистика и ее применения», г. Ташкент, 2012, 2015 гг.; 12-ая Международная научная школа «Моделирование и Анализ Безопасности и Риска в сложных системах» (МАБР–2014), г. Санкт-Петербург, 18–20 ноября 2014 г.; XIII–XIV Международные конференции имени А.Ф. Терпугова «Информационные технологии и математическое моделирование» (ИТММ– 2014, 2016), г. Анжеро-Судженск, 20–22 ноября 2014 г.; пос. Катунь, 12–16 сентября 2016 г.; VI Международная конференция «Проблемы оптимизации и экономические приложения», г. Омск, 28 июня – 4 июля 2015 г.; IX–XIV Международные конференции по финансово-актуарной математике, г. Красноярск, 2010–2015 гг.; V Международная конференция «Актуальные проблемы прикладной математики и информационных технологий – Аль-Хорезми 2016», г. Бухара, 9–10 ноября 2016 г.

Публикации. По тематике диссертации опубликовано 20 работ, из них 5 статей в журналах, включенных в Перечень рецензируемых научных изданий, в которых должны быть опубликованы основные научные результаты диссертаций на соискание ученой степени кандидата наук, на соискание ученой степени доктора наук (в том числе 1 статья в российском научном журнале, индексируемом Scopus), 3 статьи в изданиях, индексируемых Web of Science и Scopus, 1 свидетельство о регистрации электронного ресурса, 1 статья в научном журнале, 10 публикаций в сборниках материалов международных и всероссийских научных и научно-практических конференций (из них 1 сборник материалов зарубежной конференции).

Структура и объем диссертации. Диссертация состоит из введения, трех глав, заключения, списка литературы, двух приложений, списка таблиц, списка иллюстраций и списка условных обозначений. Общий объем диссертации составляет 147 страниц, включая приложения; иллюстративный материал представлен 12 рисунками (из них 4 в приложениях) и 9 таблицами; список литературы содержит 157 наименований.

Достаточные условия существования распределений вероятностей конечных случайных множеств

В многомерном анализе данных актуальны задачи моделирования случайных объектов нечисловой природы. Такие задачи возникают в медицине — при прогнозировании осложнений, возможных у пациента по множеству диагностических симптомов; в экономике — для исследования потребительского спроса; в пожарной безопасности — для описания процесса случайного распространения лесного пожара и т.п. Одним из возможных подходов к решению этих задач является использование аппарата случайных множеств. Случайные множества с различными типами носителей ранее исследовались в работах И. Молчанова [122], H. T. Nguyen [125], А. И. Орлова [62], О. Ю. Воробьева [17–19, 21], D. Stoyan [146–148] и другие.

Данная глава посвящена конечным случайным множествам, носителями которых выступают множества случайных событий. Конечные случайные множества с таким носителем можно рассматривать в качестве математической модели сложных объектов и систем, когда число описываемых их признаков конечно и появление любого из этих признаков представляется как случайное событие. Например, в анализе лекарственной устойчивости при лечении туберкулеза в роли моделируемого объекта выступает больной с конечным множеством лекарственных препаратов, используемых при его лечении. Если число признаков равно N, то возможное число различных состояний объекта равно 2N. Если каждому из этих состояний соответствует некоторая вероятность появления, то набор всех 2N вероятностей задает при определенных условиях распределение конечного случайного множества.

В параграфе 1.1 приведены основные определения и утверждения, касающиеся конечных случайных множеств. Сформулированы и доказаны леммы для трех типов распределений вероятностей конечного случайного множества (далее распределения I-го, II-го и V-го рода). Введено определение распределения вероятностей конечного случайного множества, заданного на подмножестве носителя.

В параграфе 1.2 доказаны теоремы о достаточных условиях существования распределений вероятностей II-го и V-го рода конечного случайного множества, которые дополняют ранее доказанные в работах [14,21] необходимые условия существования этих распределений.

В параграфе 1.3 получены модифицированные границы Фреше для вероятностей пересечений и объединений событий, которые уточняют необходимые и достаточные условия существования распределений вероятностей II-го и V-го рода конечных случайных множеств.

Наряду со случайными величинами в теории вероятностей и ее приложениях рассматривают случайные объекты произвольной природы, например, случайные точки, векторы, функции, процессы, множества, меры и т.д. Для описания такого типа объектов используется понятие случайного элемента [80].

Определение 1.1. Пусть (Г2, J7, Р) — вероятностное пространство, а (U, А) — измеримое пространство, где U — произвольное множество, а А — некоторая сг-алгебра его подмножеств. Будем говорить, что функция К = К(ш), определенная на Q и принимающая значения в U, есть /Л–измеримая функция, или случайный элемент (со значениями в U), если для любого А є А верно {си : К(си) Є А] Є J-.

Если рассмотреть некоторое пространство (U,A), элементами которого являются множества, тогда измеримое отображение К семейства элементарных исходов произвольного вероятностного пространства (Г2, J7, Р) в (U,A) называют случайным множеством [57,125]. Существуют различные уточнения понятия случайное множество в зависимости от структуры множества значений. Наиболее распространенными являются замкнутые случайные множества, открытые случайные множества, случайное непустое компактное множество, случайное выпуклое множество и другие [11]. В случае, когда U — конечное множество, можно ограничиться понятием алгебры подмножеств 2и.

Пусть (U, Л) = (2M,22M. Тогда измеримая функция К : П -+ 2м, отображающая вероятностное пространство в пространство подмножеств некоторого конечного множества М, называется конечным случайным множеством [11]. Множество М называется носителем случайного множества К [122,123].

В диссертации исследуются специфические случайные множества, носителем которых выступают конечные множества случайных событий X с 7, выбранных из алгебры Т вероятностного пространства (Г2, J7, Р), Х оо. Случайный элемент, значения которого являются подмножествами конечного множества X, т.е. элементами 2х, будем называть конечным случайным множеством, заданным на множестве случайных событий X.

Определение 1.2. Случайное множество К, заданное на конечном множестве случайных событий Хс7 определяется как отображение К : П -+ 2х, измеримое относительно пары алгебр (J7, 22 ] в том смысле, что для всякого X є 22 справедливо К 1(Х) є Т.

Выражение К (ш) = {х Є X : ш Є х} может быть истолковано, как «случайное множество наступивших событий», поскольку элементарному исходу эксперимента ш Є Q ставится в соответствие некоторое подмножество событий X С X, которое содержит все те события, которые наступили в данном испытании.

Измеримое событие {ш : К(ш) = X, X С X} Є J7, которое заключается в том, что случайное множество К принимает одно из своих возможных значений X С X, означает, что наступившие случайные события из X образуют подмножество X С X, а ненаступившие — подмножество Xе = X \ X : ГIжГ1 Г1 х хеХ хеХс {и : K{UJ) = X, X С X} = Г j х Г j Г j хс С Q. Множество всех таких событий, порожденных множеством событий X, образует разбиение пространства элементарных событий Q = Y1 {Кх = X}. хсх Далее используется обозначение {ш : К(ш) = X, X С X} = {К% = X}, где запись Кх означает, что рассматривается конечное случайное множество К, заданное на носителе X.

Понятие функции множества, как функции, сопоставляющей каждому множеству из некоторого класса множеств определённое число, имеет фундаментальное использование во многих областях дискретной математики, например, в теории кооперативных игр [128], комбинаторной оптимизации [97], теории принятия решений [104], компьютерных науках [153], в области исследования операций [107] в форме псевдобулевых функций, а также в теории конечных случайных множеств [14,19-21].

Определение 1.3. Функция множества /(X), X є 2х, определенная на множестве всех подмножеств некоторого произвольного конечного множества X есть отображение / : 2х -+ R со значениями на числовой оси К.

Определение 1.4. Функция множества /, определенная на 2х некоторого произвольного конечного множестве X, называется - аддитивной, если /(X U Y) + f(X П Y) = f(X) + f(Y), V X, Y С X; - субаддитивной, если f(X U Y) + f(X П Y) f(X) + f(Y), V X, У С X; - супераддитивной, если /(X U Y) + /(X ПУ) /(X) + f(Y), V X, У С X. Докажем вспомогательную лемму, которая потребуется в дальнейшем при рассмотрении аддитивных свойств распределений вероятностей конечных случайных множеств.

Распределение вероятностей V-ro рода

На сегодняшний день сдерживающим фактором применения случайно-множественного моделирования объектов нечисловой природы является ограниченный спектр выявленных законов распределений вероятностей конечных случайных множеств и проблема размерности этих распределений. В общем случае количество параметров, задающих распределения вероятностей конечного случайного множества, зависит от мощности носителя. Современные приложения требуют повышения мощности носителя и увеличения объема выборки данных для построения статистической оценки параметров распределения. Однако эти факторы значительно увеличивают время формирования и исследования этих распределений. Так, при мощности носителя N приходится оперировать 2N вероятностями событий. В этом суть проблемы размерности.

Проблема размерности может быть решена путем уменьшения числа параметров, необходимых для описания законов распределения вероятностей конечных случайных множеств. Для решения этой проблемы в работах А. О. Воробьева [16], О. Ю. Воробьева [18,28,151,152], Д. В. Семеновой [116,135], E. E. Голденок [30, 100] использованы энтропийные и среднемерные методы построения распределений вероятностей конечных случайных множеств. Кроме уменьшения числа параметров данные методы позволили выделить некоторые классы распределений вероятностей конечных случайных множеств для ряда конкретных экономических приложений. К этим классам относятся кусочно-независимые, m-зависимые, слойно-равномерные, равномощно-равномерные распределения ве 47 роятностей и другие. Расширение области применения случайно-множественного моделирования требует увеличения спектра законов распределений вероятностей конечных случайных множеств.

Во второй главе предлагается метод рекуррентного построения распределений вероятностей конечных случайных множеств на основе ассоциативных функций. Данный метод сокращает число параметров и порождает новые классы распределений вероятностей конечных случайных множеств.

В параграфе 2.1 даются предварительные сведения из теории ассоциативных функций и обосновывается применение понятия ассоциативной функции к распределению вероятностей конечного случайного множества.

Предложенный метод решает проблему размерности, однако порождает другую проблему: построенные с помощью данного метода функции множества могут не являться распределением вероятностей; для каждого рассматриваемого семейства ассоциативных функций возникает необходимость исследования области применимости метода. Параграф 2.3 посвящен решению этой проблемы. Кроме того, в параграфе 2.3 с помощью предложенного метода получены ранее известные законы распределений вероятностей (законы с независимо-точечной, вложенной и непересекающейся структурой зависимостей событий), а также выявлены новые классы распределений вероятностей конечных случайных множеств. Для каждого из построенных распределений вероятностей найдены характеристики конечного случайного множества: следствия 2.3, 2.4, 2.6 –2.8.

В параграфе 2.4 метод рекуррентного построения распределений вероятностей конечных случайных множеств распространен на двойственные ассоциативные функции.

В современных теориях неопределенности широкое распространение получили классы ассоциативных функций (S. Alsina, M. Frank и B. Schveizer [83]; M. Frank [95]), в частности, треугольные нормы (E.P. Klement [111,113], K. Men-ger [121]) и копулы (R.B. Nelsen [124], B. Schveizer и A. Sclar [134]).

Приведем определение ассоциативной функции, используемое в работе. Определение 2.1. Ассоциативная функция (AF- Associative Function) определяется как двуместная функция AF : [О, I]2 — [0,1], удовлетворяющая следующим свойствам. A1. Граничные условия: AF(a,0) = AF(0,a) = 0, AF(a,l) = AF(l,a) = а, V 2 Є [0, 1]. A2. Монотонность: Vai, а 2, &і, &2 Є [0,1] таких, что а\ а 2, Ъ\ Ь справедливо AF(ai, Ъ\) AF( 22, 2)-A3. Коммутативность: AF(a, Ь) = AF(&, a), Va, Ъ Є [0,1]. A4. Ассоциативность: AF(AF(a, 6), с) = AF(a, AF(&, с)), Va, 6, с Є [0,1]. A5. Условие Липшиц-непрерывности: AF(c, Ъ) — AF(a, Ь) с — а,а с а Ь с Є [0,1].

Геометрически график ассоциативной функции - это поверхность (рис. 2.1), которая «натянута» на четырехугольник с вершинами (0,0,0), (0,1,0), (1,0,0) и (1,1,1). На рис. 2.1 стороны четырехугольника выделены жирными линиями и соответствуют граничным условиям A1. Согласно свойству A2 ассоциативная функция возрастает по вертикали и по горизонтали [83,124], а по свойству A3 симметрична относительно плоскости а = Ь. Свойства A1 — A3, A5 гарантируют, что значение функции AF(a, Ъ) будет обладать свойствами вероятности. Свойство A4 позволяет рекуррентно перейти к n-местной функции.

Заметим, что свойства ассоциативной функции A1 - A4 соответствуют свойствам треугольной нормы (-нормы). Понятие -нормы введено и используется в теории вероятностных метрических пространств [121,134]. В настоящее время -нормы получили широкое применение в нечеткой логике в качестве операции конъюнкции. Они представляют интерес, потому что сохраняют основные свойства связки «и», которые выполняются одновременно, а именно: коммутативность, монотонность, ассоциативность и ограниченность и, таким образом, они служат естественным обобщением классической конъюнкции для многозначных (1, 1,1) (0,1,1) (0, 0,1) (0,1, 0) b щ (1, 0,1) (1, 0, 0) (0,0, 0) График произвольной ассоциативной функции систем рассуждений [83,111,113]. Классом бинарных операций, которые связаны с t-нормами, являются копулы [124], введенные А. Скляром в 1959 г. Модели на основе копул чрезвычайно значимы для моделирования многомерных наблюдений в эконометрике. Модели с использованием копул определяют функцию совместного распределения случайных величин в виде двух частей, что позволяет отдельно рассматривать одномерные маргинальные распределения и функцию, отвечающую за их зависимость [124]. В нашем случае использование копул позволяет представить вероятность пересечения множества событий через вероятности событий и функцию AF, отражающую их взаимосвязь. Некоторые семейства t-норм известны как семейства копул под различными именами. В [83] доказано, что A5 дает условия, при которых t-норма является копулой. С другой стороны [83], любая коммутативная и ассоциативная копула является t-нормой. Известно [83, 113, 124], что любая копула удовлетворяет границам Фреше–Хевдинга, которые, как следствие, справедливы и для ассоциативных функций (рис. 2.2).

Таким образом, с учетом [83,113,124] и выше изложенного, определение можно выразить так: ассоциативная функция — непрерывная t-норма, удовлетворяющая условию Липшица, или, что тоже самое, ассоциативная и коммутативная копула. Именно такая трактовка понятия ассоциативной функции используется ниже в данной работе.

Ассоциативная функция AF(a, Ь) = min{a, b}

Следовательно, функция множества f(X), значения которой определяются методом рекуррентного построения с ассоциативной функцией Франка, будет распределением вероятностей II-го рода конечного случайного множества при выполнении системы из (2N — N — і) неравенств (2.41). Теорема доказана. о

Теорема 2.5 дает инструмент для построения конечных случайных множеств Кх с заранее заданной структурой зависимостей. Из теоремы 2.5 следует, что выполнение системы неравенств (2.41) зависит от выбора значения параметра а. Рассмотрим предельные случаи при а — 0і и а — ±оо.

Теорема 2.6 (Предельные случаи для функции Франка). Пусть XcJ конечное множество случайных событий, выбранных из алгебры Т вероятностного пространства (f2,F, Р). И пусть конечное случайное множество Кх определяется распределением вероятностей II-го рода, построенным ассоциативной функцией Франка рх = Frank (рх, х Є X; а), X С X. Тогда распределение {рх, X С X} 1. при а 0± стремится к распределению вероятностей II-го рода незави симо-точечного случайного множества: lim Frank(px, х Є X: а) = II рх: хєХ 2. при а +ос стремится к распределению вероятностей II-го рода случай ного множества вложенных событий: lim Frank(px, х Є X] а) = тіпрх] а- +оо хєХ 3. при а -ос стремится к распределению вероятностей II-го рода конеч ного случайного множества, которое определяется ассоциативной функ цией (2.14): / Рх — \х\ + 1,0 хеХ lim Frank(px, х Є X; а) = max рх — \Х\ + 1, 0 , \Х\ 1. а— —оо Доказательство. 1. Рассмотрим распределение вероятностей конечного случайного множества Кх, построенное ассоциативной функцией Франка (2.34) при а -+ 0і Для

Следовательно, при a -+ 0і распределение вероятностей, построенное ассоциативной функцией Франка (2.34), стремится к распределению вероятностей независимо-точечного случайного множества, определяемому ассоциативной функцией (2.7). 2. Рассмотрим распределение вероятностей конечного случайного множества, построенное ассоциативной функцией Франка (2.34) при а -+ +оо. Для начала выделим pt = minpx, lim In I 1 + -, 4V, minpx QJ— +QQ py \ (p — a 1 \ A — 1 / — xGX Итак, при a — +oo распределение вероятностей, построенное ассоциативной функцией Франка (2.34) стремится к распределению, построенному ассоциативной функцией (2.10), которое определяет случайное множество вложенных событий. 3. Рассмотрим распределение вероятностей конечного случайного множества, построенное ассоциативной функцией Франка (2.34) при а -+ -ос. Для Р(х Г\у) = Frank(px,py] а), где X = {ж, у}, X С X, получаем:

Итак, при a — oo распределение вероятностей II-го рода, построенное ассоциативной функцией Франка (2.34) стремится к распределению II-го рода, построенному ассоциативной функции (2.14). Было показано в теореме 2.3, что такое распределение вероятностей конечного случайного множества возможно только при выполнении определенных ограничений на вероятности самих событий. При этом возникают только три вида результирующих конечных случайных множеств с соответствующими распределениями II-го рода (следствие 2.5). Теорема доказана. о

Для построенного распределения вероятностей II-го рода конечного случайного множества найдем арные ковариации множества событий.

Следствие 2.8. Для конечного случайного множества Кх с распределением вероятностей II-го рода, определяемым ассоциативной функцией Франка, все арные ковариции Kovx, X С X, \Х\ 1, имеют вид

В примере А.7 приложения 1 продемонстрированы распределения вероятностей конечного случайного множества, построенные ассоциативной функцией Франка.

Построение распределений вероятностей V-го рода на основе двойственных ассоциативных функций

Спектр рассматриваемых ассоциативных функций может быть расширен за счет двойственных ассоциативных функций [83,124]. Ассоциативные функции по объединению

Определение 2.3. Ассоциативная функция по объединению (или ассоциативное объединение, AU - Associative Union) определяется как двуместная функция AU : [0,1]2 — [0,1], удовлетворяющая следующим свойствам. B1 Граничные условия: AU(a,0) = AU(0,a) = a, AU(a, 1) = AU(l,a) = 1 V 2 є [0,1]. B2 Монотонность: Vai, a i, &i, &2 Є [0,1] таких что a\ a i, b\ 62 справедливо AU(ai, b\) AU(a2, 2) B3 Коммутативность: AU(a, 6) = AU(6, a), Va, 6 Є [0,1]. B4 Ассоциативность: AU(AU(a, b),c) = AU(a, AU(6, c)), Va, 6, с є [0,1]. B5 Условие Липшиц-непрерывности: AU(c, 6) — AU(a, 6) с — a, a с, a b c Є [0,1]. Геометрически график ассоциативной функции по объединению - это поверхность (рис. 2.3), которая «натянута» на четырехугольник с вершинами (0,0,0), (1,0,1), (0,1,1) и (1,1,1). Согласно свойству B2 ассоциативная функция возрастает по вертикали и по горизонтали [83,124], а по свойству B3 симметрична относительно плоскости а = Ь. Свойства B1 — B3, B5 гарантируют, что значение функции AU(a, b) будет обладать свойствами вероятности. Свойство B4 позволяет рекуррентно перейти к n-местной функции.

Численная аппроксимация эмпирических распределений теоретическими распределениями при исследовании лекарственной устойчивости y больных туберкулёзом

Данный модуль предназначен для численной аппроксимации эмпирических распределений конечных случайных множеств теоретическими распределениями, построенными с помощью ассоциативных функций. Процесс аппроксимации выполняется поэтапно. 1. Выбор теоретического распределения конечного случайного множества. 2. Оценка параметра теоретического распределения. На первом этапе выбор осуществляется среди теоретических распределений, полученных методом рекуррентного построения распределения вероятностей конечных случайных множеств однопараметрическими ассоциативными функциями: (2.34), (3.7), (3.8), (3.9), (3.10). Тем самым параметр теоретического распределения определяется единственным параметром соответствующей ассоциативной функции. Предполагается, что вероятности событий рх, х Є X для теоретического и эмпирического распределений совпадают.

На втором этапе для оценки параметра теоретического распределения используются традиционные для математической статистики меры близости распреде 104 лений [6,33,66,67]. Оценка параметра теоретического распределения осуществляется путем минимизации расстояния между теоретическим (р) и эмпирическим (q) распределениями.

Пусть р(а) = {р(Х;а), X С X, а Є Ботдр} — теоретическое распределение 1-го рода, полученное методом рекуррентного построения с использованием одной из ассоциативных функций (2.34), (3.7), (3.8), (3.9), (3.10); DomAF -область определения параметра а для используемой ассоциативной функции; q = {q (X) ДСX}- эмпирическое распределение I-го рода. Обозначим через D (р(ск), q) расстояние между распределениями.

В качестве оценки параметра а распределения р(а) выбирается значение а , определяемое из соотношения а = arg min D(p(a),q). (3.11) аєБотдр В модуле DISTRIBUTION FITTING OF FINITE RANDOM SETS предусмотрена возможность использования одного из следующих типов расстояний [?, , 152]: - расстояние Кульбака-Лейблера DKL{V{(1)I Ч) = / q(X)ln; (3.12) хсX l v - -расстояние Пирсона т- (р {X) ot) — q (X))2 D/v(p(m, q) = ; (3.13) - вероятностная симметрическая %2-мера 7- (P (X , a) — q (X))2 Dx2{p(a), q) = ,г ; (3.14) \p [X: a) — q [X)\ xcX u v d v - расстояние Евклида между двумя точками в 2w-мерном пространстве: I ДЕ(Р(О:), q) = У (р (X; а) — q (X))2. (3.15) хсX Выбор того или иного типа расстояния в каждом конкретном случае осуществляется в зависимости от особенностей решаемой задачи случайно-множественного моделирования статистических систем.

Модуль Simulation of Finite Random Sets Модуль SIMULATION OF FINITE RANDOM SETS носит вспомогательный характер и предназначен для моделирования выборки значений конечного случайного множества с заданным распределением и для проведения серии вычислительных экспериментов.

В данном параграфе метод рекуррентного построения распределений вероятностей конечных случайных множеств на основе ассоциативных функций, алгоритмы и программы, описанные выше в главах 2-3, применены для исследования лекарственной устойчивости у больных туберкулёзом.

Для исследования использовалась база данных, полученная в процессе обработки историй болезни пациентов Красноярских краевых противотуберкулёзных диспансеров №1 и №2 за 2007-2011 гг. (4126 чел.). База данных сформирована экспертами и включает в себя результаты ретроспективного анализа первичной медицинской документации впервые выявленных больных туберкулезом с лекарственной устойчивостью. По запросам экспертов были отобраны пациенты без гендерного различия, возраст старше 18 лет, статус «болен», работающие, проживающие в городе, с формами заболевания: диссеминированный туберкулез, инфильтративная форма, казеозная пневмония, очаговый туберкулез, тубер-кулема (1452 чел.).

Задача исследования лекарственной устойчивости является актуальной в связи с тем, что в последние годы установлено увеличение числа больных туберкулезом легких, что в значительной мере связано с устойчивостью возбудителя к противотуберкулезным препаратам. Известны подходы решения этой задачи с применением методов многомерной математической статистики и интеллектуального анализа данных [59,60]. Все они направлены на выявление скрытых закономерностей в данных и принятия решений с учетом оценки рисков. Однако

применение этих методов на практике осложняется проблемой хранения и обработки больших массивов данных. Переход от эмпирических распределениях к теоретическим распределениям снижает остроту этой проблемы. С этой целью может быть использованы случайно-множественное моделирование и метод рекуррентного построения распределений вероятностей конечных случайных множеств на основе ассоциативных функций.

Рассмотрим множество препаратов, к которым у больных наблюдается лекарственная устойчивость X = {H,R,S,E,K,Pt,Ofl}, где основные препараты: Н - изониазид, R - рифампицин; S - стрептомицин, Е - этамбутол; резервные препараты: К - канамицин, Pt - протионамид, Ofl - офлоксацин. Конечное случайное множество, заданное на носителе X, будет выступать в качестве математической модели случайного пациента с лекарственной устойчивостью к противомикробным препаратам, используемым для лечения болезни. Для каждого набора X С X вероятность I-го рода р(Х) интерпретируется, как вероятность того, что случайный пациент будет обладать лекарственной устойчивостью точно к набору препаратов X, а вероятности II-го рода рх интерпретируется, как вероятность того, что среди препаратов, на которые у случайного пациента присутствует лекарственная устойчивость, есть набор препаратов X.