Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Метод статистической обработки малых выборок данных в задачах прогнозирования и контроля состояния сложных систем Горбунова Екатерина Борисовна

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Горбунова Екатерина Борисовна. Метод статистической обработки малых выборок данных в задачах прогнозирования и контроля состояния сложных систем: диссертация ... кандидата Технических наук: 05.13.01 / Горбунова Екатерина Борисовна;[Место защиты: ФГАОУ ВО «Южный федеральный университет»], 2018

Введение к работе

Актуальность исследования.

Повышение эффективности и надежности технических систем невозможно без разработки специальных средств контроля и прогнозирования их состояния. Задача создания инструментов эффективного контроля и диагностики не теряет актуальности благодаря поступательному развитию технологий и непрерывному усложнению контролируемых объектов. У термина "сложный объект" или "сложная система" нет строго определения, однако исследователи выделяют ряд черт, которые им присущи:

отсутствие строго математического описания;

случайный характер изменения параметров, обусловленный в первую очередь сложностью самого объекта, обилием различных внутренних процессов;

нестационарность, проявляющаяся в дрейфе характеристик системы и ее эволюции во времени;

точки бифуркации и "странные аттракторы";

- невоспроизводимость экспериментов со сложной системой, и др.
Эти черты являются определяющими при выборе подходов к анализу

сложных систем, при этом накладываемые ими ограничения нередко бывают противоречивы: с одной стороны, неожиданное поведение системы удобнее рассматривать как случайный фактор и использовать для анализа методы, учитывающие неопределенность – вероятностно-статистические; с другой стороны, нестационарность сложных систем ограничивает применимость статистических моделей, которые, как известно, требовательны к объему доступных данных и не слишком подходят для работы с динамическими процессами.

В случаях, когда значительная стохастическая составляющая препятствует применению детерминированных подходов, нередко прибегают к выделению и статистическому анализу псевдостацинарных участков процессов, протекающих в анализируемой системе, однако такие участки не всегда имеют достаточную длительность для набора представительной статистики. Из этого факта неизбежно вытекает необходимость поиска эффективных алгоритмов увеличения информативности анализа при обработке малых выборок.

В классической статистике принято считать пригодными для анализа выборки данных длиной в сто и более некоррелированных значений, в то время как менее представительная статистика считается неинформативной из-за значительных погрешностей оценок. Между тем, в связи с актуальностью

задачи извлечения максимально возможного количества информации даже из неполных данных, на текущий момент разработано некоторое количество специальных статистических методов, которые ориентированы на анализ укороченных выборок.

Исторически, начало статистике малых выборок было положено У. Госсетом (Стьюдентом). Еще более специализированные подходы были предложены М. Розенблаттом и позже развиты Е. Парзеном. Среди отечественных ученых, работавших в этой области, следует отметить Д.В. Гаскарова и В.И. Шаповалова, систематизировавших известные на тот момент методы.

Эти труды носят фундаментальный характер, и большинство современных работ по методам анализа малых выборок в той или иной мере опираются на них. При этом, хотя эта тематика является, очевидно, прикладной, нередко известные алгоритмы бывает проблематично применить при решении конкретной задачи ввиду отсутствия объективных рекомендаций по выбору значений параметров, которые необходимы для реализации выбранного алгоритма.

Кроме того, хотелось бы отметить разработанный Б. Эфроном бутстрэп-анализ. Частоту его использования в современной статистической практике можно объяснить не только улучшением результатов обработки критически ограниченных по объему данных, но также простотой и однозначностью процедуры реализации. Но этот метод не предполагает оценки функции распределения или плотности вероятностей по выборке, что также является важной задачей статистического анализа.

Таким образом, потребность в увеличении информативности анализа неполных данных с одной стороны, и ограничения, возникающие при попытке реализации существующих подходов, с другой, дают право с уверенностью говорить об актуальности исследований в данной области.

Объект исследования – обработка информации в задачах диагностики, контроля и прогнозирования состояния сложных систем.

Предмет исследования – метод статистического анализа данных в условиях критически ограниченного объема исходных выборок.

Методы исследования: системный анализ; методы математической статистики и теории вероятностей; имитационное моделирование; абстрагирование; индукция; статистический эксперимент; классификация и обобщение.

Цель работы. Повышение информативности статистического анализа выборочных данных в задачах контроля и прогнозирования состояния сложных систем.

Задачи, решаемые для достижения поставленной цели:

- классификационный анализ подходов к контролю и прогнозированию
состояния сложных систем;

- системный анализ методов и алгоритмов идентификации
статистических моделей по выборкам данных критически ограниченного
объема;

- разработка и исследование нового метода прогнозирования плотности
вероятностей случайной величины по укороченной выборке данных;

- оптимизация параметров метода с точки зрения минимизации
погрешности оценки функции плотности вероятностей по выборке данных.

Тематика работы соответствует п. 4 «Разработка методов и алгоритмов решения задач системного анализа, оптимизации, управления, принятия решений и обработки информации»; п. 5 «Разработка специального математического и алгоритмического обеспечения систем анализа, оптимизации, управления, принятия решений и обработки информации»; п. 11 «Методы и алгоритмы прогнозирования и оценки эффективности, качества и надежности сложных систем» и п. 12 «Визуализация, трансформация и анализ информации на основе компьютерных методов обработки информации» паспорта специальности 05.13.01 – «Системный анализ, управление и обработка информации».

Научная новизна работы

- на основе проведенного исследования и классификации существующих
методов статистической обработки малых выборок данных выявлены
ограничения их применимости при решении задачи оценки функции плотности
вероятностей и ее числовых параметров, разработан и исследован метод
имитационного дополнения в целях повышения эффективности обработки
данных в условиях малых выборок;

- получено аналитическое выражение критерия оптимизации параметра
разброса элементов дополняющих массивов;

разработана компьютерная модель, реализующая статистический эксперимент по исследованию метода имитационного дополнения;

в результате серии статистических экспериментов подтверждена целесообразность использования метода имитационного дополнения для

оценки плотности вероятностей в случае, когда объем выборки данных не превышает девяносто значений;

-подтверждена корректность предложенного критерия оптимизации параметра разброса элементов дополняющих массивов;

-выполнена оценка влияния числа элементов в дополняющих массивах на эффективность обработки данных.

Предложенный метод имитационного дополнения отличается от известных из работ М. Розенблатта, Е. Парзена, Д.В. Гаскарова, В.И. Шаповалова подходом к формированию оценки на основе дополнительной рандомизации исследуемой выборки по аналогии с методом бутстрэп-анализа. При этом аналогия не является полной ввиду отличия процедуры формирования дополняющих множеств.

Практическая значимость исследования состоит в следующем:

- создана программа для ЭВМ, реализующая разработанный в
диссертации метод оценки плотности вероятностей по малой выборке данных;

- предложена инженерная методика прогнозирования отказоустойчивости
бортовых РЛС «Гроза» по выборкам данных о наработке между отказами;

- предложена методика оценки состояния регуляторных систем и
диагностирования аритмий на основе анализа коротких участков кардиограммы
человека.

Достоверность и обоснованность результатов диссертационного исследования подтверждается сходимостью данных эксперимента и аналитического расчета; устойчивостью работы разработанного программного обеспечения и повторностью результатов экспериментов, а также сходимостью результатов при сведении разработанного в диссертации нового метода к известным.

Внедрение результатов работы. Результаты диссертационной работы внедрены и используются в деятельности ЗАО "Бета Ир", г. Таганрог, в рамках решения задачи прогнозирования отказоустойчивости тестируемых радиоэлектронных блоков авиационного назначения.

В частности, были использованы следующие результаты кандидатской диссертации:

- метод прогнозирования плотности распределения вероятностей
значений параметра на основе имитационного дополнения выборки данных;

- метод прогнозирования предотказных состояний блоков управления и
обработки сигналов на основе статистической классификации.

Кроме того, результаты диссертационной работы используются в учебном процессе при проведении лабораторных и практических занятий по дисциплинам «Статистические методы обработки данных», «Проектирование инфокоммуникационных систем и сетей» на кафедре радиотехнических и телекоммуникационных систем Института радиотехнических систем и управления ЮФУ, г. Таганрог.

Основные положения диссертации, выносимые на защиту:

- новый метод оценки (прогнозирования) плотности распределения
вероятностей значений параметров системы на основе имитационного
дополнения выборок данных (соответствует п. 4 паспорта специальности
05.13.01);

- критерий оптимизации параметров предложенного метода
(соответствует п. 5 паспорта специальности 05.13.01);

- результаты экспериментального исследования предложенного метода
(соответствует п. 12 паспорта специальности 05.13.01);

- примеры использования предложенного метода при решении
прикладных задач (соответствует п.11 и п.12 паспорта специальности 05.13.01).

Апробация работы. Результаты диссертационного исследования докладывались на следующих конференциях.

– Международная научная конференция по гидроавиации «Гидроавиасалон-2014», г. Геленджик;

– Международная научная конференция по гидроавиации «Гидроавиасалон-2012», г. Геленджик;

– Всероссийская научная конференция молодых ученых, аспирантов и студентов Теоретические и методические проблемы эффективного функционирования радиотехнических систем («Системотехника - 2015»);

– Международная конференция молодых ученых стран БРИКС «Сотрудничество стран БРИКС для устойчивого развития»;

– Международная научно-практическая конференция «Новые технологии и проблемы технических наук», Красноярск 2014;

– X Ежегодная научная конференция студентов и аспирантов базовых кафедр Южного научного центра РАН, г. Таганрог;

– Международная научно-техническая конференция «Радиотехника, электроника и связь», г. Омск;

– Международная молодежная научная конференция «XXXVIII Гагаринские чтения», г. Москва;

– 19-й Всероссийская межвузовская научно-технической конференция студентов и аспирантов «Микроэлектроника и информатика», г. Зеленоград;

– VIII Ежегодная научная конференция студентов и аспирантов базовых кафедр Южного научного центра РАН, г. Таганрог;

– 15-й Юбилейный Международный молодежный форум "Радиоэлектроника и молодежь в XХІ веке", г. Харьков;

– Двенадцатый международный научно-практический семинар «Практика и перспективы партнерства в сфере высшей школы», Г.Донецк;

– Всероссийская молодежная научная конференция «Мавлютовские чтения», г. Уфа.

В 2013 году работа, выполненная по тематике диссертационного исследования, была удостоена премии по результатам конкурса имени академика И.И. Воровича среди молодых ученых и специалистов Ростовской области на лучшую работу по фундаментальным и прикладным проблемам современной техники, проводимого Ростовским отделением Российской Инженерной Академии.

Публикации. По теме диссертации опубликовано 28 печатных работ, в том числе 1 монография, 4 статьи в журналах, включенных в перечень ВАК; свидетельство о государственной регистрации программы для ЭВМ.

Структура и объем диссертации. Диссертационная работа содержит введение, 4 главы, заключение, список сокращений, библиографический список из 120 наименований, 9 приложений. Основная часть работы изложена на 152 страницах, содержит 73 рисунка, 7 таблиц.