Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Разработка нейросетевых алгоритмов анализа многомерных временных рядов и их применение при исследовании солнечно-земных связей Шугай Юлия Сергеевна

Разработка нейросетевых алгоритмов анализа многомерных временных рядов и их применение при исследовании солнечно-земных связей
<
Разработка нейросетевых алгоритмов анализа многомерных временных рядов и их применение при исследовании солнечно-земных связей Разработка нейросетевых алгоритмов анализа многомерных временных рядов и их применение при исследовании солнечно-земных связей Разработка нейросетевых алгоритмов анализа многомерных временных рядов и их применение при исследовании солнечно-земных связей Разработка нейросетевых алгоритмов анализа многомерных временных рядов и их применение при исследовании солнечно-земных связей Разработка нейросетевых алгоритмов анализа многомерных временных рядов и их применение при исследовании солнечно-земных связей Разработка нейросетевых алгоритмов анализа многомерных временных рядов и их применение при исследовании солнечно-земных связей Разработка нейросетевых алгоритмов анализа многомерных временных рядов и их применение при исследовании солнечно-земных связей Разработка нейросетевых алгоритмов анализа многомерных временных рядов и их применение при исследовании солнечно-земных связей Разработка нейросетевых алгоритмов анализа многомерных временных рядов и их применение при исследовании солнечно-земных связей Разработка нейросетевых алгоритмов анализа многомерных временных рядов и их применение при исследовании солнечно-земных связей Разработка нейросетевых алгоритмов анализа многомерных временных рядов и их применение при исследовании солнечно-земных связей Разработка нейросетевых алгоритмов анализа многомерных временных рядов и их применение при исследовании солнечно-земных связей
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Шугай Юлия Сергеевна. Разработка нейросетевых алгоритмов анализа многомерных временных рядов и их применение при исследовании солнечно-земных связей : диссертация ... кандидата физико-математических наук : 05.13.18, 01.04.08.- Москва, 2006.- 137 с.: ил. РГБ ОД, 61 06-1/1281

Содержание к диссертации

Введение

Раздел 1 Обзор литературы но искусственным нейронным сетям Подраздел

1.1 Многослойный персептрон (МСП) 14

1.2 Нейросетевые комплексы 24

Раздел 2 Иерархический нейросетевой комплекс для анализа многомерных временных рядов

Подраздел 2.1 Описание построения иерархического неиросетевого комплекса 32

Подраздел 2.2 Результаты применения разработанного неиросетевого комплекса для анализа модельных временных рядов

Подраздел 2.3 Методики определения значимых переменных при нейросетевом прогнозировании 41

Раздел 3 Обзор литературы по исследованию солнечно-земных связей Подраздел

3.1 Исследования солнечно-земных связей 47

3.2 Космофизические данные, используемые для исследования солнечно-земных связей 60

3.3 Алгоритм обработки изображений Солнца для представления информации о геоэффективных объектах в компактном виде 60

Раздел 4 Рекуррентные потоки высокоскоростного солнечного ветра (СВ) и их зависимость от размеров и местоположения корональных дыр (КД)

Подраздел 4.1 Сравнение размеров КД, рассчитанных по изображениям Солнца, полученным в различных диапазонах длин волн 70

Подраздел 4.2 Однопараметрическое представление зависимости среднесуточной скорости СВ от размера низкоширотных КД, на различных фазах 11-летнего солнечного цикла 82

Подраздел 4.3 Среднесрочное прогнозирование скорости СВ и радиального магнитного поля в период спада 11-летнего солнечного цикла по нескольким кэрриштоновским оборотам 90

Раздел 5 Результаты применения разработанного иерархического нейросетевого комплекса для исследования солнечно-земных связей

Подраздел 5.1 Нейросетевое прогнозирование среднесуточной скорости рекуррентных потоков СВ на околоземной орбите 103

Подраздел 5.2 Сравнение полученных в диссертации результатов прогнозирования скорости СВ с данными, полученными другими методами 109

Подраздел 5.3 Краткий обзор результатов прогнозирования геомагнитного DST индекса 112

Подраздел 5.4 Применение разработанного нейросетевого комплекса для прогнозирования геомагнитного DST индекса 115 Подраздел 5.5 Определение значимых переменных при нейросетевом прогнозировании геомагнитного DST индекса 119

Заключение

Основные результаты и выводы работы 124

Список литературы

Введение к работе

Актуальность

Задача анализа временных рядов представляет собой весьма

актуальную проблему в различных областях науки и техники. В частности, задачей такого типа является прогнозирование бинарных событий или непрерывных значений временного ряда. Существенным условием во многих случаях является фиксированная и заданная задержка между прогнозируемым событием (или значением) и "явлением" - комбинацией признаков, вызывающем событие. В таких случаях проблему поиска корреляционных связей между явлением и событием можно считать уже решенной. Помимо этого, иногда существует возможность проводить "активное" исследование зависимостей (диагностику объекта), т.е. варьировать входные условия и регистрировать соответствующий отклик, что упрощает решение задачи. В то же время, во многих задачах заданы лишь допустимые интервалы задержки. Тем самым, необходим поиск корреляционных связей, причём он должен вестись в достаточно широком временном диапазоне. Другим осложняющим обстоятельством является невозможность воздействовать на объект исследования, т.е. варьировать входные условия и регистрировать соответствующий отклик ("пассивное наблюдение"). В качестве примера можно назвать задачу прогнозирования космической погоды и связанный с ней анализ влияния разных солнечных явлений на развитие геомагнитных бурь. Одной из задач этого ряда является прогнозирование параметров солнечного ветра (СВ) на околоземной орбите путем поиска тех явлений на Солнце, которые могут влиять на формирование потоков СВ. В настоящее время для прогнозирования параметров СВ в основном используются эмпирические модели, которые основаны на частичном понимании физических процессов, происходящих

на Солнце. Детали формирования потоков СВ весьма сложны и являются предметом многих современных исследований. До сих пор не существует точной математической модели физических процессов, влияющих на формирование потоков СВ. Однако за многолетнюю историю наблюдений Солнца накоплено большое количество фактических данных, полученных со спутников и из наземных обсерваторий. Количество фактического материала о Солнце и о параметрах СВ все время увеличивается, кроме того, улучшается его качество.

Одним из подходов для решения задач такого рода является применение искусственных нейронных сетей (ИНС). Важным свойством ИНС является их способность настраиваться, обучаясь на примерах. Такое свойство нейронных сетей позволяет применять их, когда построение строгой математической модели невозможно, но существует достаточно представительный набор примеров (желательных решений в каждой ситуации). Другим важным свойством нейронных сетей является способность обобщать полученную информацию, т.е. давать правильные ответы при предъявлении «незнакомых» данных. При решении сложных задач прогнозирования и анализа многомерных временных рядов зачастую оказывается намного эффективнее использовать нейросетевые комплексы, в которых каждая нейронная сеть решает отдельную подзадачу, чем использовать одиночную нейронную сеть. Такой подход разбивает процесс решения всей задачи на последовательность более простых этапов, что позволяет повысить качество прогнозирования и упростить интерпретацию результатов.

Таким образом, представляется перспективной задача разработки специализированного алгоритма построения нейросетевого комплекса для анализа многомерных временных рядов и его применения при исследовании солнечно-земных связей, в частности для решения задачи

прогнозирования параметров СВ на околоземной орбите на основе данных, полученных с космических аппаратов и из наземных обсерваторий.

Целью диссертационной работы были

Разработка алгоритма построения нейросетевого комплекса для решения фундаментальной проблемы анализа многомерных временных рядов, связанной с прогнозированием тех или иных событий или непрерывных значений и определением временного диапазона, в котором следует рассматривать значения входных признаков для осуществления наиболее эффективного прогнозирования.

Решение задач прогнозирования при исследовании солнечно-земных связей с помощью разработанной методики.

Для достижения поставленной цели были решены следующие основные задачи:

1) Разработан алгоритм построения нейросетевого комплекса для анализа временных рядов с целью прогнозирования событий и непрерывных значений. На первом уровне используется комитет искусственных нейронных сетей, обучаемых на различных участках временного ряда. На втором уровне используется обобщающая нейронная сеть, которая обучается прогнозировать итоговую вероятность события или непрерывное значение на основе локальных оценок, полученных специализированным комитетом искусственных нейронных сетей. Такой подход позволил прогнозировать событие или непрерывную величину, а также автоматически определять и учитывать задержку между явлением и событием.

  1. Разработан алгоритм анализа изображений Солнца, получаемых со спутников и космических аппаратов, с целью определения характеристик объектов на изображениях Солнца, которые могут оказать влияние на формирование высокоскоростных потоков СВ.

  2. Разработанные алгоритмы применены для прогнозирования среднесуточной скорости потоков СВ на основе информации о размерах низкоширотных корональных дыр.

  3. Нейросетевой комплекс применен для прогнозирования Dst-индекса геомагнитной активности на основе параметров СВ и межпланетного магнитного поля, измеряемых на околоземной орбите. Для установления логической взаимосвязи между входными параметрами и прогнозируемой величиной Dst-индекса (или событием начала сильной геомагнитной бури) применен анализ весовых коэффициентов нейронной сети.

Научная новизна

  1. Предложен нейросетевой подход как для решения собственно задачи прогнозирования, так и для определения наиболее вероятного временного диапазона, в котором следует рассматривать значения входных признаков для осуществления наиболее эффективного прогнозирования.

  2. Проанализированы изображения Солнца, полученные на длинах волн 28.4 нм и 19.5 нм инструментом EIT/SOHO за период с 1997 по 2005 год. Построена эмпирическая зависимость среднесуточной скорости СВ от суммы размеров корональных дыр, рассчитанных по изображениям Солнца.

  3. Для нейросетевого прогнозирования среднесуточной скорости рекуррентных высокоскоростных потоков СВ на несколько суток вперед впервые использованы размеры геоэффективных объектов

(корональных дыр и активных областей), рассчитанные по ежедневным снимкам Солнца, получаемым с КА SOHO на длине волны 28.4 нм. 4) Значимые переменные для нейросетевого прогнозирования значения Dst-индекса оценивались в зависимости от временного интервала, на котором обучалась нейронная сеть, с помощью анализа весовых коэффициентов нейронной сети.

Научная и практическая значимость работы

1) Предлагаемый подход к решению задачи анализа многомерных

временных рядов является универсальным и может быть применен в различных областях - в космической физике, сейсмологии, медицине, финансах и других;

  1. Проведены численные эксперименты по применению разработанной методики для анализа модельных одномерных и многомерных временных рядов. Разработанный метод построения нейросетевого комплекса продемонстрировал высокую эффективность и качество прогнозирования, а также возможность определять временной диапазон, в котором следует рассматривать значения входных признаков для осуществления наиболее эффективного прогнозирования;

  1. Разработанные алгоритмы были успешно применены для решения ряда практических задач: прогнозирования среднесуточных значений скорости рекуррентных потоков СВ, среднечасовых значений геомагнитного Dst-индекса, а также определения входных переменных, наиболее сильно влияющих на прогнозирование геомагнитного Dst-индекса;

4) Данные, полученные с помощью алгоритма анализа изображений с целью определения размеров и местоположения корональных дыр и активных областей, были использованы

для нахождения эмпирической формулы, описывающей зависимость среднесуточной скорости СВ от суммарной площади низкоширотных корональных дыр на видимой стороне Солнца в виде ряда Тейлора первого и второго порядка;

Для нейросетевого прогнозирования среднесуточной скорости СВ на околоземной орбите.

Основные положения, выносимые на защиту

  1. Предложенная методика построения нейросетевого комплекса для решения задач анализа многомерных временных рядов, которая позволяет значительно упростить решение задачи, улучшить результат прогнозирования, а также автоматически определять временной диапазон, в котором следует рассматривать значения входных признаков для осуществления наиболее эффективного прогнозирования.

  2. Анализ данных наблюдений за 1997-2005 годы, полученных с КА SOHO, с целью выделения корональных дыр на изображениях Солнца и изучения влияния площади корональных дыр на скорость СВ на околоземной орбите.

  3. Результаты применения нейросетевого комплекса для решения задачи прогнозирования среднесуточной скорости СВ на околоземной орбите.

  4. Результаты анализа весовых коэффициентов нейронной сети для выявления параметров СВ и межпланетного магнитного поля, наиболее значимых для прогнозирования геомагнитного Dst-индекса.

Апробация работы

Результаты, полученные в настоящей диссертации, доложены на 11

всероссийских и международных конференциях:

  1. VIII International Workshop on Advanced Computing and Analysis Techniques in Physics Research (ACAT 2002), Moscow, Russia, 24-28 June, 2002.

  2. 7th International conference on Pattern Recognition and Image Analysis (PRIA-6-2002), Velikiy Novgorog, Russia, October 21-26, 2002.

  3. 7th International conference on Pattern Recognition and Image Analysis (PRIA-7-2004), St.Petersburgh, Russia, October 18-23, 2004.

  4. Международная конференция "Интеллектуализация обработки информации" (ИОИ'2004), г. Алушта, Крым, Украина, 14-19 июня 2004.

  5. Artificial Neural Networks: Formal Models and Their Applications -ICANN 2005, 15th International Conference, Warsaw, Poland, September 11-15,2005.

  6. ІХ-я Пулковская международная конференция "Солнечная активность как фактор космической погоды", ГАО РАН, Пулково, Санкт-Петербург, 4-9 июня 2005.

  7. Всероссийская конференция "Экспериментальные и теоретические исследования основ прогнозирования гелиогеофизической активности", Троицк, 10-15 окт. 2005.

  8. 12-я Всероссийская конференция «Математические методы распознавания образов» (ММРО-12), Москва, Россия, 20-26 ноября 2005.

  9. VIII всероссийская научно-техническая конференция "Нейроинформатика-2006" Москва, Россия, 24 - 27 янв. 2006.

10) Научная сессия МИФИ-2006, Секция «Астрофизика и
космофизика», Москва, Россия, 23 - 27 янв. 2006.

11) Всероссийской конференции «Многоволновые исследования

Солнца и современные проблемы солнечной активности», п. Нижний Архыз, САО РАН, 28 сентября - 2 октября 2006.

Публикации

Основные результаты диссертации опубликованы в 17 статьях [24-

30, 47, 59, 78, 81-86, 98], в том числе в 8 журнальных публикациях и материалах 9 всероссийских и международных конференций.

Краткое содержание диссертации

Диссертация состоит из 5 разделов, а также введения и заключения.

Во введении сформулирована цель работы, обосновывается ее актуальность; описывается структура и приводится краткое содержание диссертации; приводятся основные положения, выносимые на защиту. В разделе 1 излагаются общие сведения об искусственных нейронных сетях. В разделе 2 описывается методика построения нейросетевого комплекса для анализа многомерных временных рядов, а также приводятся результаты проверки его работоспособности на модельных задачах. Рассматриваются методы выделения значимых входных переменных при нейросетевом прогнозировании временных рядов. Раздел 3 посвящен краткому обзору литературы по исследованию солнечно-земных связей. В этом разделе описывается данные, которые использовались для прогнозирования скорости потоков солнечного ветра (СВ) и геомагнитного Dst-индекса, приведены методы обработки и анализа данных, получаемых со спутников и наземных обсерваторий. В разделе 4 исследуется зависимость скорости СВ от размеров и местоположения КД, рассчитанных по изображениям Солнца. Кроме того, проводится сравнение суммарных размеров корональных дыр (КД), рассчитанных по изображениям Солнца, получаемым в различных спектральных диапазонах электромагнитного излучения. Рассматривается

возможность прогноза среднесуточных значений скорости СВ, основанного исключительно на хорошей рекуррентности потоков СВ и межпланетного магнитного поля (ММП), наблюдаемой в прошлом, связанной с прохождением больших низкоширотных КД по диску Солнца. В Разделе 5 описываются результаты прогнозирования среднесуточных значений скорости рекуррентных потоков СВ, среднечасовых значений геомагнитного Dst-индекса. Кроме того, приводятся результаты работы нейросетевого комплекса при прогнозировании событий. В отличие от предыдущей задачи прогнозирования непрерывного значения Dst-индекса решалась задача прогнозирования события начала сильной геомагнитной бури, когда значение Dst-индекса становится меньше -100 пТ. В разделе также приводятся результаты определения входных переменных, наиболее сильно влияющих на прогнозирование геомагнитного Dst-индекса.

Нейросетевые комплексы

Рассмотрим нейросетевые комплексы, в которых каждая нейросеть решает отдельную подзадачу. Такой подход при решении сложных задач классификации и прогнозирования зачастую оказывается намного эффективнее, чем использование одиночной нейронной сети [12]. Это не удивительно, поскольку иерархический подход, позволяющий разбить процесс решения всей задачи на последовательность более простых этапов, давно и успешно используется для распознавания образов.

Однако выигрыш связан вовсе не с увеличением количества нейронов и связей между ними, как может показаться на первый взгляд. У модульных архитектур существует целый ряд преимуществ [13], обсуждаемых ниже.

Модульный подход позволяет разбить аппроксимируемую функцию на набор более простых функций. В результате обучение отдельных модулей может проходить быстрее, чем если бы одна нейросеть обучалась аппроксимировать сложную функцию.

В тренировочных данных могут присутствовать противоречивые примеры. С другой стороны, при обучении больших нейросетей могут возникать противоречия между сигналами ошибки, поступающими от нейронов выходного слоя на нейроны скрытого слоя. Модульность архитектуры дает возможность избежать потери качества распознавания, связанной с такими противоречиями.

При использовании модульной архитектуры можно ожидать, что нейросетевой комплекс будет иметь лучшие способности к обобщению, поскольку архитектура в каждом модуле проще, и она полнее соответствует структуре аппроксимируемой функции. Как правило, в нейросетевом комплексе общее количество весовых коэффициентов заметно меньше, чем в эквивалентной одиночной неиросети, что положительно влияет на обобщение. Кроме того, в каждый модуль могут поступать примеры из достаточно локализованной области данных, что упрощает задачу, повышает качество получаемой неиросети и также улучшает обобщение.

Анализ результатов, полученных одиночной нейросетью, обычно достаточно труден, поскольку выделяемые свойства сложным образом распределяются между нейронами скрытого слоя. Разбиение сложной задачи на набор более простых подзадач позволяет упростить интерпретацию результатов и в структурном смысле, и в смысле анализа свойств, выделенных в скрытом слое конкретного модуля.

Наконец, значительное сокращение количества связей между нейронами может оказаться важным при аппаратной реализации.

Способы организации архитектуры нейросетевых комплексов можно разделить на параллельные и последовательные. При параллельной организации каждый из участников с тем или иным качеством решает одну и ту же задачу, а их совместное использование служит для повышения итогового качества решения. В противоположность такому способу, при последовательной организации исходная задача разбивается на несовпадающие подзадачи, решаемые последовательно, и каждый из участников вносит свой вклад в формирование окончательного решения. Часто используются и комбинации этих методов.

Обычно параллельную организацию модулей называют комитетом или ансамблем, а участников - экспертами. Каждый эксперт представляет собой некоторый метод решения одной и той же задачи (заметим, что используемые в комитете методы решения могут быть не только нейросетевыми, но и любыми другими).

Как известно, квадрат средней ошибки комитета из L экспертов меньше среднего значения квадратов индивидуальных ошибок _L 1=1 J L /=i и если ошибки экспертов не коррелируют, то ошибка комитета EL. \ Е, , где , - средняя ошибка одного эксперта.

Для выполнения условия нескоррелированности ошибок желательно, чтобы эксперты были разнородными. Для получения разнородных нейросетевых классификаторов обычно используются специальные методики их построения, среди которых можно выделить (по мере уменьшения разнородности получаемых классификаторов) [14]:

1. Использование различающихся наборов входных переменных дает наиболее разнородные классификаторы, однако этот метод приемлем лишь при большом количестве входных переменных или при избыточности информации в них. В противном случае, этот метод может дать настолько слабых экспертов, что комитет будет работать хуже, чем одиночный классификатор, использующий все входные переменные [15].

2. Использование различающихся тренировочных наборов данных. Так, в [16] исходный набор данных разбивается на 10 непересекающихся поднаборов. Каждый из 10 экспертов строится с использованием данных, получающихся выбрасыванием одного из 10 поднаборов.

Результаты применения разработанного неиросетевого комплекса для анализа модельных временных рядов

Для проведения исследования были выбраны значения скорости обучения, равные 0.1, 0.05, 0.02, 0.01 и 0.001, а количество нейронов в скрытом слое - 1, 2, 5, 10, 20 и 30. Для скорости обучения, равной 0.1, лучшие результаты получаются на экзаменационном наборе для сетей с двумя нейронами в скрытом слое. При увеличении количества нейронов с 2 до 30 процент правильного прогнозирования событий на экзаменационном наборе уменьшается с 97.4% до 69.2% для скорости обучения, равной 0.1. Для скоростей обучения 0.05 и 0.02 максимальный процент правильного прогнозирования, равный 76%, получился для сети с 5 нейронами в скрытом слое. При скоростях обучения, равных 0.01 и 0.001, процент правильного прогнозирования событий увеличивается с увеличением количества нейронов в скрытом слое от 25% для 2 нейронов до 64% для 30 нейронов. Лучший процент правильного прогнозирования событий на экзаменационном наборе, равный 97.4%, получен для сети с двумя нейронами в скрытом слое и скоростью обучения, равной 0.1.

Самый лучший процент прогнозирования событий получился для следующих параметров нейронной сети: 2 нейрона в скрытом слое; скорость обучения 0.1 и остановка обучения через 5000 эпох после достижения максимального значения R-квадрат на тестовом наборе.

Задача прогнозирования значений временного ряда чаще всего предполагает использование в качестве входных переменных некоторого количества предыдущих значений прогнозируемого временного ряда или других временных рядов, связанных с прогнозируемой переменной. Результатом такого погружения многомерного временного ряда является значительное увеличение количества входных переменных задачи, что затрудняет работу алгоритмов и ухудшает точность прогнозирования. Для таких задач становится весьма актуальной проблема понижения размерности входного пространства. Помимо понижения входной размерности задачи, определение существенных переменных может позволить установить логические взаимосвязи между входными переменными и прогнозируемой переменной.

В диссертационной работе были проведены исследования по выделению наиболее существенных переменных, влияющих на формирования прогнозируемого события или непрерывной величины.

Существует ряд методов, которые помогают оценить относительный вклад каждой из входных переменных в прогнозируемый выход. Рассмотрим некоторые из них: анализ весов натренированной нейронной сети, линейный анализ главных компонент (ЛАГК), линейная регрессия (ЛР), метод группового учета аргументов (МГУА).

Первый метод реализуется путём тренировки трёхслойного персептрона и последующего расчета показателей важности входных переменных путем анализа весов обученной нейронной сети. Для каждой входной переменной рассчитывается число, показатель важности, которое является грубой мерой важности этой переменной для прогнозирования выхода сети по отношению к другим входным переменным той же сети. Чем больше показатель важности, тем больше вклад данной входной переменной в прогноз.

Начиная с 1980 года, предлагались различные методы анализа важности входов обученной нейронной сети [31], состоящей из N нейронов входного слоя, L нейронов скрытого слоя и М нейронов входного слоя. Методы анализа амплитуд групп весов используют в основном сумму произведений весов w,j (связь между і нейроном входного слоя и j - скрытого слоя) на веса v,k (между j нейроном скрытого слоя и к - выходного слоя) (Рис. 9). входной скрытый выходной

Рис. 9 Архитектура трехслойного персептрона. X(t) - входные значения, Y(t) - активности выходных нейронов, w,j — значения весов между і-м нейроном входного слоя и j-м нейроном скрытого слоя, v, -значения весов между j-м нейроном скрытого слоя и k-м нейроном выходного слоя.

В диссертационной работе для анализа входных переменных использовалось следующее выражение из работы [32].

Рассчитанная величина Qlk (показатель важности) представляет собой относительное влияние входной переменой JC, на выходную переменную yk, а ее сумма по всем входным переменным равна единице (Рис. 9). Чем больше значение Qlk, тем больше вклад данной входной переменной в прогноз данной выходной переменной. Обычно наиболее существенные для прогнозирования переменные отбираются по заданному порогу. В данной работе в качестве порогового значения использовалось среднее значение Qlk по всем входам плюс одно стандартное отклонение. Переменные, чьё значение показателя важности превышало пороговое значение, считались наиболее существенными для прогнозирования.

Линейный Анализ Главных Компонент (см., например, [33]) - это линейный метод, заключающийся в повороте исходного пространства входных переменных. Компоненты вектора преобразованного пространства называются Главными Компонентами (ГК). Поворот исходного пространства осуществляется таким образом, чтобы в преобразованном пространстве корреляционная матрица была ортогональной. При этом направление первой ГК соответствует направлению максимальной дисперсии (т.е. максимальной информативности) данных, вторая ГК ортогональна первой и соответствует направлению максимальной дисперсии в подпространстве, оставшемся после исключения первой ГК, и т.д. В преобразованном пространстве можно выбрать несколько первых ГК, которые описывают нужный процент суммарной дисперсии, а остальные компоненты отбросить. Таким образом, будет произведено уменьшение размерности данных.

Сделать выводы о существенности исходных переменных можно на основании факторных нагрузок. Под факторной нагрузкой понимается линейный коэффициент корреляции между одной из полученных ГК и одной из входных переменных. Факторная нагрузка считается существенной, если она больше 0.7. Пространство полученных ГК поворачивалось по методу VARIMAX [34], чтобы добиться большей выразительности факторных нагрузок.

Космофизические данные, используемые для исследования солнечно-земных связей

Как уже упоминалось выше, корональные дыры на изображениях видны как темные области, из-за пониженной плотности и температуры плазмы (Рис. 10), а активные области как яркие.

Для автоматического выделения геоэффективных объектов на изображениях Солнца и определения их параметров был разработан специализированный алгоритм, и создана его программная реализации. В основе алгоритма [59] автоматического определения размеров и местоположения геоэффективных объектов лежит классификация точек изображения по пороговой интенсивности (Рис. 11).

В начале к изображению применяется линейная фильтрация, для сглаживания. Затем изображение нормируется по интенсивности в единый для всех изображений интервал. Далее строится гистограмма распределения точек изображения по интенсивности. Затем происходит пороговое выделение точек с низкой интенсивностью и их объединение в объекты «корональные дыры». Точки с высокими значениями интенсивности объединяются в объекты «активные области». В конце вычисляется местоположение и площадь найденных объектов с учетом сферической формы Солнца. Надо заметить, что алгоритм позволяет обрабатывать как все изображение, так и только его часть. Например, для прогнозирования скорости солнечного ветра на околоземной орбите наиболее существенную информацию дает центральная область изображения Солнца. Полученные значения размеров выделенных объектов нормируются на площадь выделенной области изображения Солнца. Площадь выделенной области считается равной единице.

Опишем более подробно алгоритм автоматического выделения геоэффективных объектов и определения их параметров.

Программа работает с изображениями, записанными в графическом формате «GIF». Исходное цветное изображение кодируется тремя байтами - R, G и В, которые соответствуют красной (R), зелёной (G) и синей (В) составляющим цвета. Поскольку поиск объектов в дальнейшем ведётся исключительно по степени яркости областей изображения, то разумно свести исходную картинку к её монохромному аналогу. Каждый пиксель монохромного изображения кодируется одним байтом, который характеризует яркость (интенсивность) пикселя. Новое монохромное изображение получается из цветного следующим образом: каждой точке

Для удаления шумов с изображения применяется линейная фильтрация. Будем считать, что на изображение накладывается аддитивный шум, отсчеты которого случайны и независимы. В этом случае механизм подавления шума состоит в том, чтобы при суммировании шумы компенсировали друг друга. Эта компенсация происходит тем успешнее, тем больше количество точек в фильтре. Однако в результате сильного сглаживания изображение может потерять важные детали. Линейная фильтрация заключается во взвешенном суммировании приведенных амплитуд (интенсивностей) исходного изображения с весовыми коэффициентами фильтра, и в нормировании полученной суммы на сумму весовых коэффициентов (чтобы не происходило изменеїшя средней амплитуды обработанного изображения). Новое значение матрицы приведенных амплитуд в точке j определяется выражением:

Однопараметрическое представление зависимости среднесуточной скорости СВ от размера низкоширотных КД, на различных фазах 11-летнего солнечного цикла

В настоящее время хорошо известно, что источником наиболее быстрых квазистационарных потоков солнечного ветра служат участки внутри корональных дыр на Солнце, а более медленный ветер испускается со всей поверхности, окружающей Солнце на достаточно больших расстояниях. Поэтому существует заметная связь между наблюдаемой средней скоростью солнечного ветра и площадью корональных дыр на Солнце [50]. Детали формирования потоков солнечного ветра весьма сложны и являются предметом многих современных теоретических и экспериментальных исследований [68, 69, 70].

С помощью описанной выше программы определения площади и местоположения корональных дыр на изображениях Солнца была обработана созданная ранее база данных ежедневных снимков Солнца, сделанных телескопом EIT с космического аппарата SOHO на длине волны 28.4 нм. Данная методика также применялась при исследовании глобальной асимметрии Солнца по различным данным, когда осуществлялся поиск зависимости скорости СВ от площади КД за 2003 год в виде простой линейной функции [71].

Среднесуточные значения измеренной скорости солнечного ветра сопоставлялись с найденными значениями площади корональных дыр с учетом временного сдвига (Рис. 23). В среднем сдвиг составлял около четырех суток, и каждый раз вычислялся по текущему среднесуточному значению скорости как время распространения солнечного ветра от Солнца до орбиты Земли. Введение этого временного сдвига, естественно, повышает точность искомой эмпирической зависимости. В этом мы имели возможность убедиться путем прямых пробных расчетов и сопоставлений. Все приводимые ниже эмпирические зависимости включают в себя этот временной сдвиг.

Предполагаемая зависимость скорости солнечного ветра V от площади корональных дыр S, рассчитанных по центральной области солнечного диска, описывается функцией V(S), которую ищем в виде разложения в ряд Тейлора: V(S)=V0 + a(S-S0)+0,5b(S-S0)2 + г, где V0 - скорость солнечного ветра при некотором значении площади корональных дыр S0. Постоянные коэффициенты a, b, г имеют, соответственно, смысл первой и второй производной, а также остаточного члена в рассматриваемом разложении. Остаточный член (средняя абсолютная ошибка) вычислялся по формуле: г = V- V(S) IN , где V - измеренные значения скорости солнечного ветра, V(S) -вычисленные значения скорости солнечного ветра, N - количество измерений ежедневных значений площадей корональных дыр за исследуемый период.

Мы построили и исследовали несколько подобных аппроксимаций. Положив So =0, мы определили соответствующие коэффициенты ао, Ь0, Го- Положив So = Si, МЫ нашли другие наборы коэффициентов г.\, Ъ\, Г\. В качестве S1 было выбрано среднее значение площади за весь период наблюдений в период с января 1997 года по сентябрь 2004 года. Результаты для разложения в ряд Тейлора первого и второго порядка вокруг нулевой площади (So = 0) представлены в таблице 2. Средняя скорость солнечного ветра V0 для нулевых значений площади корональных дыр (So = 0) оказалась равной 391.1 км/с. В таблице 3 представлены параметры и точность разложения в ряд Тейлора первого и второго порядка вокруг средней площади Si, которая за исследуемый период равнялась 0.018 отн. ед. Среднее значение скорости солнечного ветра Vi при таком значении площади равнялась 452.5 км/с.

Оценка точности коэффициентов разложения в ряд Тэйлора также проводилась на данных за период с января 1997 по сентябрь 2004 года. Приведенные в табл. 2 и 3 значения коэффициентов разложения были получены при минимизации среднеквадратичной абсолютной ошибки между значением искомой функции V(S) и измеренными значениями среднесуточной скорости солнечного ветра. Среднеквадратичная абсолютная ошибка вычислялась по формуле (Z(V-V(S))2)/N)1/2, где V измеренные значения скорости солнечного ветра, V(S) - вычисленные значения скорости солнечного ветра, N - количество ежедневных значений площадей корональных дыр за исследуемый период.

Для оценки точности модели вычислялся статистический индикатор R2. Он дает возможность сравнивать точность найденных моделей с точностью тривиальной реперной модели, для которой предсказание представляет собой просто среднее по всем примерам. При безупречном совпадении предсказаний с истинными (измеренными) значениями R2 будет равен 1, при хорошем совпадении близок к 1, а при очень плохом совпадении близок к 0. Индикатор R2 вычислялся по формуле приведенной в разделе 1.2 (стр. 38).

Из данных, приведенных в табл. 2 и 3, видно, что зависимость скорости солнечного ветра от площади корональных дыр за период с 1997 по 2004 годы при линейной аппроксимации описывается со средней точностью 86.9 км/с, а значение R2 равно 0.38. Значительного улучшения при использовании разложения в ряд Тэйлора второго порядка не происходит. Поправки второго порядка в среднем существенно меньше среднеквадратичной ошибки разложения, так как среднее значение площади корональных дыр за исследуемый период является малой величиной и составляет около 2% (0.018 отн. ед.) от изображения солнечного диска.

Похожие диссертации на Разработка нейросетевых алгоритмов анализа многомерных временных рядов и их применение при исследовании солнечно-земных связей