Организация доступа, хранения и извлечения знаний в темпоральных базах данных Нгуен Доан Куонг

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Нгуен Доан Куонг. Организация доступа, хранения и извлечения знаний в темпоральных базах данных : Дис. ... канд. техн. наук : 05.13.11 СПб., 2006 180 с. РГБ ОД, 61:06-5/2114

Содержание к диссертации

Введение

ГЛАВА 1 Постановка задачи организации доступа и хранения данных и извлечения знаний в темпоральных базах данных 12

1.1. Организации доступа и хранения данных в темпоральных БД 12

1.2. Обзор методов интеллектуальной обработки временных рядов 18

1.3. Использования темпоральных СУБД для обработки временных рядов 31

1.3.1. Темпоральная надстройка над реляционной СУБД 31

1.3.2. Интеллектуальная обработка временных рядов 32

Выводы 34

ГЛАВА 2 Реализация темпоральной базы данных на основе реляционной СУБД 35

2.1. Темпоральные модели данных 35

2.2. Трансляция SQL/Temporal в SQL-92 44

2.3. Темпоральная алгебра 51

2.3.1. Темпоральная выборка 52

2.3.2. Темпоральная проекция 52

2.3.3. Темпоральное объединение 53

2.3.4. Темпоральное пересечение 53

2.3.5. Темпоральная разность 54

2.3.6. Темпоральное произведение 56

2.3.7. Темпоральная агрегация 57

2.3.8. Склейка 59

2.4. Темпоральные ограничения целостности 60

2.5. Операции модификации 65

Выводы 69

ГЛАВА 3 Исследование методов извлечения знаний из временных рядов, хранящихся в темпоральных СУБД 70

3.1. Обзор методов извлечения знаний 70

3.2. Предварительная обработка временных рядов 78

3.2.1. Фильтрация данных временных рядов 78

3.2.2. Индикатор обобщенного тренда 81

3.3. Прогнозирование поведения временных рядов 83

3.3.1. Формирование гистограмм распределения 83

3.3.2. Предсказание поведения временных рядов 96

Выводы 99

Заключение 100

Литература

Обзор методов интеллектуальной обработки временных рядов
Темпоральная надстройка над реляционной СУБД
Темпоральная алгебра
Фильтрация данных временных рядов

Введение к работе

Появление нового класса СУБД - темпоральных СУБД обусловлено необходимостью отслеживания изменяющихся во времени данных (работа с их историей, возможность регистрации прогнозируемых значений в будущем). В таких СУБД задача описания запросов и ограничений целостности для изменяющихся во времени данных существенно упрощается по сравнению с традиционными СУБД реляционного типа.

В темпоральных базах данных время понимается не только как особый тип данных. Время является целым измерением, причем совершенно самостоятельным, управляемым самой СУБД и не являющимся атрибутом никакой сущности, поэтому языки запросов темпоральных СУБД, должны существенно отличаться от классических СУБД.

Актуальность темы исследования: Так как на данный момент не существует промышленных систем управления базами данных, в полной мере поддерживающих обработку темпоральных данных, то становится актуальной задача реализации темпоральной надстройки над классической СУБД. Клиентские приложения будут обращаться не к самой СУБД, а к надстройке, которая будет преобразовывать все темпоральные запросы клиента в запросы, понятные существующей СУБД. При этом темпоральная надстройка не вмешивается в реализацию классической СУБД, в результате чего вся существующая функциональность СУБД сохраняется.

Целью извлечения знаний из информации, полученной эмпирическим путем, является выявление скрытых, нетривиальных и не формализуемых закономерностей в наборах данных. Получение практически полезных и доступных интерпретации знаний необходимо для принятия решений в различных сферах человеческой деятельности. Подобные задачи актуальны в областях, где присутствуют большие информационные массивы неоднородных, меняющихся во времени данных высокой размерности. Например, методы извлечения знаний из баз данных с временными рядами могут применяться для предприятий торговли (анализ структуры клиентов и покупок, моделей поведения потребителей), банков и страховых компаний (выявление мошенничества, создание новых целевых программ и услуг), медицинских учреждений (выбор способа лечения, прогнозирование осложнений).

В данной работе в качестве эмпирических данных, подлежащих обработке, используются временные ряды, отражающие деятельность мирового валютного рынка FOREX. Каждому временному отрезку и определенной валютной паре соответствует совокупность четырех цен сделок купли-продажи на этом рынке: цена открытия, минимальная и максимальная цена, цена закрытия. Факторы, влияющие на цену сделки, настолько разнообразны и недетерминированы, что рынок FOREX является типичным представителем класса «хаотических» систем.

Обычно выделяют пять различных типов закономерностей: ассоциация, последовательность, классификация, кластеризация, прогнозирование. Ассоциация представляет собой определение связи между событиями. Если события связаны друг с другом по времени, то говорят о последовательности. Классификация - выявление признаков, характеризующих группу, к которой принадлежит тот или иной объект. Кластеризация отличается от классификации тем, что сами группы заранее не заданы. Прогнозирование осуществляет предсказание поведения системы в будущем на основе исторической информации, хранящейся в виде временных рядов. Ввиду широты проблематики, связанной с извлечением знаний из информационных массивов, область исследований была сужена, и в дальнейшем речь пойдет о решении задачи прогнозирования.

При анализе полученных в результате наблюдений (т.е. эмпирических) данных часто встает задача нахождения зависимости между значениями некоторого набора факторов и поведением исследуемого объекта или процесса. Такая зависимость может быть найдена из теоретических соображений и описана аналитически, однако на практике нередко встречаются случаи, когда подобная формализация затруднена.

В данной работе рассматривается часто возникающая в реальной жизни (например, при игре на финансовых рынках) задача прогнозирования временных рядов, которая имеет следующие особенности:

• на прогнозируемую величину влияют множество факторов, причем зависимость от ряда из них имеет недетерминированный характер;

• рассматриваемые временные ряды являются нелинейными и нестационарными;

• вид нелинейности временного ряда априорно не известен и не описан аналитически;

• в результате решения задачи требуется нахождение краткосрочного прогноза.

Цель и задачи работы: Настоящая диссертационная работа посвящена решению задачи организации доступа, хранения и извлечения знаний в темпоральных базах данных, предназначенных для регистрации и обработки эмпирических данных (временных рядов), являющихся результатом жизнедеятельности «хаотических» систем, а также разработке метода краткосрочного прогнозирования поведения временных рядов. Для достижения поставленной цели в работе решаются следующие основные задачи.

1. Анализ принципов построения темпоральных СУБД на предмет выбора способа реализации, оптимального с точки зрения отношения функциональных возможностей к трудоемкости реализации.

2. Выбор и обоснование набора операций темпоральной алгебры, достаточного для эффективного манипулирования временными рядами.

3. Разработка схемы трансляции темпоральных запросов в запросы к современной реляционной промышленной СУБД.

4. Разработка метода структуризации и накопления статистической информации о поведении временных рядов, ориентированного на использование накопленной информации для прогнозирования поведения временного ряда.

5. Разработка методики прогнозирования поведения временного ряда на основе структурированной статистической информации.

6. Разработка способа классификации состояния «хаотической» системы по временному ряду, отражающему ее функционирование.

7. Практическая реализация предложенных методов и применение для обработки реальных временных рядов, являющихся результатом жизнедеятельности мирового валютного рынка FOREX.

Объект и предмет исследования: Объектом исследования является темпоральная СУБД, ориентированная на хранение и обработку временных рядов. Предметом исследования является организация структуры темпоральной СУБД и методы интеллектуальной обработки временных рядов, хранимых в темпоральной СУБД, обеспечивающие краткосрочное прогнозирование поведения временных рядов.

Методы исследования: Исследования проводились с использованием теории реляционной алгебры, теории вероятности и методов теории искусственного интеллекта, применяемых в направлении "обнаружение знаний в темпоральных базах данных".

Научная новизна: В результате выполнения диссертационной работы обоснована структура темпоральной СУБД для хранения временных рядов и предложены методы краткосрочного прогнозирования поведения временных рядов.

Научная новизна работы состоит в следующем:

• предложена архитектура темпоральной СУБД в виде надстройки над традиционной реляционной СУБД;

• предложен набор операций темпоральной алгебры для эффективного манипулирования временными рядами;

• предложена схема трансляции темпоральных запросов в запросы к реляционной СУБД; • разработан метод структуризации и накопления статистической информации о поведении временных рядов;

• предложена методика краткосрочного прогнозирования поведения временных рядов;

• разработан способ классификации состояния «хаотической» системы по ее временному ряду.

Практическая значимость работы заключается в следующем:

• предложенные архитектура темпоральной СУБД и схема трансляции темпоральных запросов обеспечивают повышение эффективности процессов регистрации и обработки временных рядов;

• разработанный метод структуризации и накопления статистической информации о поведении временных рядов позволяет организовать процесс ее накопления в реальном времени;

• эффективность предложенной методики краткосрочного прогнозирования поведения временных рядов продемонстрирована на примере временных рядов мирового валютного рынка FOREX.

Положения, выносимые на защиту:

• Архитектура темпоральной СУБД и набор операций темпоральной алгебры.

• Схема трансляции темпоральных запросов в запросы к реляционной СУБД.

• Метод структуризации и накопления статистической информации о поведении временных рядов.

• Методика краткосрочного прогнозирования поведения временных рядов.

Реализация результатов работы: Результаты диссертационной работы реализованы в виде комплекса программы, осуществляющего прогнозирование временных рядов мирового валютного рынка FOREX. Комплекс используется для предсказания поведения соотношения валютных пар трейдерами валютного рынка. Результаты работы в части прогнозирования временных рядов использования в учебном процессе на кафедре математического обеспечения и применения ЭВМ СПбГЭТУ "ЛЭТИ" при проведении занятий по курсу "теория вероятности и математическая статистика".

Апробация работы: Результаты работы докладывались на международной конференции по мягким вычислениям и измерениям в 2005 г. на конференциях ППС СПбГЭТУ "ЛЭТИ" в 2004-2006 гг.

Публикации: По теме диссертационной работы опубликованы 3 научные работы, из них - 2 статьи и 1 работа в материалах международной конференции.

Структура и объем диссертации: Диссертационная работа состоит из введения, трех глав, заключения, списка литературы, включающего 138 наименований, и трех приложений. Основная часть работы изложена на 100 страницах машинописного текста. Работа содержит 63 рисунков и 3 таблицы.

Обзор методов интеллектуальной обработки временных рядов

Проблема аппроксимации временного ряда становится более интересной и перспективной в контексте потокового временного ряда, когда значения данных непрерывно генерируются, потенциально вечно. В этой ситуации, мы не можем применить методы приближения, которые требуют знания полного ряда, типа декомпозиции сингулярных значений [103] и большинства символических подходов [104]. Кроме того, большинство текущих представлений временных рядов обрабатывают каждый точку временного ряда одинаково. Это означает, что, при вычислении приближения, позиция времени точки не влияет на точности его приближения. Это может быть желательно для некоторых приложений, типа архивирования. Однако существуют много реальных ситуаций, где бы хотелось принять во внимание измерение времени в приближении временного ряда. Если принимать некоторый предел погрешности в приближении, то желательно, чтобы самые свежие данные имели маленькую ошибку, а в старых данных ошибки могут быть более существенными.

Основные результаты работы [96] можно сформулировать следующим образом:

Введено понятие общих функций забывания. Представлена таксономия этих функций, обсуждаются их свойства, и описано, как они затрагивают решение проблемы интерактивного приближения с забыванием.

Проблема интерактивного приближения с забыванием сформулирована как проблема оптимизации, в которой ошибка реконструкции минимизируется для заданного доступного для приближения объема памяти.

Предлагаются эффективные алгоритмы, чтобы решить вышеупомянутые проблемы оптимизации. Временная сложность предложенных алгоритмов не зависит от размера ряда времени. Время для обработки каждой новой точки постоянно (оно логарифмически зависит от числа сегментов, используемых в аппроксимации).

Представлена обширная экспериментальная оценка методов с использованием больше чем 40 синтетических и реальных наборов данных.

В работе [96] экспериментально сравнивались (в терминах точности реконструкции) наиболее известные методы для аппроксимации временных рядов, включая: Дискретное преобразование Фурье [105,11]; Дискретное косинусное преобразование; Кусочно-агрегатную аппроксимацию [91]; Дискретное волновое преобразование [106,89]; Адаптивное кусочно-постоянное приближение [103, 107]; Кусочно-линейное приближение [83]; Кусочно-квадратичную аппроксимацию и т.д.

Результаты экспериментального сравнения оказались довольно удивительными, потому что наблюдалось лишь небольшое различие между всеми подходами. Фактически, подобные результаты были зарегистрированы в других работах [102,105]. Из эксперимента можно сделать следующее общее заключение. Если мы хотим выбрать представление для задачи аппроксимации временного ряда, то мы не должны выбирать представление, основанное на точности приближения, а скорее из других соображений.

В отличие от статических баз данных базы данных с временными рядами (БДВР) содержат множество записей, в которых некоторые атрибуты или действия связаны с временными метками.

В БДВР рынка FOREX каждая запись включает кроме статических атрибутов, таких, как имя валютной пары, некоторые динамические атрибуты, такие, как цена открытия, закрытия, максимальная и минимальная, относящиеся к определенному интервалу времени. В базах данных такого типа временная размерность является неотъемлемой частью БД и должна быть учтена в методологии обнаружения знаний.

В то время как в статических базах данных обычно ссылаются на сами атрибуты в процессе извлечения знаний, в динамической базе данных ссылаются на свойства, определяемые через атрибуты. Примером такого свойства является тренд, который понимается как угол наклона прямой, аппроксимирующей значения атрибута на определенном отрезке времени.

Сырые данные рынка FOREX зашумлены и трудны для обработки. Атрибуты каждой записи подвержены влиянию различных факторов, затрудняя наблюдение признаков длительного срока. Поэтому необходима предварительная обработка первоначальных сырых данных и работа с преобразованной информацией.

Темпоральная надстройка над реляционной СУБД

Необходимость отслеживания изменяющихся во времени данных (работа с их историей, возможность регистрации прогнозируемых значений в будущем) привела к появлению нового класса СУБД - темпоральных СУБД. В темпоральных СУБД задача описания запросов и ограничений целостности для изменяющихся во времени данных существенно упрощается по сравнению с традиционными СУБД реляционного типа.

В темпоральных базах данных время понимается не только как особый тип данных. В них время является целым измерением, причем совершенно самостоятельным, управляемым самой СУБД и не являющимся атрибутом никакой сущности. К тому же, оперирование только временными моментами не всегда удобно, и часто намного удобнее оперировать целыми временными интервалами или наборами интервалов, работа с которыми заметно отличается от работы с моментами времени, хотя и может быть построена на ней. Все это приводит к выводу, что темпоральные СУБД, и в частности языки запросов, должны существенно отличаться от классических СУБД.

Так как на данный момент не существует промышленных систем управления базами данных, в полной мере поддерживающих обработку темпоральных данных, то становится актуальной задача реализации темпоральной надстройки над классической СУБД. Клиентские приложения будут обращаться не к самой СУБД, а к надстройке, которая будет преобразовывать все темпоральные запросы клиента в запросы, понятные существующей СУБД. При этом темпоральная надстройка не вмешивается в реализацию классической СУБД, в результате чего вся существующая функциональность СУБД сохраняется. Основным преимуществом такого подхода является возможность использования всей функциональности существующей СУБД. Основной недостаток его заключается в том, что мы не можем использовать технику оптимизации, использующую такие понятия как темпоральные соединения [135], темпоральные структуры хранения и темпоральные индексы.

Ключевым моментом в реализации темпоральной надстройки является набор правил, который позволил бы реализовать соответствующий алгоритм перевода входящих запросов в запросы на SQL-92. Во второй главе данной диссертации описывается набор таких правил и алгоритм их применения. В качестве языка, с которого осуществляется трансляция, выбран SQL-3, т.к. он представляет наиболее вероятное направление развития языка запросов современных промышленных СУБД, подавляющее большинство которых использует SQL-92.

Определение 1. База данных с временными рядами - это набор записей {г У. \ таких, что каждая запись содержит множество атрибутов и значение времени rf =\si,s2,...,sk,di,d2,...,dm,t }. Каждый атрибут может быть либо вещественным числом а, є IR, либо дискретным а, є IN и может иметь или не иметь связи со значением времени. Если атрибут связан со значением времени, он называется динамическим, в противном случае - статическим. Будем рассматривать следующие значения интервала времени tf: 1 мин, 5 мин, 15 мин, 1 ч, 4 ч и 1 день. Определение 2. Атрибутная функция - это функция от времени, элементы которой являются значениями атрибута / в записях, и она отображается как функция от времени а? (/), так что (tx) = a erj ,3tx єгу , где af- атрибут і во временном ряде с интервалом At; rf- у-я запись из базы данных во временном ряде с интервалом At ; tx— момент времени, связанный с этой записью. Определение 3. Свойство определяется на интервале времени [/,,/2], если некоторая атрибутная функция af{t) может быть аппроксимирована другой функцией от времени, т. е. 9 (/).

Говорят, что ф и ее параметры являются свойством af{t) на интервале [tx,t2]. Например, если (pAt(t)=aft + fi?на некотором интервале, можно сказать, что в этом интервале функция af{t) имеет наклон af, где наклон - это свойство, извлеченное из af {t) на некотором интервале.

Определение 4. Изменение свойства между двумя соседними интервалами является событием.

Необходимо разработать методы и алгоритмы, позволяющие проводить классификацию состояний «хаотической» системы, результатом жизнедеятельности которой является временной ряд. Эти средства должны учитывать различные временные срезы, а также обеспечивать предварительную обработку зашумленных первичных данных.

Методика обработки «исторических» данных должна формировать информацию, обеспечивающую краткосрочное прогнозирование поведения «хаотической» системы. Трудоемкость получения и объем этой информации должны быть такими, чтобы обеспечивалась возможность прогнозирования поведения временных рядов и коррекция накопленной информации в реальном времени.

Кроме того, должен быть разработан механизм отображения временного ряда в символическое описание и предложен метод поиска закономерностей в этом описании в виде ассоциативных правил.

Темпоральная алгебра

Темпоральная выборка вычисляется по следующей формуле: (г)=1? VT) (t VT) еглс{({ VT))} Она фактически совпадает с операцией селекции из реляционной алгебры Кодда при условии, что временная метка задается обычными атрибутами.

Результат селекции всегда является склеенным. В результирующее отношение входит только часть кортежей исходного отношения и других кортежей в нем нет, поэтому появление в результирующей таблице записей с одинаковыми пользовательскими атрибутами и пересекающимися временными метками означало бы наличие таких записей в исходном отношении, что противоречит его склеенности.

Таким образом, операция темпоральной селекции может быть записана как простая селекция: SELECT FROM table WHERE condition Темпоральная проекция задается формулой: тг} {г) = соа%{ КГ) (t Т) є г л f, = f(t)})

Здесь f задает набор пользовательских атрибутов, по которым производится проекция. При вычислении результатов проекции требуется дополнительная склейка, т.к. удаление из кортежей склеенного отношения некоторых пользовательских атрибутов может привести к нарушению склеенности таблицы.

Таблица, передаваемая в качестве параметра операции склейки, может быть вычислена следующим образом (помимо пользовательских атрибутов в результат должна входить временная метка): SELECT al,..., an, valid_begin, valid_end FROM r; Предполагается, что проекция таблицы г производится по пользовательским атрибутам al,...,an. Темпоральное объединение вычисляется по формуле: rx uv/ r2 = coal({(t VT) (t VT) є rx v (t VT) Є r2})

Результат необходимо приводить к склеенному состоянию, т.к. в объединяемых таблицах могут быть записи с одинаковыми пользовательскими атрибутами и пересекающимися либо смежными временными метками. Параметр операции coal может быть вычислен достаточно просто: SELECT FROM rl UNION SELECT FROM r2 При этом необходимо гарантировать, что типы атрибутов на соответствующих местах совпадают. Темпоральное пересечения вычисляется по формуле: intersect rlnvtr2 = f(t\\VT)\(t\\VTl)erlA(t\\VT2)e г2 л VTxoverlaps VT2 л VT = intersect , VT2)}

Результат пересечения двух склеенных таблиц всегда является склеенным. Если в результате содержатся две записи с одинаковыми пользовательскими атрибутами и пересекающимися временными метками, то, по крайней мере, в одной из исходных таблиц было две записи с такими же пользовательскими атрибутами и временными метками содержащими временные метки записей результата. Поскольку такие метки не меньше меток соответствующих записей результирующего отношения, то они обязаны пересекаться, что противоречит предположению о склеенности исходных таблиц.

Результат пересечения двух таблиц rl и г2 с пользовательскими атрибутами al,...,an и bl,...,bn соответственно, можно вычислить с помощью SQL-выражения: SELECTrl.al,. ..,rl.an, CASE WHEN rl.valid_begin r2.valid_begin THEN rl.valid_begin ELSE r2.valid_begin END AS valid_begin, CASE WHEN rl.valid_end r2.valid_end THEN rl.valid_end ELSE r2.valid_end END AS valid_end FROMrl,r2 WHERE rl.al=r2.bl AND rl.a2 = i2.b2AND rl.an = r2.bnAND rl.valid_begin r2.valid_end AND r2.valid_begin rl.valid_end Разность двух темпоральных отношений вычисляется по следующей формуле: rx\vt r1 = {{t\\VT)\{t\\VTl)&rxA (3 VT2((t VT2) є r2 A VT; VT2+ A VT = VT2+)v VT = VT )A (3 VT3((t VT3) є r2 A VTX+ VT; A VT+ = VT2 )v VT+ =VT+)A VT VT+ A-,3 VT4((t VTA) є r2 A VT4+ VT A VT; VT+)}

В результат входят все записи из первой таблицы, для которых не существует записей с такими же значениями пользовательских атрибутов во второй таблице, и записи, для которых существуют записи во второй таблице. При этом временная метка записи результата является максимальным интервалом, содержащимся в соответствующей временной метке записи из первой таблицы, не пересекающимся с временными метками записей второй таблицы с такими же значениями пользовательских атрибутов.

Фильтрация данных временных рядов

Операция очистки состоит в нахождении а{п) как приближения долгосрочного сигнала а{п). Для очистки данных, как правило, используют операцию фильтрации низкой частоты, т. е. операцию, которая исключает волны высокой частоты (относящиеся в наибольшей мере к шуму) и оставляет только низкочастотные волны (относящиеся в наибольшей мере к долгосрочному сигналу).

Имеется достаточно много операций фильтрации низкой частоты в области времени и частоты: простая скользящая средняя, взвешенная скользящая средняя и т. д. Следует отметить, что независимо от специалистов по обработке сигналов технические аналитики рынка FOREX подошли к использованию техники сглаживания для фильтрации сигналов.

Подавляющее число технических аналитиков сегодня предпочитают экспоненциальное сглаживание, которое заключается в нахождении экспоненциального скользящего среднего (ЭСС). С точки зрения отношения к новым данным, генерируемым рынком, экспоненциальная скользящая средняя представляет собой идеальный компромисс между повышенной чувствительностью взвешенного скользящего среднего и заметным отставанием простого скользящего среднего. В отличие от многих других техник усреднения экспоненциальная скользящая средняя следует за трендом текущих данных более гладко, с минимальным количеством скачков и наименьшим запаздыванием [1].

С точки зрения вычислений, экспоненциальная скользящая средняя также представляет немало выгод пользователю: данный метод предполагает небольшое число расчетов и не слишком сложные манипуляции с данными. Для получения новых значений экспоненциального скользящего среднего необходимы численные значения, относящиеся только к двум периодам: самому последнему периоду необработанных данных и предшествующему периоду экспоненциального скользящего среднего. Кроме того, метод вычисления экспоненциальной скользящей средней позволяет избежать текущих ошибок, связанных с потерей несущественных и малозначимых данных. Существует несколько подходов к вычислению экспоненциального скользящего среднего. Для его расчета воспользуемся следующей формулой: 1 Т-\ ЕМА = — С + Ер, где ЕМА- экспоненциальная скользящая средняя текущего периода; С- цена закрытия текущего периода; Ер- экспоненциальная скользящая средняя предшествующего периода; Т- число периодов экспоненциальной скользящей средней (период ЭСС).

Для каждой валютной пары и всех рассматриваемых интервалов времени (1 мин, 5 мин, 15 мин, 1 ч, 4 ч, 1 день) определим три экспоненциальные скользящие средние с периодами 8, 13 и 55. Значения периодов экспоненциальных скользящих средних взяты из последовательности Фибоначчи.

Экспоненциальную скользящую среднюю с периодом 55 будем использовать для оценивания статической составляющей индикатора обобщенного тренда (долгосрочный тренд). Динамическую составляющую обобщенного тренда будем оценивать с помощью экспоненциальных скользящих средних с периодами 8 и 13.

На рис. 3.1 показаны экспоненциальные скользящие средние цен закрытия для валютной пары британский фунт - доллар США и 4-х часового временного интервала. Хорошо видно, что экспоненциальная скользящая средняя с периодом 55 не повторяет мгновенных скачков цен закрытия и может выступать в качестве приемлемого приближения долгосрочного тренда. Экспоненциальные скользящие средние с периодами 8 и 13 повторяют по форме первоначальную последовательность. Они следуют за ней по сглаженной траектории, причем ЭСС с периодом 8 обладает большей реактивностью.

Изменение рыночных цен происходит в форме тренда. Характер тренда определяется многими переменными. На движение цен влияют перемены, происходящие на уровне соответствующих фундаментальных экономических факторов. Таким образом, в момент возникновения тренда причина его появления не всегда очевидна. Определить обстоятельства, способствовавшие рождению конкретного тренда, не всегда удается даже по прошествии значительного временного периода. Технические индикаторы рынка - это инструмент идентификации тренда и изменений в нем; причины формирования тренда не могут быть определены с их помощью.

Известные технические индикаторы рынка, как правило, ограничены рамками конкретной валютной пары и конкретного интервала времени, даже когда индикатор является комбинацией нескольких других индикаторов.

Предлагаемый в данной работе технический индикатор рынка не выходит за рамки одной валютной пары, но в его основе лежат 18 экспоненциальных скользящих средних для 6 интервалов времени: 1 мин, 5 мин, 15 мин, 1 ч, 4 ч и 1 день. Из общепринятых в техническом анализе рынка FOREX интервалов времени в данный список не включены интервалы 10 и 30 мин. При выборе интервалов времени принималось во внимание следующее соображение: интервалы должны отличаться друг от друга примерно в одинаковое число раз (в данном случае в 3...6 раз).

Организация доступа, хранения и извлечения знаний в темпоральных базах данных Нгуен Доан Куонг

Обзор методов интеллектуальной обработки временных рядов

Темпоральная надстройка над реляционной СУБД

Темпоральная алгебра

Фильтрация данных временных рядов

Похожие диссертации на Организация доступа, хранения и извлечения знаний в темпоральных базах данных