Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Структурно-параметрическая оптимизация баз знаний обучаемых экспертных систем Бухнин Алексей Викторович

Структурно-параметрическая оптимизация баз знаний обучаемых экспертных систем
<
Структурно-параметрическая оптимизация баз знаний обучаемых экспертных систем Структурно-параметрическая оптимизация баз знаний обучаемых экспертных систем Структурно-параметрическая оптимизация баз знаний обучаемых экспертных систем Структурно-параметрическая оптимизация баз знаний обучаемых экспертных систем Структурно-параметрическая оптимизация баз знаний обучаемых экспертных систем Структурно-параметрическая оптимизация баз знаний обучаемых экспертных систем Структурно-параметрическая оптимизация баз знаний обучаемых экспертных систем Структурно-параметрическая оптимизация баз знаний обучаемых экспертных систем Структурно-параметрическая оптимизация баз знаний обучаемых экспертных систем
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Бухнин Алексей Викторович. Структурно-параметрическая оптимизация баз знаний обучаемых экспертных систем : диссертация ... кандидата технических наук : 05.13.01.- Нижний Новгород, 2005.- 175 с.: ил. РГБ ОД, 61 06-5/1232

Содержание к диссертации

Введение

Глава первая. Современные подходы к построению экспертных систем и методы интеллектуального анализа данных 11

1.1. Традиционные подходы к представлению и приобретению знаний в интеллектуальных системах 11

1.1.1. Общие сведения об экспертных системах 11

1.1.2. Представление знаний в экспертных системах 13

1.1.3. Приобретение знаний экспертными системами 20

1.2. Интеллектуальный анализ данных 22

1.2.1. История развития Data mining 22

1.2.2. Обзор алгоритмов Data mining 23

1.3. Адаптивные системы нечеткого логического вывода 34

1.4. Выводы 39

Глава вторая. Метод структурно-параметрической оптимизации базы знаний 41

2.1. Структура базы знаний 41

2.2. Математическая модель нечеткой сети логического вывода 46

2.2.1. Нечеткий элемент типа "ИЛИ" 47

2.2.2. Нечеткий элемент типа "И" 47

2.2.3. Элемент типа "Входной" 48

2.2.4. Элемент типа "Входная переменная" 49

2.2.5. Элемент типа "Сегмент" 52

2.2.6. Пример нечеткой сети логического вывода 53

2.3. Общее описание процесса оптимизации базы знаний 57

2.4. Выводы 75

Глава третья. Основные алгоритмы оптимизации нечеткой сети логического вывода 77

3.1. Генетический алгоритм параметрической оптимизации 77

3.2, Алгоритм факторизации 96

3.3. Выводы 104

Глава четвертая. Исследование эффективности разработанного подхода с помощью математического моделирования 106

4.1. Исследование зависимости эффективности генетического алгоритма параметрической оптимизации от значений его параметров 106

4.2. Сравнение эффективности модификаций генетического алгоритма 117

4.3. Решение прикладных задач 119

4.3.1. Классификация цветов 119

4.3.2. Построение аналитической модели для прогнозирования активности кариеса зубов в период беременности и ближайшие после родов сроки 130

4.3.3. Прогнозирование валютных цен на финансовом рынке 132

4.4. Выводы 140

Заключение 141

Список литературы 143

Введение к работе

Актуальность исследования. При решении сложных задач во многих областях человеческой деятельности, связанных с использованием слабоформализованных знаний специалистов-практиков, успешно применяются технологии искусственного интеллекта. Системы, основанные на базах знаний или моделях предметной области, описанных на языке, близком к естественному, называют интеллектуальными. На данный момент прикладные интеллектуальные системы используются в десятках тысяч приложений [86]. Одним из наиболее распространенных видов интеллектуальных систем являются экспертные системы (ЭС).

Экспертные системы - это класс интеллектуальных систем, ориентированный на распространение опыта высококвалифицированных специалистов для консультироваїшя менее квалифицированных пользователей. Современные ЭС — это сложные программные комплексы, позволяющие использовать ЭВМ для обработки информации в тех областях науки и техники, где традиционные математические методы малопригодны. К таким областям можно отнести экономику, медицину, геологию, химию и др.

Главное отличие ЭС от других программных средств - это наличие базы знаний (БЗ), в которой знания хранятся в понятной человеку форме, что позволяет специалисту их легче анализировать и изменять. Первыми широкую известность получили нечеткие экспертные системы, в которых представляются и обрабатываются неточные знания (знаменитая медицинская система MYCIN [34]).

В России исследования ЭС проводили ученые В.Л. Вагин, В.И. Городецкий, Г.С. Осипов, Э.В. Попов, Д.А. Поспелов, В.Л. Сте-

фанюк, В.К. Финн, В.Ф. Хорошевский и многие другие. Развитию нечетких ЭС способствовали работы А.Н. Авсркина, А.Н. Борисова, Л.А. Заде, Дж. Клира, А. Кофмана, Е.А. Мамдани, Д.А. Поспелова, А.П. Рыжова и др.

Современное состояние разработок в области ЭС в России исследователи характеризуют "как стадию все возрастающего интереса среди широких слоев специалистов - финансистов, менеджеров, преподавателей, инженеров, медиков, психологов, программистов, лингвистов" [86]. Недостаток в недавнем прошлом учебников и специальной литературы на русском языке, ограниченное финансирование исследований в этой области привело к тому, что отечественный рынок инструментов для разработки ЭС пока является слабым.

Создание эффективной системы - дорогостоящий и продолжительный процесс, требующий привлечения специалистов различных направлений: программистов, инженеров по знаниям, экспертов в прикладной области. Одной из основных проблем при этом является приобретение знаний, т.е. "передача потенциального опыта решения проблемы от некоторого источника знаний и преобразование его в вид, который позволяет использовать эти знания в программе" [94]. Знания передаются во время собеседований между инженером по знаниям и экспертом в предметной области. "Многие исследователи рассматривают функцию приобретения знаний в качестве одного из главных "узких мест" технологии экспертных систем из-за низкой скорости наполнения базы знаний системы правилами" [95]. Для получения требуемого результата необходимо взаимопонимание между экспертом и инженером по знаниям. Не всегда специалист может объяснить, как он решает задачи в своей области.

Между тем, существуют прикладные области, в которых собрано большое количество фактической информации. Эти данные могут быть использованы для генерации правил или для оптимизации имеющейся базы знаний, В настоящее время усилия многих исследователей направлены на разработку адаптивных или самоорганизующихся систем, способных обучаться на примерах. Под самоорганизующейся системой понимается система, упорядоченность и организованность которой возрастает со временем. Наиболее известными примерами подобных систем являются искусствешіьіе нейронные сети, системы, использующие метод группового учета аргументов (МГУА), адаптивные системы нечеткого логического вывода (последним посвящены работы Ч. Карра, О. Кордона, Б. Коско, В.В. Круглова, А.П. Ротштейна, Т. Фукуда, Ф. Херреры, С.Д. Штовбы, Р. Янга и др.) Все используемые технологии обладают как достоинствами, так и определенными недостатками. Ней-росетевой подход и МГУА приводят к получению логически непрозрачных систем. Способ решения задачи такими системами трудно вербализовать. Существующие подходы к получению логически прозрачных нейросетей нельзя признать эффективными. Да и само понятие "логической прозрачности" иерархических интеллектуальных систем недостаточно формализовано.

В свою очередь, наиболее изученные варианты систем нечеткого логического вывода не обладают достаточной гибкостью в представлении знаний. Их базы знашій имеют одноуровневый вид, т.е. промежуточные выводы не используются. Кроме того, существующие методы оптимизации таких систем допускают ограниченное участие эксперта в обучении. Его роль сводится к подготовке обучающей выборки и выбору параметров алгоритма оптимизации. Использование априорной инфор-

мации о прикладной области в виде формулирования начальной базы знаний, защиты от изменения части параметров модели не допускается. Общепризнанного лучшего метода оптимизации нечетких систем на данный момент не существует. Известные алгоритмы обучения различаются особенностями этапов структурной и параметрической оптимизации, подходами к настройке параметров сегментации входных переменных. Последняя задача является особо важной и трудно решаемой (если учитывать требование простой вербализуемости результирующей базы знаний).

Таким образом, актуальной является задача создания эффективного метода оптимизации баз знаний экспертных систем, с возможностью модификации списка нечетких правил и настройки параметров сегментации входных переменных. Метод должен допускать использование априорной информации о прикладной области на разных этапах обучения. Модель системы должна поддерживать иерархический логический вывод.

Целью работы является разработка метода структурно-параметрической оптимизации баз знаний обучаемых экспертных систем и исследование его эффективности. Для достижения поставленной цели необходимо решить следующие задачи:

  1. Разработать математическую модель нечеткой адаптивной системы, сочетающую гибкость и универсальность в представлении знаний с простотой вербализации.

  2. Ввести критерий структурной сложности нечеткой адаптивной модели, формализующий понятие "логической прозрачности".

  3. Разработать и программно реализовать метод оптимизации адаптивной системы, допускающий автоматическую генера-

цию и модификацию нечетких правил, настройку параметров сегментации входных переменных и при этом позволяющий использовать априорную информацию о прикладной области на различных этапах обучения.

4. Исследовать эффективность применения предложенной модели нечеткой адаптивной системы при решении прикладных задач.

На защиту выносятся:

  1. Метод оптимизации баз знаний экспертных систем, основанный на преобразовании исходной БЗ в нечеткую сеть логиче-ского вывода, оптимизации сети с использованием обучающей выборки и обратном преобразовании сети в базу знаний.

  1. Генетический алгоритм параметрической оптимизации нечеткой сети.

  2. Алгоритм факторизации нечеткой сети логического вывода, использующий критерий структурной сложности для получения сети с более легко интерпретируемой структурой.

  3. Результаты исследования эффективности предложенной модели и метода оптимизации при решении прикладных задач.

Методы исследования. Работа базируется на методах и моделях теории нечетких множеств, эволюционных вычислений, гибридных интеллектуальных систем, математической статистики, объектно-ориентированного программирования, а также алгоритмах синтеза микропрограммных автоматов.

Научная новизна. В диссертационной работе получены следующие результаты, характеризующиеся научной новизной;

Ї. Разработан метод оптимизации баз знаний экспертных систем, основанный на преобразовании исходной БЗ в нечеткую сеть логического вывода, оптимизации сети и обратном преобразовании сети в базу знаний. Метод допускает использование априорной информации о прикладной области для получения наиболее полной и точной базы знаний в условиях малой обучающей выборки.

  1. Разработана математическая модель нечеткой сети логического вывода, включающая исчерпывающий набор типов элементов, необходимых для преобразования БЗ в сеть и обратно.

  2. Введен критерий структурной сложности нечеткой сети логического вывода, используемый для сравнения сетей с различающимися структурами, но позволяющих решать задачу с одинаковой точностью.

  3. Разработан алгоритм факторизации нечеткой сети, основанный на выделении устойчивых сочетаний посылок в условных частях нечетких элементов.

Практическая значимость и ценность работы заключается в создании программы-оболочки для построения экспертных систем, которая позволяет пользователю, не являющемуся программистом, создавать базы знаний, оптимизировать их с использоваїгаем обучающей выборки, проводить интеллектуальный анализ данных, выявляя логические закономерности. С применением данной разработки была создана аналитическая модель для прогнозирования активности кариеса зубов в период беременности и ближайшие после родов сроки, представляющая профессиональный интерес для врачей-стоматологов.

Апробация работы. Основные положения и результаты диссертационной работы докладывались и обсуждались на Всероссийской научно-технической конференции "Информационные системы и технологии" ИСТ - 2002; Всероссийской научно-технической конференции ИСТ - 2003; Всероссийской научно-технической конференции ИСТ — 2004; III Всероссийской молодежной научно-технической конференции "Будущее технической науки"; Всероссийской научно-технической конференции ИСТ-2005.

Публикации. По материалам диссертационной работы опубликовано 10 печатных работ, из них 3 статьи и 7 публикаций в материалах научных конференций.

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы из 102 наименований и четырех приложений; содержит 142 машинописные страницы основного текста, включая 27 рисунков и 3 таблицы.

Представление знаний в экспертных системах

Знания в ЭС представляются в такой форме, которая с одной стороны предполагает простую интерпретацию человеком, а с другой - позволяет перевести их во внутреннее представление в памяти ЭВМ и использовать для логического вывода. Решение задачи экспертной системой происходит на основании эвристических правил, которые хранятся в базе знаний. Проблемы ставятся перед системой в виде совокупности фактов, описывающих некоторую ситуацию, и система пытается вывести заключение из этих фактов. Качество решений ЭС определяется размером и качеством базы знаний. Для создания полной и точной БЗ необходимо опросить экспертов в предметной области, а затем систематизировать полученные от них знания. Перечислим основные способы представления знаний в интеллектуальных системах. Фреймом называется структура для описания стереотипной ситуации или объекта, состоящая из характеристик этой ситуации (объекта) и их значений. Характеристики называются слотами, а значения -заполнителями слотов. Слот может содержать не только конкретное значение, но и имя процедуры, позволяющей вычислить его по заданному алгоритму, а таюке продукции, с помощью которых это значение можно найти. Логический вывод во фреймовой системе базируется на обмене сообщениями между фреймами, активации и выполнении присоединенных процедур [11]. Представление знаний, основанное на фреймах, дает возможность в явной форме хранить в базе знаний родовидовую иерархию понятий. На верхнем уровне иерархии находится фрейм, содержащий наиболее полную информацию, истинную для всех остальных фреймов. Фреймы обладают способностью наследовать значения характеристик своих родителей, находящихся на более высоком уровне иерархии. Положительными чертами фреймовой модели являются наглядность, однородность, высокая степень структуризации знаний, интеграция декларативных и процедурных знаний. Наиболее ярко достоинства фреймовых систем проявляются в том случае, если родовидовые связи изменяются нечасто и предметная область насчитывает немного исключений. Как недостаток фреймовых систем следует отметить их относительно высокую сложность, что проявляется в снижении скорости работы механизма вывода и в увеличении трудоемкости внесения изменений в родовидовую иерархию. Кроме того, во фреймовых системах затруднена обработка исключений. Семантическая сеть считается наиболее общим способом представления знаний [11]. В ней понятия и классы, а также отношения и связи между ними представлены в виде сети. Семантическая сеть ото -15 бражает совокугаюсть объектов предметной области и отношений между ними, при этом объектам соответствуют вершины (или узлы) сети, а отношениям — соединяющие их дуги. В качестве объектов могут выступать события, действия, обобщенные понятия или свойства объектов. Свойства представляются в сети также в виде вершин и служат для описания классов объектов. Вершины сети соединяются дугой, если соответствующие объекты предметной области находятся в каком-либо отношении. Как и в системе, основанной на фреймах, в семантической сети могут быть представлены родовидовые отношения, которые позволяют реализовать наследование свойств от объектов-родителей. Это обстоятельство приводит к тому, что семантические сети приобретают большинство недостатков и достоинств представления знаний в виде фреймов. Основное преимущество семантических сетей заключается в их наглядности и непосредственной связанности понятий через сеть, которая позволяет быстро находить связи понятий. Главный недостаток семантических сетей - сложность обработки исключений, требующих перестройки больших участков сети с взаимосвязанными узлами. Кроме того, имеет место смешение групп знаний, относящихся к совершенно различным ситуациям, что усложняет интерпретацию знаний и затрудняет управление выводом на сети. Однако достоинства данного подхода позволяют применять его и в современных системах [44]. -16 3) Нейросетевая модель Нейросетевой подход является одним из наиболее интенсивно развивающихся направлений ИИ. Как и семантические сети, он относится к сетевым моделям представления знаний. Нейросетевой метод основан на попытке имитировать процессы, происходящие в мозге человека на клеточном уровне. В настоящее время искусственные обучаемые нейронные сети (НС) широко применяются для решения сложных неформализованных задач прогнозирования и классификации [78]. Несколько основных нейросетевых архитектур, такие, как многослойные персеп-троны, сети и карты Кохонена, делают возможным решение широкого спектра задач, зачастую нерешаемых классическими статистическими методами обработки данных.

Пример нечеткой сети логического вывода

Элементы типа "Сегмент" имеют следующие значения параметров к, равные номерам сегментов соответствующих переменных (перечисляем слева направо по рис. 2.3): 1,2, 3,2.

С одной стороны описанную сеть можно рассматривать как разновидность искусственных нейронных сетей. По топологии это будут многослойные синхронные сети прямого распространения с перекрестными связями. С другой стороны нечеткие нейроны играют роль продукционных правил, а их совокупность может быть представлена в виде базы знаний, т.е. сеть может быть легко вербализована. От стандартных гибридных сетей, описанных в [51] и [67], приведенные сети отличаются наличием нейронов, реализующих промежуточные вводы, что приводит к получению многоуровневой иерархии правил. Эта особенность делает предложенные системы более гибким инструментом для выражения знаний о прикладной области.

В терминах нечетких систем сеть описанного типа производит нечеткий логический вывод по алгоритму Сугэно 0-го порядка [65], однако она не содержит характерный для всех нечетких систем блок деффузификации. В предыдущем разделе рассматривались особенности интерпретации значений степеней истинности нескольких исходов и указывалось на отсутствие универсального подхода. Поэтому в данной работе предлагается отказаться от включения в систему блока деффузификации. Это позволит упростить преобразование базы знаний в сеть и обратно, приведет к упрощению алгоритма структурной оптимизации, а также сократит набор оптимизируемых параметров системы (за счет отсутствия функций принадлежности для выходных переменных).

Кроме того, особенностью данной системы является применение блока агрегации выводов в виде элемента типа "ИЛИ" (реализующего функцию max), а не сумматора, более характерного для типичных нечетких систем. Такой подход позволяет получать сети более однородной структуры (не требуется введение дополнительного типа элементов), что упрощает вербализацию.

Целью процесса оптимизации базы знаний является получение наиболее полной, непротиворечивой и доступной для оценки экспертом модели, позволяющей решать прикладную задачу. При этом на различных этапах используется априорная информация о прикладной области (знания эксперта, известные зависимости и правила, информация из литературных источников) и обучающая выборка, описывающая наблюдения за реальными объектами или ситуациями. На рис. 2.5 представлена диаграмма, описывающая процесс оптимизации базы знаний.

Процесс создания модели можно разделить на несколько этапов; 1) Вначале эксперт формирует исходный список правил на основе имеющихся у него знаний и в соответствии с собственными представлениями о способе решения прикладной задачи. Этот этап во многом повторяет классический подход к построению экспертных систем, заключающийся в совместной работе эксперта и инженера по знаниям по формулированию продукционных правил [26, 34, 86]. Отличие от классического подхода заключается в отсутствии строгих требований полноты, точности и непротиворечивости базы знаний, полученной в результате данного этапа. Перечисленные требования должны быть удовлетворены по окончании структурно-параметрической оптимизации. При этом очевидно, что чем более полной и точной будет исходная база знаний, тем быстрее завершится автоматическое обучение. На этом же этапе эксперт решает, какие параметры объекта должны быть учтены при проведении логического вывода. Список входных переменных должен включать все важные параметры и может корректироваться по результатам обучения системы - некоторые параметры будут исключены как незначащие либо может понадобиться пополнение списка при невозможности получения достаточной точности решения задачи. При неполном наборе входных переменных успешное разделеігае объектов на классы в пространстве признаков не может быть произведено.

Генетический алгоритм параметрической оптимизации

Использование недифференцируемых функций т т и max при вычислении выходных значений нечетких элементов типа "И" и типа "ИЛИ" не позволяет применять градиентные методы глобальной минимизации функции ошибки. Кроме того, алгоритм оптимизации нечеткой модели должен быть эффективным в условиях многоэкстремальности и большой размерности оптимизируемой функции [27, 32, 41, 102]. В данной работе для обучения нечеткой сети предлагается использовать генетический алгоритм (ГА). Потенциальная эффективность генетических алгоритмов в нашем случае обусловлена особенностями оптимизируемой системы. Известно [51, 64], что эволюционные методы целесообразно применять для обучения систем, состоящих из относительно независимых блоков или подсистем. Тогда нахождение оптимальных значений параметров каждого блока дает некоторое увеличение приспособленности системы в целом независимо от состояния других подсистем. Это приводит к доминированию в популяции особей с большим числом оптимизированных блоков. В результате их скрещивания получаются особи с еще большей приспособленностью ("неудачные" варианты отсеиваются).

Сеть логического вывода представляет собой пример подобной системы. В ней существуют подсети, каждая из которых описывает оп -78 ределенный класс случаев (т.е. входящие в подсеть правила активизируются при рассмотрении объекта из соответствующего класса). Эти подсети могут частично пересекаться, но, в целом, оптимизация некоторых из них будет приводить к правильным решениям для соответствующих примеров, не влияя на вывод в остальных случаях. Еще более изолированными друг от друга являются подсети, которые содержат правила, относящиеся к разным выходным переменным. При этом они имеют общий набор входных переменных, что не позволяет упростить задачу оптимизации, путем выделения одновыходных систем и проведения раздельного обучения.

Еще одним доводом в пользу применения генетических алгоритмов при решении нашей задачи являются нестрогие требования к точности искомых значений параметров элементов сети. При вербализации оптимизированной системы численные значения весов правил и посылок чаще всего заменяются соответствующими лингвистическими термами. Целесообразно ограничить список возможных значений этих параметров всего несколькими числами (включая максимальное значение 1 и минимальное 0). Тогда для их кодирования достаточно двух или трех битов.

Во второй главе были перечислены 5 типов элементов, используемых для формирования сети лопїческого вывода. Элементы каждого типа, кроме типа "Входной", имеют различные параметры, определяющие способ преобразования информации каждым элементом и сетью в целом.

Обозначим через X вектор параметров всех элементов сети, через D - описание области допустимых значений этих управляемых параметров [9]. Тогда обучение нечеткой модели сводится к задаче нелинейной оптимизации.

Исследование зависимости эффективности генетического алгоритма параметрической оптимизации от значений его параметров

Далее приводится описание процесса создания базы знаний на примере построения экспертной системы для прогнозирования риска заболевания кариесом беременных женщин. Данная задача решалась в сотрудничестве с аспирантом кафедры ортопедической стоматологии НГМА Покровским М.Ю.

В качестве исходных данных имелись результаты обследования 97 пациенток (20 параметров, 1 зависимая переменная, принимающая одно из трех значений). На основе анализа литературы были отобраны 6 прогностических факторов, наиболее сильно влияющих на активность кариеса зубов: уровень резистентности по Недосеко В.Б., резистентность эмали (КОСРЭ), вязкость, рН, МПС, буферная емкость. В дальнейшем эксперименты показали, что необходимо увеличить их число до 8 (добавились возраст пациентки и резус фактор крови). Эксперт на основе своих знаний с использованием информации из литературных источников по предметной области произвел разбивку входных переменных на небольшое число интервалов (3-6 для одной переменной). Некоторые переменные затруднительно разбить таким образом, поэтому далее была использована программа WizWhy предприятия WizSoft (эта система предназначена для поиска логических закономерностей в данных методом ограниченного перебора, ее описание приводится в [37]). В ней происходила автоматическая сегментация параметров, результаты которой корректировались экспертом. На основе априорной информации о предметной области (знания эксперта, литературные источники) был сформирован начальный набор логических правил. Он был дополнен наиболее значимыми и безошибочными правилами, найденными системой WizWhy (всего получилось порядка 20 правил). Система WizWhy имеет ряд недостатков, из-за которых она может использоваться лишь как вспомогательное средство: - значительно ограниченное участие эксперта в процессе отыскания зависимостей, т.е. невозможность использования априорной информации (отсутствует возможность формирования начального набора правил или редактирования полученного системой, невозможно повлиять на сегментацию параметров); - отсутствие иерархии правил, что приводит к громоздкости правил и увеличению их числа; - ориентированность на большие объемы обучающей выборки. Затем была проведена структурно-параметрическая оптимизация набора правил. В начале этой процедуры число правил автоматически увеличилось до 50 - 60. По достижении предельных значений ошибки на обучающей выборке (когда ошибка перестала уменьшаться) произошло упрощение базы знаний за счет отбрасывания незначащих правил и связей между правилами. В результате был получен набор из примерно 40 правил. В начале работы, когда успешной оптимизации не происходило, производилось уточнение сегментащш и добавление новых входных параметров. Далее, полученная база знаний была проанализирована с целью отбрасывания некоторых правил, не отражающих тенденцию или противоречащих знаниям о предметной области (такие правила обычно охватывают 1-2 случая из обучающего множества). Данная процедура позволяет избежать "переобучения" системы (то есть запоминания конкретных примеров вместо нахождения тенденции) в условиях малой выборки. Уменьшение базы знаний до 31 правила привело к тому, что система ошибалась дополнительно в нескольких случаях по сравнению с предыдущей, но такая БЗ не содержала заведомо противоречивых правил. Ошибочно решаемых примеров 15 из 97, то есть точность прогноза составила 85%. Анализ ошибок приводит к выводу о необходимости введения дополнительных входных параметров или проведения более подробной сегментации для уменьшения ошибочности прогноза, но это ухудшит логическую прозрачность прогностической модели. База знаний содержит 4 уровня иерархии логических правил (см. приложение 2). Результаты прогноза, который строится на основе этих правил, эксперта удовлетворяют. Как минимум одно правило, отражающее явную тенденцию, вызвало затруднения при оценке экспертом. Однако оно не вступает в противоречие с априорными знаниями по предметной области, т.е. была найдена скрытая зависимость. Рассмотрим возможность применения разработанной системы для решения задач прогнозирования временных рядов на примере предсказания курса ЕВРО. Суть задачи состоит в том, чтобы, зная динамику изменения курсовой стоимости продажи валюты за фиксированный интервал времени, предсказать значение ее курсовой стоимости на определенный момент времени в будущем

В качестве исходных данных была использована информация о динамике курса ЕВРО за период с 01.01.2004 по 10.05.2005, которая доступна в Интернете по адресу; www.finmarketru. Обучающая выборка строится методом скользящего окна, когда каждая запись содержит значения курса за несколько дней, следующих друг за другом (в нашем примере - 5 дней). При этом значения за первые 4 дня являются независимыми параметрами (с именами "D!", "D2", "D3" и "D4"), а за пятый -зависимой от них переменной "у". Пятидневное окно смещается на один день для получения очередного обучающего примера. Для использования было отобрано 130 примеров, из них первые 100 вошли в обучающую выборку, а последние 30 составили тестовый задачник.

Все переменные были равномерно разбиты на 3 сегмеїгга каждая. Для выходной переменной для каждого примера были найдены значения функций принадлежности трех нечетких множеств ("у_Г, "у_П" и "у_Ш"), соответствующих сегментам. Эти значения и должна научиться предсказывать система после обучения.

Похожие диссертации на Структурно-параметрическая оптимизация баз знаний обучаемых экспертных систем