Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Разработка математической модели "состав-свойства" технологического процесса варки оптического стекла Родькин Сергей Владимирович

Разработка математической модели "состав-свойства" технологического процесса варки оптического стекла
<
Разработка математической модели "состав-свойства" технологического процесса варки оптического стекла Разработка математической модели "состав-свойства" технологического процесса варки оптического стекла Разработка математической модели "состав-свойства" технологического процесса варки оптического стекла Разработка математической модели "состав-свойства" технологического процесса варки оптического стекла Разработка математической модели "состав-свойства" технологического процесса варки оптического стекла Разработка математической модели "состав-свойства" технологического процесса варки оптического стекла Разработка математической модели "состав-свойства" технологического процесса варки оптического стекла Разработка математической модели "состав-свойства" технологического процесса варки оптического стекла Разработка математической модели "состав-свойства" технологического процесса варки оптического стекла
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Родькин Сергей Владимирович. Разработка математической модели "состав-свойства" технологического процесса варки оптического стекла : Дис. ... канд. техн. наук : 05.13.18 : Саранск, 2003 236 c. РГБ ОД, 61:04-5/401-3

Содержание к диссертации

Введение

Глава I Многокомпонентные системы - описание и методы моделирования 10

1.1. Физико-химическая теория многокомпонентных природных и техногенных систем 10

1.2 Методы математического моделирования многокомпонентных систем 14

1.3 Моделирование свойств свинецсодержащих и безсвинцовых стекол, как пример плохо формализованной многокомпонентной системы 30

1.3.1 Общие замечания 30

1.3.2 Промышленное производство свинецсодержащего и безсвинцово-го стекол 31

1.3.3 Анализ системы «состав-свойства» при варке бариево-литиевого стекла 38

Глава II Применение искусственных нейронных сетей при моделировании многокомпонентных систем 44

2.1. Анализ и выбор нейронной сети для решения задачи моделирования системы «состав-свойства» при варке бариево-литиевого стекла 44

2.1.1 Структуры нейронных сетей 44

2.1.2 Модели нейронных сетей 45

2.1.2.1 Модель Маккалоха 45

2.1.2.2 Модель Розенблата 47

2.1.2.3 Модель Хопфилда 48

2.1.2.4 Модель сети с обратным распространением 51

2.1.3 Способы реализации нейронных сетей 69

2.1.4 Выбор модели нейронной сети для решения задачи моделирования системы «состав-свойства» при варке бариево-литиевого стекла .. 72

Глава III Описание программного комплекса для моделирования много компонентных систем 77

3.1 Структура программного комплекса 77

3.2. Особенности организации данных 79

3.2.1. Особенности организации входных данных 80

3.2.2. Преобразование входных данных программного комплекса 82

3.3. Описание программы BPNN и её модификаций 86

3.3.1. Загрузка данных для моделирования 87

3.3.2. Установка параметров нейронной сети 89

3.3.3. Обучение нейронной сети 89

3.3.4. Особенности реализации алгоритмов обучения нейронных сетей 92

3.3.5. Просмотр результатов, и сохранение последних во внешнем файле 97

3.4. Получение графиков изменения среднеквадратических ошибок с использованием электронных таблиц Microsoft Excel 102

3.5. Получение таблиц результатов экспериментов с использованием текстового процессора Microsoft Word 107

3.6. Получение ЗБ-моделей и их проекций на координатные плоскости с использованием программы 3D Grapher 110

3.7. Практическая ценность программного комплекса 115

Глава IV. Моделирование многокомпонентных систем с использованием нейронных сетей с алгоритмом обратного распространения ошибки 118

4.1. Общий подход к моделированию многокомпонентных систем с использованием нейронных сетей с алгоритмом обратного распространения ошибки 118

4.2. Описание экспериментов 120

4.3. Анализ полученных практических данных 125

4.3.1. Анализ работы модифицированного алгоритма обратного распространения ошибки 125

4.3.2. Анализ работы модифицированного алгоритма обратного распространения ошибки при моделировании обратных данных 128

4.4. Практические рекомендации по варке бариево-литиевого стекла

Заключение 133

Список использованных источников 135

Приложения 141

Введение к работе

Актуальность темы. В последнее время все большее внимание уделяется применению автоматизированных систем обработки данных в реальном производстве^-9]. Это связано прежде всего с тем, что современные технологические процессы требуют значительных материальных и временных затрат. Большое количество различных производств практически не мыслимо без предварительного создания моделей технологических процессов.

Примером такого производства может служить варка стекла. Помимо большой конкуренции, сложившейся в данной области, существуют и другие проблемы, связанные, прежде всего, с неудовлетворительной проработкой технологии производства.

Не достаточно точно подобранные параметры технологического процесса, такие как состав шихты, температура и давление варки стекла, приводят к тому, что тонны не удовлетворяющего по выходным параметрам стекла подвергаются переплавке. Это в свою очередь приводит к простою оборудования и огромным убыткам. Кроме того, встречаются ситуации, когда неправильные параметры приводят к выходу из строя печи, что требует её перестройки и, следовательно, влечет за собой многомиллионные потери.

При решении этих проблем до последнего времени использовался, в основном, профессиональный опыт, накопленный специалистами. Очевидно, что данная практика губительна для производства. Поэтому единственным выходом из сложившейся ситуации может, по нашему мнению, стать внедрение на начальных этапах технологических процессов программных комплексов, позволяющих заранее смоделировать, «предугадать», «предсказать» ситуацию, которая может сложиться. Эти предсказания должны основываться на ранее полученных данных и обладать точностью, гибкостью настройки, наличием обратных связей.

Существующие пакеты обработки статистических данных не удовлетворяют конечного потребителя, во-первых, по стоимости затрат на внедрение, во-вторых, по сложности обучения персонала работе с этими пакетами.

Следовательно, для реального производства необходимо создание программного продукта, удовлетворяющего предъявляемым требованиям качества, быстрого в освоении, позволяющего в кратчайшие сроки получать графические и иные представления технологических процессов.

При анализе статистических данных, полученных в результате некоторых производственных процессов, до недавнего времени использовались модели, основанные на построении и дальнейшем решении уравнений регрессии. У этого подхода есть ряд недостатков, отметим лишь два наиболее существенных: во-первых, регрессионный анализ не учитывает возможную неточность, неадекватность, ошибочность исходных данных, во-вторых, реально построенные модели линейны, создание же нелинейных моделей, которые, естественно, более точно представляют реальную физическую картину, приводит к такому усложнению уравнения регрессии и дальнейших методов его решения, что это становится невыгодным.

Наряду со стандартными подходами при анализе статистических данных все чаще применяются нейронные сети. Особенностью нейросете-вых технологий является, во-первых, возможность работы с плохо заданными, неточными данными, во-вторых, нелинейность моделей, позволяющая выиграть в качестве и во времени по сравнению со стандартными методами.

Кроме того, применение моделей нейронных сетей для решения различных задач является приоритетным направлением в связи с переходом компьютеров пятого поколения к новой архитектуре, основанной на элементах интеллектуального поведения систем обработки данных и устройств.

Неоспоримые преимущества нейросетевых алгоритмов перед стан-

дартными и переход к компьютерам пятого поколения определяют актуальность темы диссертационной работы.

Цель исследования. Целью работы является разработка математических моделей многокомпонентных систем на базе нейронных сетей.

К числу подобных систем относится моделирование зависимости «состав-свойства» при варке бариево-литиевого стекла для ОАО «Лисма», г. Саранск.

Для достижения поставленной цели выделяются три основные задачи.

Решение первой задачи предусматривает анализ нейронных сетей с различными модификациями в алгоритмах обучения, а так же выбор наиболее подходящего алгоритма.

Решение второй задачи включает в себя написание компонента в среде программирования Delpi 7.0, реализующего выбранный при решении первой задачи алгоритм обучения, а также последующее написание программного продукта для анализа многокомпонентных систем.

Наконец третья задача включает в себя несколько этапов, связанных с обучением полученных нейронных сетей на конкретных экспериментальных данных, и анализом полученных результатов,

Составными задачами работы являются:

  1. Теоретический анализ современного состояния в области применения нейросетевых технологий и обоснование основных задач исследований диссертационной работы.

  2. Анализ набора обучающих выборок — данных экспериментальных варок бариево-литиевого стекла для ОАО «Лисма», г. Саранск.

3.Создание математической модели нейронной сети. Создание программного продукта, реализующего алгоритм выбранной нейронной сети. 4. Установление (с помощью созданного программного продукта) аналитических зависимостей между процентным содержанием компонентов шихты и основными параметрами полученных стекол.

5.Сравнительный анализ эффективности новых способов моделирования.

Научная новизна работы. Для существующей проблемы предложен алгоритм, отвечающий требованиям перехода к компьютерам пятого поколения.

Впервые нейросетевые технологии с применением алгоритма обратного распространения ошибки реализованы для решения круга задач в области моделирования многокомпонентных технологических систем.

Создан невизуальный компонент в среде Delphi 7.0, реализующий алгоритм обратного распространения ошибки для нейронных сетей, а также программный комплекс с интуитивно понятным и «дружественным» интерфейсом для анализа результатов экспериментальных варок бариево-литиевого стекла, построения моделей и получения конечных результатов моделирования в виде графиков изменения среднеквадратических ошибок и трехмерных графиков обратных зависимостей.

На основе программного комплекса создан АРМ технолога для поддержки производства стекла с заданными свойствами из шихты, содержащей произвольные процентные содержания компонентов. Даны рекомендации по производству бариево-литиевого стекла на ОАО «Лисма», г. Саранск.

Практическая значимость результатов исследований.

  1. Разработанная математическая модель адекватно отражает зависимость «состав - свойства» для бариево-литиевого стекла. Можно получить обратные зависимости «свойства - состав» для любых компонентов модели. Это позволяет технологу, не прибегая к осуществлению дополнительных дорогостоящих экспериментальных варок, определять, каким образом необходимо изменить состав шихты для получения требуемых свойств стекла.

  2. Предложенная методика позволяет рассчитывать с большой долей уверенности конечные параметры стекла в зависимости от состава шихты. Выполнение прогнозирования свойств стекла особенно важно в целях

уменьшения потерь предприятия, возникающих в результате применения некачественных компонентов при его производстве, когда это может привести к переплавке готового стекла, либо к выходу печи из строя. 3.Метод нейронных сетей для моделирования многокомпонентных систем универсален. Поэтому программный продукт можно применять и в других, отличных от стекловарения, отраслях производства. Положения, выносимые на защиту.

Предложенный метод моделирования многокомпонентных систем нейронными сетями, обученными алгоритмом обратного распространения ошибки, отражающий новые подходы к обработке статистических и плохо формализованных данных.

Разработанная модель нейронной сети с модифицированным алгоритмом обратного распространения ошибки, позволяющим избежать попадания сети в локальные минимумы,

Методика прогнозирования результирующих качеств стекла по неизвестному начальному процентному содержанию компонентов в шихте ба-риево-литиевого стекла.

Разработка программного комплекса, осуществляющего моделирование многокомпонентных технологических систем нейронными сетями.

При разработке алгоритмов и проведении исследования в диссертационной работе использовались методы и аппарат численных методов, теории экспертных систем и искусственных нейронных сетей, регрессионного анализа, систем автоматизированного объектно-ориентированного программирования.

Первая глава диссертационной работы посвящена рассмотрению общей теории многокомпонентных систем. Описан вклад российских и зарубежных авторов в теоретическом исследовании проблемы. Рассмотрен регрессионный анализ, как стандартный метод моделирования, указаны его недостатки. Описаны другие сложившиеся подходы в этой области. Приведена система «состав—свойства» для варки бариево-литиевого стек-

л а, показано, что она относится к классу многокомпонентных плохо формализованных систем.

Вторая глава посвящена рассмотрению аппарата нейронных сетей с различными алгоритмами обучения. Производится выбор наиболее эффективного алгоритма. Обосновываются преимущества алгоритма обратного распространения ошибки перед остальными алгоритмами обучения нейронных сетей.

В третьей главе описывается структура созданного программного комплекса, его основные характеристики, а так же способы работы с ним. Рассмотрены программы BPNN и Exchange и их модификации, предназначенные для моделирования многокомпонентных систем с использованием нейросетевых технологий и алгоритма обратного распространения ошибки.

В четвертой главе описаны эксперименты по моделированию многокомпонентных систем с использованием нейронных сетей с алгоритмом обратного распространения ошибки. Для экспериментов, которые показали удовлетворительные результаты обучения, в приложениях приведены таблицы и графики результатов моделирования.

В заключении перечислены основные научные и практические результаты.

Моделирование свойств свинецсодержащих и безсвинцовых стекол, как пример плохо формализованной многокомпонентной системы

Исследования А.С. Бычкова и П.П. Макарычева в области моделирования сложных техногенных многокомпонентных систем привели их к теории системных графов [20]. Сторонники построения моделей многокомпонентных сложных систем с применением системных графов (СГ) в качестве аппарата формализованного описания процессов продвижения модельного времени и обеспечения квазипараллелизма вычислений в описании модели выделяют две составляющие. Первая относится к описанию структуры и взаимодействия элементов, а вторая - к описанию функционирования отдельных элементов. Описание структуры модели осуществляется на основе СГ и матрицы связей (МС), использование которых для построения имитационных моделей сложных систем позволяет обеспечить высокую степень сходства между функциональной схемой исследуемой системы и структурой модели. Взаимодействие подсистем Si в сложной системе S2 представляется в виде МС. Строки и столбцы МС соответствуют подсистемам Si. Каждая подсистема Si описывается векторно-матричным уравнением состояния наблюдения где: А, В, С, D- матрицы коэффициентов модели; Х(к), у (к) -входной (векторный) и выходной сигнал; Z(k) - вектор состояний подсистемы; к =kAt ; At - шаг квантования по времени. Для решения задач квазипараллелизма вычислений и продвижения модельного времени в описании структуры модели дополнительно вводится маркировка СГ. Маркированный СГ задается в виде G=(P, Е, MJ, где: Р -множество позиций (вершин графа); Е —множество дуг графа; М0 — начальное состояние ориентированного графа (маркировка или разметка). Маркировка заключается в присвоении дугам графа числовых значений (меток). Каждая дуга СГ взвешивается парой чисел (п т , определяющей динамику продвижения маркеров в процессе срабатывания вершин графа при моделировании. Числа nh тк определяют количество маркеров, размещаемых на выходящей дуге и удаляемых с входящей дуги при запуске вершины /?,. Если в процессе моделирования количество маркеров входящей дуги меньше тк, то запуск данной вершины графа запрещен.

Доломатов М.Ю. [21] предлагает в качестве альтернативы феноменологический подход к исследованию сложного вещества. В отличии от классического подхода, учитывающего только индивидуальные основные компоненты, в феноменологическом подходе вещество рассматривается как единая стохастическая многокомпонентная система. Многокомпонентные стохастические системы динамичны, даже их изучение изменяет их свойства. Такие же по своей сути и биологические, и социальные системы. Сложные системы и явления могут быть поняты на основе противоположного атомизму целостного феноменологического подхода: природное вещество является единой непрерывной и, вместе с тем, сложной системой, состоящей из менее крупных многокомпонентных стохастических систем из компонентов различного происхождения.

В веществе существуют преобладающие компоненты и компоненты - спутники, которые часто не обнаруживаются в лабораториях, но играют роль в физико-химических и биологических процессах. Из этого следует, что на уровне макросистем существуют вероятностно-статистические закономерности, общие для всех подобных систем, независимо от их состава (явления обратной изомерии или подобия свойств различных систем). В числе этих закономерностей специфическая кинетика процессов, например, существование законов кинетики типа Авраами -Ерофеева.

В таких системах существует также специфическая термодинамика процессов, которая выражается в бернуллиевском распределении состава вещества по термодинамическим потенциалам, свободной энергии, энтропии, энтальпии, геометрическим размерам вещества фракций и температурам кипения в случае жидких веществ. Кроме того, в сложных многокомпонентных системах существует специфический вид энтропии -энтропии поликомпонентности: если каждый компонент, индивидуальное вещество или вид рассматривать как микросостояние единой макросистемы, то, в соответствии со вторым началом термодинамики, число микросостояний увеличивается. Иными словами, увеличивается особая энтропия поликомпонентности (ЭПК). Одной из причин эволюции вещества, по-видимому, является рост энтропии поликомпонентности. Система самопроизвольно стремится увеличить свою компонентность (усилить свое многообразие). Очевидно, энтропию поликомпонентности надо учитывать как дополнительный фактор в эволюционных природных и технических процессах. Другой, не менее важной, особенностью моделей сложных систем является их квазилинейность при условии незначительного отклонения от состояния равновесия. Решением уравнения Колмогорова—Фоккера-Планка удалось показать, что большинство природных, экологических, технических и технико-экономических систем квазилинейны, если не слишком отдалены от равновесия. Более того, само понятие линейности относительно и связано с временами возвращения отдельных факторов (свойств) системы в состояние равновесия (релаксацией системы). Если свойства системы релаксируют с близкими скоростями, имеет место квазилинейная взаимосвязь этих свойств, В рамках развития принципов феноменологического подхода к сложному веществу разработано новое научное направление - неатомарный недискретный подход к спектрам вещества; разработаны принципы феноменологической электронной спектроскопии [21 ]. Последняя дает возможность прогнозировать свойства всех веществ на основе закона квазилинейной связи свойств и оптических характеристик поглощения.

Выбор модели нейронной сети для решения задачи моделирования системы «состав-свойства» при варке бариево-литиевого стекла

Рассмотрена система «состав-свойства» варки бариево-литиевого стекла. Показано, что она относится к классу многокомпонентных физико-химических технологических систем. 2. Рассмотрены два различных подхода к моделированию многокомпонентных физико-химических технологических систем. Для дифференциального подхода характерно использование метода регрессионного анализа, являющегося следствием схемы функционального изучения процесса. 3. Указаны недостатки регрессионного анализа, связанные с линейностью моделей и невозможность работы с плохо формализованными исходными статистическими данными. В связи с чем, применение дифференциального подхода для решения задачи моделирования системы «состав-свойства» является не возможным. 4. Проанализирован феноменологический подход к анализу сложных природных систем. В современных исследованиях по этому вопросу можно выделить несколько направлений, среди которых особенным является моделирование с использованием многослойных нейронных сетей. 5. Особенности неЙросетевых алгоритмов, связанные прежде всего с нелинейностью моделей и возможностью работы с плохо формализованными данными выгодно отличают их от методов исследований, применявшихся до последнего времени. В связи с этим предлагается использование неЙросетевых алгоритмов для моделирования многокомпонентной системы «состав-свойства» 6. Проведенный анализ ситуации, сложившейся в области нейровычислений в последнее время, говорит о многообразии, как способов организации, так и алгоритмов обучения нейронных сетей. Поэтому для адекватного выбора наиболее подходящей модели требуется более глубокий анализ, который будет проведен в главе 2.

В данной главе описывается структура созданного программного комплекса, его основные характеристики, а так же способы работы с ним. В приложениях помещены листинги программ.

Программный комплекс для моделирования многокомпонентных систем предназначен для аппроксимации и составления прогнозов для поточечно представленных зависимостей любой природы.

Входные данные поступают в систему в виде внешнего текстового файла ( .txt) специального формата (о формате см. подробнее 3.2.1), Это связано, прежде всего, с тем, что ввод данных с клавиатуры занимает большую часть времени моделирования и, следовательно, является весьма трудоемким процессом. Начальные данные могут быть подготовлены в любом текстовом редакторе, или, при желании, импортированы из другой программы.

На дальнейшем этапе происходит конвертирование данных в «удобный», специальный формат для дальнейшей обработки при помощи программ Exchange, ExchangeSm2, ExchangeSm3, Exchange3D (об этих программах см. подробнее в 3.3.). Это является необходимым, поскольку является возможностью для создания специальных файлов с подготовленными начальными данными, при наличии которых нет необходимости возвращаться к первому этапу.

Далее происходит моделирование многокомпонентных систем с помощью программ BPNN и BPNN3D (см.3.4.) и дальнейшая обработка полученных с помощью этих программ данных (см. 3.5.) в результате чего получаются выходные данные. Структура программного комплекса

Здесь программные продукты, использованные при моделировании, выделены одинарной рамкой и объединены стрелками. Над стрелками описаны данные, которые передаются из одной программы в другую. Полученные результаты, или выходные данные выделены двойной рамкой.

Система оперирует несколькими типами внутренних данных. Данные в системе хранятся во внешних файлах различных форматов. Преимуществом такой организации данных является то, что использование внешних файлов позволяет производить работу в комплексе поэтапно, причем нет необходимости возвращаться на предыдущие этапы для выполнения последующих. Это в свою очередь экономит время исследователя, использующего программный комплекс.

Так же при такой организации данных выполняется требование к целостности и сохранности данных, а также требование к совместимости данных с широко известными программными продуктами. Большинство внешних файлов, функционирующих в системе, имеют известные и повсеместно используемые форматы, такие как .txt, .doc, .bmp.

Еще одним способом передачи данных в системе является использование буфера обмена Windows, как стандартного средства передачи данных между приложениями. Хотя этот способ менее надежен с точки зрения сохранности данных, но его известность и повсеместное использование позволяют часто применять его в практике создания программных продуктов.

Данные в системе делятся на следующие классы: 1. Входные данные - данные, поступающие в программный комплекс из внешней среды. Эти данные являются результатами экспериментов, проводимых исследователем, и изначально хранятся чаще всего на бумажных носителях, хотя не отрицается, что эти данные могут фиксироваться и в электронном виде. Для использования в системе эти данные должны пройти предварительную подготовку, т.е. обрести определенную структуру, которая бала бы «понятна» программному комплексу (см. 3.2.1)

Преобразование входных данных программного комплекса

Программы-преобразователи вычислительного комплекса предназначены для преобразования входных текстовых файлов в специальный формат. Это сделано для удобства дальнейшей загрузки данных в программный комплекс. Проделав эту операцию с использованием специальных программных средств, встроенных в комплекс, исследователь получает ряд внешних файлов специального формата, что позволяет не возвращаться при проведении последующих экспериментов к этому этапу.

Внешний вид программы Exchange и её модификаций ExchangeSm3, ExchangeSm2, Exchange3D изображен на рис.3.2.

При нажатии на кнопку «Загрузить...» происходит загрузка текстового файла специального формата (подробнее см. 3.2.), при этом отображается окно выбора загружаемого файла (рис.3.3.)

Окно выбора загружаемого файла является стандартным для всех Windows-приложений и поэтому имеет интуитивно понятный интерфейс, описывать который нет смысла.

При обработке нажатия кнопки «Загрузить...» происходит вызов процедуры анализа текстового файла FileExLoad, в которой входным параметром является имя загружаемого файла, а выходным - переменная типа ff.

Обработка данных происходит в несколько этапов. На первом этапе происходит «очистка» (т.е. обнуление) массивов выходной переменной. На втором этапе открывается файл, имя которого задано в первой входной переменной. На третьем этапе происходит чтение данных из файла, анализ строк и заполнение выходной переменной данными из файла. Причем при анализе экспериментов используется процедура FindExample, которая переводит входной параметр - строку в выходной - типа ех. На четвертом и последнем этапе происходит закрытие файла данных.

Для выгрузки данных в типизированные файлы необходимо нажать кнопку «Выгрузить...». Обработка производится в несколько этапов. На первом этапе производится очистка записи выгружаемых данных. На втором - заполнение записи выгружаемых данных данными, полученными из входного текстового файла. На третьем - непосредственная запись в файл.

Выгрузка данных происходит в типизированные файлы (file of оо).

Количество файлов определяется количеством выходов многокомпонентной системы. Всем выходным файлам сопоставлены имена «Data + Номер выхода», и расширения « .ехр» (от англ. «Experiment»). Таким образом, при выполнении программы происходит конвертирование входного текстового файла в специально организованные типизированные файлы, необходимые для обработки с помощью программы BPNN и её модификаций, что избавляет конечного пользователя от целого комплекса проблем: набор входных данных вручную занимает много времени; при ручном наборе данных возможны ошибки, что может сказаться на правильности интерпретации задачи; сделав однажды конвертирование данных, можно в дальнейшем пропускать этот этап и использовать уже готовые файлы с данными.

Нажатие кнопки «Выходить...» инициирует закрытие программы. ExchangeSm2 и ExchangeSm3 отличаются лишь выгрузкой данных — выгружается лишь каждый второй и третий соответсвенно пример.

Другим отличием Exchange Sm2 и ExchangeSm3 от Exchange являются имена выгружаемых файлов - «DataSm2 + Номер выхода» и «DataSm3 + Номер выхода» соответственно.

Exchange3D подготавливает данные для программы BPNN3D, и поэтому имеет свою процедуру выгрузки данных.

Поскольку с помощью BPNN3D решается задача, обратная решаемой BPNN, то входы нейронной сети заменяются её выходами и наоборот. Причем для реализации трехмерности (Z=F(X,Y)) необходимо, чтобы число входов было равно количеству координат, т.е. двум.

В качестве этих двух координат в нашем реальном примере (моделирование свойств бариево-литиевого стекла) выбраны температура кристаллизации и температура размягчения.

Ещё одним отличием Exchange3D являются имена выгружаемых файлов: «Data3D + Номер выхода».

Рассмотренные модификации имеют один и тот же внешний вид с точки зрения интерфейса, что, безусловно, является очень удобным для конечного пользователя.

В конечной реализации программного комплекса программа Exchange и её модификации ExchangeSm2, ExchangeSm3 и Exchange3D представлены в виде автономных исполняемых модулей, название которых приведено в таблице 3.2.

Анализ работы модифицированного алгоритма обратного распространения ошибки

Исследования проводились на основе модели сети с обратным распространением (подробнее смотри главу II). Целью экспериментов было моделирование системы «состав-свойства» для бариево-литиевого стекла. Для достижения данной цели было проведено исследование влияния представления данных экспериментальных варок на ошибку нейронной сети. Также были рассмотрены вопросы влияния структуры НС на скорость обучения сети и ошибку моделирования.

Моделирование системы «состав-свойства» для бариево-литиевого стекла проводилось на основе экспериментальных данных, описанных в главе I. Исходными данными для моделирования служили результаты экспериментальных варок бариево-литиевого стекла. Моделировались свойства полученных стекол (температура Тк-шсь температура размягчения, ТКЛР, термостойкость, температура верхнего предела кристаллизации). Каждый из экспериментов, можно разбить на несколько этапов.

Первым этапом было формирование обучающей выборки. На этом этапе происходит формирование наборов, подаваемых на входные нейроны и соответствующих им наборов снимаемых с выходов сети.

Для автоматизации процесса формирования обучающих выборок была использована созданная авторами программа Exchange и ее модификации Exchange3D и ExchangeSM, преобразующая текстовые файлы с экспериментами в удобную для анализа форму.

Вторым этапом является обучение НС на основе сформированной на первом этапе обучающей выборки. Качество обучения характеризовалось ошибкой обучения, определяемой как суммарное квадратичное отклонение значений на выходах НС в обучающей выборке от реальных значений, полученных на выходах НС. Критерием прекращения обучения было уменьшение ошибки на выходах сети до 10"4—10 5, поскольку начальные данные, доступные нам, представлены с точностью 10"2. 11а третьем этапе проводилось тестирование обучения сети. На вход подавалось порядка 4-5% наборов из обучающей выборки и определялось качество распознавания сети. Опыт считался успешным, если относительная достоверность распознавания образов была не менее 80%.

На четвертом этапе проводилась симуляция прогнозирования. На вход сети подавались наборы, которые не были внесены в обучающую выборку, но результат по ним (прогноз) известен.

Результаты успешных опытов приведены в приложениях. В приложениях для удачных экспериментов приведены графики изменения среднеквадратической ошибки на эпохах 8000-9000, а так же на эпохах 9000-10000 для демонстрации метода обратного распространения ошибки с встряской. Далее в приложениях приведены таблицы с данными, по которым нейронная сеть дала прогнозы, а также такие оценки этих данных, как относительная и абсолютная погрешность отклонения от реальных результатов, полученных при варках бариево-литиевого стекла. Для оценки скорости обучения и получения оптимальной структуры нейронной сети для моделирования многокомпонентной системы «состав-свойства» технологического процесса варки бариево-литиевого стекла проведена серия экспериментов. В каждом эксперименте данные подаются на входы НС в виде содержания массовых долей (%) различных компонентов в шихте бариево-литиевого стекла. Цель экспериментов -получение 30 классов моделируемых составов бариево-литиевого стекла для каждого выработочного свойства.

Основные параметры экспериментов отображены в таблице 4.1, температуры верхнего предела кристаллизации от состава стекла. В эксперименте № 1 не достигнута требуемая точность моделирования. В связи с чем, в экспериментах №2-№4 были проведены попытки увеличить скорость обучения нейронной сети. Эксперименты показали, что изменение скорости обучения нейронной сети не приводит к уменьшению конечной ошибки, а в некоторых случаях (эксперименты №3 и №4) наоборот приводит к увеличению оной. Поэтому было принято решение об изменении количества нейронов во внутреннем слое. В экспериментах №5-№7 рассмотрена ситуация с 5-ю нейронами во внутреннем слое, и произведено обучение с различными скоростями, но это не привело к глобальному уменьшению ошибки на выходе. В эксперименте №8 рассмотрено 18 нейронов во внутреннем слое (вдвое больше, чем во входном) при прочих равных условиях с экспериментом №7. Однако ошибка практически не изменилась. Поэтому была выдвинута гипотеза о сильной противоречивости и несогласованности входных данных, для проверки которой необходимо провести эксперименты с оставшимися 4-ю выработанными свойствами. Если на оставшихся свойствах сеть при прочих равных условиях покажет требуемую ошибку, то гипотеза подтвердится, иначе она будет неверной.

В экспериментах №9-№11 моделировалась термостойкость при различных количествах нейронов во внутреннем слое, однако ни какие модификации структуры не дали видимого улучшения ситуации - конечная среднеквадратическая ошибка по-прежнему не удовлетворительна. Те же опыты были произведены для ТКЛР в экспериментах №12-№14. Однако результаты такие же, как и для термостойкости. Отсюда, скорее всего, следует то, что структура нейронной сети (т.е. количество нейронов во внутреннем слое) мало влияет на конечную среднеквадратическую ошибку. Поэтому для температуры размягчения и температуры TV10o были проведены только по одному опыту с количеством нейронов в скрытом слое, равном 9 (эксперименты №15 и №16 соответственно). Показанные эксперименты показали ошибочность гипотезы о неполноте и несогласованности входных данных, и, с другой стороны подтвердили гипотезу об отсутствии влияния количества нейронов в скрытом слое на точность моделирования с помощью нейронных сетей.

Неудовлетворительные результаты моделирования - время обучения больше 1 мин. и конечные ошибки больше 10"2, наталкивают на необходимость снижения репрезентативности выборки в пользу увеличения скорости и точности обучения.

Как показали проведенные эксперименты №17-№31 уменьшение репрезентативности выборки привело к ожидаемым результатам (см. описание экспериментов в приложении 4.1) - снизило время обучения до 20-30 секунд и увеличило точность моделирования до порядков 10"4-10"5, что является приемлемым. Результаты экспериментов находятся в приложении 4.1-4.15.

Похожие диссертации на Разработка математической модели "состав-свойства" технологического процесса варки оптического стекла