Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Разработка интерпретационной картографической системы "ИнформГео" для прогноза нефтеносности месторождений Горбачев Сергей Викторович

Разработка интерпретационной картографической системы
<
Разработка интерпретационной картографической системы Разработка интерпретационной картографической системы Разработка интерпретационной картографической системы Разработка интерпретационной картографической системы Разработка интерпретационной картографической системы Разработка интерпретационной картографической системы Разработка интерпретационной картографической системы Разработка интерпретационной картографической системы Разработка интерпретационной картографической системы Разработка интерпретационной картографической системы Разработка интерпретационной картографической системы Разработка интерпретационной картографической системы
>

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Горбачев Сергей Викторович. Разработка интерпретационной картографической системы "ИнформГео" для прогноза нефтеносности месторождений : диссертация ... кандидата технических наук : 05.13.18.- Томск, 2003.- 185 с.: ил. РГБ ОД, 61 03-5/3320-7

Содержание к диссертации

Введение

Глава 1. Выявление знаний в данных 25

1.1 Интеллектуализация обработки данных 25

1.2 Методы интеллектуального анализа данных 31

1.3 Обзор аналитических геоинформационных систем 39

1.4 Выводы 54

Глава 2. Математические методы и алгоритмы картопостроения в интерпретационной картографической системе " ИнформГео " 57

2.1 Картографические средства отображения данных в геоинформационных системах 57

2.2 Кубическая сплайн-интерполяция по профилям в ИКС "ИнформГео" 60

2.3 Занесение параметрической информации из профилей в узлы сетки в ИКС "ИнформГео" 67

2.4 Построение численной модели геологической поверхности в ИКС "ИнформГео" 68

2.5 Выводы 71

Глава 3. Методика расчета комплексного прогнозного параметра в икс "ИнформГео" 73

3.1 Постановка задачи 73

3.2 Методы решения задачи классификации 74

3.3 Адаптация нейросетевого подхода к расчету комплексного прогнозного параметра 82

3.4. Обучение нейронных сетей для расчета комплексного прогнозного параметра 83

3.5. Модификация метода самоорганизации логической сети 89

3.6. Выводы 94

Глава 4. Опыт практического применения 96

4.1 Задачи экспериментальных исследований 96

4.2 Построение прогнозных карт нефтеносности на Южно-Черемшанском нефтяном месторождении 97

4.3 Построение прогнозных карт нефтеносности на Олимпийском куполовидном поднятии и южной периклинали Болтной структуры 115

4.4 Интерпретация результатов 119

4.5 Модель вычислительного устройства на булевых и пороговых элементах 121

4.6 Диагностические решающие правила на Южно-Черемшанском нефтяном месторождении 124

4.7 Выводы и рекомендации практического назначения 128

Заключение 130

Список литературы 133

Приложение

Введение к работе

Актуальность работы

В настоящее время компьютерные технологии автоматического интеллектуального анализа данных переживают бурный расцвет. Это связано главным образом с потоком новых идей, исходящих из области компьютерных наук, образовавшихся на пересечении искусственного интеллекта, статистики и теории баз данных и обозначаемых как Data Mining (обнаружение знаний в данных) [65]. Этим термином сегодня обозначают процесс получения из "сырых" данных новой, потенциально полезной информации о предметной области. Появившийся в 1978 г., термин Data Mining, оказался удачным и приобрел высокую популярность в конце 90-х годов.

Применительно к геологоразведке углеводородов, основной целью которой является построение согласованной геолого-геофизической модели месторождения, дающей ясное представление о вероятности наличия нефти (газа) в данной точке месторождения, проблема обнаружения знаний о причинно-следственных соотношениях между входными (независимыми) и выходными (зависимыми) переменными [33], позволяющими объяснить механизм получения прогнозных зон нефтеносности в явном виде, в настоящее время является очень актуальной.

На сегодняшний день такие модели строятся опытным геофизиком-экспертом в результате комплексной интерпретации и анализа различных полей параметров (геофизических, геохимических), их трансформант, структурного и сейсмического материала и т.д., на основе спектрально-энергетических и статистических методов [30,73,93] с учетом всего накопленного в этой области потенциала знаний. Таких специалистов, как правило, немного, а построение моделей требует больших трудозатрат.

Поэтому актуальной является автоматизация расчета комплексного прогнозного параметра в интерпретационной картографической системе, которая позволяет ускорить процесс создания геолого-геофизической модели месторождения без привлечения экспертов, дополнить ее вероятностью наличия воды в данной точке месторождения. Применение методов интеллектуального анализа, в частности нейронных сетей, позволяет дообучать нейросети при поступлении новых данных, а также выводить диагностические решающие правила, объясняющие механизм прогноза нефти и газа в явном виде. Кроме того, применяемые геофизические и геохимические методы автоматически ранжируются по уровню из значимости для решения задачи.

Традиционным ведущим геофизическим методом, применяемым при поисках и разведке месторождений нефти и газа, является сейсморазведка. Она позволяет решать целый ряд задач прогнозирования геологического разреза. Несмотря на достигнутые успехи в разработке сейсморазведочных методик, успешность прогноза залежей по материалам только этого метода остается недостаточно высокой, особенно в случае сложнопостроенных ловушек, к которым относятся и ловушки, сосредоточенные в меловом интервале разреза осадочного чехла Западной Сибири.

Известно (А.Е. Канторович, О.Л. Кузнецов, Р.С. Сахибгареев, Е.Н.Ильясова, В.А. Ежова, Н.Ф. Столбова, С.Л. Шварцев, Г.И. Тищенко, В.А. Баженов и др.), что физические и химические поля, наблюдаемые над месторождениями нефти и газа, видоизменяются в зависимости от расположения залежей и интенсивности процессов преобразования надпродуктивной толщи пород под воздействием миграции углеводородов. Они позволяют создать многомерное признаковое пространство, которое можно использовать как фактическую основу для прогнозирования контура нефтегазоносности. Опыт многолетних геофизических исследований месторождений нефти и газа юго-восточной части Западной Сибири [53,73,89] и других регионов бывшего СССР [3,8,50,67,94] показывает, что структура наблюдаемых магнитных и радиогеохимических полей закономерным образом

7 отражает особенности геологического строения разреза и пространственного расположения углеводородов. Аналогичные результаты приводятся в зарубежной литературе [113].

Одной из наиболее часто встречающихся проблем, встающих перед учеными различных специальностей при комплексной интерпретации разнородных данных, является проблема построения новых объектов - зон до того на карте не существовавших, т.е. участков территорий, однородных в смысле некоторого критерия или группы критериев. В этом смысле задача сводится к проблеме классификации, которая заключается в разбиении многомерного признакового пространства переменных на классы принадлежности или подобия тому или другому эталону и нахождении таким образом зависимости между признаковым пространством переменных, описывающих поведение объекта (класса), и самим объектом (классом).

Применение методов интеллектуального анализа данных [65], в частности нейронных сетей, для решения задачи классификации позволит, во-первых, учитывать первичные полевые данные, которые могут быть статистически непредставительны, во-вторых, автоматизировать процесс расчета комплексного прогнозного параметра путем обучения искусственной нейронной сети на основе околоскважинной (разведочной) информации, и, в-третьих, решить обратную задачу - ранжировать применяемые геофизические и геохимические методы по уровню значимости, что в конечном итоге должно привести к сокращению временных и материальных затрат на интерпретацию полевых данных. Однако, несмотря на свою универсальность, позволяющую реализовать технологию прогноза нефти и газа в виде интерпретационной подсистемы Data Mining в ГИС, нейронные сети обладают плохой интерпретируемостью - процесс решения задачи обученной нейросетью не поддается прозрачному для пользователя описанию.

Дело в том, что в рамках классической нейросетевой парадигмы, во-первых, топология нейросетей задается исходя из эвристических соображений, и, во-вторых, в обученных нейросетях веса межнейронных связей не

8 поддаются анализу и интерпретации человеком. В диссертационной работе предпринята попытка расширения интеллектуальных свойств обучаемых сетей за счет применения так называемых самоорганизующихся (растущих или эволюционирующих) булевых сетей [102], структура которых поддается расшифровке в виде логических высказываний. Этот подход, ориентируемый на объединение принципов обучаемости и интерпретируемости, соответствует целям и задачам Data Mining.

Используемые в работе методы эвристической самоорганизации логической сети для построения согласованной геолого-геофизической модели месторождения позволяют, в отличие от формальной нейросетевой модели "черного ящика" [36] получить интерпретацию решения на основе системы булевых функций, представляющей обученную сеть. От системы булевых функций осуществляется переход к решающим правилам, сформулированным в удобной и понятной для понимания пользователю символьной форме.

Для расчета комплексного прогнозного параметра в интерпретационной картографической системе (ИКС) "ИнформГео" значимыми являются оба подхода - результаты, полученные на реальных данных с применением нейронных сетей, обученных алгоритмом обратного распространения ошибки, и методом самоорганизации логических сетей, коррелируют между собой и с экспертными прогнозными зонами нефти.

Обученная на Южно-Черемшанском нефтяном месторождении методом самоорганизации логическая сеть, состоящая из двухвходовых логических элементов, представляет собой функциональную схему вычислительного устройства, обученного решению задачи прогноза нефтеносности. Разработка нейрочипов, функционирующих в реальном масштабе времени, в настоящее время является актуальной и ведется во многих странах мира. Основная проблема связана с удешевлением элементной базы, поскольку с одной стороны формальные нейроны (ФН) выполняют взвешенное суммирование и нелинейное преобразование сигнала при аналоговых значениях весов

9 взаимодействия нейронов, а с другой стороны создается "тирания межсоединений" в нейрочипах, когда реализуется структурный принцип: каждый ФН связан с каждым ФН. Все это приводит к значительному удорожанию (тысячи долларов) стоимости нейрочипов.

Переход от модели формального нейрона в нейронных сетях к простейшим логическим элементам (пороговым и булевым), реализуемым в двухвходовых логических сетях, обученных в процессе самоорганизации, в рамках диссертационной работы позволил использовать простейшую (недорогую) элементную базу вычислительных устройств, реализуемых на основе технологии ПЛИС (программируемые логические интегральные схемы). Данная технология в связи с быстродействием и сверхнизким уровнем энергопотребления в последнее время находит наибольшее практическое использование при реализации нейрочипов - области микропроцессорной техники, в которой в настоящее время нет подавляющего лидерства США и Японии. Поэтому нишу нейрочипов могут занять другие страны мира, в том числе и Россия.

Предложенная в работе схема вычислительного устройства может быть использована для создания интеллектуальных геологоразведочных приборов, работающих в режиме реального времени в составе штатной геофизической аппаратуры, например, через порт RS-232. Такие приборы в настоящее время пользуются большой популярностью у геологов.

Диссертационная работа посвящена также исследованию вычислительных аспектов интерполянтов, наименее искажающих исходную информацию в данных в процессе картопостроения в геоинформационных системах [23,26,31,96], реализации пакета программ картопостроения в составе ИКС "ИнформГео" [90,91], а также разработке, созданию и включению нейросетевой подсистемы как интеллектуальной составляющей в геоинформационные (картографические) системы, оперирующие с разнородными данными. Обычно такие ГИС включают в себя стандартный набор средств картопостроения [31]: от ввода полевых данных и занесения

10 параметрической информации на регулярную сеть до функций обработки изображений (трансформация полей, выделение изолиний, построение трехмерной геологической модели). В данной работе автором используются разработанные Гафуровым О.М. и проверенные на реальных данных в 80-х годах коллективом томского СКБ НПО "Нефтегеофизика" специфические применительно к предметной области методы построения карт параметров [90], в которых применяется математический аппарат кубических сплайнов и решения второй задачи Коши конечно-разностными методами, реализованные в виде картографической системы "ИнформГео" на ЭГВК ПС-2000 (образец мультипроцессора, имевшего от 8 до 64 процессоров). Система прошла опытно-методическое опробование на материалах Томского геофизического треста и была передана в следующие организации: НОМЭ (г. Новосибирск), Прикаспийское отделение Нижневартовского НИИ геологии и геофизики (г. Астрахань), ААГФЭ (г. Алма-Ата), ЗапСибНИГеофизики, ГВЦ "ГлавТюменьГеология" (г.Тюмень), Наро-Фоминский филиал ВНИИГеофизики (Московская обл.), КОМЭ (г. Киев), ПГО "ЕнисейГеофизика" (г. Красноярск).

В настоящей версии интерпретационной картографической системы "ИнформГео" на базе персонального компьютера автором реализован пакет прикладных программ картопостроения, начиная от ввода полевых данных в систему, а также разработан и создан, в отличие от предыдущей версии системы, блок интеллектуального анализа и интерпретации построенных карт геофизических и геохимических параметров на основе нейросетевых методов с целью локализации нефтегазоносных участков месторождения, с ранжированием входных признаков по уровню значимости, обеспечивающим оценку информативного вклада каждого параметра для точности прогноза. Механизм получения прогноза после обучения сети выдается пользователю логическими решающими правилами в понятном для пользователя виде.

Постановка задачи

По исследуемой площади имеется набор численных значений Np геофизических и геохимических параметров полевых данных, замеренных по

сетке профилей с определенным шагом, а также S разведочных скважин с актами испытаний и каротажными оцифрованными диаграммами испытаний, разбитых по своей принадлежности на классы к - нефтяные (газовые) (к—1), водно-нефтяной контакт (к—О), порода (к=-1).

По этим данным необходимо рассчитать значения комплексного прогнозного параметра по регулярной сети, представляющего вероятность наличия нефти (газа), воды и породы в данной точке площади.

Эта задача в описанной постановке является задачей распознавания образов (классификации) - предсказания для объекта значения некоторого его целевого признака, выраженного в шкале наименований. Для ее решения в рамках нейросетевого базиса [38] применительно к задаче геологоразведки углеводородов автором были выделены следующие подзадачи.

  1. Рассчитать по регулярной сети карты Р геофизических и геохимических параметров в едином масштабе с общей начальной точкой координат.

  2. Сформировать на основе околоскважинной информации выборку U.

Для каждой /-й скважины, где i=],.,.,S, строится множество Dj , состоящее из Пі точек, лежащих в круге радиуса R» с центром в /-й скважине. Радиус зависит от геологических условий и параметров околоскважинного пространства.

Для каждой у'-й точки из множества Д формируется вектор У j длины

Р+1, называемый наблюдением, компонентами которого являются значения

геофизических и геохимических параметров Vy.lv.., V jp и номер класса к, к

которому относится /-я скважина:

v) =(v;„..., v]e,k').

12 Таким образом, выборкой, построенной на множестве точек D»

относящихся к /-й скважине, является множество векторов

а выборку, построенную по всем скважинам, образует множество:

и=[)и, ={t/,,..,t/s }.

3) Разбить выборку U некоторым образом на два подмножества U0Qy4 и
ипров 5 образующих обучающую и проверочную выборку.

Далее возможны два варианта расчета комплексного прогнозного параметра.

По методу обучения нейросетей алгоритмом обратного распространения ошибки:

4) Сформировать трехслойную нейронную сеть с Р входами, 7 нейронами
промежуточного слоя и 1 выходным нейроном, принимающим значение OUT є

5) На множестве 1]0буч обучить нейросеть методом обратного
распространения ошибки, обеспечив минимум ошибки обучения.

По методу самоорганизации булевой сети:

  1. На множестве U0sy4 синтезировать булеву сеть.

  2. По синтезированной сети вывести решающие правила в виде системы логических выражений "Если, ..., то".

  1. На множестве Unpog по несовпадением ответов сети с известными ответами рассчитать ошибку обобщения сети.

  2. Предъявить на вход сети наборы значений, не вошедшие в множество U, на основании выходов сети построить прогнозную карту распределения классов по площади.

13 8) Для каждого из Р входных параметров определить показатель значимости, характеризующий информативный вклад данного параметра в полученные результаты.

Целью данной работы является разработка и практическая реализация в виде интерпретационной картографической системы методики расчета комплексного прогнозного параметра, предусматривающей два подхода комплексного анализа и интерпретации полевых данных, полученных различными геологоразведочными методами:

1) обучение нейронных сетей алгоритмом обратного
распространения ошибки;

2) самоорганизацию булевых сетей, позволяющую строить
разделяющие булевы функции и выводить диагностические решающие
правила,
объясняющие механизм решения задачи прогноза нефти и газа в
явном виде.

Оба подхода позволяют ранжировать применяемые геофизические и геохимические методы по уровню их значимости для решения задачи.

Основное назначение созданного программного продукта состоит в автоматизации и существенном ускорении процесса создания геолого-геофизической модели месторождения без привлечения экспертов и может быть рекомендовано геологоразведочным предприятиям, занимающимся камеральной обработкой полевых данных.

Для достижения поставленной цели в работе осуществлена систематизация комплекса задач: научно-технических, прикладных, опытно-методических и промышленных.

В рамках решения научно-технических задач проведена классификация существующих алгоритмов картопостроения, а также методов обучения и самообучения нейронных сетей; введена классификация уровней выявления знаний из данных с позиции информационно-аналитической деятельности; на основе общепринятых стандартов обучения искусственных нейронных сетей предложена общая методика комплексной интерпретации геолого-

14 геофизического материала, начиная от ввода полевых данных и заканчивая локализацией месторождения нефти и газа; описан класс эффективных интерполирующих функций над профильными данными, посредством которых происходит предварительная обработка исходного материала; выбраны подходящие из известных математические модели, методы и алгоритмы для решения задач прогноза.

В рамках решения прикладных задач было разработано информационно-программное обеспечение, реализующее разработанную методику комплексной интерпретации данных и включенное в виде подсистемы анализа в интерпретационную картографическую систему "ИнформГео" (ИКС "ИнформГео" является расширенной версией системы, разработанной в 80-е годы на ЭГВК ПС-2000 в Томском СКБ НПО "Нефтегеофизика" под руководством Гафурова О.М. [91]). Настоящая версия ИКС "ИнформГео" осуществляет замкнутый цикл камеральной обработки геолого-геофизического материала с прогнозированием залежей нефти и газа и выдачей диагностических решающих правил в форме продукций "Если..., то", применяемых в экспертных системах. Методы и подходы комплексного анализа, положенные в основу интеллектуального ядра системы, могут быть использованы для решения задач распознавания, диагностики и прогноза в различных областях (медицина, финансовые рынки (коммерческие банки, инвестиционные фонды и т.д.). В частности применялись автором для анализа финансовой устойчивости предприятий агропромышленного комплекса в рамках разработанной интеллектуальной системы "Нейросетевая прогнозная модель финансовой устойчивости предприятий АПК".

При решении опытно-методических задач под научным руководством к.г.-м.н., доцента кафедры геофизики Томского политехнического университета Меркулова В.П. проведены опытно-методические исследования эффективности предлагаемых подходов на Южно-Черемшанском нефтяном месторождении [40], принадлежащем ЗАО "Томск-петролеум-унд-газ", по результатам исследований разработаны рекомендации к планированию бурения скважин.

15 Было пробурено 7 скважин, полностью подтвердивших прогноз нефти и водно-нефтяного контакта.

В рамках применения разработанных методов в промышленности согласно государственному контракту между ООО "ИнформГеоСервис" и ОГУП "Томскинвестгеонефтегаз" осуществлена камеральная обработка геолого-геофизических данных на Олимпийском куполовидном поднятии и южной периклинали Болтной структуры, построены прогнозные карты нефтеносности. Результаты работы были защищены на совместном заседании ОГУП "Томскинвестгеонефтегаз" и Комитета природных ресурсов Томской области.

Кроме того, предложены схема вычислительного устройства на основе обученной на реальных данных логической сети, состоящей из двухвходовых логических элементов. Это устройство может быть рекомендовано для создания интеллектуальных геологоразведочных приборов, работающих в режиме реального времени в составе штатной геофизической аппаратуры.

Методы исследования

При решении поставленных задач в работе использованы элементы математического аппарата линейной алгебры, интерполяции и аппроксимации, дифференциальных уравнений, нейроматематики, информатики, теории вероятностей, геофизики, геохимии, дискретной математики, системного анализа, теории информационных систем и обработки данных.

Научная ценность работы состоит в следующем.

  1. Адаптация нейросетевого подхода к анализу пространственно распределенных данных в ГИС для решения задачи прогноза нефтеносности месторождений.

  2. Модификация метода самоорганизации булевых сетей в части построения дополнительных разделяющих булевых функций и увеличения количества используемых входных переменных для повышения уровня принятия решения.

Достоверность полученных научных результатов, выводов и рекомендаций диссертационной работы подтверждена результатами экспериментальных исследований и камеральной обработки геолого-геофизических данных на Южно-Черемшанском нефтяном месторождении [40], принадлежащем ЗАО "Томск-петролеум-унд-газ" (достоверность прогноза здесь подтверждена бурением скважин №№ 105, 106, 107, 112, 225, 232, (нефть), 102бис (вода)), а также на Олимпийском куполовидном поднятии и южной периклинали Болтной структуры в результате промышленного внедрения интерпретационной картографической системы "ИнформГео" в ОГУП "Томскинвестгеонефтегаз". Прогнозные зоны нефтеносности, рассчитанные в ИКС "ИнформГео", согласуются с экспертными заключениями, а также коррелируют с прогнозными зонами, полученными независимо в системах "Интерсейс" на основе спектрально-энергетического анализа временного разреза и "Геосейс" на основе фазочастотного анализа сейсмических сигналов, что позволило защитить результаты обработки на совместном заседании ОГУП "Томскинвестгеонефтегаз" и Комитета природных ресурсов Томской области. По полученному прогнозу были разработаны рекомендации к планированию глубокого бурения скважин на Олимпийском куполовидном поднятии.

По сравнению с Южно-Черемшанским месторождением, на котором для полного обучения нейронной сети методом обратного распространения ошибки на 12 скважинах потребовалось 4700 циклов обучения, на Олимпийском и Болтном месторождениях уже обученная на Южно-Черемшанском месторождении нейронная сеть полностью дообучилась распознавать классы (нефть, вода) за ПО циклов на 6 разведочных скважинах. Предположительно, такая тенденция к сокращению времени обучения и количества используемых для обучения скважин (объектов) будет сохраняться при обработке следующих месторождений юго-восточной части Западной Сибири [41].

Естественно, что погрешность прогноза во многом зависит от состава и значимости выбранных для анализа геофизических (геохимических)

17
переменных-признаков. При эксплуатации интерпретационной

картографической системы "ИнформГео" на базе ООО "ИнформГеоСервис" была проведена работа по выявлению наиболее значимых аргументов для прогноза нефти и газа. Анализ значимости входных признаков на Южно-Черемшанской площади (число образуемых связей каждой переменной в логической сети) по методу самоорганизации позволил сократить число входов сети с 10 до 9, соответствующих следующим параметрам: исходное магнитное поле, осредненное магнитное поле, остаточное магнитное поле, концентрация урана, концентрация тория, концентрация калия, отношение тория к урану, мощность экспозиционной дозы излучения, структурный параметр с показателями значимости 0.2, 0.2, 0.2, 0.36, 0.2, 0.56, 0.56, 0.56 и 0.32 соответственно. Таким образом, наиболее информативными входными признаками оказались концентрация урана, концентрация калия, отношение концентраций тория к урану, мощность экспозиционной дозы излучения и структурный параметр, что согласуется с представлениями экспертов-геофизиков о значимости применяемых геологоразведочных методов для прогнозирования залежей нефти и газа.

Практическая ценность работы состоит в следующем.

  1. Разработана методика расчета комплексного прогнозного параметра на основе комплексного анализа и интерпретации разнородных геологоразведочных данных нейросетевыми и логическими методами, предусматривающая построение расширенной геолого-геофизической модели месторождения с учетом наличия воды и нефти в данной точке площади.

  2. Получены показатели информативности входных переменных, позволяющие ранжировать применяемые геофизические и геохимические методы по уровню их значимости для прогноза нефти и газа.

  3. По результатам интерпретации булевой сети получены решающие (диагностические) правила в виде системы логических выражений, имеющих форму продукций "Если..., то", позволяющие диагностировать классы (нефть, вода).

  1. Предложена схема вычислительного устройства, которое может быть использовано для создания интеллектуальных геологоразведочных приборов, работающих в режиме реального времени в составе штатной геофизической аппаратуры

  2. Разработана интерпретационная картографическая система "ИнформГео" для решения задачи прогнозного картопостроения на основе объединения технологий интеллектуального анализа данных (нейронных сетей и метода самоорганизации булевых сетей) с геоинформационными технологиями.

Использованные модели, методы и алгоритмы позволили реализовать автоматизированную систему ввода, анализа и интерпретации геологоразведочных данных и осуществить, таким образом, замкнутый цикл камеральных работ на нефть и газ.

Реализованные в ИКС "ИнформГео" математические алгоритмы картопостроения позволяют рассчитывать эффективные модели распределения геофизических и геохимических параметров. К ним относится интерполяция кубическими сплайнами, позволяющими свести задачу к решению системы линейных алгебраических уравнений с симметричной матрицей, а также конечно-разностный метод решения дифференциальных уравнений.

Построенная геолого-геофизическая модель Южно-Черемшанского месторождения, прогнозная точность которой проверена бурением 7 скважин, содержит в себе знания о зависимости наличия нефти (газа), воды в данной точке площади от геофизических и геохимических параметров и потенциально применима для локализации прогноза на других месторождениях Юго-Восточной части Западной Сибири в условиях сокращения, во-первых, объектов разведочной информации (скважин), и, во-вторых, признаковых аргументов анализа, что может способствовать сокращению временных и материальных затрат на полевые и камеральные работы по интерпретации геологоразведочных данных.

С другой стороны, разработанное программное обеспечение содержит функции, выполняющие распознавание образов (классов) в условиях недостатка входной информации, образующей, по определению Щетинина В.Г. [102], непредставительную статистику. Обученные в результате самоорганизации логические сети, построенные на опорных функциях, принадлежащих классу булевых функций двух аргументов, в отличие от традиционных нейронных сетей, интерпретируются в виде диагностических таблиц в форме продукций "Если..., то", применяемых для представления знаний в экспертных системах. Найденные диагностические решающие правила включают меньшее, чем предлагается экспертами, число входных параметров с весами, обеспечивающими информативный вклад переменной в прогнозирование. Рассчитанные показатели значимости согласуются с представлениями экспертов-геофизиков об эффективности применяемых геологоразведочных методов для прогноза нефтеносности.

По результатам синтеза булевой сети на Южно-Черемшанском нефтяном месторождении создана модель вычислительного устройства на булевых и пороговых элементах, который может быть рекомендован для создания интеллектуальных приборов измерения и интерпретации полевых данных на местности в комплексе со штатной геофизической аппаратурой, например, через порт RS-232. При переходе от одного месторождения к другому данный нейрочип можно перепрограммировать на основе новых разведочных данных, используя технологии ПЛИС.

Представленные алгоритмы самоорганизации логической сети в рамках разработанной методики интерпретации данных позволяют значительно быстрее по сравнению с традиционными (алгоритм обратного распространения ошибки) обучить сеть без ухудшения качества прогноза, а также отвечают требованиям логической прозрачности сети. Это позволяет сделать вывод о возможности использования методики на основе как обучения нейронных сетей, так и самоорганизации булевых сетей для решения задач диагностики, прогнозирования, распознавания образов не только в геологоразведке, но и в

20 других областях знания, в частности, в настоящее время применяется для прогноза финансовой устойчивости предприятий агропромышленного комплекса Томской области. Реализация результатов

Полученные в работе результаты - методика расчета комплексного прогнозного параметра и пакет прикладных программ картопостроения, анализа и интерпретации геофизических и геохимических данных в составе интерпретационной картографической системы "ИнформГео" - прошли опытно-методическое опробование на материалах Южно-Черемшанского нефтяного месторождения, принадлежащего ЗАО "Петролеум-унд-газ". Кроме того, они используются в ООО "ИнформГеоСервис" и ОГУП "Томскинвестгеонефтегаз" в процессе камеральной обработки полевых геофизических и геохимических материалов с целью выявления и оконтуривания нефтегазоперспективных объектов по комплексным геолого-геофизическим данным, обеспечивая решение нефтегазопоисковых и разведочных задач в условиях минимального объема скважинной информации.

На базе выбранной методики расчета комплексного прогнозного параметра разработана интеллектуальная система "Комплексная нейросетевая модель финансовой устойчивости предприятий АПК", которая используется в Администрации Томской области для анализа финансовой устойчивости предприятий АПК.

Копии документов о внедрении прилагаются.

Внедрение результатов работы продолжается, они также могут быть использованы при создании иных автоматизированных систем прогнозирования, решающих задачу распознавания, классификации. Апробация работы

Результаты работы были представлены на Ш-м Международном научном симпозиуме студентов, аспирантов и молодых ученых "Проблемы геологии и освоения недр" (Томск, 13-16 апреля 1999 г.), Международном научном семинаре "Структурный анализ в геологических исследованиях" (Томск, 31

21 марта - 4 апреля 1999 г.), Международной научно-практической конференции "Геоинформатика-2000" (Томск, сентябрь 2000 г.), Международной научно-практической конференции "Новые информационные технологии в исследовании дискретных структур" (Томск, 12-14 сентября 2000 г.), региональной конференции геологов Сибири, Дальнего Востока и северо-востока России, посвященной 300-летию горно-геологической службы России (Томск, октябрь 2000 г.), VIII-м Всероссийском семинаре "Нейроинформатика и ее приложения" (Красноярск, 6-8 октября 2000 г.), Международной выставке "Высокие технологии. Инновации. Инвестиции" (С-Петербург, 12-15 июня 2001 г.), VI-й Всероссийской инновационной выставке-ярмарке в рамках IV-ro Международного Всесибирского инновационного форума (Томск, 28-30 ноября 2001 г.), Юбилейной Международной конференции по нейрокибернетике, посвященной 90-летию со дня рождения А.Б. Когана (Ростов-на-Дону, 25-28 сентября 2002 г.).

На Международной выставке "Высокие технологии. Инновации. Инвестиции", проходившей в г. С-Петербурге в июне 2001 г., разработанные методы нейрокомпьютерной обработки комплексных геолого-геофизических материалов в интеллектуальной геоинформационной системе "ИнформГео" с целью прогноза нефтегазоносности были отмечены Дипломом Минпромнауки РФ и серебряной медалью выставки. Копия прилагается.

На VI-м Всероссийской инновационной выставке-ярмарке, проходившей 28-30 ноября 2001 г. в рамках IV-ro Международного Всесибирского инновационного форума и областного конкурса "Сибирские Афины", разработанные нейросетевые методы прогноза нефти и газа на основе анализа и интерпретации геофизических и геохимических данных в интерпретационной картографической системе "ИнформГео" были отмечены Дипломом Администрации Томской области. Копия прилагается. Публикации Основные результаты работы опубликованы в 10 печатных работах.

22 Структура и объем работы

Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы и приложений, включающих документы о внедрении. Общий объем диссертации - 185 страниц, 34 рисунка, 11 таблиц, 6 приложений, список использованных источников состоит из 119 наименований.

КРАТКОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ

Во введении обоснована актуальность темы диссертации, определены цели настоящей работы, дана постановка задачи прогнозирования залежей нефти и газа с использованием картографических методов отображения данных и определены этапы ее решения. Рассмотрена научная и практическая значимость полученных результатов.

Первая глава посвящена новой области информатики - технологии интеллектуального анализа данных (ИАД) - применительно к ГИС. В обзорной части вводятся термины, указываются основные причины, способствующие распространению новой технологии, приводятся методы интеллектуального анализа данных. Рассматриваются аналитические возможности современных ГИС и их недостатки с точки зрения специализированного анализа в геологоразведке. Приводятся примеры интерпретационных ГИС.

Вторая глава посвящена описанию математических моделей, методов и алгоритмов решения задач картопостроения согласно результатам, полученным Гафуровым О.М. в 80-х г.г. в СКБ НПО "Нефтегеофизика" [90]. Приводится обзор картографических средств отображения данных в ГИС.

Описываются преимущества кубического сплайна - среди всех
интерполянтов, имеющих непрерывные первую и вторую производные,
кубический сплайн имеет наименьшую линеаризированную

среднеквадратичную кривизну [24].

В третьей главе описана общая методика расчета комплексного прогнозного параметра применительно к задаче прогноза нефти и газа, приводятся результаты тестирования прогнозных карт нефтеносности на Южно-Черемшанском месторождении, рассчитанных методом инверсных расстояний и методом Кригинга, рассматриваются недостатки статистических методов обработки информации, определяются условия, при которых целесообразно использовать эмпирический способ прогнозирования, определяются особенности формирования обучающей выборки и связанные с этим недостатки существующих алгоритмов обучения нейронной сети, формулируются дополнительные условия и ограничения по структуре и логической прозрачности, которым должна удовлетворять обученная нейронная сеть. Показывается, что для расчета комплексного прогнозного параметра значимы оба подхода - обучением нейронных сетей по алгоритму обратного распространения ошибки и методом самоорганизации булевой сети с построением разделяющих булевых функций и выводом диагностических решающих правил. Обученные сети в своей топологии содержат знания о значимости входных параметров.

Четвертая глава посвящена задачам, стоящим перед экспериментальными исследованиями, а также описанию результатов этих исследований и промышленного внедрения ИКС "ИнформГео", иллюстрирующих эффективность применения предложенных и разработанных моделей, методов и алгоритмов на примере Южно-Черемшанского нефтяного месторождения, Олимпийского куполовидного поднятия и южной периклинали Болтной структуры. Описываются выводы и рекомендации, которые отражают опыт практического применения разработанной методики комплексирования геофизических и геохимических методов.

В приложении 1 описана программная реализация ИКС "ИнформГео".

В приложении 2 приводится описание магнитной и радиогеохимической съемок на Южно-Черемшанском месторождении.

24 Положения, выносимые на защиту:

  1. Методика расчета комплексного прогнозного параметра на основе анализа и интерпретации геофизических и геохимических данных для прогноза залежей нефти и газа и ее программная реализация в виде пакета прикладных программ анализа и интерпретации геолого-геофизических данных в интерпретационной картографической системе "ИнформГео".

  2. Модификация метода самоорганизации булевых сетей в части построения дополнительных разделяющих булевых функций и увеличения количества используемых входных переменных.

  3. Методика формирования решающих диагностических правил в виде системы логических выражений, имеющих форму продукций "если..., то", позволяющих диагностировать классы (нефть, вода).

  4. Программная реализация методов картопостроения в ИКС "ИнформГео" на основе кубической сплайн-интерполяции по профилю и пересчета на сетку конечно-разностными методами решения дифференциальных уравнений, моделирующих пликативные поверхности раздела.

  5. Разработка интерпретационной картографической системы "ИнформГео" для анализа пространственно распределенных данных на основе объединения технологий интеллектуального анализа данных (нейронных сетей и метода самоорганизации булевых сетей) с геоинформационными технологиями.

Методы интеллектуального анализа данных

Data Mining является мультидисциплинарной областью, возникшей и развивающейся на базе достижений прикладной статистики, распознавания образов, методов искусственного интеллекта, теории баз данных и др. Отсюда обилие методов и алгоритмов, реализованных в различных действующих системах Data Mining. Многие из таких систем интегрируют в себе сразу несколько подходов. Тем не менее, как правило, в каждой системе имеется какая-то ключевая компонента, на которую делается главная ставка. Ниже приводится классификация указанных ключевых компонент и дается их краткая характеристика.

Предметно-ориентированные аналитические системы очень разнообразны. Наиболее широкий подкласс таких систем, получивший распространение в области исследования финансовых рынков, носит название "технический анализ". Он представляет собой совокупность нескольких десятков методов прогноза динамики цен и выбора оптимальной структуры инвестиционного портфеля, основанных на различных эмпирических моделях динамики рынка. Эти методы часто используют несложный статистический аппарат, но максимально учитывают сложившуюся в своей области специфику (профессиональный язык, системы различных индексов и пр.). На рынке имеется множество программ этого класса. Как правило, они довольно дешевы (обычно $300-1000).

Последние версии почти всех известных статистических пакетов включают наряду с традиционными статистическими методами также элементы Data Mining. Однако основное внимание в них уделяется все же классическим методикам — корреляционному, регрессионному, факторному анализу и другим. Недостатком систем этого класса считают требование к специальной подготовке пользователя. Также отмечают, что мощные современные статистические пакеты являются слишком "тяжеловесными" для массового применения в финансах и бизнесе. К тому же часто эти системы весьма дороги — от $1000 до $15000. Есть еще более серьезный принципиальный недостаток статистических пакетов, ограничивающий их применение в Data Mining. Большинство методов, входящих в состав пакетов опираются на статистическую парадигму, в которой главными фигурантами служат усредненные характеристики выборки. А эти характеристики, как указывалось выше, при исследовании реальных сложных жизненных феноменов часто являются фиктивными величинами. В качестве примеров наиболее мощных и распространенных статистических пакетов можно назвать SAS (компания SAS Institute), SPSS (SPSS), STATGRAPICS (Manugistics), STATISTICA, STADIA и другие.

Нейронные сети - это большой класс систем, архитектура которых имеет аналогию (как теперь известно, довольно слабую) с построением нервной ткани из нейронов. В одной из наиболее распространенных архитектур, многослойном перцептроне с обратным распространением ошибки, имитируется работа нейронов в составе иерархической сети, где каждый нейрон более высокого уровня соединен своими входами с выходами нейронов нижележащего слоя. На нейроны самого нижнего слоя подаются значения входных параметров, на основе которых нужно принимать какие-то решения, прогнозировать развитие ситуации и т. д. Эти значения рассматриваются как сигналы, передающиеся в следующий слой, ослабляясь или усиливаясь в зависимости от числовых значений (весов), приписываемых межнейронным связям. В результате на выходе нейрона самого верхнего слоя вырабатывается некоторое значение, которое рассматривается как ответ - реакция всей сети на введенные значения входных параметров. Для того чтобы сеть можно было применять в дальнейшем, ее прежде надо "натренировать" на полученных ранее данных, для которых известны и значения входных параметров, и правильные ответы на них. Тренировка состоит в подборе весов межнейронных связей, обеспечивающих наибольшую близость ответов сети к известным правильным ответам. Пример нейросети, аппроксимирующей полином, показан на рис. 1.

Пример полиномиальной нейросети Основной недостаток нейросетевой парадигмы с позиции Data Mining заключается в том, что даже натренированная нейронная сеть представляет собой "черный ящик". Знания, зафиксированные как веса нескольких сотен межнейронных связей, совершенно не поддаются анализу и интерпретации человеком (известные попытки дать интерпретацию структуре настроенной нейросети выглядят неубедительными - система "KINOsuite-PR"). Примеры нейросетевых систем — BrainMaker (CSS), NeuroShell (Ward Systems Group), OWL (HyperLogic). Стоимость их довольно значительна: $1500-8000. Системы рассуждений на основе аналогичных случаев.

Идея систем case based reasoning — CBR — на первый взгляд крайне проста. Для того чтобы сделать прогноз на будущее или выбрать правильное решение, эти системы находят в прошлом близкие аналоги наличной ситуации и выбирают тот же ответ, который был для них правильным. Поэтому этот метод еще называют методом "ближайшего соседа" (nearest neighbour). В последнее время распространение получил также термин memory based reasoning, который акцентирует внимание, что решение принимается на основании всей информации, накопленной в памяти. Несмотря на то, что системы CBR показывают неплохие результаты, главным их минусом считают то, что они вообще не создают каких-либо моделей или правил, обобщающих предыдущий опыт, — в выборе решения они основываются на всем массиве доступных исторических данных, поэтому невозможно сказать, на основе каких конкретно факторов CBR системы строят свои ответы. Другой минус заключается в произволе, который допускают системы CBR при выборе меры "близости". От этой меры самым решительным образом зависит объем множества прецедентов, которые нужно хранить в памяти для достижения удовлетворительной классификации или прогноза. Примеры систем, использующих CBR, — KATE tools (Acknosoft, Франция), Pattern Recognition Workbench (Unica, США).

Деревья решений (decision trees) являются одним из наиболее популярных подходов к решению задач Data Mining. Они создают иерархическую структуру классифицирующих правил типа "ЕСЛИ..., ТО..." (ifhen), имеющую вид дерева. Для принятия решения, к какому классу отнести некоторый объект или ситуацию, требуется ответить на вопросы, стоящие в узлах этого дерева, начиная с его корня. Вопросы имеют вид "значение параметра А больше х?". Если ответ положительный, осуществляется переход к правому узлу следующего уровня, если отрицательный — то к левому узлу; затем снова следует вопрос, связанный с соответствующим узлом. Популярность подхода связана с наглядностью и понятностью. Но деревья решений принципиально не способны находить "лучшие" (наиболее полные и точные) правила в данных. Они реализуют наивный принцип последовательного просмотра признаков и "цепляют" фактически осколки настоящих закономерностей, создавая лишь иллюзию логического вывода. Вместе с тем, большинство систем используют именно этот метод. Самыми известными являются See5/C5.0 (RuleQuest, Австралия), Clementine (Integral Solutions, Великобритания), SIPINA (University of Lyon, Франция), IDIS (Information Discovery, США), KnowledgeSeeker (ANGOSS, Канада). Стоимость этих систем варьируется от 1 до 10 тыс. долл.

Кубическая сплайн-интерполяция по профилям в ИКС "ИнформГео"

Чтобы построить геолого-геофизическую модель среды, отражающую ее структурные особенности, свойства и состояние, можно использовать различные геофизические параметры: амплитуду, время, скорость, глубину и т.д. С точки зрения математики неважно, какой метод применялся - в каждом случае получают трехмерное поле сигнала, которое необходимо анализировать и интерпретировать. Рассмотрим сейсморазведку.

На предполагаемом месте залегания породы (нефти, газа) выделяется полигон - площадка определенных размеров, имеющая координаты (Хо, У о, XQYC) В мировой системе координат. На этом полигоне в различных точках прямолинейных участков (звеньев) профилей производятся взрывы. Соответствующие параметры замеряются сейсмоприемной аппаратурой и заносятся в первичные файлы данных. Пусть имеется М точек анализа хь на профиле со значениями параметра / (xi), к=0,п. В ИКС "ИнформГео" применяется кубическая сплайн-интерполяция, сочетающая хорошие аппроксимационные качества с локальным характером сплайна. Покажем, как находятся коэффициенты сплайна (в данном случае коэффициентами являются вторые производные сплайн-функции во внутренних точках хк) и почему применяется именно этот способ интерполяции [22]. Кубический сплайн представляет собой функцию Рз(х), которая непрерывна на всем отрезке [ Хо,хп ], а на каждом частичном отрезке [ xk.j,Xk ], k-l,п в отдельности является алгебраическим многочленом 3-й степени [22]: о что и требовалось доказать. Таким образом, сплайн имеет наименьшую линеаризированную среднеквадратичную кривизну среди всех интерполянтов.

Поэтому, если приближающая функция ищется среди функций наибольшей гладкости, то наилучшей оказывается интерполяция сплайнами. Кроме того, при одинаковой точности вычислительный аспект у сплайн-функций ниже, а при одинаковых вычислительных затратах точность выше по сравнению с интерполированием на основе алгебраических полиномов, гармонических, экспоненциальных и других функций. Результат интерполяции - коэффициенты сплайна (по ним сплайн-функция однозначно восстанавливается на отрезке [ %о,хп ]) - заносятся в файл типа "профиль".

Построенные по профилям двумерные модели параметра являются для геофизика (геолога) эффективными средствами предварительного анализа и интерпретации данных, которые можно отнести к средствам выявления знаний класса 1. В процессе построения одномерных моделей пользователь может рассчитать элементы залегания пласта на основе дифференциальных характеристик сплайна, вычислить точки максимумов, минимумов и перегибов, также контролируется угол наклона на прямолинейных участках горизонта. Как правило, для пользователя важно, чтобы значения функции по параметру соответствовали методу, которым были получены данные (магниторазведка, геохимические методы) - находиться внутри определенных интервалов, особенно вблизи разведочных скважин. Кроме того, с помощью преобразований можно получить более сглаженные или наоборот, подчеркнуть дизъюнктивные особенности модели, а также проверить исходные данные на наличие ошибок (шума). Пример занесения параметрической информации из профиля в узлы сетки Рис. 2. Пример определения ближайших к профилю узлов сетки По начальной Mj (Xj, Yj) и конечной М2 ( Yj) точкам звена профиля рассчитывается уравнение прямой: Далее определяются вертикальные столбцы сетки и координаты пересечения их с линией звена профиля в соответствии с условием

Адаптация нейросетевого подхода к расчету комплексного прогнозного параметра

В рамках нейросетевого базиса методика расчета комплексного прогнозного параметра, реализованная автором в РЖС "ИнформГео", состоит в общих чертах в следующем. 1. Формируется выборка U по скважинам. Исходными данными являются сетки различных геофизических и геохимических параметров по площади месторождения, подаваемые в едином масштабе с общей начальной точкой координат, и S разведочных скважин, разбитых по результатам испытаний на классы к - нефтяные (газовые) (к—1), водно-нефтяной контакт (к—О), порода (к—-1). Для каждой /-й скважины, где i=l,...,S, строится множество Z), , состоящее из щ точек, лежащих в круге радиуса Rt, с центром в /-й скважине. Радиус зависит от геологических условий и параметров околоскважинного пространства. Для каждой У-й точки из множества Д формируется вектор Уj длины Р+1, называемый наблюдением, компонентами которого являются значения геофизических и геохимических параметров ,..., VJP , образующие входной набор, и номер класса к — выходное значение, к которому относится і-я скважина: Таким образом, выборкой, построенной на множестве точек Д, относящихся к /-й скважине, является множество векторов а выборку, построенную по всем скважинам, образует множество: 2. Выборка /некоторым образом разбивается на два подмножества U06y4 и ипров » образующие обучающую и проверочную выборку. 3. Нейросеть с количество нейронов в 1-м слое - 10, во 2-м слое - 7, в третьем слое - 1 и характеристической функцией нейрона в виде экспоненциальной сигмоиды, обучается на выборке U0$y4 с заданной точностью обучения. 4. На проверочной выборке Unpoe по величине несовпадений ответов нейросети с известными ответами оценивается качество обученной нейросети (ошибка обобщения). 5. Обученная нейросеть разбивает все многомерное признаковое пространство на классы (нефть, вода, порода), по которым формируется прогнозная карта нефтеносности по площади. 6. Для каждого из входных параметров оценивается показатель его значимости, характеризующий информативный вклад данного параметра в полученные результаты. Результаты практического применения данной методики приведены в главе 4. Итак, рассмотрим трехслойную нейронную сеть с количеством нейронов в 1-м слое - 10, во 2-м слое - 7, в третьем слое - 1 и выберем характеристическую функцию нейронов в виде экспоненциальной сигмоиды Выбор функции такого вида обусловлен тем, что она гладкая, непрерывная на всем диапазоне переменной S, имеет непрерывную первую производную, диапазон значений ограничен. Параметр С влияет на качество и скорость обучения. Функция с малой характеристикой обеспечивает относительно большую разность между преобразованными сигналами, которые до преобразования находились или на значительном расстоянии друг от друга, или группировались в зоне наиболее крутого участка функции (около нуля). Наоборот, функция с большой характеристикой лучше разделяет сигналы, попадающие в крайние зоны и находящиеся на небольшом расстоянии друг от друга. Экспериментальным путем установлено [38], что оптимальный диапазон характеристики для решения подавляющего большинства задач составляет от 0,1 до 0,8.

Опишем более подробно шаги рассмотренного в главе 3.3 алгоритма расчета комплексного прогнозного параметра, использующегося в ИКС "ИнформГео". 1. Формирование выборки U по скважинам. 1.1 В качестве параметров (признаков), по которым ведется классификация, используется 10 параметров: 1) Исходное магнитное поле. 2) Осредненное магнитное поле. 3) Остаточное магнитное поле. 4) Дисперсия магнитного поля. 5) Концентрация урана. 6) Концентрация тория. 7) Концентрация калия. 8) Отношение тория к урану. 9) Мощность экспозиционной дозы излучения. 10) Структурный параметр. 1.2 Выборка [/случайным образом разбивается на обучающую UQQy4 и проверочную Unpoe выборки. 1.3 Анализируется обучающая выборка на непротиворечивость. Выборка непротиворечива, если в ней отсутствуют наблюдения V,,..., Vр, к, в которых одинаковые входные наборы V,,..., Vpи разные выходные значения к. Нейронная сеть не может обучиться на противоречивой выборке. 1.4 Нормируются параметры на диапазон [-1...1]. Значение параметра перед подачей на вход нейронов 1-го слоя пересчитывается по формуле: Vj= 2 (V} - mirij) / (maxj - mirij) - I , где v, - значение /-го входного параметра, V\- получаемое нормированное значение, mini и maXj - соответственно минимальное и максимальное значения /-го параметра в пределах обучающей выборки. 2. Инициализация нейронной сети. Необученная нейросеть может выдать правильный ответ только совершенно случайно. Однако трудно сразу подобрать такое количество нейронов в промежуточном слое, при котором бы нейросеть обучилась решить задачу с заданной ошибкой обучения. Поэтому начинают обычно с Р/2 нейронов в промежуточном слое, а затем, если сеть не может обучиться с заданной точностью, пробуют обучать сети с увеличенным числом нейронов в промежуточном слое. 3. Обучение нейронной сети. Для обучения выбран метод обратного распространения ошибки [36], основная трудность которого состоит в том, как получить значения ошибки для нейронов промежуточного слоя, поскольку правильные значения ошибки имеются только для нейронов выходного слоя. Чем больше значение веса между нейроном промежуточного слоя и выходным нейроном, тем сильнее ошибка первого влияет на ошибку второго. Следовательно, значения ошибок элементов промежуточного слоя можно получить как взвешенную сумму ошибок последующих слоев. При обучении значения ошибок нейронов вычисляются в обратном направлении, что и отражено в названии метода. Обозначим матрицу весов связей, идущих от входов к промежуточному слою, как Р= \ру , где рц - значение веса связи от нейрона с номером / во входном слое к нейрону с номером У в промежуточном слое, а матрицу весов связей, соединяющих промежуточный и выходной слой (в данном случае выходной слой содержит один нейрон) как Q— 4} Для индексов примем следующие обозначения: входные нейроны будем нумеровать индексом /, нейроны промежуточного слоя - индексом

Построение прогнозных карт нефтеносности на Южно-Черемшанском нефтяном месторождении

Сопоставление информативных материалов гамма-спектрометрической и магнитной съемок показывает высокую корреляцию пространственного расположения аномальных зон, выделенных по обоим методам, с контуром нефтеносности месторождения. Это явление, по мнению экспертов-геофизиков, не является случайным, т.к. по существу физико-геологическая модель нефтегазоносного объекта и для магниторазведки, и для радиометрических методов принципиально одна и та же. Сходство результатов может быть обусловлено только единой причиной, формирующей наборы аномальных признаков - наличием залежи углеводородов и эпигенетическим преобразованием надпродуктивной толщи под влиянием миграции углеводородов.

Учитывая глобальное различие физических и геологических основ рассматриваемых методов, тем более логично их комплексирование при исследовании месторождений нефти и газа.

Полученные контуры нефтеносности хорошо коррелируются между собой и с данными по скважинам, а также подтверждены последующим бурением 7 скважин, давших промышленные притоки нефти. Кроме того, экспертные прогнозные зоны включают в себя локализацию залежей нефти без учета окружающего их водно-нефтяного контакта, т.е. распознается один класс, тогда как методика неиросетевои и логической интерпретации данных предполагает построение расширенной геолого-геофизической модели месторождения с вероятностями наличия нефти и воды в данной точке площади. Такой подход повышает достоверность прогноза, что подтверждается бурением скважины № 102 (вода).

Для оценки качества обучения нейронной сети методом обратного распространения ошибки и достоверности прогнозного решения были проведены исследования графиков ошибок обобщения на проверочной выборке после обучения 10 нейросетей с различными начальными значениями весов. По каждому примеру из проверочной выборки было найдено среди 10 ошибок обобщения среднее значение, для которого рассчитаны дисперсия и доверительный интервал при 95-процентном уровне надежности. Результаты исследований представлены на рис. 32.

Таким образом, с точки зрения экспертов-геофизиков, получено приемлемое качество прогноза вне зависимости от примененных алгоритмов обучения сети (обратного распространения ошибки и самоорганизации логической сети) для обоих классов распознавания (нефть, вода). В экспериментах рассматривались сети с одинаковым количеством элементов во входном слое. Установлено, что незначительное улучшение целевой функции при использовании трехслойной сети методом обратного распространения ошибки приводит к существенному увеличению времени обучения. Так, время обучения трехслойной сети методом обратного распространения ошибки при точности решения задачи 0.06 в три раза превышает время обучения методом самоорганизации.

Таким образом, представленные алгоритмы самоорганизации логической сети в рамках разработанной методики интерпретации данных позволяют значительно быстрее по сравнению с традиционными (алгоритм обратного распространения ошибки) обучить сеть, а также отвечают требованиям логической прозрачности сети. Это позволяет сделать вывод о возможности использования методики для решения задач диагностики, прогнозирования, распознавания образов не только в геологоразведке, но и в других областях знания, в частности, в настоящее время применяется для прогноза финансовой устойчивости предприятий агропромышленного комплекса Томской области.

Знания, полученные в результате обучения нейронной сети на двух нефтяных месторождениях Юго-Восточной части Западной Сибири, могут применяться для локализации прогноза нефти и на других месторождениях при минимальном объеме скважинной информации вплоть до отсутствия разведочных скважин.

По результатам обучения на Южно-Черемшанском нефтяном месторождении логической сети методом самоорганизации автором была создана модель вычислительного устройства на булевых и пороговых элементах. Функциональная схема такого устройства показана на рис. 26.

Разработка вычислительных систем и нейрочипов, функционирующих в реальном масштабе времени, в настоящее время является актуальной и ведется во многих странах мира. Основная проблема связана с удешевлением элементной базы, поскольку с одной стороны формальные нейроны (ФН) выполняют взвешенное суммирование и нелинейное преобразование сигнала при непрерывно изменяемых весах взаимодействия нейронов, а с другой стороны создается "тирания межсоединений" в нейрочипах, когда реализуется структурный принцип: каждый ФН связан с каждым ФН. Все это приводит к значительному удорожанию (тысячи долларов) стоимости нейрочипов.

В качестве элементной базы используются заказные кристаллы (ASIC), встраиваемые микроконтроллеры (тС), процессоры общего назначения (GPP), программируемая логика (FPGA - ПЛИС), транспьютеры, цифровые сигнальные процессоры (DSP), для передачи данных пробуют использовать оптические нейронные сети [112].

Конкуренция на мировом рынке диктует такие условия развития некоторых секторов рынка, когда зачастую простые, дешевые, "товарные" продукты имеют более высокий спрос и обеспечивают большую прибыль, чем сложные и дорогие нейрочипы.

Переход от модели формального нейрона в нейронных сетях к простейшим логическим элементам (пороговым и булевым), реализуемых в двухвходовых логических сетях, обучаемых в процессе самоорганизации, в рамках диссертационной работы позволил перейти к простейшей (недорогой) элементной базе вычислительных устройств, реализуемых на основе технологии ПЛИС. Данная технология в связи с быстродействием и сверхнизким уровнем энергопотребления в последнее время находит наибольшее практическое использование при реализации нейровычислителей.

Похожие диссертации на Разработка интерпретационной картографической системы "ИнформГео" для прогноза нефтеносности месторождений