Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Обработка слабоструктурированной информации при построении базы знаний экспертной системы микроэлементных нарушений у человека Махалкина Валерия Викторовна

Обработка слабоструктурированной информации при построении базы знаний экспертной системы микроэлементных нарушений у человека
<
Обработка слабоструктурированной информации при построении базы знаний экспертной системы микроэлементных нарушений у человека Обработка слабоструктурированной информации при построении базы знаний экспертной системы микроэлементных нарушений у человека Обработка слабоструктурированной информации при построении базы знаний экспертной системы микроэлементных нарушений у человека Обработка слабоструктурированной информации при построении базы знаний экспертной системы микроэлементных нарушений у человека Обработка слабоструктурированной информации при построении базы знаний экспертной системы микроэлементных нарушений у человека
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Махалкина Валерия Викторовна. Обработка слабоструктурированной информации при построении базы знаний экспертной системы микроэлементных нарушений у человека : диссертация ... кандидата биологических наук : 05.13.01 / Махалкина Валерия Викторовна; [Место защиты: Тул. гос. ун-т].- Тула, 2009.- 188 с.: ил. РГБ ОД, 61 09-3/1332

Содержание к диссертации

Введение

Глава I Аналитический обзор использования различных методологий для построения базы знаний экспертной системы в биологии и медицине 11

1.1 Интеллектуализация медицинских систем 11

1.2 Применение экспертных систем в медико-биологических исследованиях 12

1.3 Методы приобретения знаний для построения экспертной системы 18

1.4 Состояние разработок в области медицинских экспертных систем 26

Глава II Объект и методы исследования 36

Глава III Методология обработки данных для построения медицинской базы знаний экспертной системы 40

3.1 Алгоритм обработки данных для построения базы знаний экспертной системы 40

3.2 Идентификация проблемы исследования 43

3.3 Построение концептуальной модели 51

3.4 Формализация базы знаний 62

3.5 Выполнение экспертной системы 88

3.6 Тестирование и опытная эксплуатация экспертной системы 89

Глава IV Построение базы знаний экспертной системы микроэлементных нарушений у человека на примере экологически и производственно обусловленных заболеваний органов дыхания 92

4.1 Постановка задачи контрольного аналитического расчета по микроэлементным нарушениям при заболеваниях органов дыхания 92

4.2 Диагностическая значимость микроэлементов при заболеваниях органов дыхания для построения экспертной системы микроэлементных нарушений 95

4.3 Аналитический контрольный расчет для построения базы знаний экспертной системы микроэлементных нарушений у человека на примере экологически и производственно обусловленных заболеваний органов дыхания 101

Заключение 122

Выводы 125

Практические рекомендации 126

Список использованной литературы 127

Приложения 150

Введение к работе

Актуальность проблемы. В настоящее время разработано множество различных систем, направленных на повышение уровня интеллектуальной информационной поддержки современного специалиста при принятии решений. Это системы интеллектуального анализа данных, позволяющие выявить скрытые закономерности; системы компьютерного имитационного моделирования; экспертные системы (ЭС), основанные на знаниях и опыте принятия решений экспертов в определенных предметных областях, и другие системы, облегчающие выбор лучшего решения из множества предложенных (Попов Э.В., 1990; Дюк В., Эммануэль В., 2003; Абдикеев Н.М., 2004).

Наиболее трудными для анализа и поддержки принятия решений являются слабоструктурированные предметные области, типичные для задач интерпретации, диагностики и прогнозирования в экономической, биологической, медицинской и других сферах деятельности, в которых данные могут быть представлены и количественно, и качественно. В слабоструктурированных областях знаний формализация модели (выявление основных факторов, связей между ними) должна происходить в тесном контакте с экспертами, причем для сложных предметных областей такая работа должна осуществляться при помощи компьютерной поддержки. Современные системы, предназначенные для работы со слабоструктурированной информацией, должны включать различные методы анализа, оценки и выработки решений, развитый пользовательский интерфейс, средства редактирования и настройки баз знаний (БЗ), а также визуализации всего процесса принятия решения, анализа результатов, их интерпретации и объяснения (Гаврилова Т.А., Червинская К.Р., 1992; Степанова М.Д., Самодумкин С.А., 2000). Архитектуры систем, удовлетворяющих указанным требованиям, в настоящее время находятся на этапе бурного развития, т.к. применение подобных систем открывает более широкие аналитические возможности для исследования сложных предметных областей. Поэтому тематика данной работы, посвященная разработке методологии построения БЗ сложных ЭС поддержки принятия решений в слабоструктурированных предметных областях биологии и медицины, является актуальной (Луценко Е. В., 2004).

Цель исследования. Разработка методологии построения БЗ сложных ЭС поддержки принятия решений, принимаемых в слабоструктурируемых предметных областях биологии и медицины на примере микроэлементных нарушений у человека для экологически и производственно обусловленных заболеваний органов дыхания.

Исходя из цели, были поставлены следующие задачи:

  1. Определить принципы построения ЭС моделирования слабоструктурированной информации.

  2. Проанализировать существующие ЭС в области медицины, биологии и, в частности, в области микроэлементных нарушений у человека, выявить их основные достоинства и ограничения.

  3. Выявить эффективные способы приобретения знаний от экспертов и определить методы обработки экспертной информации для создания структуры исходной базы данных (БД) микроэлементных нарушений у человека для экологически и производственно обусловленных заболеваний органов дыхания.

  4. Исследовать существующие методы анализа данных и способы приобретения знаний из плохо формализуемых данных для построения БЗ ЭС микроэлементных нарушений у человека на примере экологически и производственно обусловленных заболеваний органов дыхания.

  5. Разработать методологию перехода от данных к знаниям, включающую ее компьютерную поддержку, с построением полных и непротиворечивых БЗ ЭС для слабоструктурированных предметных областей на примере экологически и производственно обусловленных заболеваний органов дыхания.

  6. Экспериментально проверить предложенную методологию и качество получаемых результатов на практике при построении БЗ ЭС выявления микроэлементных нарушений у человека на примере экологически и производственно обусловленных заболеваний органов дыхания.

Научная новизна диссертации состоит в следующем:

  1. Предложена и адаптирована процедура экспертного опроса для определения структуры исходной БД диагностики экологически и производственно обусловленных заболеваний органов дыхания по микроэлементам на основе согласованного коллективного решения.

  2. Предложена новая методология анализа медико-биологических данных с учетом контекста по алгебраической модели конструктивной логики (АМКЛ), позволяющая проводить интерпретацию экологически и производственно обусловленных заболеваний органов дыхания по микроэлементам для построения полной непротиворечивой БЗ ЭС.

  3. Доработан алгоритм АМКЛ в части его использования для построения БЗ ЭС: разработана методика вычисления обобщенной оценки результата, факторов уверенности (ФУ), коэффициентов значимости (КЗ), анализа чувствительности каждого фактора.

  4. Разработана архитектура модели ЭС, основанной на логике предикатов, и смоделирована БЗ диагностики экологически и производственно обусловленных заболевания органов дыхания по биологическому маркеру – концентрации солей тяжелых металлов в биосубстрате моча и кровь.

  5. Показана адекватность предложенной методологии на основе проведенного аналитического контрольного расчета по диагностике микроэлементных нарушений у человека на примере экологически и производственно обусловленных заболеваний органов дыхания, подтверждающая правильность построенной модели и обеспечивающая объективность и достоверность получаемых результатов.

Практическая значимость работы. Разработанная ЭС может быть использована в научных медико-биологических исследованиях, а также может применяться при подготовке студентов медицинских вузов и колледжей. Внедрение технологии ЭС в процесс обработки и интерпретации медицинской информации повышает объективность и достоверность полученных результатов обследования на микроэлементозы, что можно использовать в клинической практике после соответствующих утверждений в виде методических рекомендаций.

Внедрение результатов работы. Результаты исследования внедрены в диагностическую и лечебную практику работы Городской больницы №10 г. Тулы. Материалы диссертационной работы также внедрены в учебный процесс на кафедре «Санитарно-гигиенические и профилактические дисциплины» Тульского государственного университета по дисциплине «Медицинская информатика».

Апробация материалов работы. Апробация и внедрение результатов исследования осуществлялись на базе токсико-экологической лаборатории и Профцентра Городской больницы №10 г. Тулы.

Основные положения диссертационной работы докладывались и обсуждались на следующих научных мероприятиях: II Всероссийской научно-технической конференции (Тула, 2004); III Всероссийской научно-технической конференции (Тула, 2006); V Всероссийском конгрессе «Профессия и здоровье» (Москва, 2006); II Всероссийском съезде врачей-профпатологов (Ростов-на-Дону, 2006); 1-ой магистерской научно-технической конференции (Тула, 2006); научных семинарах и конференциях кафедры «Автоматизированных информационных и управляющих систем» (Тула, 2004-2008): VII Всероссийском конгрессе «Профессия и здоровье» (Москва, 2008); Всероссийской научно-практической конференции с международным участием, посвященной III Международному Полярному Году (Архангельск, 2009).

Результаты диссертационной работы апробированы на совместном заседании кафедр медико-биологических дисциплин, санитарно-гигиенических и профилактических дисциплин, автоматизированные информационные и управляющие системы Тульского государственного университета.

Публикации. По материалам диссертации опубликовано 13 печатных работ, из них 6 статей в рекомендованных ВАК журналах.

Структура и объем диссертации. Диссертация состоит из введения, 4 глав, заключения, выводов, практических рекомендаций, списка литературы, приложений. Работа изложена на 187 страницах, содержит 20 рисунков, 17 таблиц. Список использованной литературы включает 235 источников, из них 53 зарубежных.

Применение экспертных систем в медико-биологических исследованиях

Автоматизированные системы, в которых используются ИИ, принято называть интеллектуальными информационными системами (ИИС). В нашем исследовании под интеллектуальной системой будем понимать объединенную информационным процессом совокупность технических средств и программного обеспечения, работающего во взаимосвязи с человеком (коллективом людей) или автономно, способную на основе сведений и знаний при наличии мотивации синтезировать цель, выработать решение о действии и находить рациональные способы достижения цели [106].

Для ИИС, ориентированных на генерацию алгоритмов решения задач, характерны следующие признаки [23, 99, 156]:

развитые коммуникативные способности, которые характеризуют способ взаимодействия (интерфейса) конечного пользователя с системой;

умение решать сложные плохо формализуемые задачи - это задачи, которые требуют построения оригинального алгоритма решения в зависимости от конкретной ситуации, для которой могут быть характерны неопределенность и динамичность исходных данных и знаний;

способность к самообучению — это возможность автоматического извлечения знаний для решения задач из накопленного опыта конкретных ситуаций;

адаптивность - способность к развитию системы в соответствии с объективными изменениями модели проблемной области.

В различных ИИС перечисленные признаки интеллектуальности развиты в неодинаковой степени и редко, когда все четыре признака реализуются одновременно.

Одним из основных классов ИИС являются экспертные системы (ЭС), или системы, основанные на знаниях (СОЗ). Медицина относится к числу тех областей деятельности, где применение ЭС может дать существенный эффект. Большие диагностические и лечебные возможности ЭС связаны с тем, что их базы знаний (БЗ) могут включать знания большого числа специалистов о возможных диагностических признаках того или иного заболевания, видах его проявления, ходе его протекания, о взаимосвязях с факторами смежных областей; учитывать особенности конкретных пациентов, поддерживать принятие решений в критических точках лечебного процесса и т. д. и в итоге накапливать большой объем сведений о заболеваниях и их формах, превышающий знания одного человека (или одной школы) [150, 202].

При решении сложных медицинских задач не представляется возможным учесть все реально имеющиеся условия, от которых зависит ответ, а можно лишь выделить приблизительный набор наиболее важных условий. Следовательно, часть условий при этом не учитывается, а это значит, что полученный ответ носит неточный, приблизительный характер, и алгоритм нахождения ответа не может быть выписан точно. Медицинские задачи практически всегда имеют несколько способов решения [80]. Практически вся медицинская и биологическая наука состоит именно из слабоструктурированных и трудноформализуемых задач. К ним относятся задачи диагностики, прогнозирования, выбора стратегии и тактики лечения и др. [80].

ЭС основаны на концепции использования БЗ для генерации алгоритмов решения прикладных задач различных классов в зависимости от конкретных информационных потребностей пользователей [7, 193].

Основным элементом в ЭС являются знания. Знания — это основные закономерности ПрО, позволяющие человеку решать конкретные производственные, научные и другие задачи, т.е. факты, понятия, взаимосвязи, оценки, правила, эвристики (фактические знания), а также стратегии принятия решения в этой области (стратегические знания) [22].

Достоинство применения ЭС заключается в возможности принятия решений в уникальных ситуациях, для которых алгоритм заранее не известен и формируется по исходным данным в виде цепочки рассуждений (правил принятия решений) из БЗ [44, 163]. Причем решение задач предполагается осуществлять в условиях неполноты, недостоверности, многозначности исходной информации и качественных оценок процессов [44, 156].

Использование ЭС для решения задач в неформализованных областях определено их особенностями: возможностью накопления и организации знаний, использование высококачественного опыта для решения проблемных ситуаций, наличие прогностических и объяснительных возможностей, а также институциональной памяти.

Таким образом, можем сделать вывод, что технология ЭС прекрасно подходит для решения сложных медицинских задач, которые представляют собой слабоструктурированные и трудно формализуемые области знаний. Решения, полученные ЭС, не уступают по качеству и эффективности решениям высококвалифицированных специалистов, обладают «прозрачностью», т.е. могут быть объяснены на качественном уровне пользователю, и они позволяют моделировать процесс принятия решения экспертом [149]. Кроме того, ЭС позволяют использовать для поиска решений сложные по конструкции правила и решать трудные задачи, содержащиеся в ПрО, исследовать свои рассуждения, т.е. проверять их правильность. Все эти особенности ЭС выгодно отличают их от традиционных программ, в которых алгоритмы решения задачи обычно прописываются жестко.

Для того чтобы лучше понимать особенности и возможность применения ЭС для решения поставленной задачи рассмотрим принцип ее работы и базовые элементы, из которых они состоят. ЭС включает в себя два основных компонента (рис. 1): базу знаний (хранилище единиц знаний) и программный инструмент доступа и обработки знаний, состоящий из интеллектуального интерфейса, механизма вывода заключений (решений), объяснения получаемых результатов, механизма приобретения знаний и рабочей памяти (РП). Причем центральным компонентом ЭС является база знаний (БЗ), которая выступает по отношению к другим компонентам как содержательная подсистема, составляющая основную ценность [156].

Она отражает объекты ПрО и их взаимосвязи, действия над ними и неопределенности, с которыми эти действия осуществляются. БЗ предназначена для хранения правил, описывающих рассматриваемую ПрО [49, 221, 222]. В рабочей памяти (базе данных) хранятся исходные и промежуточные данные решаемой в текущий момент задачи [149].

Конечный пользователь взаимодействует с ЭС через интеллектуальный интерфейс, который воспринимает сообщения пользователя и преобразует их в форму представления БЗ и, наоборот, переводит внутреннее представление результата обработки в формат понятный пользоввателю.

Механизм логического вывода (МЛВ) получает от интеллектуального интерфейса преобразованный во внутреннее представление запрос, формирует из БЗ конкретный алгоритм решения задачи, выполняет алгоритм, а полученный результат предоставляется интеллектуальному интерфейсу для выдачи ответа на запрос пользователя.

В основе использования любого МЛВ лежит процесс нахождения в соответствии с поставленной целью и описанием конкретной ситуации (исходных данных), относящихся к решению единиц знаний и связыванию их при необходимости в цепочку рассуждений, приводящую к определенному результату. Представление знаний в форме правил может быть реализован в виде прямой или обратной цепочки рассуждений [70, 92].

С помощью механизма объяснения пользователь может запросить объяснение или обоснование хода решения задачи. Объяснительные способности ЭС определяются возможностью механизма вывода запоминать путь решения задачи [145, 155].

Для ввода знаний в базу и их последующего обновления ЭС обладает механизмом приобретения знаний. В простейшем случае это интеллектуальный редактор, который позволяет вводить единицы знаний в базу и проводить их синтаксический и семантический контроль; в более сложных случаях позволяет извлекать знания из вводимых примеров реальных ситуаций [44, 163].

Создание ЭС системы обусловлено сложностью и большой трудоемкостью по сравнению с другими классами ИИС. Это связано со слабой формализуемостью процесса принятия решений, его альтернативностью и нечеткостью, качественной и символьной природой используемых знаний, динамичностью изменения проблемной области [156].

Рассмотрим процесс создания модели ЭС, исходя из традиционных этапов проектирования ЭС: идентификация, концептуализация, формализация, выполнение, тестирование, опытная эксплуатация [44, 229]. Этапы проектирования ЭС представлены на рис. 2.

Идентификация проблемы исследования

Определим задачу исследования [59].

Пусть дано некоторое целевое свойство G (например, наличие заболевания, степень тяжести заболевания), т.е. непосредственно объект исследования.

Целевое свойство может состоять из одного или нескольких сочетанных целевых факторов, обозначим их через множество G={Gj, G2, ..., GJ.

К={К], К2, ..., KN} - множество критериев (признаков, атрибутов), по которым оценивается каждый объект исследования.

Множество оценок по критерию определяется как Sq={k ,k ,...,k v }, где q=l,iV - шкала оценок по критерию Kq, wq — число градаций на шкале критерия Kq. Y — S±XS2X ... X 5V - декартово произведение шкал критериев, которое определяет пространство гипотетически возможных состояний объектов, подлежащих классификации. Здесь каждый объект можно представить в виде векторной оценки (кортежа) y&Y, гдеу=(уі, у2, ..., ун), где_у9 - одна из оценок множества Sq. I = \у\ = По=і wa мощность множества Г. у с у — множество объектов, которые требуется классифицировать. C={Ci, С2, ..., См} — множество классов решений целевой переменной Gz. На основе собранных в базе экспериментальных данных можно построить множество допустимых объектов Y на М непересекающихся классов решений Ct (Сг Л С, = 0 Vi Ф j, U Q 3 F") так, чтобы выполнялось свойство непротиворечивости классификации данных: Ух, у Є У таких, что х Є Сиу Є CJf (х,у) Є Р = i j

В случае если набор оценочных критериев не может быть определен однозначно, т.е. проблематика задачи, по нашему мнению, мало изучена и трудно выделить конкретный набор фактор, влияющих на состояние целевой переменной, то необходимо составить набор критериев, который характеризуется минимальной избыточностью.

Для решения данной проблемы необходимо привлечь экспертов в данной предметной области, которым предлагается оценить вклад каждой переменной в целевое состояние объекта исследования. Существуют также и другие способы определения структуры данных для уже имеющихся исходных массивов информации. Но в случае если исходная база данных не существует, и ее предстоит только накапливать, то можно проконсультироваться с компетентными специалистами (экспертами), которые помогут определить структуру базы данных, основываясь на своем личном профессиональном опыте, интуиции. Кроме этого необходимо провести анализ, имеющихся баз данных и знаний в той же проблемной области или по смежным областям.

При изложении своей методологии по выявлению согласованных экспертных мнений мы воспользуемся основными положениями, изложенными в монографии [32]. Пусть известен набор критериев, по которым следует получить заключение экспертов. Пусть также имеется некоторая совокупность экспертов. Известно также, по каким критериям может дать заключение каждый эксперт.

Необходимо осуществить такой выбор экспертов, чтобы по каждому критерию можно было получить заключение, по крайней мере, одного эксперта и чтобы при этом затраты времени или средств на проведение опроса экспертов были минимальны.

Для решения этой задачи можно воспользоваться методом случайного поиска.

Введем следующие обозначения:

1 = {1, 2, 3, ..., п} — множество всех экспертов;

Т = {1, 2, 3, ..., ш} - множество всех критериев;

Г, - множество всех критериев, которые может ответить z-ый эксперт;

\т - число элементов множества Т.

Положим, что затраты времени и средств на проведение опроса каждого эксперта одинаковы. В этом случае рассматриваемая задача о выборе экспертов сводится к нахождению такого минимального по численности множества экспертов, которое соответствовало бы множеству Т всех вопросов, т. е. на каждый вопрос мог дать заключение хотя бы один эксперт.

Введем показатель веса эксперта, понимая под этим весом относительную способность эксперта отвечать на возможно большее число вопросов. Вес каждого эксперта следует определять как отношение количества вопросов, на которые он может ответить, к сумме количества вопросов, на которые могут ответить все эксперты множества 1.

Сумма количества вопросов, на которые могут ответить все эксперты множества 1, может превосходить множество Т всех вопросов в случае, если имеет место пересечение областей компетентности экспертов.

Таким образом, показатель веса /-го эксперта будем определять по формуле:

В соответствии с полученным упорядоченным распределением показателей веса экспертов (РХ,РІ,-,РІ) исключаем эксперта с наименьшим показателем веса из множества 1 всех экспертов, а из множества Г и Т исключаются те вопросы, по которым данный эксперт может дать заключение.

В результате образуются множества / , Т, Tt.

Этот процесс продолжается до тех пор, пока после выбора r-го эксперта множество Тг окажется пустым. В результате образуется группа из г экспертов, которая может ответить на все вопросы множества Т.

На этом заканчивается первый этап случайного поиска. Затем описанная процедура повторяется. В результате образуется группа из q экспертов, которая может ответить на все вопросы множества Т.

При неограниченном числе таких этапов будет найдена минимальная по численности группа экспертов, способная дать заключение по всем вопросам множества Т.

Отобранной группе экспертов предлагается оценить п критериев по 100 бальной шкале по важности вклада критерия в решение поставленной задачи. Результаты опроса экспертов собираются в общую таблицу, столбцами которой являются критерии, а строками - баллы, данные каждым экспертом.

Далее переходим к обработке результатов, полученных мнений экспертов. Это позволяет определять зависимости между ранжировками различных экспертов и тем самым устанавливать единство и различие во мнениях экспертов. Выявление таких зависимостей позволяет вскрыть связанные показатели сравнения и осуществить их группировку по степени связи.

При статистической обработке результатов экспертных оценок в виде количественных данных, содержащихся в анкетах, определяются статистические оценки прогнозируемых характеристик и их доверительные границы, статистические оценки согласованности мнений экспертов.

Для статистической обработки результатов опроса группы экспертов используем метод ранговой корреляции. Обработка мнений экспертов осуществляется по следующему алгоритму

Тестирование и опытная эксплуатация экспертной системы

Процесс тестирования предполагает проверку полученной модели БЗ ЭС на адекватность, т.е. проверяют правильность выдаваемых заключений ЭС, оценивают способности обоснования решений [234]. Кроме того, также оценивается дизайн системы (естественность и легкость работы), широта охвата предметной области, количество тупиковых ситуаций, когда система не может принять решение, анализ чувствительности программы к незначительным изменениям в представлении знаний, весовых коэффициентах, применяемых в механизме логического вывода, данных и т.п. [22]

Окончательные оценки ЭС ставят специалисты в проблемной области — эксперты. При этом оценивание ЭС осуществляется по набору тестовых примеров с заранее известными ответами, как из предшествующей практики экспертов, так и специально подобранных ситуаций. Результаты тестирования подлежат статистической обработке, после чего делаются выводы о степени точности работы ЭС.

Если ЭС, по мнению экспертов, удовлетворяет всем перечисленным выше требованиям, т.е. распознает правильно большую часть тестовой выборки, то можно говорить, что система пригодна для эксплуатации.

Также возможна и обратная ситуация, неправильное определение значения целевой переменной некоторых примеров может быть вызвано следующими причинами:

1. Выборка, по которой строилась модель БЗ ЭС, недостаточно полно отражает картину соответствия классов обучающим примерам, иначе говоря, в обучающей выборке слишком мало примеров.

2. Выборка, на основе которой построена модель, составлена тенденциозно. Это означает, что для обучения подбирались примеры, которые, по мнению исследователя, являются самыми яркими представителями своего класса. Это серьезная ошибка. В действительности необходимо строить модель на реальных данных, какими бы они противоречивыми ни были.

3. Обучающая выборка имеет недостаточное количество обучающих параметров, т.е. информационных атрибутов, описывающих целевое состояние объекта. Модель при этом построена вроде бы правильно, но реальные ситуации могут совершенно не вписаться в данную схему. В этом случае можно увеличить либо количество примеров, но тогда могут возникнуть ситуации, что данные в выборке начнут противоречить друг другу, либо можно увеличить количество информационных параметров объекта исследования. Но последний вариант на практике не всегда возможно воплотить, т.к. добавить недостающие данные зачастую практически невозможно, а, следовательно, для такого расширения надо собрать новый набор данных. Поэтому необходимо находить компромисс при выборе количества информационных полей (что упоминалось на первых этапах построения ЭС), в большинстве случаях лучше задать больше параметров, а после обучения их можно минимизировать с учетом личного вклада каждого параметра в решение поставленной задачи (переменные с минимальным вкладом исключить) и точностью получаемого результата.

4. В обучающей выборке неправильно выбраны классы целевой переменной, т.е. неправильно задана классификационная модель. Например, все примеры группируются в три класса, а задано только два, либо наоборот - задано три класса, а они делятся только на два класса.

В этом случае зависимости от перечисленных выше проблем необходимо будет вернуться на соответствующий этап создания модели БЗ ЭС.

Опытная эксплуатация предполагает использование ЭС для решения реальных задач в массовом порядке. Но на этом процесс разработки ЭС не заканчивается. В процессе опытной эксплуатации осуществляется сбор критических замечаний и по необходимости осуществляется внесение необходимых корректив в работу системы.

В процессе работы ЭС будет накапливаться новый материал исследований, который в дальнейшем может послужить для доучивания экспертной системы, уточнения предметных связей между атрибутами объекта и поддержания ЭС постоянно в актуальном состоянии.

Таким образом, решение задачи по предложенному алгоритму может осуществлять с помощью двух методов: АМКЛ и НС. На практике можно использовать одним из этих методов, а для большей уверенности в получаемых результатах можно воспользоваться сразу двумя этими методами и сравнить получаемые результаты. Если возвращаемый результат из под одного метода и другого одинаковый, то это означает, что задача решена однозначно. В противном случае, если результаты расходятся, то за окончательное решение принимается результат, полученный с помощью АМКЛ, т.к. данный метод является более надежным с точки зрения механизма работы и возможности проверки его результирующей модели по правилам вывода заключений («прозрачность» модели).

Аналитический контрольный расчет для построения базы знаний экспертной системы микроэлементных нарушений у человека на примере экологически и производственно обусловленных заболеваний органов дыхания

В связи с тем, что отмечается тенденция к увеличению заболевания хронической обструктивной болезнью легких (ХОБЛ), весьма актуальным представляется изучение проблемы своевременного диагностирования случаев этого заболевания. В России насчитывается около 1 млн. больных ХОБЛ (официальные данные МЗ РФ), но в действительности их количество может превышать 11 млн. человек (данные эпидемиологических обследований) [176].

В Городской больнице №10 г. Тулы в отделении пульмонологии и профпатологии Тульского областного центра профпатологии проведены исследования по оценке микроэлементных нарушений у пациентов с бронхообструктивным синдромом.

Обследование пациентов проводилось с использованием следующих лабораторно-инструментальных методов: анализ крови (гемоглобинометрия, подсчет количества эритроцитов, лейкоцитов, лейкоцитарная формула, СОЭ); общий анализ мочи; биохимические тесты на фибриноген, сиаловую кислоту, белок и белковые фракции, глюкозу, липиды; общий клинический анализ мокроты, исследование мокроты на микробактерии туберкулеза и клетки злокачественных образований, оценка функции внешнего дыхания на установке «Spirosift», рентгенотомография органов дыхания, бронхофонография с использованием компьютерно-диагностикого комплекса «Паттерн».

Кроме приведенных выше лабораторно-инстрементальных исследований больным проводилось определение содержания микроэлементов (МЭ) в суточном количестве моче и сыворотке крови с целью изучения осуществления дополнительной диагностики ХОБЛ с помощью биологических маркеров -концентрации солей тяжелых металлов.

Определение концентрации МЭ в биосредах осуществлялось в Тульской областной токсико-экологической лаборатории при Городской больнице №10 методом атомной абсорбционной спектроскопии (пламенной) на установке «Сатурн-ЗП-1».

Для исследования зависимостей между содержанием МЭ и наличием заболеваний органов дыхания для построения прототипа ЭС было проведено обследование 75 человек, составляющих группу «условно здоровых», и 70 человек с заболеванием органов дыхания.

В первую группу «условно здоровые» вошли обследованные не страдающие заболеваниями органов дыхания и не работающие во вредном производстве — в основном это были пациенты молодого возраста, проживающие на территории Привокзального района г.Тулы.

Вторую группу обследованных составили пациенты с заболеваниями органов дыхания. Среди них почти все мужчины в возрасте от 33 до 73 лет. Все пациенты, прошедшие обследование, проживают на территории Тульской области и г.Тулы и страдают хроническим профессиональным бронхитом (ХПБ), хроническим пылевым бронхитом (ХПыБ), хроническим обструктивным бронхитом (ХОБ) непрофессиональной этиологии. В исследуемой группе с диагнозами ХПБ — 26 чел., ХПыБ - 24 чел., ХОБ — 20 чел.

Определение списка входных данных относится к квалифицированной работе предметного специалиста, требующей знания изучаемой области и ориентировочной важности тех или иных параметров, необходимых для получения ответа. В качестве экспертной группы было приглашено 103 специалистов из Городской больницы №10 г.Тулы, которые имеют практический в области пульмонологии и микроэлементологии. В задачи экспертной группы также входило накопление данных для обучающей выборки.

В результате обследования пациентов на содержание МЭ были получены результаты, представленные в таблице 8. Исходные данные, которые использовались в исследовании представлены в приложении В.

Нормативное содержание МЭ в биосредах брались из источника [69]. Это связано тем, что на сегодняшний день не существует утвержденных нормативов предельно-допустимых концентраций (ПДК) содержания МЭ в биосредах человека. Поэтому ПДК взяты из нормативов, разработанных тульскими специалистами, в которых учтены специфика и особенности региона Тульской области.

Данные в таблице 8 разбиты на содержание МЭ в норме и отклонение. Возможно и другое разбиение данных, например, дефицит, избыток и норма МЭ в организме. Но при проверке данных выяснилось, что количество обследованных с дефицитом МЭ незначительное, а в большинстве случаев и вообще отсутствует. Поэтому было принято решение объединить дефицитные и избыточные состояния вместе.

Здесь также можно было применить и другой подход. Отклонение МЭ можно разделить по степени отклонения от нормы, например, незначительное, значительное и высокое. Но такой подход возможен только в том случае, если имеется достаточно большой массив исходной информации. В таблице 9 приведены сведения о частотной встречаемости заболеваний органов дыхания по содержанию МЭ (отклонение, норма).

В данном случае по таблицам 8 и 9 нельзя сделать никаких умозаключений о существовании зависимости между содержанием МЭ и наличием проявления заболеваний органов дыханий. Это, конечно, в первую очередь связано с тем, что для контрольного примера, взят ограниченный объем выборки, что усложняет задачу интерпретации данных.

В таблице 10 приведены среднее арифметические значения содержания МЭ в группе I и II.

Перед тем как, приступать к непосредственному анализу данных, необходимо проверить данные на нормальность распределения. Все статистические расчеты выполняются с помощью прикладного статистического пакета Statistica 6.0. Для принятия решения о виде распределения можно применять критерии Колмогорова-Смирнова (среднее значение и среднеквадратическое отклонение известны априори, а не вычисляются по выборке), Лиллиефорса (среднее значение и среднеквадратическое отклонение априори неизвестны и вычисляются по выборке), Шапиро-Уилка применяется также при исходно неизвестном среднем значении и среднеквадратическом отклонении признака. Критерий Шапиро-Уилка предпочтителен, т.к. является наиболее надежным из перечисленных.

Похожие диссертации на Обработка слабоструктурированной информации при построении базы знаний экспертной системы микроэлементных нарушений у человека