Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Факторный анализ и другие многомерные статистические методы диагностики кардиопатологий Гольтяпин Виктор Викторович

Данный автореферат диссертации должен поступить в библиотеки в ближайшее время
Уведомить о поступлении

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - 240 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Гольтяпин Виктор Викторович. Факторный анализ и другие многомерные статистические методы диагностики кардиопатологий : диссертация ... кандидата физико-математических наук : 05.13.18.- Омск, 2002.- 124 с.: ил. РГБ ОД, 61 03-1/438-1

Содержание к диссертации

Введение

Глава I. Факторный анализ и методы распознавания образов, математическая постановка задачи 20

1.1 Основная цель факторного анализа... 20

1.2 Базовая идея факторного анализа как метода уменьшения числа данных...

1.2.1 Комбинирование двух переменных в один фактор 21

1.2.2 Компонентный анализ 21

1.2.3 Выделение основных компонент 21

1.2.4 Обобщающий случай многочисленных переменных 22

1.2.5 Многомерные ортогональные факторы 22

1.2.6 Как много факторов выделять? 22

1.2.7 Рассмотрение результатов компонентного анализа 23

1.2.8 Собственные значения 23

1.2.9 Собственные значения и проблема числа факторов

1.2.10 Критерий Кайзера 24

1.2.11 Графический тест 25

1.2.12 Какие критерии использовать? 25

1.2.13 Факторный анализ. Общности 26

1.2.14 Компонентный и факторный анализ 26

1.3 Факторный анализ как классификационный метод 27

1.3.1 Факторные нагрузки 28

1.3.2 Вращательные стратегии 28

1.3.3 Интерпретация факторной структуры 29

1.3.4 Косоугольные факторы 29

1.3.5 Иерархический факторный анализ 30

1.3.6 Априорный факторный анализ 30

1.4 Другие аспекты факторного анализа .31

1.4.1 Факторное множество 31

1.4.2 Воспроизведенные и остаточные корреляции 31

1.4.3 Вращение факторной структуры. Плохо обусловленная корреляционная матрица

1.5 Вероятностные методы распознавания 32

1.6 Метрические методы распознавания 38

1.7 Формализация медицинской постановки задачи 41

1.8 Математическая постановка задачи 49

Глава II. Описание информационно-вычислительной экспертной системы 53

2.1 Описание интерфейса первой программной формы информационно вычислительной экспертной системы и алгоритм работы с ней

2.2 Описание интерфейса второй программной формы информационно вычислительной экспертной системы и алгоритм работы с ней 59

Глава III. Базовые многопараметрические факторные модели и их гибридизации, используемые в диагностировании кардиологических признаков 64

3.1 Описание общей факторной модели. Алгоритм расчета факторных выражений 64

3.2 Классификация факторных нагрузок. Понятие факторной структуры 65

3.3 Варимакс вращение, как метод поиска "простой структуры" ортогональных моделей факторного анализа. Алгоритм поиска угла вращения 67

3.4 Вариация метода главных компонент (МПС)

3.4.1 Варимакс вращение и критерий отсеивания % незначимых факторов дляМГК 72

3.4.2 Тестирование новой факторной модели на данных "физиологическая норма" и митральный стеноз различной степени. Вычислительный эксперимент 73

3.4.3 Факторные диаграммы "физиологической нормы" и митрального стеноза 1-ой и 5-ой степени 74

3.4.4 Обсуждение результатов и выводы 76

3.5 Итерационный метод главных факторов (МГФ) с варимакс вращением. Нахождение редуцированной матрицы 76

3.5.1 Тестирование МГФ и МПС на данных "физиологическая норма" и митральный стеноз различной степени (13 параметров). Сравнение матриц весовых нагрузок МПС и МГФ. Вычислительный эксперимент 78

3.5.2 Факторные диаграммы состояния "физиологическая норма" и митральный стеноз 1-ой и 5-ой степени полученные МГФ и МПС 80

3.5.3 Обсуждение результатов и выводы

3.6 Метод нахождения факторных значений при прямоугольной матрице весовых нагрузок факторов 85

3.7 Способы вычисления оценок общностей

3.7.1. Способ наибольшей корреляции 86

3.7.2. Коэффициент множественной корреляции как первичная оценка общности 87

3.7.3. Итеративная процедура

3.8 Нахождение обратной матрицы R"1 методом квадратного корня. 89

3.9 Нахождение собственных значений и собственных векторов матрицы R методами вращения 3.9.1 Прямой метод вращения для эрмитовых матриц 91

3.9.2 Итерационный метод вращения 94

3.9.3 Нахождение собственных значений и собственных векторов матрицы R путем объединения прямого и итерационного метода вращения 99

Глава IV. Метод распознавания образов, базирующийся на гибридизации формулы Байеса для распознавания классов с методом главных компонент и стохастической аппроксимацией и-мерной функции плотности распределения 101

4.1 Байесовский критерий для задачи распознавания образов 101

4.2 Аппроксимация плотности распределения вероятности 102

4.3 Определение уровня значимости 107

4.4 Обсуждение результатов и выводы. 108

Глава V. Метрические методы распознавания на базе факторной модели метода главных компонент 111

5.1 Общая постановка задачи таксономии 111

5.2 Решение проблемы весовых множителей для решающего правила посредством использования факторной модели 112

5.3 Новый метод таксономии, основанный на гибридизации метода главных компонент с методом определения расстояния объекта до центра класса 114

5.4 Обсуждение результатов и выводы 115

Выводы 117

Литература

Рассмотрение результатов компонентного анализа

Вместо факторных нагрузок часто вызывающих трудность при интерпретации косоугольных факторов, можно использовать стратегию, предложенную Томсоном (1951), Шмидом и Леймоном (1957), которая была детально разработана Верри (1959, 1975, 1984). В этой стратегии определяют кластеры переменных и вращают оси сквозь эти кластеры. Затем вычисляют корреляции между косоугольными факторами. Корреляционная матрица косоугольных факторов подвергается дальнейшему факторному анализу, приносящему множество ортогональных факторов, которые разделят дисперсию переменных на общность и уникальность. Верри (1984) обсудил детально большое количество примеров таких иерархических анализов, а так же вопрос о том, как полностью осмысленные и интерпретируемые вторичные факторы можно разделить [3, 29, 36,46, 47, 50, 54].

В последние годы априорные методы стали все более и более популярными Можно точно определять априорно образ факторных нагрузок для определенного числа ортогональных или наклонных факторов и затем проверять, может ли наблюдаемая матрица корреляций быть воспроизведена полученной спецификацией. [З, 26, 46,47, 54]

Можно оценивать фактическое значение индивидуальных случаев (наблюдений) для факторов. Это факторное множество особенно полезно, когда хотят выполнить дальнейший анализ факторов.

Корреляционная матрица, полученная посредством матрицы факторного отображения, называется воспроизведенной матрицей корреляций (или редуцированной). Имея матричные отклонения от наблюдаемой матрицы корреляций, можно вычислить разницу между этими двумя матрицами, результатом будет матрица называемая матрицей остаточных корреляций. Остаточная матрица может указать ошибки, т.е. есть специфичные коэффициенты корреляции, которые не могут быть воспроизведены соответственно текущим числом факторов [46, 47].

Если в матрице корреляций имеются переменные, которые являются 100% избыточными, то инверсия матрицы не может быть вычислена. Например, если переменная - сумма двух других переменных, отобранных для анализа, то матрица корреляций тех переменных не может быть инвертирована, и факторный анализ не может быть проведен. Практически это случается, когда делается попытка провести факторный анализ на множестве высоко некоррелируемых переменных. Этот пример иногда встречается в исследовании анкетных опросов. Затем можно искусственно понизить все корреляции в матрице корреляций, прибавляя малое постоянное значение к диагонали матрицы и затем повторно стандартизируя ее. Эта процедура будет производить матрицу, которая может быть инвертирована и таким образом проанализирована факторным анализом. Однако заметим, что результирующие оценки не точны [46].

Пусть заданы непрерывные вероятностные законы. Рассмотрим одномерный случай. Пусть априорная информация о классах дана в виде двух плотностей распределения вероятностей f(x\ Н и f(x\H 2) . Поскольку функции распределения х F(x\ Н к) = J x Н k)dx ,к = 1, 2, (1Л) -оо F2(x #2J xeHl9 или х еН2. (1.2) При этом значение х t удовлетворяющее условию F& Hi) (1.3) задает граничную точку гр, справа от которой все объекты относятся к классу Н2 , а объекты, расположенные левее, - к классу Н\. Иными словами, при х хгр выносится диагноз А, а при гр-диагноз А. Очевидно, что принятие любого диагноза связано с ошибкой. Принято называть ошибку диагноза D2 ошибкой I рода, а ошибку диагноза А ошибкой II рода. Уровни этих ошибок характеризуют вероятностями их появления: 00 Р(ошибки I рода ) = а = \f(x\ Н Jdx , (1.4) Р(ошибки II рода) = /З = \f(x\ Н dx . -00

При изменении порога хгр уровни ошибок изменяются, но противоположным образом. Это означает, что нельзя одновременно сделать их произвольно малыми. Поскольку стоимости ошибок (последствия) могут оказаться различными, то, очевидно, качество классификации целесообразно характеризовать величиной некоторого функционала, зависящего как от а, так и от Р. В статистической теории решений получили распространение критерии, основанные на линейных комбинациях ошибок I и II рода, r = cla + c2j3. (1-5)

Весовые коэффициенты с\ и с2 могут зависеть от априорных вероятностей классов Н\ и Н2 , стоимостей ошибок и других факторов, что обусловливает большое число частных случаев общего критерия среднего риска (1.5) , или байесова критерия. Так при q =с2 =1 получаем r = a + /3 5 или критерий наибольшего правдоподобия; при с\ = Р(Н\ )t с2= Р(Н2) t r = P(Hl)a + P(H2)ft получаем критерий идеального наблюдателя. К последнему приводится также критерий максимума апостериорной вероятности, основанный на формуле Байеса: Р(Н к \х) = Н Х -,к =1,2. (L6) Y P(H t)f(x \Ht) Из небаейсовых критериев упомянем два наиболее распространенные: минимаксный и критерий Неймана-Пирсона. При минимаксе находят гр из условия m г, Ф ГДЄ Рі=Р(Щ), Р2=Р(Н2) неизвестны, и минимизируют средний риск г, вычисляемый в предположении наихудших Pi и Р2. Критерий Неймана-Пирсона заключается в том, что уровень ошибки I рода а фиксирован, а вероятность 1 - Р , или мощность критерия, выбирается максимальной. Можно показать, что все упомянутые критерии суть частные случаи более общего критерия отношения правдоподобия [27]. Действительно, комбинация двух альтернативных классов Н\ и Н2 и диагнозов А и А дает четыре возможные пары HkDj,kJ =1,2. Каждой из пар соответствуют свои вероятности и величины потерь (штрафы) П - (таблица 1.5).

Описание интерфейса второй программной формы информационно вычислительной экспертной системы и алгоритм работы с ней

Меню первой программной формы состоит из пяти пунктов - Список методов, Факторная диаграмма, Расчет факторов, Количество классов, Работа с Excel. шш Информационная экспертная система STIR. Список метопов Факторная диаграмма Расчёт факторов Количество классов Работа с Excel

На рабочей области первой программной формы имеется встроенный редактор таблиц (Рис. 2.4). С помощью этого редактора можно создавать таблицы данных, просматривать соответствующие файлы-матрицы, переносить первичные данные, набранные в табличном процессоре Microsoft Excel. Двигаясь по таблице данных, выбирается объект классификации. Та строка, где будет стоять черный треугольник, и содержит объект, который будет классифицироваться. данные обратное факторное отображени і ф&кторы математическое ожидание и етано і jrj ТзЁлзоо Ечтеї ±г Заполнение таблиц Рис. 2.4. Табличный редактор данных. При нажатии пункта Список методов открывается подменю с пятью пунктами Метод главных компонент, Нормальный закон распределения, Аппроксимация закона распределения полиномами Эрмита, Эвклидова метрика, Расстояние объекта до центра области (Рис. 2.4а). Список методов Факторная диаграмма Pa счёт ера кторов Ко Метод главных компонент Нормальный закон распределения Аппроксимация закона распределения полиномами Эрмита Эвклидова метрика Расстояние объекта до центра области Рис. 2.4а. Изображение кнопок под меню Список методов.

При нажатии пункта Метод главных компонент появляется часть второй формы, функциональное описание которой будет дано позже. При нажатии пункта Нормальный закон распределения происходит квалификация выбранного из таблицы данных объекта (индивидуума) и формируется вероятностная таблица. Расчет производится без аппроксимации функции плотности вероятности. Предполагается, что данные классов и параметры объекта распределены по нормальному закону. Аналогичным образом производится расчет при нажатии пункта Аппроксимация закона распределения полиномами Эрмита, но уже с аппроксимацией плотности распределения вероятности с помощью полиномов Эрмита. При нажатии пункта Эвклидова метрика или пункта Расстояние объекта до центра области происходит классификация выбранного из таблицы данных объекта (индивидуума) через расчет расстояний от объекта до классов, в зависимости от выбранного метода строится та или иная таблица расстояний. Количество классов классификации определяется с помощью пункта меню Количество классов, при нажатии которого появляется соответствующее диалоговое окно (Рис. 2.5)

Классы при расчетах можно вводить один за другим, а можно из базы, на форме имеются соответствующие для этого объекты управления и таблица с выбором базовых файлов (Рис. 2.6). гЗагруэка иа бааы— Очистить базу С Автоматическая Загрузить базу f В ручную ЩЩЩ zl Рис. 2.6. Объекты управления и таблица с выбором базовых файлов. С помощью пункта меню Расчет факторов можно для выделенного объекта рассчитать факторное значение при условии, что таблица обратной матрицы весовых нагрузок и таблица, содержащая стандартные отклонения и математические ожидания, заполнены в редакторе таблиц.

Просмторщик факторных диаграмм. Факторную диаграмму можно посмотреть, открыв диалоговое окно просмотр-щика факторных диаграмм через нажатие пункта меню Факторная диаграм 59 ма (Рис. 2.7). Пункт меню Работа с Excel содержит три подпункта Открыть Excel, Считать данные, Считать факторные нагрузки. Первый пункт открывает табличный процессор Excel, второй считает данные из первого листа-таблицы Excel, третий факторные нагрузки - из второго листа-таблицы Excel (Рис. 2.8.).

Описание интерфейса второй программной формы информационно-вычислительной экспертной системы и алгоритм работы с ней. Меню второй программной формы состоит из четырех пунктов - Действие, Редактировать, Смотреть и Помощь (Рис. 2.9) нш И Информационная экспертная система STIR (факторные модели) Действия Редактировать Смотреть Помощь

Изображение рабочего меню второй программной формы. При нажатии пункта Действия открывается подменю с двумя пунктами Расчет факторных значений и Расчет по факторной модели (Рис. 2.10). ШИнформационная экспертная система STIR (факторные модели) Действия Редактировать Смотреть Помощь Расчет по факторной модели Расчет факторных значений

Диалоговое окно Открытие файла для открытия файлов с данными. В данном окне выбираются данные (файлы с расширением med), по которым нужно провести расчет факторных значений. После выбора соответствующего файла и нажатия кнопки Открыть автоматически открывается второе диалоговое окно Открытие файла (Рис. 2.12). В этом окне выбирается файл с расширением end, содержащий обратную матрицу, необходимую для нахождения факторных значений. После выбора и нажатия клавиши Открыть происходит расчет факторных значений.

Варимакс вращение и критерий отсеивания % незначимых факторов дляМГК

В соответствии с приведенной схемой выстраивается факторная модель для группы «здоровых» людей, которая задает область изменения факторов «в норме». Подставляя в эту модель нормированные отклонения показателей индивидуума от среднестатистического показателя «здоровых», получаем его факторные значения и формируем его факторную диаграмму. Затем находим факторные значения индивидуумов с кардиопатологиями, строим их факторные диаграммы для различной степени заболевания. Проводим анализ факторов отклоняющихся от нормы, выделяя значимые параметры. Степень заболевания должна характеризоваться ростом тех факторных значений, которые отвечают за данную патологию. С помощью матрицы В определяется, какими конкретными параметрами нагружается каждый фактор. В случае вычислительного эксперимента была получена оптимальная матрица весовых нагрузок, которая представлена в таблице 3.1. Значимые нагрузки выделены жирным шрифтом. Из таблицы 3.1 видно, что 1-ый фактор нагружается 2-ым и 10-ым параметрами, 2-ой — 1-ым и 3-им, 3-ий — 4-ым и 5-ым, 4-ый — 6-ым, 5-ый — 9-ым, 6-ой — 7-ым, 7-ой — 8-ым.

На рис.3.1 представлены типичные факторные диаграммы здоровых индивидуумов (группа из 50 человек, в возрасте 20-39 лет [8]). Значения факторов располагаются, в основном, в пределах первой и второй дисперсии, в пределах нормы. Превышение границ первой и второй дисперсии по одному - двум факторам у отдельных индивидуумов связано со случайными ошибками измерений.

На рис.3.2 представлены факторные диаграммы больных индивидуумов, с патологией - митральный стеноз 1-ой степени. Уже на этой стадии имеется характерная картина данной патологии.

На рис.3.3 показаны факторные диаграмм больных с диагнозом митральный стеноз 5-ой степени. Значения факторов у больных индивидуумов выходят за границы не только второй дисперсии (область изменений для здорового человека), но, при существенной разнице измеряемых параметров «в норме» и «патологии», за границы 4-ой дисперсии и более.

Из диаграмм (рис.3.2-3.3) видно, что отклоняются в основном 4-ый, 6-ый и 7-ой факторы. Известно, что эти факторы нагружаются 6-(жизненная емкость легких (ЖЕЛ)), 7-(максимальная вентиляция легких (МВЛ)) и 8-ым (пульс) параметрами. Качество нагрузки определяется через коэффициенты матрицы V. С ростом степени заболевания имеется рост факторных значений.

1. Факторный анализ кардиогемодинамики и гомеостаза при заболеваниях сердечно-сосудистой системы - объективный метод, позволяющий выявить характерные взаимосвязи показателей патологических состояний, основным признаком которых является нарушение равновесия между потребностью миокарда в кислороде и его поступлением, выделить наиболее значимые факторы, провести объективную диагностику.

2. При патологии сердечно-сосудистой системы данная факторная модель позволяет по наиболее информативным факторам провести дифференциальную диагностику митрального стеноза 1-5-ой степени. Анализ изменения факторных диаграмм в процессе коррекции патологических состояний позволяет дать объективный прогноз по течению заболевания.

Отправной точкой МГФ является не матрица R, a Rh- редуцированная корреляционная матрица, на главной диагонали стоят не единицы, а общности (3.11). Формулы используемые в МГК для нахождения матрицы А весовых нагрузок целиком переносятся для МГФ [47]. Для нахождения простой факторной струк 77 туры используется варимакс-критерий (3.19). В отличие от МПС в итерационном МГФ факторные нагрузки вычисляются последовательно друг за другом и число факторов ограничивается требованиями соответствующей проблемы. Итеративный процесс начинается с выбора вектора aw, элементы которого являются первыми приближениями значений элементов собственных векторов. Вектор а(1) перемножается с матрицей R по формуле (3.29). Разделив элементы результирующего вектора р(1) на наибольший по величине элемент этого же вектора (3.30), получаем новый вектор а(2), с которым опять повторяется процедура (3.29). Верхние индексы в скобках означают здесь шаг итерации. p(D=R.a(l)5 (3.29) a 2 = р /тахфР), (3-30) a k+1 = p k /max(P k ). (331)

Процесс повторяется до тех пор, пока не добиваются сходимости к первому собственному значению R (А,! = тах(рр)) и соответствующему первому собственному вектору а(к). Формула (3.31) является общей для -шагов. Итеративный процесс заканчивается, когда а(к) и а "1 с достаточной точностью совпадают друг с другом. В качестве элементов вектора а(1) используются величины, пропорциональные суммам элементов строк матрицы R. Исходя из полученных значений элементов собственного вектора и собственного значения, по формуле (3.32) вычисляются нагрузки первого фактора &\=(ац,..., ат}),которые затем служат для определения R+=ai ai. Матрица R+ является матрицей коэффициентов корреляции, вычисленных с учетом только первого фактора. Остаточная матрица в общем виде определяется так: Ri=R-R+ ац = аа 4k/4a\l + a2l + - + altl 31)

Если принимают решение вычислять вторые факторные нагрузки, то повторяется аналогичная процедура с Ri до получения второго собственного значения и второго собственного вектора. Процесс выделения факторов можно продол 78 жить и далее.

Получение редуцированной матрицы осуществляется следующим образом. Вначале принимается решение о выделении определенного числа факторов. Затем выбирают предварительные оценки общностей, в качестве которых могут быть использованы коэффициенты множественной корреляции (КМК). Значения КМК для каждой переменной вычисляются по формуле: г" (3.33) где г" - диагональный элемент матрицы R"1. По этим значениям диагональных элементов матрицы R с помощью метода главных факторов выделяется г столбцов матрицы весовых нагрузок факторов. По полученной матрице вычисляются новые оценки общностей. Вновь выполняется процедура выделения г столбцов матрицы А с помощью МГФ по матрице R с новыми диагональными элементами. Процесс повторяется до тех пор, пока вычисленные диагональные элементы не перестанут изменяться от итерации к итерации. На заключительном шаге применяют варимакс-критерий (3.19) к полученной на последнем шаге матрице А и получают оптимальную матрицу весовых нагрузок факторов В.

Аппроксимация плотности распределения вероятности

На практике для решения задач таксономии используются методы, основанные на измерении меры сходства [7, 25, 27, 46, 47]. Пусть в результате классификации все множество объектов О={(о} разбито на подмножества QJt Qj,---, Qt, каждое из которых составляет соответствующий класс. Обозначим объекты, относящиеся к каждому классу следующим образом. А = {« 11 »« 12»—»в І/ } Q2 = {(О 21 Ф22 »»1г2} t ={ i tl 0t2i- 0 trt} гр- количество объектов вр-ом классе.

Под объектом Юр/подразумевается -ый индивидуум из класса Qp. Параметры индивидуума обозначаются yj . Следовательно, объект в и-мерном пространстве параметров может быть представлен в виде вектора у=(уі,..,Уп), координаты которого характеризуют свойства объекта.

Для определения меры близости или подобия между объектами в 77-мерном векторном пространстве признаков необходимо ввести метрику. Выбор метрики произволен, необходимо лишь, чтобы она удовлетворяла обычным аксиомам расстояний: d(a,b)=d(b,a); d(a, с) d(a, b)+d(b, с); (5.1) d(a,b)= 0 ?.а=Ъ.

Далее будем пользоваться евклидовой метрикой: " 2 (5.2) d ( opr, oqi) = ]T(y%-y?j) ,p,q = \,...,t; r = l,...,rp;l = l,...,rq, J p где Угу есть значение у -го параметра r-го объекта р-то класса, т.е. объекта орг; У у - значение у-го параметра /-го объекта q-ro класса, т.е. объекта со ь Пусть величина L(o , {(Ok}) - мера близости между распознаваемым объектом со и классом Qk, k=l,...,tзаданным своими объектами {со }: 1 L((0,{G}k})= l—Y.Cid ( о,щ)9 (5.3) где СІ весовые множители, учитывающие различный вес слагаемых. Данная величина является среднеквадратичным расстоянием между объектом at и объектами класса Qk. Решающее правило состоит в следующем: со є Qk если L( & { J) = extr L( Ю ( J) . (5A)

Посредством формулы (4.2) получаем классы стандартизованных данных 27/,..., Et. Используя метод главных компонент (формула (4.3)), образуем классы факторных значений 0,..., Wt, впоследствии называемые факторные классы, причем для каждого класса своя матрица весовых нагрузок А , где к - номер класса, у -ым объектом факторного класса Wk является объект \\fkJ, содержащий факторные значения индивидуума, уч может быть представлен в виде вектора 113 fJ = {fji ,-,/j„ } Поскольку МГК относится к категории ортогональных, то полученные факторы линейно независимы и нормированы. Следовательно, при использовании решающего правила (5.3) не требуется определять весовые множители СІ. Получение решающего правила осуществляется последовательно следующим образом: а), объект входных данных со преобразуется в объект стандартизованных дан ных со 1. Под объектом со подразумевается объект со, подвергнувшийся стандартизации по формуле (4.2) по классу 27г; б), далее объект стандартизованных данных сог преобразуется в объект факторных значений, полученных посредством матрицы весовых нагрузок Ай в соответствии с классом, формула (4.3); в), по полученному объекту факторных значений рассчитывается расстояние между ним и исходным классом факторных значений. Первым шагом рассчитываются евклидовые расстояния между полученным факторным объектом и факторными объектами класса % по формуле: kr ll) = T(fnk -fuk)2,k = \,.,t; r = \,...,rp;l = \,...,rq, (5,5) т где /„ есть z -oe факторное значение r-го факторного объекта, полученного из объекта арг класса Qp по матрице весовых нагрузок А , т.е. объекта \/.; /цк есть z-oe факторное значение /-го факторного объекта, полученного из объекта (ogi класса Qq по матрице весовых нагрузок Ак, т.е. объекта xj/ . Полагаем, например, г или / постоянным, ар и q равным к. Следующим этапом рассчитывается не классическая мера близости по формуле: d rk " (5.6) где rk количество объектов в классе к, полагая \j/. = \/- факторный объект подвергнувшийся исследованию, а \/= \/ є к. Верхние индексы для простоты опущены. г), далее работает решающее правило (5.2) по формуле (5.6).

Новый метод таксономии, основанный на гибридизации метода главных компонент с методом определения расстояния объекта до центра класса.

Пусть имеются несколько факторных классов, получившихся из стандартных. Т.к. эти факторные классы получены методом главных компонент, то центрами их будут нулевые координаты в соответствии со своей факторной системой координат. Получение факторного расстояния объекта до центра класса осуществляется последовательно следующими шагами: а), и б), из пункта 5.2, далее вычисляется расстояние полученного объекта \/ факторных значений до центра О факторного класса, формула (5.7): (Уь ) = &(іїк)2 г = 1 - Пс (5.7) Объект будет относиться к тому классу исходных данных, у которого расстояние от соответствующего факторного объекта до центра факторного класса минимально.

Данные метрические модели распознавания преобразованы в соответствующее программное приложение, которое включает в себя интерфейс для ввода и обработки классов данных, а также объектов данных. В качестве языка программирования был выбран "Delphi 3" и "C++". Тексты программ представлены в приложении 2.

Выходными данными для данной модели является таблица содержащая, либо факторное евклидовое расстояние объекта до класса, пример-таблица 5.2, либо факторное расстояние до центра класса, пример-таблица 5.3

Похожие диссертации на Факторный анализ и другие многомерные статистические методы диагностики кардиопатологий