Методы и средства анализа данных в системах поддержки принятия решений Ананьев Николай Сергеевич

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Ананьев Николай Сергеевич. Методы и средства анализа данных в системах поддержки принятия решений : Дис. ... канд. техн. наук : 05.25.05 : М., 2005 157 c. РГБ ОД, 61:05-5/3369

Содержание к диссертации

Введение

Глава 1. Методы и средства обработки информации и данных, используемые для создания систем поддержки принятия решений 12

1.1. Классификация информационных систем, СППР, их состав и решаемые задачи 13

1.2. Типовые задачи интеллектуального анализа данных 21

1.3. Методы обработки многомерных данных, используемые при «интеллектуальном» анализе в интересах поддержки принятия решения .25

1.4. Проблемные вопросы обработки и анализа многомерных данных в задачах ИАД 28

1.4.1. Прогнозирование характеристик объектов 29

1.4.2. Распознавание объектов и ситуаций и обработка информации 31

1.5. Анализ существующих подходов к обработке информации и обоснованию выбора альтернатив 33

1.5.1. Определение приоритетных рядов 33

1.5.2. Обработка и анализ многомерных данных 34

1.6 Выводы 47

Глава 2. Совершенствование методического обеспечения обработки информации с целью учета неопределенности в исходных данных 49

2.1. Основное содержание методического обеспечения 49

2.2. Методы снятия неопределенности при обработке многомерных данных в задачах поддержки принятия решений 50

2.3. Анализ существующих методов получения обобщенных показателей 56

2.4. Метод построения обобщенных показателей сложных систем, базирующийся на использовании принципа максимума энтропии 61

2.5 Выводы 69

Глава 3. Разработка модели типовой информационной системы и приложений интеллектуального анализа данных для поддержки принятия решений 71

3.1. Состав и структура информационной системы 74

3.2. Режимы работы информационной системы и используемые средства обработки информации 80

3.3. Модель предмета обучения на примере языка программирования Паскаль 82

3.3.1 Состав и структура средств автоматизации обучения языкам программирования 84

3.3.2. Модель задачи оценивания знаний 85

3.3.3 Оценивание знаний в рамках подсистемы автоматизации процесса обучения 98

3.4. Выводы 104

Глава 4. Применение энтропийного подхода для решения задач интеллектуального анализа 106

4.1. Разработка метода автоматизированного оценивания знаний студентов в процессе обучения 106

4.1.1. Метод оценивания знаний студентов в процессе обучения 108

4.2. Разработка метода обработки информации в задаче оценивания риска для систем поддержки принятия решения в страховом деле 113

4.2.1. Постановка задачи 114

4.2.2. Условия решения задачи 116

4.2.3 Метод решения задачи 118

4.2.4. Методика проведения эксперимента и подготовка исходных данных 122

4.2.5. Программная реализация метода и порядок расчетов обобщенного показателя (оценки) страхового риска 127

4.2.6. Результаты расчетов и их анализ 128

4.3. Выводы 134

Заключение 135

Список использованных источников 138

Приложение 146

Методы обработки многомерных данных, используемые при «интеллектуальном» анализе в интересах поддержки принятия решения
Анализ существующих методов получения обобщенных показателей
Режимы работы информационной системы и используемые средства обработки информации
Разработка метода обработки информации в задаче оценивания риска для систем поддержки принятия решения в страховом деле

Введение к работе

Назначением информационных систем (ИС), независимо от области их применения (в производстве, бизнесе, медицине, образовании, страховании, других областях народного хозяйства) является обеспечение должностных лиц (или лиц принимающих решение - J11 IP)¹ информацией, необходимой для принятия решений в области его деятельности. Стратегическим направлением развития ИС является их интеллектуализация, заключающаяся в построении формализованных процедур обработки, интерпретации и представления информации в виде некоторых показателей (знания), позволяющих их использование непосредственно для принятия управленческого решения в целевой области, т.е. выбора одного из альтернативных вариантов действий ЛИР. В этом случае о подобных ИС говорят как об интеллектуальных информационных системах [2].

Независимо областей применения ИС они выполняют следующие типовые функции: сбора данных; их обработки, в том числе, направленной на получение сводных показателей; представления данных, результатов обработки и их интерпретации для непосредственного использования ЛПР при принятии решения.

Среди перечисленных функций наиболее сложной для автоматизации с точки зрения построения формальных процедур преобразования данных в информацию, позволяющую ее использование для принятия решения, является построение сводных показателей, характеризующих состояние, эффективность или качество функционирования объекта управления, и их интерпретация.

В общем случае информация, необходимая для поддержки принятия решения может иметь следующий вид:

а) первичных данных, количественно характеризующих состояние объекта (процесса) управления;

Лицом, принимающим решение, будем называть субъекта, который должен на основании полученной информации осуществить выбор одного из альтернативных вариантов действий (собственных или находящегося под его началом коллектива).

б) результатов обработки первичных данных, выполняемой по
алгоритмам, принятым в конкретной системе исходя из ее функционального
назначения,

в) обобщенных показателей функционирования объекта за определенный
период времени (прогнозов развития отраслей, демографической ситуации,
прогнозов объемов финансирования различных отраслей народного хозяйства,
образования, таможенных ставках и т.п.), т.е. данных о факторах долгосрочного
действия в области существования объекта управления.

Если объект управления представляет собой сложную систему, описываемую большим числом характеристик, имеющих различную природу и широкий диапазон значений, когда не очевиден характер связей характеристик объекта между собой и внешними факторами, преобразование данных в сводные показатели качества его функционирования и их интерпретация усложняется и приобретает характер проблемной задачи. Т.е., она не может быть выражена в терминах конкретного класса прикладных задач, для которого имеется соответствующий математический аппарат. В этом случае возникает необходимость выявить и описать факторы, влияющие на состояние объекта, выбрать или разработать методы обработки информации, ориентированные на учет неопределенности, методы представления и интерпретации информации в таком виде, чтобы решение было принято.

В общем виде информационную задачу, которую необходимо выполнять при поддержке принятия решений в указанных условиях, можно сформулировать, как преобразование данных типа а), б) и в) в некоторые сводные показатели свойств объекта управления, которые не поддаются непосредственному измерению. Эти показатели могут интерпретироваться как некоторое качество объекта управления в целом или определенных его свойств (сторон): его эффективность, потенциал (потенциалы) достижения целей, вклад в эффективность или выигрыш от определенной деятельности, в которой участвует система и т.п. и характеризуют качественные и прагматические аспекты ее функционирования.

Условия, в которых приходится решать указанную информационную задачу, характеризуются неопределенностью, которая обусловлена одновременным действием целого ряда факторов:

неполнотой описания объекта или процесса;

существенной многомерностью;

недостаточностью информации или ее отсутствием о характере связей между характеристиками объекта (процесса), а также между его характеристиками и внешними факторами;

использованием моделей и методов обработки данных, применимость которых для решения конкретных целевых задач управления не обоснованы;

- задержками в получении необходимых данных, связанными с
нерациональной организацией их управления (процессами сбора, подготовки и
обработки), приводящими в конечном итоге к несвоевременным
управленческим решениям.

Для решения задач поддержки принятия решений в этих условиях чрезвычайно актуальными являются выработка подходов, которые принципиально ориентированы на работу в так называемой неопределенной или «нечеткой» среде, а также разработка методов и средств их реализации в информационных системах.

На основании вышеизложенного можно заключить, что разработка (выбор) методов обработки информации и архитектуры информационных систем, предназначенных для поддержки принятия решений в условиях неопределенности, является актуальной и практически значимой задачей.

Степень разработанности задач.

Исследования по разработке методов и средств информационного обеспечения в интересах поддержки принятия решений в условиях неопределенности требуют системного подхода, использования последних достижений в области математических методов обработки и анализа многомерных данных, теории систем и системного анализа, новых информационных технологий.

Вопросам разработки методов классификации и анализа многомерных данных, алгоритмов обработки информации в информационных системах, архитектуры информационных систем и систем управления базами данных посвящено большое количество работ.

Методы анализа многомерных данных, применяемые для исследования структуры и характера взаимосвязей между анализируемыми количественными данными о характеристиках и параметрах функционирования объектов и систем, их классификации, снижения размерности исходного описания с целью лаконичного объяснения природы анализируемых многомерных данных и наглядного представления, в задачах анализа сложных систем (технических, социально-экономических, общественных и др.) и управления ими рассматриваются в трудах Миркина Б. Г., Айвазяна С. А., Малиновского Л. Г., Ивченко Б.П., Мартыщенко Л.А., Монастырского М.Л., Саати Т. Системный аспект при обработке информации, циркулирующей в сложных системах, рассматривается в трудах Денисова А.А., Волковой В.Н., Прангишвили И.В., Пащенко Ф.Ф., Бусыгина Б.П..

В работах Вильсона А.Дж., Трухаева Р. И., Куренкова Н.И., Лебедева Б.Д. рассматриваются методы учета неопределенности при решении информационных задач: построении обобщенных характеристик систем, обработки массивов с пропущенными данными, прогнозировании их развития и т.д.

Вопросам построения автоматизированных информационных систем в производстве, маркетинге, финансах посвящены работы Абдикеева Н.М., Салимова В.Г., Яковенко И.И., Денисова А.А., Одинцова Б.Е., Романова А.Н., Попова И.И., Кульбы В.В.

Проблемам создания информационных систем, ориентированных на поддержку принятия решений в области стратегического управления, таких как интеллектуальные и экспертные системы, методологическим основам их построения посвящены работы Гаврилова А.В., Ларичева О.И., Фатхутдинова Р.А., Трахтенгерца Э.А., Т.Саати, Буркова В.Н., Райфы Х.и др.

Несмотря на большое количество работ, посвященных как общим, так и частным проблемам информационного обеспечения систем поддержки принятия решений, практически нет работ, в которых освещаются вопросы и проблемы формализации задач преобразования данных, описывающих сложные системы или процессы их функционирования, в сводные показатели их целевого назначения. Важность решения этих задач заключается в том, что они и составляют существо большинства процедур интеллектуальной обработки.

Исходя из степени разработанности перечисленных задач для данного диссертационного исследования, выдвинуты следующие цель и задачи.

Целью исследования является разработка методов, обоснование состава средств обработки данных и архитектуры информационных систем, обеспечивающих поддержку принятия решений в условиях неопределенности в различных предметных областях. Задачи исследования

Анализ состояния в области архитектуры информационных систем поддержки принятия решений (СППР) и используемых в них методов обработки и анализа данных.
Обоснование основных требований к методам и способам учета неопределенности при решении задач обработки и анализа многомерных данных в интересах поддержки принятия решений.
Разработка модели типовой информационной системы для комплексной автоматизации административной, учебной и научно-методической деятельности учебного заведения.
Определение места и роли систем (приложений) автоматизации обучения и разработка модели подсистемы автоматизации обучения языкам программирования.
Разработка метода, алгоритма и программного обеспечения приложения интеллектуального анализа данных для информационной системы страховой компании, предназначенного для прогнозирования страховых рисков.

6. Оценка эффективности разработанного метода прогнозирования страховых рисков.

Объектом исследования являются информационные системы поддержки принятия решений в области информационного обеспечения основных видов деятельности учебного заведения, а также страхования имущества граждан (автотранспорта).

Предметом исследования являются методы, алгоритмическое обеспечение приложений обработки и анализа многомерных данных и архитектура распределенных баз данных, обеспечивающие сбор, обработку и преобразование информации в вид, необходимый для принятия решений.

Теоретические основания исследования

Для построения сводных показателей качества объектов управления в информационных системах поддержки принятия решений использовались энтропийные методы анализа многомерных разнородных данных.

При обосновании построения информационных систем использовались разделы теории систем и системного анализа, при выборе вариантов и разработке структуры базы данных системы использовались разделы теории реляционных баз данных.

Эмпирическую базу диссертации составили результаты исследований по разработке модели процесса обучения языкам программирования, выполненных автором в 2000-2003 гг. на кафедре информационных технологий в сфере сервиса Московского государственного университета сервиса, и фактические данные о страхователях и их имуществе, представляющие собой содержание базы данных, а также ее приложение интеллектуального анализа данных, которые разрабатывались с участием автора для страховой компании.

Результаты диссертации внедрены в деятельность Института информационных технологий Московского государственного университета сервиса, а также в деятельность ООО «Страховая компания «Оранта», что подтверждается актами о внедрении и реализации (приложение 4).

Научная новизна исследования.

Впервые предложено и обосновано использование нового энтропийного метода обработки многомерной информации для создания приложений интеллектуального анализа данных в условиях неопределенности для информационных систем поддержки принятия решений.
Впервые разработана модель типовой информационной системы учебного заведения на основе концепции распределенных баз данных и приложений информационного обеспечения административной, учебной и научно-методической деятельности.
Разработан новый метод оценивания и прогнозирования рисков перехода объектов в возможные состояния для приложений интеллектуального анализа данных, заключающийся в преобразовании характеристик объекта в факторы риска и построении на них обобщенных показателей риска с помощью энтропийного метода.

Практическая значимость исследования.

Разработана модель типовой информационной системы комплексной автоматизации административной, учебной и научно-методической деятельности в учебном заведении, схема хранилища данных для этой системы, разработана и программно реализована учетная система.
Разработан алгоритм генерации заданий подсистемы обучения языкам программирования, а также метод, алгоритм и программное обеспечение приложения оценивания уровня знаний и навыков по результатам обучения на основе энтропийного метода построения обобщенных характеристик.
Разработаны алгоритмы и программное обеспечение приложения оценивания и прогнозирования рисков для информационной системы поддержки принятия решений в области страхования.

На защиту выносятся следующие положения:

1. Принцип построения приложений интеллектуального анализа данных для систем поддержки принятия решений.

Метод построения гарантированных оценок риска в информационных системах на основе преобразования характеристик объекта управления в факторы риска и использования энтропийного метода построения обобщенных характеристик систем.
Модель типовой информационной системы динамического сопровождения процесса обучения.

Методы обработки многомерных данных, используемые при «интеллектуальном» анализе в интересах поддержки принятия решения

Методы анализа многомерных данных изучаются и рассматриваются в рамках дисциплины прикладная статистика, где можно указать почти классическую работу [6] и ее более позднее переработанное в виде учебного пособия издание [53]. Основными методами анализа многомерных данных, используемых для ИАД, являются следующие. Метод главных компонент и факторный анализ.

Этот метод используется для наглядного представления (визуализации) исходных данных путем их проецирования на специально подобранное трехмерное пространство, плоскость и числовую прямую, чем одновременно достигается существенное снижение исходного признакового пространства [7]. Главные компоненты (ГК) служат для компактного описания коррелированных данных путем создания наиболее «эффективной», в определенном смысле, линейной комбинации переменных. ГК несут информацию о существенных свойствах исследуемого объекта, представляя собой своего рода его «резонансный» портрет, определяемый составом и структурой связей его элементов. Они позволяют визуализировать проекцию многомерных данных в пространстве меньшей размерности (например, на плоскости). К методу ГК примыкает факторный анализ, целью которого является получение более удачно интерпретируемых комбинаций переменных. Другие методы снижения размерности и графического анализа

Многомерное шкалирование (нахождение пространства наименьшей размерности для многомерных дискретных данных), целенаправленное проецирование (нахождение направлений и проекций данных, отвечающих заданным требованиям и свойствам — таким, как построение кривой регрессии с наименьшей среднеквадратической ошибкой или наиболее удачная кластеризация в пространстве проекции); анализ функциональных данных (в которых наблюдением является функция или изображение). Классификация и дискриминантный анализ.

Классификация данных состоит в выработке правил отнесения точек выборки к одному из классов. При этом число классов и их «метки» (например, названия политических партий, к которым относятся члены парламента) известны. Задача методов классификации - во-первых, найти характеристики, наиболее сильно связанные с принадлежностью к данному классу; во-вторых, анализируя данные характеристики для данного наблюдения, определить, к какому классу это наблюдение ближе всего [24]. Классическим методом классификации является линейный дискриминантный анализ (аналогом которого в эконометрической литературе является логит-регрессия), который разделяет пространство характеристик гиперплоскостью на два класса. Будут рассмотрены альтернативы, в т.ч. непараметрические, данному методу, которые позволяют получить границы более сложной конфигурации. Кластерный анализ.

В отличие от классификации кластерный анализ обеспечивает выявление в данных групп точек (кластеров), явственно отличающихся друг от друга по структуре значений признаков с использованием критериев их близости («подобия»). Важность решения этой задачи связана с тем, что применение стандартных средств анализа данных (в т.ч. стандартных эконометрических процедур) при наличии кластеров в данных приведет к смещению как точечных оценок (коэффициентов регрессии), так и стандартных ошибок, а значит, и к неверным статистическим выводам. Кроме того, структура данных и схожесть наблюдений могут представлять и самостоятельный интерес. Имеются два основных подхода к поиску кластеров - иерархический анализ, результатом которого является построение дендрограммы, описывающей близость отдельных точек и кластеров друг к другу, и неиерархический (композиционный) анализ, в котором число кластеров зафиксировано, и необходимо найти оптимальное разбиение точек по этим кластерам. Регрессионный анализ

Занимает центральное место в математико-статистическом инструментарии решения задач прогнозирования состояния и развития сложных систем и процессов, описываемых многомерными данными [7]. Прогноз состояния сложной системы (точечное или интервальное), который получают как значение функции fiX) регрессии (результирующей переменной у) в зависимости от значений объясняющих (предикторных) переменных X = (х(1), ;с(2),..., (р))т (р - размерность вектора данных) формально (математически) записывается в видеДХ ) = Е (у/ X = X ). В большинстве случаев используется классическая линейная модель множественной регрессии, которая представляет собой наиболее простой вариант конкретизации требований к общему виду построения функции ДХ), природе объясняющих переменных (характеристик системы) X и статистических регрессионных остатков в общих уравнениях регрессионной связи y(X) = f(X) + e(X), Еє(Х) = 0 [7].

Анализ существующих методов получения обобщенных показателей

В терминах рассматриваемого методического подхода оцениваемая величина - скалярный агрегированный показатель (обобщенный показатель) у с некоторой точностью восстанавливается по значениям частных показателей эффективности X, где X={xf},i=\,nk,j=\,mk . Здесь п — число признаков (характеристик) объекта, т - число объектов. В базовой модели метода статистического исследования зависимостей между обобщенным показателем у и Х={ху) постулируется статистическая связь типа [7]

В статистическом анализе для определения центра группирования наиболее широко используется среднее арифметическое значение. Известно, что средняя арифметическая оценка соответствует истинному (фактическому) значению измеряемой величины (т.е. ее можно считать гарантированной) только в том случае, если она является несмещенной, состоятельной и эффективной [7]. Однако в условиях, когда необходимо получать оценку на малых выборках, средняя арифметическая оценка (2.3) не удовлетворяет этим требованиям (как правило, является смещенной).

В рамках рассматриваемого методического подхода задача получения оценки некоторого объекта может рассматриваться как задача сравнительной оценки ряда однотипных объектов. Схема решения этой задачи имеет следующий вид. Имеется группа объектов С\, Сг,..., Ст, каждый из которых (/-й объект) характеризуется вектором (столбцом) характеристик Ху-Ху={х,, х2,...,хп}, (y=l,m), п — число характеристик. Обобщенный показатель уровня знаний строится на основе критерия Байеса Рекорреляция значений оценок (преобразование коррелированных значений в некоррелированные) проводится с помощью линейного преобразования:

После рекорреляции элементов матрицы исходных данных и их преобразования к однородному виду вводится мера разброса относительных оценок (искомые весовые коэффициенты.

Правомерность получения оценок et в виде (2.7) (как следствия использования принципа максимума неопределенности) вытекает из решения следующей задачи на условный экстремум:

Из приведенного описания методов построения обобщенных показателей видно, что последний позволяет лучше отразить в обобщенных показателях соотношение оценок объектов за счет учета в весовых коэффициентах 9, информации о структуре значений исходных данных. Однако, несмотря на статистическую устойчивость оценок, получаемых с их использованием [7], оба метода отличаются сложностью, которая связана с необходимостью решения следующих задач: нормировки (нормализации) исходных данных, которая проводится с целью придания им вероятностного смысла, и обязательной интерпретации результатов расчетов применительно к конкретной задаче сравнительного анализа объектов.

Нормировка исходных данных всегда приводит к искажению их структуры, поскольку она осуществляется на основании определенных допущений, проверка которых зачастую просто невозможна. Тем самым, в данные вносится неопределенность, связанная с субъективными представлениями исследователя об их природе.

Интерпретация результатов сравнительной оценки также вносит определенный субъективизм и, самое главное, требует присутствия специалиста-исследователя, что не всегда возможно, особенно при проведении оперативных расчетов.

Перечисленные особенности методов, основанных на использовании вероятностно-статистического подхода к анализу данных, ограничивают возможность их применения для решения задач, рассматриваемых в данной работе в силу специфики данных предметных областей. С точки зрения практического применения (учитывая проведенный анализ вероятностно-статистических методов) можно сформулировать очевидные требования к методу построения обобщенных оценок объектов: - гарантированность оценок, обеспечивающих учет неопределенности исходных данных и устойчивость к «возмущающим» факторам; - возможность использования исходных данных без их нормировки; - возможность использования исходных данных, которые, в общем случае, не являются независимыми; - аддитивность вкладов каждой характеристики в значение обобщенного показателя, позволяющее анализировать, интерпретировать и использовать полученные результаты для принятия решения; - его реализуемость в виде простых, не требующих специальной настройки и сопровождения в ходе проведения расчетов, алгоритмов, позволяющих их использование в приложениях интеллектуального анализа данных.

Режимы работы информационной системы и используемые средства обработки информации

Исходя из назначения информационной системы учебного заведения, можно определить два основных режима ее функционирования: - информационная поддержка принятия решений по организационно методическому обеспечению учебного процесса; - информационная поддержка принятия решений по управлению процессом обучения студентов. Информационные потребности персонала учебного заведения, возникающие в ходе оперативного управления организационно-методическим обеспечением учебного процесса, в своей основной массе удовлетворяются при применении традиционных средств СУБД и OLAP. Эти средства реализуют функции учетной системы, представления первичных данных в виде таблиц, традиционно используемых для поддержки принятия решений в рамках модели организационного управления учебным процессом, установленного соответствующими нормативными документами. У администраторов высшего звена управления для удовлетворения их информационных потребностей, связанных с решением задач прогнозирования развития учебных дисциплин и планирования учебного процесса, существует потребность в получении информации о тенденциях в соответствующей области знаний (финансирование научных программ, инвестиций в техническое перевооружение, демографические данные и их прогноз и т.п.), а также сводных показателей учебного процесса в его динамике и исторической ретроспективе.

Такие сводные показатели строятся на основе многомерного описания учебного процесса средствами ИАД - интеллектуального анализа данных. Информационная поддержка принятия решений по управлению обучением студентов необходима в первую очередь преподавательскому составу. Информационные потребности преподавателей удовлетворяются в рамках модели обучения, в которой базовым уровнем является модель предмета обучения. Существо модели обучения конкретному предмету составляют: - данные по предмету обучения, их организация, представление, правила генерации данных для контроля знаний и навыков студентов; - правила использования данных о предмете преподавателем для управления процессом обучения на основе учета результатов оценивания знаний студентов в ходе учебного процесса. Данные о предмете обучения, организованные в виде электронного учебника, могут храниться в специализированных хранилищах. Для получения сводных показателей уровня усвоения знаний студентами, на основе которых преподаватели управляют процессом обучения (путем изменения количества и сложности контрольных вопросов и задач), необходим учет и хранение оценок за выполнение студентами контрольных заданий (вопросов и задач). Эти текущие оценки за выполненные контрольные задания по всем изучаемым предметам (темам предмета), после их объединения в единый массив являются информационной базой для построения сводных показателей уровня усвоения знаний. Средством, обеспечивающим получение этих сводных показателей, также является приложение интеллектуального анализа данных. Модель предмета обучения на примере языка программирования Паскаль, разработанная с целью автоматизации обучения студентов этому языку программирования приведена ниже, в пункте 3.3.

Разработка метода обработки информации в задаче оценивания риска для систем поддержки принятия решения в страховом деле

Первоочередной типовой информационной задачей, которую приходится решать при выборе альтернативных вариантов действий типа инвестирования различных проектов, возмещения возможного ущерба, убытков и других возможных потерь, является оценивание рисков, сопутствующих деятельности в той или иной области. В страховании, такой задачей является оценивание страховых рисков, связанных с выплатой страхового возмещения при наступлении страховых случаев. Эта оценка лежит в основе определения размера страховых взносов, из которых затем формируется фонд денежных средств, направляемых на выплаты по компенсации убытка потерпевшим при наступлении страховых случаев. В области страхования автомобилей и гражданской ответственности владельцев автотранспортных средств страхуются риски, связанные с владением, пользованием, распоряжением автомобилями, или компенсацией убытка потерпевшим за вред, причиненный третьим лицам. Однако, в связи с неопределенностью, связанной с отсутствием точной информации о законах распределения вероятности наступления в период страхования страховых случаев и размеров причиненного в них ущерба у различных страхователей, строго формальное без субъективных допущений определение гарантированных оценок страховых рисков и, следовательно, назначение величины страховых взносов является сложной и трудно формализуемой информационной задачей. В страховых компаниях, особенно в крупных, вся исходная информация о страхователях и их имуществе, страховых случаях в течение периода страхования, размере причиненного в них ущерба содержится в базах данных, являющихся структурными элементами их информационных систем.

Эти системы также включают инструментальные средства (в том числе стандартные, например, MS Excel) для проведения анализа данных и расчетов по определению необходимых оценок и параметров, используемых при оценке рисков и назначении размеров страховых взносов, которые, тем не менее, во многих случаях осуществляются вручную из-за сложности формализации задачи оценивания рисков. Очевидно, что наличие в составе информационных систем. средств интеллектуального анализа данных, реализующих строгие формальные методы построения гарантированных оценок страховых рисков для их прогнозирования, обеспечит повышение надежности работы страховых компаний и, в конечном счете, качества страхового обслуживания граждан. Особенно актуально использование таких средств новыми страховыми компаниями на этапе их становления и не имеющих большой статистики страховых случаев. В вопросах оценивания страховых рисков они руководствуются методическими рекомендациями Ассоциации страховщиков, в которых аккумулирован опыт работы многих страховых компаний за достаточно большой период их работы. Однако для эффективного применения этих рекомендаций на практике необходим учет специфики области страхования, региона (условий существования объекта страхования) и многих других факторов, плохо поддающихся формализации, и поэтому не используемых при определении страховых рисков. Страховой риск при автомобильных поездках, владении имуществом и т.п. может быть формально описан набором характеристик страхователя - личных и принадлежащего им имущества. В явном виде информация о страховых рисках проявляется, когда происходят страховые случаи. Тогда появляется возможность, имея частости (которые при увеличении статистики стремятся к вероятности) страховых случаев, оценить их функциональную связь с характеристиками страхователей и предметов страхования, условий их существования и эксплуатации. Такое оценивание заключается в сравнительном анализе страхователей по их характеристикам (далее длякраткости под страхователем будем понимать субъекта страховой операции, который характеризуется всей совокупностью характеристик - личных и предмета его страхования - автомобиля, имущества и т.п.) и их ранжировании с позиции величины страхового риска. Поэтому задача оценивания риска с целью его прогнозирования по существу может быть представлена как задача сравнения страхователей по их характеристикам и предметов страхования, результатам которого ставятся в соответствие страховые риски pt. Очевидным желанием при проведении такого сравнительного анализа является отыскание характеристики или ряда характеристик, которые указывали бы на величину страхового риска. Однако при этом исследователю приходится сталкиваться с проблемой принятия решения в условиях неопределенности исходных данных. Неопределенность вызвана допущениями в построении моделей страховых рисков, ограниченностью объемов, условий, измеряемых (количественных) параметров, неполнотой исходных данных, необходимых для определения показателей рисков, а также методическими погрешностями соответствующего математического аппарата. Большинство из перечисленных причин, в силу специфики страхования, не носит вероятностной природы, вследствие чего при проведении оценки рисков приходится использовать интервальные оценки (возможные диапазоны изменения данных). Ясно, что в такой ситуации расчеты по сравнительной оценке рисков страхователей целесообразно осуществлять методами, принципиально ориентированными на учет неопределенности информации. Спецификой задачи сравнения страхователей является также использование набора частных критериев (показателей), имеющих различную природу (показатели возрастные, эксплуатационного качества имущества, стоимостные показатели; технические характеристики, эргономические, физиологические факторы). С этой точки зрения задача сравнительной оценки страхователей относится к классу т.н. многокритериальных задач, методы решения которых предполагают принятие допущений, не соответствующих фактическим условиям жизнедеятельности страхователя и эксплуатации имущества. В частности, основное допущение - о безразмерности частных критериев - приводит к неадекватности и несопоставимости результатов вследствие субъективного характера выбора вида нормировки, которую приходится вводить для обеспечения однородности данных, имеющих различную природу [7,12]. Таким образом, возникает необходимость разработки нового методического подхода к оцениванию страховых рисков, учитывающего неопределенность значительного объема исходных данных и многокритериальный характер задачи сравнения.

Методы и средства анализа данных в системах поддержки принятия решений Ананьев Николай Сергеевич

Методы обработки многомерных данных, используемые при «интеллектуальном» анализе в интересах поддержки принятия решения

Анализ существующих методов получения обобщенных показателей

Режимы работы информационной системы и используемые средства обработки информации

Разработка метода обработки информации в задаче оценивания риска для систем поддержки принятия решения в страховом деле

Похожие диссертации на Методы и средства анализа данных в системах поддержки принятия решений