Теория и методы исследования информационной среды распределенных систем обработки данных Приходько, Максим Александрович

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Приходько, Максим Александрович. Теория и методы исследования информационной среды распределенных систем обработки данных : диссертация ... доктора технических наук : 05.13.01 / Приходько Максим Александрович; [Место защиты: ГОУВПО "Московский государственный горный университет"].- Москва, 2012.- 146 с.: ил.

Содержание к диссертации

Введение

Глава 1 Разработка информационно-потенциального подхода к описанию распределенных систем обработки информации и протекающих в них информационных процессов 14

1.1 Обоснование необходимости информационно-потенциального подхода к описанию пространственно-временного распределения информационных процессов по узлам распределенной системы обработки информации 14

1.2 Обоснование мультиагентного подхода как основного способа описания элементарных квантов информации и распределенных систем 27

1.3 Анализ передовых отечественных и зарубежных достижений в области мультиагентных систем и распределенных систем обработки информации 37

Выводы по главе 1: 49

Глава 2 Формализация распределенных систем обработки информации с позиций информационно потенциального подхода 50

2.1 Основные понятия информационно-потенциального подхода 50

2.2 Исследование волнового уравнения пространственно-временного распределения элементарных квантов информации в информационном поле с позиций модели козлова-никишина 58

2.3 Решение волнового уравнения для основных видов информационного потенциала 61

Выводы по главе 2: 67

Глава 3 Концептуальная модель конфликтного взаимодействия интеллектуальных агентов в мультиагентных распределенных системах обработки информации 68

3.1 Выбор и обоснование сновных сценариев конфликтного взаимодействия интеллектуальных агентов и случаев роста численности контрагентов 68

3.2 Разработка моделей взаимодействия интеллектуальных агентов с позиций количественной эволюции их фракций 76

3.3 Разработка обобщенной концептуальной модели конфликтного взаимодействия интеллектуальных агентов в мультиагентных распределенных системах обработки информации 80

Выводы по главе 3: 85

Глава 4 Разработка моделей взаимодействия агентов и контрагентов для различных сценариев роста их численности 86

4.1 Разработка модели перераспределения информационных потоков по узлам распределенной мультиагентной системы обработки разнородной информации в условиях непредсказуемого изменения объема и характера входящих информационных потоков 86

4.2 Разработка модели взаимодействия агента и контрагента для случая равномерного роста численности контрагентов и интеллектуальных агентов 91

4.3 Разработка модели взаимодействия агента и контрагента для случая экспоненциального роста численности контрагентов и интеллектуальных агентов

4.4 Разработка модели взаимодействия агента и контрагента для случая экспоненциального роста численности контрагентов и равномерного роста численности интеллектуальных агентов... 103

Выводы по главе 4: 108

Глава 5 Формализация и алгоритмизация процесса выработки управляющего воздействия для нормализации функционирования распределенной системы обработки информации 109

5.1 Разработка алгоритма выработки управляющего воздействия в случае равномерного роста численности контрагентов и интеллектуальных агентов 109

5.2 Разработка алгоритма выработки управляющего воздействия в случае экспоненциального роста численности контрагентов и интеллектуальных агентов 114

5.3 Разработка алгоритма выработки управляющего воздействия в случае экспоненциального роста численности контрагентов и равномерного роста численности интеллектуальных агентов... 119

Выводы по главе 5: 124

Глава 6 Разработка пакета прикладных программ «квант-мп» для реализации созданной теории исследования информационной среды распределенных систем обработки данных 125

6.1 Разработка пакета прикладных программ «квант-мп» для нормализации функционирования распределенной системы обработки разнородной информации в условиях непрогнозируемого изменения объемов и характера обрабатываемой информации 125

6.2 Внедрение пакета прикладных программ «квант-мп» 133

Выводы по главе 6: 137

Заключение 138

Список использованных источников 139

Обоснование мультиагентного подхода как основного способа описания элементарных квантов информации и распределенных систем
Исследование волнового уравнения пространственно-временного распределения элементарных квантов информации в информационном поле с позиций модели козлова-никишина
Разработка моделей взаимодействия интеллектуальных агентов с позиций количественной эволюции их фракций
Разработка модели взаимодействия агента и контрагента для случая равномерного роста численности контрагентов и интеллектуальных агентов

Введение к работе

Актуальность работы. Современное состояние общества характеризуется процессом информатизации, затрагивающим практически все сферы деятельности человека. Вслед за периодом локальной компьютеризации наступила эра создания корпоративных информационных систем, эра распределенных систем. Сложность этого этапа заключается в том, что автоматический перенос хорошо зарекомендовавших себя решений в области локальной информатизации на распределенные системы зачастую приводит к плачевным результатам. Требуется выработка новых решений, поиск новых подходов, создание новых технологий.

Надежность работы распределенных систем, скорость и качество обработки информации – темы, актуальные сегодня как никогда. Для доказательства достаточно обратиться к сети Интернет – одной из наиболее ярких распределенных систем современности:

темпы роста Интернет-трафика последние два года превышают 60% (74% в 2009 году и 62% в 2010 году);

объем информации в сети Интернет увеличивается с каждым годом в геометрической прогрессии;

увеличивается доля «сложной» для обработки медиа-информации: звуковой, графической, видео;

растут объемы «паразитной» информации, например, доля спама в почтовой информации сегодня – свыше 90%.

Пример сети Интернет показывает: темпы развития инструментов, а также средств накопления и передачи данных превышают существующие возможности по их обработке. Проблема усугубляется постоянным ростом доли сложной для обработки информации – графической, звуковой, видео. Многие задачи требуют уже не просто быстрой, а моментальной обработки – «на лету». Распределенные системы насчитывают сотни тысяч и миллионы узлов. Вирусные эпидемии распространяются в течение нескольких часов и даже минут, а их масштабы достигают миллионов зараженных компьютеров. И все это происходит на фоне крайне слабой развитости инструментов описания эволюции во времени как самих распределенных систем, так и популяций функционирующих в их структуре программ.

До недавнего времени это не являлось проблемой. Несмотря на свою «распределенность», распределенные системы представляли собой статичные по своей структуре комплексы, содержащие весьма ограниченное количество узлов. Например, одна из крупнейших распределенных систем Российской Федерации ГАС «Выборы-М» содержит около 4000 компьютеров. Но что это на фоне сети Интернет, к которой по разным оценкам подключено около 1.5 млрд. компьютеров?! – менее 3 десятитысячных (!) доли процента.

Сегодня мы находимся на пороге новой эры, когда распределенные системы будут содержать миллионы и миллиарды устройств. И спрогнозировать их поведение существующими методами не представляется возможным. Потребуется построить суперкомпьютерный аналог андронного коллайдера, чтобы заниматься в нем традиционным моделированием функционирования подобных распределенных систем обработки информации. Но и это еще не самая сложная задача.

Гораздо более серьезные вызовы готовит нам еще одно направление развития все той же сети Интернет – мобильный доступ. Будучи изначально распределенной системой существенно неоднородной структуры и достаточно непостоянного состава, с развитием технологий мобильного доступа в сеть Интернет она трансформируется в первую общедоступную и функционирующую распределенную систему с динамически изменяющейся структурой, причем изменяющейся совершенно непредсказуемо. Мобильные устройства, подключающиеся к сети Интернет, а также функционирующие в них программы, которые нередко называют мобильными агентами, формируют сегодня уникальную распределенную среду, не имеющую аналогов. Анализ современных отечественных и зарубежных работ показывает, что существующие подходы к изучению распределенных систем обработки информации не готовы ответить на вопрос, как она будет развиваться дальше.

Мы видим, что распределенные системы обработки информации глобальных масштабов с непредсказуемо и динамически изменяющейся структурой – не просто ближайшее будущее, а самое реальное настоящее. Вместе с тем существующие методы описания и исследования распределенных систем уже сейчас не в состоянии ответить на самые первые серьезные вопросы, например о протекании вирусной эпидемии. Впрочем, как и о поведении популяций любых других однотипных программ. Существующие эпидемиологические модели в лучшем случае достаточно точно отвечают на вопрос о том, «сколько» узлов распределенной системы обработки информации заражено вирусом. И совершенно не знают ответ на вопрос, «какие именно». Налицо необходимость разработки модели, позволяющей определять пространственно-временное распределение различных однотипных программ по узлам распределенной системы обработки информации в заданный момент времени. Актуальность поставленной задачи для повышения надежности функционирования распределенных систем не вызывает сомнений.

В диссертационной работе предлагается новая теория описания распределенных систем обработки информации с позиций информационного потенциала на базе квантовой теории поля и мультиагентного подхода. Квантовая теория поля выбрана в качестве основной не случайно, а вследствие того, что элементарные кванты информации в распределенных системах обработки информации проявляют свойства, присущие кванто-механическим системам. На основе предложенной теории разработана модель мультиагентной системы, позволяющая определить пространственно-временное распределение интеллектуальных агентов по узлам распределенной системы обработки информации. Полученная модель используется для анализа пространственно-временного распределения фракций контрагентов в условиях конфликтного взаимодействия и построения на основе полученных результатов системы выработки управляющего воздействия, направленного на нормализацию функционирования распределенной системы обработки информации.

Цель диссертации заключается в повышении надежности работы распределенных мультиагентных систем обработки информации за счет нормализации функционирования путем формирования оптимальных управляющих воздействий на основе данных о пространственно-временном распределении контрагентов по узлам распределенной системы.

Для достижения указанной цели предполагается решить следующие основные задачи:

Анализ передовых отечественных и зарубежных достижений в области мультиагентных систем и распределенных систем обработки информации;
Исследование методов качественного и количественного описания распределенных систем обработки информации и обоснование необходимости применения информационно-потенциального подхода к изучению конфликтного взаимодействия интеллектуальных агентов в распределенных мультиагентных системах обработки информации с позиций квантовой теории поля;
Выявление и формализация типовых конфликтных ситуаций с позиций информационно-потенциального подхода на базе методов квантовой теории поля и мультиагентных систем;
Разработка концептуальной модели распределенной мультиагентной системы обработки разнородной информации в условиях возникновения множества негативных процессов (популяций контрагентов) в узлах распределенной системы с позиций информационно-потенциального подхода;
Разработка модели выработки управляющих воздействий для нормализации функционирования распределенной системы обработки информации в условиях прогнозируемого распространения контрагентов;
Разработка модели выработки управляющего воздействия для нормализации функционирования распределенной системы обработки разнородной информации в условиях непрогнозируемого изменения объемов и характера обрабатываемой информации;
Разработка пакета прикладных программ нормализации функционирования распределенной системы обработки информации в условиях распространения различных фракций контрагентов.

Основная идея работы заключается в исследовании динамики популяций интеллектуальных агентов в условиях их конфликтного взаимодействия в распределенных мультиагентных системах обработки информации путем определения информационного потенциала информационной среды с позиций квантовой теории поля.

Методы исследования, используемые для решения поставленных задач, включают методы квантовой теории поля, методы теории специальных функций и дифференциальных уравнений, методы математического моделирования, методы теории вероятностей.

Научные положения работы, выносимые на защиту:

1. Обоснована теория описания распределенных мультиагентных систем обработки информации с позиций информационного потенциала как единой информационной среды на базе квантовой теории поля.

2. Создана теория, которая показала, что базовыми видами информационных потенциалов распределенных систем обработки информации с сетевыми структурами, соответствующими основным видам топологии сети, являются потенциалы с равномерной напряженностью или напряженностью, убывающей с удалением от области, занятой контрагентами. В частности, таким потенциалом является равномерный потенциал, а также кулоновский потенциал и потенциал центробежных сил.

3. Поставлена и решена задача определения пространственно-временного распределения контрагентов по узлам распределенной системы обработки информации для основных видов информационного потенциала.

4. Разработана математическая модель конфликтного взаимодействия интеллектуальных агентов в распределенных мультиагентных системах обработки информации, учитывающая новый вид макровзаимодействия интеллектуальных агентов – трансформацию.

5. Решены задачи конфликтного взаимодействия контрагентна и интеллектуального агента для трех основных сценариев роста численности контрагентов и интеллектуальных агентов, для которых разработаны модели, методы и базовые алгоритмы выработки управляющего воздействия для нормализации функционирования распределенной системы обработки информации.

7. Разработан пакет прикладных программ нормализации функционирования распределенной мультиагентной системы обработки информации в условиях распространения различных фракций контрагентов.

Новизна научных исследований заключается в следующем:

предложена новая теория и методы описания распределенных мультиагентных систем с позиций информационного потенциала на базе квантовой теории поля, что впервые позволяет оценить среду как единое целое и получить количественные и качественные оценки пространственно-временного распределения негативных процессов (контрагентов) по узлам распределенной системы обработки информации;

установлены взаимосвязи топологий сетевых структур распределенных систем обработки информаций и видов информационного потенциала;

предложена математическая модель взаимодействия интеллектуальных агентов и контрагентов, впервые учитывающая новый вид макровзаимодействия – трансформацию интеллектуальных агентов в агенты иного рода, которая описывает численную эволюцию фракций интеллектуальных агентов и в отличие от существующих впервые позволяет описать их конфликтное взаимодействие;

получены аналитические выражения числа контрагентов в условиях конфликтного взаимодействия для основных сценариев роста численности интеллектуальных агентов и контрагентов;

получены аналитические оценки параметров управляющего воздействия в условиях конфликтного взаимодействия для основных сценариев роста численности интеллектуальных агентов и контрагентов;

созданные модели и методы выработки управляющего воздействия впервые позволили определить не только количественные характеристики протекающих процессов, но и их качественные свойства, такие как вероятностное распределение протекающих процессов по узлам распределенной системы.

Обоснованность и достоверность научных положений, выводов и рекомендаций подтверждаются:

анализом представительного объема научных работ отечественных и зарубежных авторов;

использованием результатов анализа отечественного и зарубежного практического опыта в области распределенных систем обработки информации, мультиагентных систем, математического моделирования;

корректным использованием методов квантовой теории поля, теории специальных функций и дифференциальных уравнений, математического и имитационного моделирования, теории вероятностей;

положительными результатами использования основных положений диссертации в практике разработки стратегий обеспечения антивирусной защиты ФГУП НИИ «Восход».

Научное значение заключается в разработке теории информационно-потенциального описания распределенной мультиагентной системы обработки информации, позволившей впервые определить пространственно-временное распределение фракций интеллектуальных агентов в условиях их конфликтного взаимодействия для выработки оптимального управляющего воздействия с целью нормализации функционирования распределенной системы обработки информации.

Практическое значение состоит в том, что использование разработанных теоретических и практических положений и рекомендаций обеспечит повышение надежности функционирования распределенных мультиагентных систем обработки информации и качества обработки информации.

Реализация выводов и рекомендаций. Предлагаемая теория была использована при разработке части общей стратегии обеспечения антивирусной защиты ФГУП НИИ «Восход». Разработанные теоретические принципы исследования распределенных систем обработки информации использованы в учебном процессе при подготовке специалистов на кафедре «Автоматизированные системы управления» по направлению 230100 «Информатика и вычислительная техника» специальности 230102 «Автоматизированные системы обработки информации и управления» в Московском государственном горном университете. Методы и модели анализа протекания негативных процессов в распределенных системах обработки информации также используются в учебном процессе.

Основные результаты работы, связанные с разработкой моделей и методов описания протекания негативных процессов в распределенных системах обработки информации, были внедрены в рамках подготовки решений по обеспечению антивирусной защиты ФГУП НИИ «Восход», а также разрабатываемых предприятием проектов.

Апробация работы. Основные положения и результаты работы докладывались на кафедре «Автоматизированные системы управления» Московского государственного горного университета, на международном научном симпозиуме «Неделя горняка» (Москва, 2009-20011 гг.), на II Международной студенческой конференции по проблемам компьютерной безопасности «IT-Security Conference for the Next Generation» (Москва, 2009 г., Диплом I степени в номинации «Средства анализа и тестирования современных средств защиты», Сертификат о присвоении статуса Победителя конференции «Лаборатории Касперского» в номинации компании Softline), Всероссийской научно-технической конференции студентов, аспирантов и молодых ученых «Научная сессия ТУСУР-2009» (Новосибирск, 2009 г.), Пятом международном научном конгрессе «Роль бизнеса в трансформации российского общества» (Москва. 2010 г.), научно-практической конференции «Современные информационные технологии в управлении и образовании» (Москва, 20011 г., Грамота за I место с работой «Современные способы обнаружения негативных процессов в сетевых структурах и распределенных системах», Диплом лауреата премии имени д.т.н. В. С. Корсакова-Богаткова).

Публикации. По теме диссертации автором опубликовано 20 научных работ, в т.ч. 15 статей – в журналах по перечню ВАК Минобрнауки России.

Структура и объем работы. Диссертация состоит из введения, 6-ти глав, заключения, содержит 31 рисунок и список литературы из 250 наименований.

В ходе подготовки работы автор обсуждал промежуточные результаты и возможные перспективы исследований с рядом ведущих специалистов в области мультиагентных систем и математического моделирования. Подобные контакты способствовали формированию взглядов автора в выбранной области исследования, за что автор искренне благодарен научному консультанту – д.т.н., проф. Н. И. Федунец, явившейся идейным вдохновителем работы.

Обоснование мультиагентного подхода как основного способа описания элементарных квантов информации и распределенных систем

Воздействие информационной среды на помещенный в нее элементарный квант информации обусловлено большим числом факторов: скоростью, пропускной способностью и загруженностью каналов связи, задержками и ошибками передачи информации, наличием программных и аппаратных средств контроля над передаваемой информацией и многими другими. Однако, наиболее перспективным является описание оказываемого воздействия с помощью единственного параметра. В качестве такого параметра естественно выбрать время, с помощью которого возможно оценить как затраты на перемещение элементарного кванта информации по каналам связи, так и затраты на его обработку внутри самого узла, предшествующую его дальнейшей передаче. Здесь важно отметить два принципиально различных случая, касающиеся соотношения времени обработки элементарного кванта информации внутри узла и времени его передачи по каналам связи. В первом случае задержки каналов связи и обработки в узлах распределенной системы являются величинами одного порядка. Во втором - задержки каналов связи пренебрежимо малы по сравнению с задержками обработки в узлах распределенной системы. Четкое разделение этих случаев важно для правильного описания расстояния между узлами распределенной системы обработки информации и последующего определения вида потенциала. А сама возможность описать потенциал в виде функциональной зависимости от одной величины (например, некоторой метрики на основе времени) позволяет значительно продвинуться в нахождении пространственно-временного распределения элементарных квантов информации по узлам распределенной системы обработки информации.

Несмотря на оценку задержек узлов распределенной системы и каналов связи, связывающих эти узлы, одной величиной - временем, необходимо понимать, что в основе самой задержки по-прежнему лежат многие факторы, а для элементарных квантов информации различной природы задержка узла может различаться и не является постоянной величиной. Например, один и тот же антивирус для двух разных вирусов может быть причиной как бесконечной задержки (определяет и излечивает данный вирус), так и нулевой задержки (не определяет и пропускает данный вирус). Поэтому, говоря об информационном потенциале, необходимо понимать, что он не является универсальным понятием и зависит от конкретных видов элементарных квантов информации, участвующих в его формировании. Как электромагнитный потенциал применим при исследовании частиц, обладающих зарядом, а гравитационный -для тел, обладающих массой, так и информационный потенциал распределенной системы обработки информации - понятие, неразрывно связанное с природой рассматриваемых элементарных квантов информации, пусть и обладающее определенными инвариантными свойствами. Верно и обратное. В то время как электромагнитное и гравитационное поля создаются точечным зарядом или точечной частицей, обладающей массой, аналогично информационный потенциал создается фракцией интеллектуальных агентов, размещенных в узлах распределенной системы обработки информации (в информационной среде). Простейшим случаем является информационный потенциал, формируемый единственным (первым) элементарным квантом информации (например, интеллектуальным агентом), который и является эквивалентом точечного заряда или точечной массы в классической физике.

Еще одна причина зависимости потенциала от вида рассматриваемых элементарных квантов информации кроется в различии характера обрабатываемой информации. До недавнего времени обрабатываемая информация носила преимущественно текстовый характер. Сегодня наблюдается лавинообразный рост объемов обрабатываемой медиа-информации - графики, звука, видео. Каждый вид информации обладает своей спецификой. Например, хорошо известно, что звук и видео плохо поддаются сжатию стандартными средствами архивации данных. Учет этой специфики крайне важен при определении потенциала распределенной системы обработки информации. Система, рассчитанная на обработку текстовой информации, практически наверняка не справится с обработкой потокового видео в силу ограничений, заложенных в нее на этапе проектирования. А значит, будет обладать иными свойствами как информационная среда, в которой распространяется новый вид элементарных квантов информации.

Существует еще один важный аргумент в пользу потенциального подхода, связанный со свойствами сетевых структур простейших топологий -шина, кольцо, звезда. Как известно, все сети строятся на основе трех базовых топологий. Эти топологии определяют способ соединения компьютеров в сети, но что более важно для нас - пути прохождения сигналов или, в нашей терминологии, распространения элементарных квантов информации. Каждая из базовых топологий сети может быть представлена в виде графа и накладывает свои ограничения на способы распространения элементарных квантов информации в ней.

Топология типа «шина» (Рис. 2) представляет собой множество компьютеров, подключенных к единой незамкнутой магистрали данных -шине. На концах шины устанавливаются «терминаторы» - устройства для погашения передаваемые сигналов после их прохождения по шине. Особенностью топологии является то, что передаваемые по шине сигналы доступным всем подключенным к ней компьютерам. А основным достоинством является то, что сеть сохраняет работоспособность при отключении или выходе из строя произвольного компьютера. Однако, при повреждении шины вся сеть перестает работать.

Исследование волнового уравнения пространственно-временного распределения элементарных квантов информации в информационном поле с позиций модели козлова-никишина

Сопоставим каждому ребру графа определенный вес, соответствующий среднему времени передачи интеллектуального агента по выбранному каналу передачи данных. С учетом предыдущего замечания о более широкой трактовке понятия «канал передачи данных» отметим, что данное значение может быть достаточно большим и сравнимо со временем, требующимся на обработку (размещение) интеллектуального агента на узле распределенной системы обработки информации.

Задержка узла распределенной системы обработки информации - время, которое в среднем тратится узлом на обработку полученной информации (интеллектуального агента) соответствующего рода и дальнейшую передачу по каналам связи, - также влияет на передачу элементарных квантов информации наряду с характеристиками непосредственно каналов передачи данных. Если взять в качестве примера распространение сетевой вирусной эпидемии почтовых «червей», то задержкой узла будет являться среднее время между очередными проверками полученной корреспонденции пользователем, т.к. дальнейшее распространения «червя» возможно только после прочтения инфицированного письма. Если же компьютер защищен антивирусом, устойчивым к данному «червю», то задержка узла возрастает до бесконечности - дальнейшее распространение «червя» через этот компьютер не происходит.

Обратим внимание, что задержка узла зависит от характера обрабатываемой информации и не является величиной абсолютной и неизменной. Например, она может различаться для одного и того же узла в случае обработки текстовой, аудио- и видеоинформации, а также интеллектуальных агентов различного рода.

Присвоим каждому узлу распределенной системы обработки информации вес, соответствующий задержке узла на обработку интеллектуальных агентов заданного вида. В результате данной операции все ребра и вершины графа будут ранжированы величинами одной размерности - время в секундах. Выберем минимальный вес среди всех полученных и поделим на него веса всех ребер и вершин графа. Получим безразмерную задержку информационных потоков - нормированные веса, не меньшие 1. Минимальное значение веса 1 будет достигаться на ребре (или в узле), соответствующем каналу связи (узлу) с минимальной задержкой информационного потока.

Таким образом, с помощью введенных весов можно определить минимально необходимое время, которое потребуется элементарному кванту информации, чтобы преодолеть путь между двумя узлами, что позволяет оценить расстояние между этими узлами.

Определим длину маршрута между двумя узлами распределенной системы обработки информации как сумму весов ребер, составляющих этот маршрут, а также весов узлов, находящихся на этом маршруте, не включая концевые узлы маршрута. Маршрут понимается в классическом смысле теории графов. Пользуясь этим определением, можно аналогично ввести понятие длины пути между узлами распределенной системы обработки информации как сумму весов ребер, составляющих этот путь, и весов узлов, находящихся на этом пути. Путь понимается в классическом смысле теории графов как маршрут, соединяющий два узла, все ребра которого различны. Тогда расстоянием между узлами распределенной системы назовем минимальную длину пути, связывающего эти узлы в неориентированном дубликате графа.

Важным аспектом применимости потенциального подхода и существующего математического аппарата в этой области является соответствие введенного понятия расстояния аксиомам метрики. Применение неориентированного дубликата графа для определения расстояния, а также исключение весов концевых узлов маршрута позволяет утверждать, что введенное нами определение действительно является метрикой при условии связности исходного графа. Поэтому обоснованы следующие определения:

Определение 1: длиной маршрута между двумя узлами распределенной системы обработки информации называется сумма весов ребер, составляющих этот маршрут, а также весов узлов, находящихся на этом маршруте, не включая концевые узлы маршрута.

Определение 2: длиной пути между узлами распределенной системы обработки информации называется сумма весов ребер, составляющих этот путь, и весов узлов, находящихся на этом пути, не включая концевые узлы пути.

Определение 3: расстоянием между узлами распределенной системы обработки информации называется минимальная длина пути, связывающего эти узлы в неориентированном дубликате графа.

Формальное определение расстояния как метрики позволяет ввести систему координат, необходимую для формализации информационного потенциала. Для этого определим начало координат и способ определения значений координат узлов распределенной системы обработки информации. Как следует из проведенного выше анализа, в качестве точки отсчета наиболее естественно взять первый узел распределенной системы, на котором размещен интеллектуальный агент. Такой выбор начала координат оправдан тем, что размещенный первым интеллектуальный агент будет оказывать определяющее влияние на формирование потенциала. Координатой узла в зафиксированной таким образом системе координат будет расстояние между началом координат и выбранным узлом.

Мы видим, что выбор начала координат фактически эквивалентен фиксации состояния распределенной системы обработки информации в определенный момент времени. Исходя из характера распространения интеллектуальных агентов, логично расширить определение координаты узла, а именно - считать координатой узла не просто длину пути между узлом и началом координат, а длину пути между узлом и ближайшим узлом, с размещенным на нем интеллектуальным агентом. Уточненное таким образом понятие координаты узла учитывает участие в процессе распространения интеллектуальных агентов не только первого, но и всех остальных узлов, занятых интеллектуальными агентами. Действительно, с течением времени область, охваченная интеллектуальными агентами, расширяется и смещается «вглубь» распределенной системы обработки информации, в результате чего повышается достижимость узлов, к которым приближается граница этой области. Введенная таким образом система координат обладает одним очень интересным свойством, а именно соответствует определению метрики расстояния, используемому в квантомеханической модели Козлова-Никишина [203].

Разработка моделей взаимодействия интеллектуальных агентов с позиций количественной эволюции их фракций

Взаимодействуя с информационной средой, интеллектуальные агенты одновременно взаимодействуют друг с другом. Наиболее часто упоминаются три основных вида взаимодействия - порождение агентом другого агента, сопротивление вытеснению (удалению) агента другим агентом, вытеснение (удаление) агентом другого агента. Как было показано в главе 1, этот список целесообразно дополнить еще одним видом взаимодействия - трансформацией - когда интеллектуальный агент одного типа трансформируется в интеллектуальный агент другого типа. В частности, возможна трансформация интеллектуального агента в контрагента и обратно, причем основной побуждающей силой данной трансформации будет именно информационная среда, в которую помещены интеллектуальные агенты (Рис. 20).

Рис. 20. Основные виды взаимодействия интеллектуальных агентов Количественная характеристика распределения интеллектуальных агентов по узлам распределенной системы обработки информации может быть найдена с помощью математической модели распределенной мультиагентной системы обработки информации, рассматривающей распределенную систему как множество разнотипных интеллектуальных агентов, взаимодействующих друг с другом четырьмя указанными выше способами. Научный интерес представляет неизученный пока случай конфликтного взаимодействия, т.к. в условиях отсутствия противодействия распространению интеллектуального агента численность популяции может быть смоделирована с помощью различных существующих моделей, например эпидемиологических [4, 95-97]. Таким образом, практическую ценность имеет оценка численности популяций контрагентов, распространяющихся в условиях активного управляющего воздействия, реализуемого с помощью интеллектуальных агентов. Заметим, что формулируемая таким образом модель является общей и может быть сведена к случаю распространения «обычных» интеллектуальных агентов путем исключения из нее управляющего воздействия.

Для построения модели рассмотрим задачу многоагентного (т 1) взаимодействия конкурирующих интеллектуальных агентов в распределенных мультиагентных системах обработки информации [215-220]. В общем случае предполагается, что распространение интеллектуальных агентов происходит в условиях реализации управляющего воздействия, направленного на нормализацию функционирования распределенной системы обработки информации. Здесь т — число различных видов интеллектуальных агентов и соответствующих им контрагентов, участвующих во взаимодействии. Задачей интеллектуальных агентов является подавление фракций контрагентов. Таким образом, в распределенной системе обработки информации, состоящей из N узлов, взаимодействуют 2 т видов конкурирующих интеллектуальных агентов - т контрагентов Кит агентов А или т пар «агент-контрагент».

Численность популяции контрагентов К описывается функциями n;(t), 1 і т, агентов А - функциями g;-(t), 1 j т. Изменение численности фракций контрагентов определяется рядом параметров: - характером увеличения численности контрагентов в отсутствие управляющего воздействия в виде агентов А; - характером увеличения численности соответствующих конкурирующих агентов Л; - характером взаимодействия контрагентов между собой (предполагается, что интеллектуальные агенты, реализующие управляющее воздействие, не взаимодействуют друг с другом). Как мы уже говорили, можно выделить четыре основных вида взаимодействия контрагентов между собой: - сопротивление (resistance) - препятствование размещению контрагента вида; на узле с уже размещенным контрагентом вида і; - вытеснение (displacement) - вытеснение контрагента вида j при размещении контрагента вида і; - порождение (production) - порождение контрагентов вида і контрагентами вида у в ходе их жизненного цикла; - трансформация (transformation) - трансформация (перерождение) контрагентов вида; в контрагенты вида і в ходе их жизненного цикла.

Отсутствие какого-либо взаимодействия описанных видов означает возможность бесконфликтного сосуществования контрагентов друг с другом -в рамках одного узла распределенной системы. Рассмотрим каждый из видов взаимодействия подробнее.

Сопротивление означает, что узлы с уже размещенными на них контрагентами вида j недоступны для размещения контрагентов вида і. Фактически это означает, что доля узлов, доступных для размещения контрагентов вида і, должна быть уменьшена на численность фракции контрагентов вида у. Введем следующее обозначение: Гц — показатель сопротивляемости контрагентов вида] контрагентам вида і. Очевидно, что Yji может принимать всего два значения - 1 или 0. С учетом введенного обозначения доля узлов, доступных для размещения контрагентов вида і, может быть вычислена по формуле:

Если положить Гц = 1 для всех і, то формула (3.1) может быть представлена в общем виде: д _N-Illij Nr]lnj(t) Порождение означает, что контрагенты вида j могут порождать контрагенты вида і. Введем следующее обозначение: Pji — скорость порождения контрагентов вида і контрагентами вида]. Общее число порождаемых контрагентов вида і вычисляется по формуле: Pi = ; t Pji Д(П; = Д{ 2j i Pji nj- О -3) Если определить рц как скорость увеличения численность агентов вида і, то формула (3.3) может быть представлена в общем виде:

Разработка модели взаимодействия агента и контрагента для случая равномерного роста численности контрагентов и интеллектуальных агентов

Главная задача пакета прикладных программ выработки управляющего воздействия - обнаружить возникновение фракций контрагентов, оценить характер их распространения и выработать управляющее воздействие, оптимальное с точки зрения надежности работы и защиты информации в распределенной мультиагентной системе обработки информации.

Таким образом, пакет прикладных программ выработки управляющего воздействия реализует следующие основные функции: Обнаружение фракций контрагентов (негативных процессов); Определение характера распространения фракций контрагентов; Выработка управляющего воздействия.

Необходимо отметить, что понятие «выработка управляющего воздействия» включает в себя не только реализацию некоторого алгоритма противодействия распространению фракций контрагентов, но также определение свойств требуемых интеллектуальных агентов и формирование их фракций («производство» и доставку до определенных узлов распределенной системы обработки информации).

Для обнаружения фракций контрагентов пакет прикладных программ выработки управляющего воздействия использует следующие методы: Сигнатурный анализ [232-246]; Эвристический анализ; Анализ энтропийных характеристик.

Сигнатурный анализ использует базу знаний сигнатур (признаков), сопровождающих протекание негативных процессов. Недостатком данного метода является необходимость регулярного и непрерывного обновления сигнатур. Проще говоря, негативный процесс, сигнатура которого пока не выявлена и не внесена в базу знаний, не будет определен в ходе анализа. С другой стороны, качественное составление сигнатуры позволяет с вероятностью практически равной 100% определять соответствующий негативный процесс. Таким образом, сигнатурный анализ является наиболее эффективным и используется при определении уже известных, ранее хорошо изученных негативных процессов.

Эвристический анализ как один из видов вероятностного анализа на основе набора вероятностных характеристик позволяет выявлять «подозрительные» процессы, которые могут рассматриваться как негативные. В отличие от сигнатурного анализа, эвристический анализ может выявлять негативные процессы неизвестного до этого момента характера. Однако, как и любой вероятностный метод, эвристический анализ подвержен ложным срабатываниям, когда негативным процессом объявляется корректно функционирующая часть распределенной системы обработки информации. Поэтому эвристический анализ хорошо подходит как сигнальное средство раннего оповещения о возможном протекании негативных процессов в системах, где осуществляется постоянный мониторинг необходимых для анализа характеристик [247].

Анализ энтропийных характеристик представляет собой перспективное направление, оценивающее протекание негативных процессов по характеристикам системы в целом. Такими характеристиками могут быть, например, энтропия IP-адресов назначения в передаваемых по сети пакетах. Энтропийный анализ позволяет не только определить факт зарождения негативных процессов, но и за счет своей прямой связи с информационным потенциалом распределенной системы обработки информации определить пространственно-временное распределение негативных процессов по узлам распределенной системы. Недостатком энтропийного анализа является необходимость постоянного сбора и обработки больших объемов информации. Однако, гораздо более существенным является преимущество метода -возможность оценки функционирования распределенной системы обработки информации в целом.

Использование описанных методов обнаружения фракций контрагентов требует наличия в программном пакете выработки управляющего воздействия распределенной базы данных, содержащей необходимую информацию для реализации аналитических функций. Для проведения сигнатурного анализа пакет прикладных программ выработки управляющего воздействия содержит базу данных сигнатур переходных процессов, сопровождающих зарождение и развитие фракций контрагентов. Для проведения эвристического анализа пакет прикладных программ выработки управляющего воздействия содержит базу данных вероятностных показателей, свидетельствующих о возникновения переходных процессов. База данных сигнатур переходных процессов, а также база данных моделей эвристического анализа пополняются в ходе работы программного пакета новыми выявленными сигнатурами и моделями.

Важно заметить, что зарождение фракций контрагентов может быть вызвано различными причинами. Фракции контрагентов могут быть как привнесенными извне (например, вирусы), так и являться следствием изменений во внешней информационной среде (например, непрогнозируемое изменение характеристик входящих информационных потоков), т.е, по сути, зарождаться «изнутри». Четкое разделение этих сценариев крайне важно, т.к. если в первом случае для нормализации работы распределенной системы обработки информации достаточно нейтрализовать все обнаруженные контрагенты, то во втором случае требуется изменить структуру самой распределенной системы обработки информации, чтобы адаптировать ее к изменившимся условиям внешней информационной среды.

В зависимости от вида реализуемого сценария используются два основных модуля программного пакета выработки управляющего воздействия. Для определения характера распространения фракций контрагентов, привнесенных извне, используется модуль анализа, мониторинга и прогнозирования пространственно-временного распределения контрагентов по узлам распределенной системы обработки информации. Данный модуль включает в себя подмодули моделирования роста численности контрагентов в зависимости от характера их распространения, а также определения вероятностного распределения контрагентов по узлам распределенной системы в зависимости от вида информационного потенциала.

Теория и методы исследования информационной среды распределенных систем обработки данных Приходько, Максим Александрович

Обоснование мультиагентного подхода как основного способа описания элементарных квантов информации и распределенных систем

Разработка моделей взаимодействия интеллектуальных агентов с позиций количественной эволюции их фракций

Разработка модели взаимодействия агента и контрагента для случая равномерного роста численности контрагентов и интеллектуальных агентов

Похожие диссертации на Теория и методы исследования информационной среды распределенных систем обработки данных