Содержание к диссертации
Введение
ГЛАВА 1. Системный анализ функционирования корпоративных вычислительных сетей 13
1.1. Технология Ethernet 15
1.2. Стек протоколов ТСРЯР 17
1.3. Сервисы корпоративных вычислительных сетей 21
1.4. Механизмы управления интенсивностью трафика 22
1.5. Механизмы обеспечения гарантированного качества обслуживания...28
1.6. Проблема самоподобия трафика 44
1.7. Выбор подхода для управления трафиком 52
1.8. Постановка задачи исследования 57
1.9. Выводы по первой главе 58
ГЛАВА 2. Моделирование и анализ трафика корпоративных вычислительных сетей 59
2.1. Основные признаки самоподобных процессов в корпоративных вычислительных сетях 59
2.2. Результаты экспериментальных исследований трафика корпоративной вычислительной сети 61
2.3. Математическая модель трафика корпоративных вычислительных сетей на основе фрактального броуновского движения 71
2.4. Анализ возможности прогнозирования трафика корпоративных вычислительных сетей 76
2.5. Выводы по второй главе 79
ГЛАВА 3. Создание алгоритмического обеспечения интеллектуальной системы управления трафиком корпоративных вычислительных сетей на базе неиросетевых технологий 80
3.1. Алгоритм перераспределения полосы пропускания 80
3.2. Прогнозирование трафика корпоративных вычислительных сетей на базе нейросетевых технологий 83
3.3 Алгоритм перераспределения буферной памяти маршрутизаторов 91
3.4. Метод интеллектуального управления трафиком 94
3.5. Выводы по третьей главе 97
ГЛАВА 4. Практическая реализация интеллектуальной системы управления трафиком на базе нейросетевых технологий 98
4.1. Имитационное моделирование с помощью симулятора NS-2 98
4.2 Структура интеллектуальной системы управления трафиком 102
4.3. Программная реализация системы управления трафиком 103
4.4. Результаты внедрения подсистемы прогнозирования трафика 105
в Астраханском государственном техническом университете 105
4.5. Выводы по четвертой главе 110
Заключение 111
Список использованной литературы 113
Приложения 124
- Технология Ethernet
- Сервисы корпоративных вычислительных сетей
- Основные признаки самоподобных процессов в корпоративных вычислительных сетях
- Алгоритм перераспределения полосы пропускания
Введение к работе
Информационные технологии постепенно проникают во все сферы человеческой жизни, что сопровождается резким увеличением количества обрабатываемой информации. Согласно исследованию роста объема информации, первое удвоение накопленной человечеством информации заняло около полутора тысяч лет, тогда как в настоящий момент для этого требуется менее пяти. Это влечет за собой постоянное усложнение технологий современных корпоративных вычислительных сетей, объединяющих требуемые для обработки информации ресурсы. На сегодняшний день сложно представить себе изолированный компьютер, не подключенный к корпоративной вычислительной сети, к сети Интернет. В связи с этим все большую актуальность приобретают вопросы проектирования и управления вычислительными сетями, так как от этого напрямую зависит стоимость их монтажа и эксплуатации.
Повышение эффективности работы корпоративных вычислительных сетей позволит более рационально использовать сетевые ресурсы. Кроме этого возможно ускорение развития сетевых технологий при условии построения адекватных моделей сетевого трафика, изучения теоретических и практических особенностей процессов, происходящих в корпоративных вычислительных сетях.
Анализ внутренних процессов современных корпоративных вычислительных сетей невозможен с помощью традиционной теории телетрафика и систем массового обслуживания. Данной проблемой занимаются российские и зарубежные ученые: В. С. Заборовский, А.Я. Городецкий, А.Ю. Громов, W. Willinger, M.S. Taqqu, A. Erramilli, V. Paxson, С. Huang, M. Devetsikiotis, I. Lambadaris, A. Kaye и др., исследования которых показывают неэффективность использования
классических моделей теории телетрафика для управления и расчета характеристик корпоративных вычислительных сетей. Учитывая огромные потоки информации, целесообразно использовать для анализа и экспериментальных исследований сетевого трафика интеллектуальные методы.
Основная проблема заключается в использовании в течение десятилетий одних и тех же протоколов передачи данных, таких как TCP (Transmission Control Protocol - протокол управления передачей). В данном протоколе содержится встроенный алгоритм ликвидации перегрузок, который динамически уменьшает скорость передачи трафика для ликвидации возникающих в корпоративной вычислительной сети заторов пакетов, что сильно мешает контролировать задержки распространения пакетов. Между тем, внедрение новых сервисов, таких как аудио- и видеоприложения, да и вполне уже распространенных, например, трафика терминальных приложений (сервер - тонкий клиент), заметно повышает требования к задержкам пакетов в сети. Так, приложения компьютерной телефонии начинают терять в качестве предоставляемых услуг уже при задержке в 80-100 мс, которую может внести всего одно сетевое устройство. Необходимо учитывать, что в современных корпоративных сетях обычно несколько последовательно соединенных устройств и общая задержка определяется как сумма задержек в каждом из них. Это особенно плохо сказывается в условиях средней территориально распределенной корпоративной сети -когда внутри отдельных ее сегментов преобладают гигабитные каналы передачи данных, а для связи с остальными сегментами, внешним миром и Интернет, используются гораздо менее скоростные каналы.
Кроме этого, в исследованиях недостаточно полно рассматриваются вопросы управления корпоративными вычислительными сетями в зависимости от текущих условий в сети, перераспределения сетевых
6 ресурсов между различными сервисами и переконфигурирования коммуникационных устройств в зависимости от интенсивности проходящего через них сетевого трафика.
Простейший пример показывает, что если запустить с неболыпим? интервалом времени несколько приложений, использующих протокол FTP" (File Transfer Protocol — протокол передачи файлов), то первые приложения с большой долей вероятности получат большую полосу пропускания в канале передачи данных, чем последующие [71]. Причем разрыв в предоставляемой-полосе может достигать нескольких раз. И хотя для данного» вида трафика задержки^ не очень важны, здесь остается задача экономического характера перераспределения полосы пропускания.
В* связи, с этим возникает актуальный* вопрос повышения эффективности управления1 работой корпоративных вычислительных сетей, из-за неэффективного использования пропускной, способности каналов. Одним из путей' решения данной проблемы, является внедрение интеллектуальных технологий в существующие методы и алгоритмы управления корпоративными сетями и их трафиком. Аппарат нейронных сетей является наиболее перспективным из интеллектуальных технологий.
Актуальность данной тематики подтверждается ее соответствием предложенной Мининформсвязи России и одобренной 18.11.2004 г. Правительством РФ- «Концепции развития рынка информационных технологий в Российской Федерации» и утвержденным 21.05.2006* г Президентом Российской Федерации В.В. Путиным приоритетным направлениям развития науки, техники- и критических технологий Российской5 Федерации в части развития информационно-телекоммуникационных систем и разработки интеллектуальных систем' управления (. №№ Пр-842 и Пр-843).
Цель настоящего исследования заключается в повышении
\
эффективности управления трафиком корпоративных вычислительных сетей на основе методов интеллектуального управления.
В соответствии с поставленной целью в диссертационной работе решены следующие задачи:
проведен системный анализ технического функционирования корпоративных вычислительных сетей;
обоснован выбор математической модели для исследования основных характеристик трафика;
разработан алгоритм перераспределения полосы пропускания на базе нейросетевых технологий;
построена модель краткосрочного прогнозирования сетевого трафика на базе нейронных сетей;,
разработан метод интеллектуального управления трафиком на основе системного анализа корпоративных вычислительных сетей, алгоритмов перераспределения полосы пропускания и буферной памяти маршрутизаторов, нейросетевой модели краткосрочного прогнозирования сетевого трафика;
разработанный метод реализован в виде алгоритмического и программного обеспечения системы управления трафиком на базе нейросетевых технологий;
на основе данного метода управления разработана система управления трафиком;
проведено имитационное моделирование разработанной системы, показавшее повышение эффективности управления трафиком. Объектом исследования является корпоративная вычислительная сеть,
работающая по стеку протоколов TCP/IP, и ее транспортная основа — каналы передачи данных.
Предметом исследования диссертационной работы является
управление трафиком сети, проходящим через каналы связи и отражающим ее фактическое состояние и загрузку.
Методы исследования: методы системного анализа, искусственного интеллекта, теория автоматического управления, математическое моделирование, методы математической статистики.
Научная новизна работы заключается в следующем:
разработан алгоритм перераспределения пропускной способности канала для управления трафиком;
построена модель краткосрочного прогнозирования трафика на базе нейронных сетей;
разработан метод интеллектуального управления трафиком корпоративных вычислительных сетей на базе нейросетевых технологий.
Практическая значимость работы:
Разработано алгоритмическое и программное обеспечение, реализующее систему управления трафиком на базе нейросетевых технологий.
Система краткосрочного прогнозирования Интернет трафика пользователей корпоративной вычислительной сети внедрена в Астраханском государственном техническом университете.
3. Получено свидетельство об официальной регистрации программ для
ЭВМ №2008611442 «Интеллектуальная автоматизированная система
управления коммутаторами корпоративной вычислительной сети» в Реестре
программ для ЭВМ Федеральной службы по интеллектуальной
собственности, патентам и товарным знакам.
Обоснованность и достоверность научных положений, выводов и рекомендаций подтверждается: применением методов системного анализа, искусственного интеллекта; построением нейросетевых моделей,
реализующих методы прогнозирования на базе современных информационных технологий; наглядной визуализацией результатов прогнозирования и имитационного моделирования; апробацией результатов исследования на конференциях различного уровня в России; положительными результатами использования научных разработок в Астраханском государственном техническом университете.
Апробация работы. Результаты работы докладывались и обсуждались на Международном форуме информатизации (Москва, 2002), 14-м Всероссийском семинаре «Нейроинформатика и ее приложения» (Красноярск, 2006), Научно-практической конференции «Инновации в условиях развития информационно-коммуникационных технологий» (Сочи, 2006), 3-й Международной заочной научно-практической конференции «Наука на рубеже тысячелетий» (Тамбов, 2006), 10-й Московской международной телекоммуникационной конференции студентов и молодых ученых (Москва, 2006), 20-й Международной конференции «Математические методы в технике и технологиях - ММТТ-20» (Ярославль, 2007), международной конференции «Современные проблемы и пути их решения в науке, транспорте, производстве и образовании'2007» (Одесса, 2007), а также на конференциях профессорско-преподавательского состава АГТУ.
Диссертация выполнена в соответствии с планом госбюджетных научных исследований, проводимых Астраханским государственным техническим университетом. Полученные результаты отражены в отчете о госбюджетной НИР кафедры «Связь» АГТУ (тема: «Анализ и синтез элементов и устройств телекоммуникационных, информационно-измерительных систем и систем управления»; номер государственной регистрации: 01200509791).
Публикации. Основные теоретические и прикладные результаты диссертационной работы изложены в 8 печатных работах, в том числе 1
статья в журнале по списку ВАК. Зарегистрирован 1 программный продукт в Реестре программ для ЭВМ Федеральной службы по интеллектуальной собственности, патентам и товарным знакам. Без соавторства опубликовано 4 работы.
Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, выводов, списка использованной литературы и приложений. Основная часть диссертации изложена на 139 страницах машинописного текста, содержит 22 рисунка и 3 таблицы. Список литературы насчитывает 93 наименования.
Во введении обоснована актуальность выбранной темы, в общем виде сформулированы цель и задачи исследования, научная новизна и практические результаты, приведено краткое содержание работы по главам.
В первой главе проведен системный анализ предметной области исследования — корпоративной вычислительной сети на основе технологий Ethernet, работающей по протоколам из стека TCP/IP. Подробно рассмотрены классификация различных видов трафика и алгоритмы обеспечения гарантированного качества сервисов.
Приведен обзор основных методов управления интенсивностью и сглаживания передаваемого по сети трафика. Проведен анализ работ в области математических исследования поведения трафика корпоративных вычислительных сетей. Проведен системный анализ интеллектуальных методов аналитической обработки данных. Были выявлены достоинства и недостатки предметно-ориентированных систем, статистических пакетов, нейросетевых пакетов, систем на основе метода ближайшего соседа, методов эволюционного программирования, систем ограниченного перебора, и сделан вывод о целесообразности использования для анализа данных в корпоративных вычислительных сетях систем, основанных на технологии нейронных сетей.
В результате проведенного анализа работ по предметной области сделан вывод и поставлена задача исследования.
Во второй главе обоснован выбор математической модели, описывающей трафик корпоративных вычислительных сетей.
Для обоснования выбора математической модели был проведен эксперимент по сбору реального трафика и его статистическому анализу. Основным результатом проведенных исследований в области анализа трафика современных корпоративных вычислительных сетей является вывод о самоподобии трафика и возможности описания реального трафика математической моделью фрактального броуновского движения.
Проведен анализ самоподобного сетевого трафика на возможность прогнозируемости, которая обосновывается наличием долговременной памяти, персистентности сетевого трафика и бесконечно протяженным интервалом корреляции.
Третья глава посвящена алгоритмической реализации системы интеллектуального управления трафиком корпоративных вычислительных сетей на базе нейросетевых технологий.
На основе математической модели сетевого трафика и существующих методов управления интенсивностью трафика и его сглаживания разработан алгоритм перераспределения полосы пропускания. Выбран метод прогнозирования поступающих пакетов сетевого трафика. Разработана краткосрочная модель прогнозирования сетевого трафика на базе нейросетевых технологий. Разработан алгоритм перераспределения буферной памяти маршрутизаторов. Разработан метод интеллектуального управления трафиком корпоративных вычислительных сетей.
Четвертая глава посвящена практической реализации системы управления трафиком корпоративных вычислительных сетей.
Разработана структура интеллектуальной системы управления
\
трафиком. Для проверки полученных в настоящей диссертационной работе результатов с помощью имитационного моделирования на ПЭВМ был поставлен эксперимент по анализу эффективности метода интеллектуального управления трафиком. Разработан программный продукт «РІнтеллектуальная автоматизированная система управления коммутаторами корпоративной вычислительной сети».
В заключении сформулированы основные результаты работы.
Таким образом, диссертационная работа посвящена задаче создания и реализации системы управления трафиком корпоративных вычислительных сетей на базе нейросетевых технологий, и на защиту выносится следующий круг вопросов:
1. Алгоритм перераспределения полосы пропускания на основе
системного анализа корпоративных вычислительных сетей и математической
модели сетевого трафика, отличающийся динамическим перераспределением
на основе прогнозирования трафика нейросетевыми технологиями.
2. Модель краткосрочного прогноза потребления трафика на базе
аппарата нейронных сетей.
3. Метод интеллектуального управления трафиком на основе
алгоритмов перераспределения полосы пропускания и буферной памяти
маршрутизаторов, нейросетевой модели краткосрочного прогнозирования
сетевого трафика.
Автор выражает благодарность научному руководителю к.т.н., доценту В.В. Жиле, проректору по информатизации АГТУ, д.т.н., профессору О.М. Проталинскому, заведующему кафедрой «Связь», д.т.н., профессору Дмитриеву В.Н., заведующему кафедрой ВТЭ, к.т.н., доценту О.В.Антонову.
Технология Ethernet
Технология Ethernet является наиболее распространенной пакетной технологией передачи данных для корпоративных и локальных вычислительных сетей. При этом под сетевой технологией подразумевается согласованный набор стандартных протоколов и программно-аппаратных средств, достаточный для построения вычислительной сети.
В рамках данной технологии на физическом уровне модели ВОС определяются проводные соединения и электрические сигналы, а на канальном — формат пакетов и протоколы управления доступом. Первый вариант данной технологии на основе коаксиального кабеля был предложен компанией Xerox в 1970 г. Отличительной особенностью данного варианта от остальных технологий являлся метод управления доступом CSMA/CD (carrier sense multiple access/collision detection — множественный доступ с контролем несущей и обнаружением коллизий). Скорость передачи данных составляла всего 3 Мбит/с, но успех этого проекта привел к разработке новой реализации технологии со скоростью 10 Мбит/с, одобренной рабочей группой ШЕЕ 802.3 в 1983 г. и ставшей позднее официальным стандартом. Таким образом, Ethernet стал самой распространенной технологией корпоративных и локальных вычислительных сетей, вытеснив Arcnet, FDDI, Token Ring и другие технологии. К первому стандарту было предложено большое количество добавлений в части расширения набора физических сред передачи данных, скоростей передачи и расширения возможностей.
Главными устройствами, обеспечивающими работу технологии Ethernet, являются двухпортовые повторители - восстанавливающие и передающие сигнал с входного порта на выходной, предназначенные для подключения к сети удаленных устройств.
Многопортовые повторители получили название «концентраторы». Эти устройства служат для передачи информации с одного порта на все остальные одновременно, что является огромной проблемой в больших сетях. И повторители, и концентраторы работают на физическом уровне модели ВОС и в настоящее время практически не применяются.
Для разделения двух сегментов сети, построенных на концентраторах, используется мост - устройство, работающее на канальном уровне ВОС и содержащее таблицы уникальных физических адресов сетевых узлов для фильтрации трафика между сегментами.
Многопортовый мост называется коммутатором; это устройство передает данные непосредственно получателю, в отличие от концентратора -рассылающего трафик всем. Коммутатор работает на канальном уровне модели ВОС и повышает производительность в сети за счет фильтрации и передачи тех данных, которые раньше обрабатывались оконечными устройствами сети, такими как персональный компьютер. Коммутатор хранит в своей памяти таблицу соответствия своего порта физическому адресу устройства, подключенному на этот порт. Таблица формируется постепенно путем отправки пакетов с незнакомыми адресами на все порты коммутатора. При первом включении коммутатора таблица обычно пуста.
Необходимо отметить, что технология Ethernet работает на физическом и канальном уровне модели ВОС, что означает возможность построения только одной сети посредством данной технологии. Физический адрес (МАС) по своей структуре является немаршрутизируемым, абсолютно уникальным и применяется только в широковещательных сетях, таких как Ethernet. Для построения глобальных разветвленных сетей необходимо использовать устройства и протоколы сетевого уровня.
В настоящее время в рамках технологии Ethernet стандарта ЕЕЕ 802.3 реализованы множество стандартов со скоростями передачи 10 (Ethernet), 100 (Fast Ethernet), 1000 (Gigabit Ethernet) и 10000 (10 Gigabit Ethernet) Мбит/с, являющихся обратно совместимыми. Достоинства данной технологии передачи данных: - низкая стоимость одного порта; - простота работы алгоритмов доступа к среде, адресации и передаче данных; - исходная ориентация на обработку пакетных данных; - наличие индустриальных стандартов, и поддержка огромным количеством производителей, что гарантирует почти полную совместимость оборудования; - хорошая масштабируемость — возможность легкого подключения новых узлов.
Наиболее критичными недостатками технологии Ethernet, выявленными в рамках проводимого исследования, являются:
1) необходимость хранения на коммутаторах огромных таблиц MAC адресов, что требует значительных ресурсов памяти, а также большого количества времени для формирования;
2) отсутствие в первоначальных версиях Ethernet механизмов, минимизирующих задержки и потери пакетов при передаче информации определенного рода;
3) перегрузки из-за большого количества широковещательного трафика при одновременной работе в сети 200-500 компьютеров, несмотря на то, что количество узлов в одном широковещательном сегменте сети ограничено стандартом до 1024.
Сервисы корпоративных вычислительных сетей
Для повышения эффективности управления трафиком корпоративных вычислительных сетей необходимо провести классификацию их сервисов, так как в зависимости от вида сервиса меняется и характер трафика.
Рассмотрим предоставляемые корпоративными вычислительными сетями сервисы с точки зрения потери пакетов:
1) сервисы, для которых потеря пакетов не является критичной, т.е., сервисы легко переносящие повторную передачу потерянных пакетов или снижение скорости передаваемой информации;
2) сервисы, для которых потеря пакетов приводит к уменьшению эффективности работы или вообще к ее невозможности.
С точки зрения задержек пакетов сервисы можно разделить: - на не чувствительные к задержкам трафика; - допускающие небольшие задержки трафика без потери функциональности; - допускающие небольшие задержки трафика с частичной потерей функциональности; - сверхчувствительные к задержкам. В основании следующей классификации сервисов лежат протоколы транспортного уровня модели ВОС:
1) использующие UDP протокол (без установления соединения и подтверждения доставки). Данный протокол обычно используют файловые сервисы, а также при передаче аудио- и видеоинформации, примером протокола здесь может служить TFTP (упрощенный ftp).
2) использующие TCP протокол (с установлением соединения и гарантированной доставкой пакетов). Данный протокол используется повсеместно как в файловых сервисах (ftp), так и в электронной почте (smtp, pop), глобальной сети Интернет (http) и т.д.
Еще одним признаком, по которому возможно классифицировать сетевые сервисы является интенсивность передачи потоков трафика:
1) сервисы с постоянной интенсивностью (скорость поступления потока имеет верхнюю границу и может варьироваться в определенных пределах). Примером таких сервисов являются аудио- и видеоконференции.
2) сервисы с непредсказуемой интенсивностью (пульсирующим трафиком). Примером может являться трафик файловых сервисов, когда скорость может резко возрасти от нуля до заполнения всей пропускной способности канала в случае скачивания большого объема файлов.
Исследования показывают, что основным средством дозирования и управления интенсивностью трафика является механизм «корзина маркеров» [3]. На рис. 1 приводится схема реализации данного механизма в рамках общепринятого согласования скорости доступа поступающих пакетов (CAR).
У «корзины маркеров» существует максимально возможное число вмещаемых маркеров - ее размер, который равен согласованному размеру всплеска (Вс).
Алгоритм работы «корзины маркеров» достаточно прост: при поступлении любого пакета данных, который будет обработан в соответствии с механизмом согласования скорости, из «корзины» необходимо «вынуть» соответствующее число маркеров. Размер пакета в байтах и количество «вынимаемых» маркеров совпадают.
Пакет передается в случае, если в корзине было обнаружено достаточное количество маркеров. В противном случае, когда размер поступившего пакета превышает количество доступных для внимания маркеров в корзине, необходимо учитывать расширенный размер всплеска (BE). согласования скорости доступа (CAR)
В случае использования стандартной корзины маркеров может возникнуть следующая ситуация: ВЕ = В В этом случае нехватка маркеров приведет к отбрасыванию пакета вследствие того, что стандартная «корзина маркеров» не поддерживает возможность экстренного увеличения размера всплеска. Расширенный размер всплеска для стандартной «корзины маркеров» всегда равен согласованному размеру всплеска (Вс).
Существует возможность построить механизм «корзины маркеров» с возможностью экстренного увеличения размера всплеска, ВЕ Вс- В данном варианте возможно «занять» недостающие маркеры, в отличие от механизма стандартной корзины маркеров. Введем понятия двух долговых терминов: текущий долг (actual debt — DA) И накопленный долг (compounded debt — Dc). Используя эти понятия, возможно разобраться в «поведении» «корзины маркеров» с возможностью экстренного увеличения размера всплеска.
Текущий долг (DA) представляет собой количество маркеров, занятых в настоящий момент времени. Благодаря накоплению маркеров текущий долг уменьшается через постоянные временные интервалы, определяемые сконфигурированной согласованной скоростью передачи информации. Предположим, что вслед за последним отбрасыванием пакета вы занимали по 100 маркеров для передачи каждого из трех пакетов данных. Таким образом, значение текущего долга (DA) после передачи первого, второго и третьего пакетов равно, соответственно, 100, 200 и 300.
Накопленный долг (Dc) представляет собой сумму текущих долгов (DA) всех пакетов, переданных с момента последнего отбрасывания. В отличие от текущего долга (DA), представляющего собой количество занятых маркеров с момента последнего отбрасывания пакета, накопленный долг (Dc) является суммой текущих долгов всех пакетов, для передачи которых потребовалось занять маркеры с момента последнего отбрасывания пакета. Аналогично предыдущему примеру, предположим, что вслед за последним отбрасыванием пакета вы занимали по 100 маркеров для передачи каждого из трех пакетов данных. Таким образом, значение накопленного долга (Dc) после передачи первого, второго и третьего пакетов равно, соответственно, 100, 300 ( = 100 + 200) и 600 ( = 100 + 200 + 300). После передачи первого пакета (для которой потребовалось занять маркеры) с момента последнего отбрасывания величина накопленного долга (Dc) становится равной величине текущего долга (DA).
Основные признаки самоподобных процессов в корпоративных вычислительных сетях
Современные исследования трафика корпоративных и мультисервисных сетей приводят к неожиданным результатам: традиционные модели и методы расчета [37], применимые к телефонным сетям общего пользования, не могут быть использованы в новых сетях пакетной передачи данных (глава 1 настоящего исследования) Для данных сетей необходимо использовать теорию фрактальных (самоподобных) процессов, основные положения которой приводятся в ряде работ современных исследователей [17].
Различают следующие виды процессов: 1. Параметр Херста лежит в пределах от нуля до 0,5 - процесс не является самоподобным. 2. Параметр Херста равен 0,5 - абсолютно случайный процесс. 3. Параметр Херста больше 0,5 - самоподобный процесс, обладающий свойствами персистентности и длительной памяти, степень самоподобия которого определяется значением данного параметра [65, 66].
Существуют три признака, по которым можно обнаружить самоподобный процесс [49]: 1. Наличие медленно убывающей зависимости (МУЗ).
Для традиционных стационарных случайных процессов типично уменьшение дисперсии с увеличением объема выборки по закону обратной пропорциональности от этого объема. Для самоподобных процессов характерно более медленное уменьшение дисперсии. Медленно убывающая зависимость определяется тем, что дисперсия среднего значения выборки стремится к нулю медленнее, чем функция п1 (п — число измерений).
Процесс X, имеющий автокорреляционную функцию следующего вида: r(k) k-pL1(k) к — оо где 0 Р 1 HLJ- медленно меняющаяся на бесконечности функция; обладает медленно убывающей зависимостью. 2. Наличие долговременной зависимости (ДВЗ)
Если для стационарного случайного процесса характерно убывание коэффициента автокорреляции по экспоненциальному закону, то для самоподобного процесса наблюдается более медленное уменьшение по гиперболическому закону. Свойство долговременная зависимости присутствует в том случае, когда корреляция выборки г(к) стремятся к нулю пропорционально к н, где Н - параметр Херста.
Самоподобным процессом, обладающим свойствами персистентности и длительной памяти, называют процесс, у которого значение параметра Херста: 0,5 Н 1. При 0 Н 0.5, говорят о антиперсистентном поведении процесса.
3. Третий признак определяет характер функции спектральной плотности самоподобного процесса. С позиций спектрального анализа спектральная плотность стремится к +со, когда частота со приближается к 0. Этот признак получил название спектра типа 1/f.
Для проверки степени самоподобия — т.е. вычисления параметра Херста существует несколько методов, например, посредством анализа R/S статистики (нормированного размаха).
Необходимо отметить, что наличие долговременной зависимости в трафике корпоративных вычислительных сетей приводит к появлению пульсаций трафика, которые могут привести к перегрузкам в сети и потере передаваемых пакетов [31,71].
При переходе от сетей с коммутацией каналов к сетям с коммутацией пакетов происходят качественные изменения телетрафика, в связи р чем необходимо уточнять математические модели, описывающих процессы передачи информации в сетях, а также методы их расчета [87]. В случае сетей с коммутацией каналов используются марковские модели, с помощью которых легко вычислить вероятность потерь вызовов, гарантирующую заданное качество обслуживания при выборе емкости каналов.
В случае корпоративных вычислительных сетей, являющихся частным случаем сетей с коммутацией пакетов, необходимо решать задачи, связанные с задержками пакетов, вероятностью их потерь, эффективным использованием полосы пропускания.
Во многих случаях классическая теория телетрафика непригодна, и для решения таких задач используется теория самоподобных процессов. Однако заранее считать трафик самоподобным в канале передачи данных корпоративной вычислительной сети нельзя, необходимо провести соответствующие исследования [72].
Алгоритм перераспределения полосы пропускания
На основе математической модели сетевого трафика и существующих механизмов управления интенсивностью и сглаживания трафика разработан алгоритм перераспределения полосы пропускания (рис. 13).
Алгоритм основан на том, что трафик пользователей корпоративных вычислительных сетей является самоподобным и может быть описан математической моделью на основе фрактального броуновского движения, следовательно, общий трафик представляет собой совокупность потоков от разных пользователей с различными значениями показателя Херста. В случае, когда можно выделить несколько приоритетных потоков из общего трафика, рекомендуется использовать механизмы управления интенсивностью, такие как шейпинг и полисинг.
Главным недостатком данных механизмов является статичность их работы: администратор заранее конфигурирует коммутатор или маршрутизатор корпоративной вычислительной сети под один или несколько определенных приоритетных потоков трафика, и выделенная полоса пропускания не изменяется до следующего конфигурирования устройства. Данный недостаток предлагается исправить с помощью алгоритма, перераспределяющего полосу пропускания через каждый промежуток времени А.
Поток сетевого трафика от различных пользователей формирует временной ряд пакетов X. На основании статистики отсчетов (х],Х2=Хі+А,...рсп) прогнозируется значение следующего отсчета Х(п + на время А вперед. Полученное значение анализируется на адекватность, и в случае положительного результата подсчитывается необходимая пропускная способность С(„ + і), на основании которой выделяется требуемая полоса пропускания. В противном случае значение отсчета Х(„ + для подсчета пропускной способности не учитывается и полоса пропускания канала остается на уровне предыдущего значения интенсивности трафика.
Сбор трафика (блок 1) планируется осуществлять с помощью специального программного обеспечения с соответствующих портов коммутаторов и маршрутизаторов корпоративных вычислительных сетей либо с помощью протокола SNMP, либо с помощью программы-улавливателя (сниффера), собирающей весь трафик с порта устройства.
С помощью специальной программы — анализатора статистики -необходимо производить агрегирование трафика с определенным интервалом (блок 2), откуда отсчеты будут поступать на блок прогнозирования (блок 3). Последний планируется представить в виде собственного программного обеспечения, реализующего существующие методы прогнозирования временных рядов.
Спрогнозированное значение (блок 4) должно быть проверено на адекватность в блоке анализа результатов (блок 5), который в случае положительной проверки выдает значение требуемой полосы пропускания на следующий интервал времени А (блок 7). В противном случае (если в блоке прогнозирования было рассчитано неадекватное значение ожидаемой интенсивности трафика), значение полосы пропускания приравнивается к последнему замеренному значению интенсивности приоритетного потока передаваемого трафика.
Блок перераспределения полосы пропускания (блок 8) планируется реализовать с помощью автоматизированной программы конфигурирования коммуникационных устройств, работающей по протоколам SSH и SNMP.
Данный алгоритм перераспределения полосы пропускания может использовать для подстройки профиля трафика к необходимому значению полосы пропускания как механизм шейпинга, так и механизм полисинга. Механизм шейпинга предлагается использовать в случае, если неприоритетные потоки трафика являются критичными к потере и некритичными к задержке пакетов, механизм полисинга — в противоположном случае, в связи с чем предпочтительнее в использовании является механизм шейпинга.
Основными условиями работы описанного выше алгоритма являются: 1) поддержка механизмов управления интенсивностью трафика коммуникационным оборудованием корпоративных вычислительных сетей; 2) возможность выделения из общего трафика приоритетных и неприоритетных потоков; 3) необходимо выбрать оптимальный метод прогнозирования интенсивности сетевого трафика.