Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Методы расчета показателей и анализ эффективности функционирования большемасштабных распределенных вычислительных систем Павский, Кирилл Валерьевич

Диссертация, - 480 руб., доставка 1-3 часа, с 10-19 (Московское время), кроме воскресенья

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Павский, Кирилл Валерьевич. Методы расчета показателей и анализ эффективности функционирования большемасштабных распределенных вычислительных систем : диссертация ... доктора технических наук : 05.13.15 / Павский Кирилл Валерьевич; [Место защиты: Сиб. гос. ун-т телекоммуникаций и информатики].- Новосибирск, 2013.- 244 с.: ил. РГБ ОД, 71 14-5/179

Введение к работе

Актуальность темы. Распределенные вычислительные системы (ВС) относятся к высокопроизводительным вычислительным средствам. Архитектура распределенных ВС представляется в виде композиции множества элементарных машин или процессоров, соединенных телекоммуникационной сетью. В таких системах все основные ресурсы (не только арифметико-логические устройства, но и память, и средства управления) являются и логически, и технически распределенными. Количество ядер в таких ВС может достигать нескольких миллионов. Именно поэтому подобные ВС относят к масштабируемым и болыпемасштабным. Проектирование и развитие распределенных болыпемасштабных вычислительных систем, в ряду вычислительных средств высокой производительности, занимает одно из приоритетных направлений науки и техники.

Фундаментальный вклад в теорию и практику вычислительных и
телекоммуникационных систем, компьютерных сетей и параллельных
вычислительных технологий внесли советские, российские и зарубежные
учёные, среди которых: Е.П. Балашов, В.Б. Бетелин, B.C. Бурцев,
В.В. Васильев, В.М. Вишневский, В.В. Воеводин, В.М. Глушков,

В.Ф. Евдокимов, Э.В. Евреинов, А.В. Забродин, В.П. Иванников,

М.Б. Игнатьев, А.В. Каляев, И.А. Каляев, Л.Н. Королев, В.Г. Лазарев,
С.А. Лебедев, В.К. Левин, Г.И. Марчук, Ю.И. Митропольский, Д.А. Поспелов,
И.В. Прангишвили, Д.В. Пузанков, Г.Е. Пухов, Г.Г. Рябов, А.А. Самарский,
В.Б. Смолов, А.Н. Томилин, Я.А. Хетагуров, В.Г. Хорошевский,

Б.Н. Четверушкин, Ю.И. Шокин, Н.Н. Яненко, S. Cray, D. Slotnick, I. Foster, M. Flynn, С. Kesselman, J. Dongara, L. Lamport, M. Livny и другие.

По архитектурным возможностям промышленные ВС достаточно близки к вычислительным системам с программируемой структурой, концептуальные основы построения которых сформировались в Сибирском отделении РАН к началу 70-х годов 20 столетия.

Примером отечественных ВС с программируемой структурой могут служить: первая система "Минск - 222" (1965 г.); мультиминимашинные ВС МИНИМАКС (1975 г.) и СУММА (1976 г.); мультипроцессорные живучие системы семейства МИКРОС (МИКРОС-1, 1986 г., МИКРОС-2, 1992 г. МИКРОС-Т 1998 г.); суперкомпьютеры семейства МВС (МВС-100 и МВС-1000,1999 г.).

Объединение ВС в пространственно распределенную среду рассматривается как одна из альтернатив построения сверхпроизводительных средств обработки информации. К ним относятся болыпемасштабные вычислительные системы, важным архитектурным свойством которых является надежность, живучесть. Отказ или восстановление элементарной машины может приводить лишь к изменению производительности ВС и не допускать аварийного завершения решения задач пользователей. Для таких систем важна и организация функционирования в основных режимах (режим решения сложной задачи, обработки наборов задач, обслуживание потоков задач).

Поэтому перспективным является разработка средств анализа и оптимизации живучего функционирования распределенных ВС.

В силу своей болыпемасштабности современные распределенные ВС требуют создания сложных многопараметрических моделей их функционирования, а это приводит к тому, что оценка меры адекватности моделей становится трудновыполнимой. Построение же простых моделей приводит, скорее, к качественным, чем количественным оценкам функционирования систем. Следовательно, создание одновременно простых и эффективных математических моделей с параметрами, основанными на качественной или достоверной, потенциально возможной, статистике, является актуальным.

Цель и задачи исследования

Целью исследования является разработка средств анализа эффективности функционирования болыпемасштабных распределенных (однородных) вычислительных систем.

Для достижения цели поставлены следующие задачи исследования:

разработать подходы для расчета показателей эффективности функционирования болыпемасштабных распределенных (однородных) вычислительных систем;

построить модели для расчета показателей надежности и живучести болыпемасштабных распределенных (однородных) вычислительных систем;

построить модели для расчета показателей осуществимости решения задач на болыпемасштабных распределенных (однородных) вычислительных системах в моно и мультипрограммных режимах;

получить формулы или эффективные оценки для показателей эффективности функционирования ВС, применимые для инженерных расчетов.

Методы исследования. Для решения поставленных задач использовались методы теории вероятностей, случайных процессов, массового обслуживания (ТМО), математического анализа, теории функции комплексного переменного. Экспериментальные исследования осуществлялись путём моделирования на пространственно-распределённой мультикластерной ВС.

Научная новизна. Предложены новые и развиты имеющиеся стохастические модели функционирования распределенных (однородных) вычислительных систем, позволившие рассчитать показатели надежности, живучести и осуществимости решения задач на распределенных ВС.

  1. Разработана методика применения случайного процесса, описывающего функционирование распределенных ВС со структурной избыточностью.

  2. Получена функция распределения времени нахождения распределенных ВС в состоянии низкой производительности.

  3. Разработан алгоритмический и программный инструментарий анализа эффективности решения задач на распределенных ВС.

Практическая значимость и реализация работы. Разработанные модели и методы, полученные формулы и алгоритмы являются практическим

инструментом анализа эффективности функционирования болыпемасштабных распределенных (однородных) ВС.

Основные результаты исследований нашли применение в работах по развитию программного обеспечения для пространственно-распределенной мультикластерной ВС Центра параллельных вычислительных технологий (ЦПВТ) ФГОБУ ВПО «СибГУТИ» и Лаборатории ВС ИФП СО РАН. Основные этапы работы выполнены в рамках ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007-2013 годы» (ГК № 02.514.11.0002, Разработка программных технологий для развития российского сегмента Грид систем параллельного программирования, систем компьютерной графики) и «Научные и научно-педагогические кадры инновационной России» (ГК № 02.740.11.0006, Проведение исследований в области распределённых вычислительных систем и развитие научно-учебного центра параллельных вычислительных технологий ФГОБУ ВПО «СибГУТИ»; грант в виде субсидий №8228, Разработка алгоритмических и программных средств моделирования наноструктур с квантовыми точками на информационно-вычислительных системах), при поддержке грантов Российского фонда фундаментальных исследований №№ 97-01-00883, 99-07-90206, 00-01-00126, 01-01-06246, 02-01-06518, 02-07-90379, 05-07-90009, 06-07-01817, 07-07-00142, 08-08-00300, 09-07-00185, 10-07-00157, 12-07-00145, 13-07-00160, Совета Президента РФ по поддержке ведущих научных школ №№ НШ-9505.2006.9, НШ-2121.2008.9, НШ-5176.2010.9, НШ-2175.2012.9 и ФГОБУ ВПО «СибГУТИ» (2008-2013).

Получено три Свидетельства о государственной регистрации программ для ЭВМ (RU) №№ 2012614642, 2012613763, 2013613353.

Результаты работы внедрены в учебный процесс ФГОБУ ВПО «СибГУТИ», в систему мультипрограммирования пространственно-распределенной мультикластерной ВС ЦПВТ ФГОБУ ВПО «СибГУТИ», в проект Сибнет ОАО «Ростелеком», что подтверждается соответствующими актами.

Автор защищает

  1. Модели и методы расчета показателей надежности и живучести болыпемасштабных распределенных вычислительных систем со структурной избыточностью и без. Функцию распределения времени пребывания ВС в состоянии низкой производительности.

  2. Модели и методы расчета показателей осуществимости параллельного решения задач на болыпемасштабных ВС в основных режимах функционирования (решения сложной задачи, решения задач набора, обслуживания потоков задач).

Личный вклад автора заключается в проведении теоретических исследований, обосновании путей их практической реализации и авторском сопровождении при внедрении.

В диссертации обобщен комплекс исследований, выполненных ведущей научной школой в области анализа и организации функционирования болыпемасштабных распределенных вычислительных систем (руководитель -

чл. корр. РАН Хорошевский В.Г.), лично автором или при участии сотрудников ФГОБУ ВПО «СибГУТИ» и ИФП СО РАН.

Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на следующих международных, всероссийских, российских и региональных конференциях: Bialystok, Poland (2006), Germany, Ilmenau (2000), пос. Кациавели, Крым, Украина (2006, 2008), Киев, Украина (2008), Минск, Беларусь (2012), пос. Дивноморское Геленджикского района (2001, 2007, 2009, 2010, 2012, 2013), Новосибирск (1994, 1995, 1998, 2000 -2002, 2006-2013), Томск (2009, 2010, 2012).

Публикации. По теме диссертации опубликовано 65 работ, в том числе 1 монография, 20 статей (14 из перечня ВАК), 3 свидетельства о государственной регистрации программы для ЭВМ.

Структура и объем работы. Диссертация состоит из введения, 5 глав, основных результатов и выводов, списка литературы (332 наименования) и приложений. Основное содержание работы изложено на 234 страницах, содержит 7 таблиц и 88 рисунков.

Похожие диссертации на Методы расчета показателей и анализ эффективности функционирования большемасштабных распределенных вычислительных систем