Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Разработка распределенных гетерогенных вычислительных систем и запуск приложений в распределенной вычислительной среде Мьё Тун Тун

Разработка распределенных гетерогенных вычислительных систем и запуск приложений в распределенной вычислительной среде
<
Разработка распределенных гетерогенных вычислительных систем и запуск приложений в распределенной вычислительной среде Разработка распределенных гетерогенных вычислительных систем и запуск приложений в распределенной вычислительной среде Разработка распределенных гетерогенных вычислительных систем и запуск приложений в распределенной вычислительной среде Разработка распределенных гетерогенных вычислительных систем и запуск приложений в распределенной вычислительной среде Разработка распределенных гетерогенных вычислительных систем и запуск приложений в распределенной вычислительной среде
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Мьё Тун Тун. Разработка распределенных гетерогенных вычислительных систем и запуск приложений в распределенной вычислительной среде : диссертация ... кандидата технических наук : 05.13.18 / Мьё Тун Тун; [Место защиты: С.-Петерб. гос. электротехн. ун-т].- Санкт-Петербург, 2011.- 127 с.: ил. РГБ ОД, 61 11-5/3109

Содержание к диссертации

Введение

Глава 1. Концепция распределенных Grid- вычислений 9

1.1. Общие задачи грида 11

1.2. Требования к Grid архитектуре 14

1.3. Облачные вычисления 16

1.3.1. Катергории Сервисов Облачных Вычислений 17

1.3.2. Типы облачных вычислений 19

1.3.3. Преимущества и недостатки 20

1.4. Grid-компьютинг и Облачные вычисления 21

Выводы по первой главе 23

Глава 2. Обзор вычислительных Grid 24

2.1. Соотношение Grid и Web 26

2.2. Эталонная модель сервис ориентированной архитектуры 28

2.3. Совместное использование средств Grid и SOA 30

Выводы по второй главе 33

Глава 3. Применяемые алгоритмы и технологии 34

3.1. Архитектура построения распределенных систем 34

3.2. Архитектура SOA 36

3.3. Открытая архитектура грид служб 39

3.4. Модель безопасности в Грид 41

Выводы по третей главе 42

Глава 4. Промежуточное программное обеспечение Грид для гетерогенных систем 44

4.1. Грид продукты 46

4.1.1. Silicon Graphics Inc. (SGI)

4.1.2. Tivoli Provisioning Manager (IBM) 48

4.1.3. Sun Grid Engine (Oracle) 51

4.2. Платформа Sun Grid Engine (SGE) 54

4.2.1. Четыре типа политики 56

Выводы по четвертой главе 58

Глава 5. Применение Грид среды для решения комплексных задач на гетерогенных системах 59

5.1. Развертывание промежуточного программного обеспечения 60

5.1.1. Конфигурация Sun Grid Engine 60

5.2. Интеграция Sun Grid Engine и MPICH2 в распределенной вычислительной среде 63

5.2.1. Три метода запуска MPICH2 64

5.2.2. Запуск приложений в распределенной вычислительной среде 65

Глава 6. Решение эталонных задач 68

6.1. Стандартные тесты производительности и их применимость для GRID..71

6.2. Тест Linpack и оценки его эффективности 72

6.2.1. Применения теста NAS для однородных и гетерогенных вычислительных сред 75

6.2.2. Сравнение тестов дальнего взаимодействия NPB для однородной и гетерогенной распределенных вычислительных сред 81

Заключение 85

Список литературы 87q

Введение к работе

Актуальность темы.

Рациональной альтернативой созданию собственного

суперкомпьютерного центра является аренда вычислительных и программных ресурсов в режиме удаленного доступа у центров коллективного пользования, функционирующих при крупных университетах, академических институтах и других организациях. Однако при этом возникает целый комплекс проблем, связанных с обеспечением безопасности вычислительных систем и данных. Указанный комплекс проблем можно решить посредством применения концепции грид вычислений (Grid Computing) и родственной ей концепции облачных вычислений (Cloud Computing) в соответствие с которыми, пользователю предоставляется конечный проблемно-ориентированный сервис, обеспечивающий решение задач на базе ресурсов распределенных вычислительных систем. В соответствии с этим актуальной является задача разработки сервисно ориентированных методов использования систем анализа в распределенных вычислительных средах. В настоящее время эффективные комплексные решения в этой области отсутствуют.

В диссертации рассматривается эксперименты с различными способами запуска приложений в распределенных системах, варьируя возможности как параллельных библиотек, так и операционной среды распределенной системы. Предложен набор математических моделей, на основе которых строится синтетический тест, позволяющий определить эффективность вычислительных сред.

Целью работы является создание набора программных средств для объединения гетерогенных вычислительных ресурсов в единый вычислительный комплекс и подбор (и программная реализация) комплекса математических моделей для тестирования и оптимизации получающихся распределенных вычислительных комплексов.

Для достижения поставленной цели в работе решены следующие задачи:

  1. Тестирование Grid программного обеспечения в новых платформах;

  2. Исследование алгоритмов виртуализации задачи и управления распределенными ресурсами;

  3. Создание комплекса программ реализации Grid системы для запуска комплексных задач.

  4. Разработка математических моделей, на основе которых строится синтетический тест, позволяющий определить эффективность вычислительных сред.

Методы исследований базируются на технологиях проектирования

программного обеспечения, теории надежности информационных систем, теории случайных процессов и потоков.

Научной новизной обладают следующие результаты, полученные автором в процессе выполнения работы:

  1. Новый подход к системным интеграции гетерогенного вычислительного комплекса.

  2. Новый метод интеграции разноуровневых приложений на базе промежуточного программного обеспечения, предоставляемого платформой SGE.

  3. Новые модели и алгоритмы интегрированной работы приложений виртуального полигона в условиях распределенной вычислительной среды.

Достоверность научных результатов и выводов подтверждена результатами тестирования алгоритмов и программного обеспечения, а также практическим использованием разработанных алгоритмических и программных методов и средств. Основные научные результаты.

  1. Осуществлена системная интеграция гетерогенного вычислительного комплекса, состоящего из процессоров разных архитектур.

  2. Предложен набор программных продуктов, реализующих распределенный гетерогенный вычислительный комплекс.

  3. Реализован набор вычислительных моделей, с помощью которых проведено тестирование созданного комплекса.

Научные положения, выносимые на защиту:

  1. Подход к системной интеграции распределенных гетерогенных вычислительных структур.

  2. Программные продукты для создания операционного окружения в распределенной гетерогенной среде.

  3. Адаптированные модели grid NAS Benchmark для тестирования полученных гетерогенных сред.

Практическая значимость составляют:

  1. Набор программных продуктов, осуществляющих системную интеграцию в гетерогенной распределенной вычислительной среде.

  2. Набор моделей, осуществляющих тестирование и оптимизацию в гетерогенной распределенной вычислительной среде.

Внедрение результатов работы. Результаты диссертационной работы внедрены для интеграции ресурсов в вычислительном комплексе ПМ-ПУ СПбГУ и использованы в учебном процессе кафедр ИВТ СПбГМТУ и ВТ СПбГЭТУ «ЛЭТИ».

Апробация работы. Основные результаты работы докладывались и обсуждались на национальных и международных научно-технических

конференциях:

Национальная конференция МОРИНТЕХ 2009, Санкт-Петербург, 2009 г.

Международная конференция «Computer Science & Information Technologies»,Yerevan, Armenia, 2009 r.

Научно-методическая конференция «Телематика-2009, Санкт-Петербург, 2009 г.

4-ая Международная конференция «Distributed Computing and Grid-Technologies in Science and Education». Dubna, 2010 r.

Известия СПбГЭТУ «ЛЭТИ». Санкт-Петербург, 2011 г.

Публикации

Основные теоретические и практические результаты диссертации опубликованы в 6 статьях и докладах, из них по теме диссертации 6, среди которых 1 публикация в ведущем рецензируемом издании, рекомендованном в действующем перечне ВАК. Доклады доложены и получили одобрение на 5 международных, всероссийских и межвузовских научно-практических конференциях перечисленных в конце автореферата.

Структура и объем диссертации. Диссертационная работа состоит из введения, шести глав с выводами, заключения, одного приложения и списка литературы, включающего 125 наименований. Основная часть работы изложена на 127 страницах машинописного текста. Работа содержит 54 рисунка.

Катергории Сервисов Облачных Вычислений

Концепция грида появилась не как абстрактная идея, а? как ответ на появляющиеся потребности в; крупных информационно-вычислительных ресурсах, динамически выделяемых для решения громоздких задач, в научной, индустриальной; административной и коммерческой; областях деятельности. Создание грид-среды подразумевает распределение вычислительных ресурсов-по территориально разделенным сайтам, на которых установлено специализированное программное обеспечение для того, чтобы распределять задания по сайтам и принимать их там; возвращать результаты пользователю, контролировать права пользователей на доступ к тем или.иным. ресурсам, осуществлять мониторинг ресурсов, и так далее.. Общедоступные ресурсы на основе сайта могут включать вычислительные узлы или узлы хранения и передачи данных, собственно данные, прикладное программное обеспечение [18,19].

Вычислительные ресурсы предоставляют пользователю грид-систёмы (точнее говоря, задаче пользователя) процессорные мощности. Вычислительными ресурсами могут быть как кластеры, так и отдельные рабочие станции. При всем разнообразии архитектур любая вычислительная система может рассматриваться: как потенциальный вычислительный ресурс грид-системы. Необходимым условием для этого является наличие НПО, реализующего стандартный внешний интерфейс с ресурсом и позволяющего сделать ресурс доступным для грид-системы [19].

Ресурсы хранения также используют ППО; реализующее унифицированный интерфейс управления и передачи данных. Как и в случае вычислительных ресурсов, физическая архитектура ресурса памяти не принципиальна для грид-системы, будь то жесткий диск на рабочей станции или система массового хранения данных на. сотни терабайт. Основной характеристикой ресурсов хранения данных является их объем.

Информационные ресурсы и каталоги являются особым видом ресурсов хранения данных. Они служат для хранения и предоставления метаданных и информации о других ресурсах грид-системы. Информационные ресурсы позволяют структурировано хранить огромный объем информации о текущем состоянии грид-системы и эффективно выполнять задачи поиска ресурсов [9].

Сетевой ресурс является связующим звеном между распределенными ресурсами грид системы. Основной характеристикой сетевого ресурса является скорость передачи данных. Основными общими задачами грида являются: создание из серийно выпускаемого оборудования широкомасштабных распределенных вычислительных систем и систем обработки, комплексного анализа и мониторинга данных, источники которых также могут быть (глобально) распределены; повышение эффективности вычислительной техники путем предоставления в грид временно простаивающих ресурсов. Приоритет той или иной общей задачи, которая решается с помощью грида, определяется типом грида и характером прикладных областей, в которых он используется.

В результате достижение научных или инженерных целей может оказаться чрезвычайно сложной, очень дорогой, а иногда совершенно невыполнимой задачей. Если же на время выполнения задачи или проекта есть возможность использовать ресурсы множества персональных компьютеров, рабочих станций, кластеров, может быть даже и суперкомпьютеров, а также хранилищ данных, размещенных в разных точках мира и принадлежащих разным людям и учреждениям, то проблема может стать разрешимой. Такую возможность - распределения отдельных частей большой задачи по географически удаленным ресурсам (если сам характер задачи позволяет разделить ее на части) и предоставляет грид-среда [19].

Особенно эффективным такой подход оказывается, когда в рамках какого-либо проекта (исследования или прикладной проблемы) надо выполнить огромный поток или набор однотипных задач. Типичным примером может служить обработка большого объема данных.

Другая общая задача, которую решают системы распределенных вычислений, является вполне традиционной для любого производственного процесса: это повышение эффективности использования оборудования (средств производства). Эта задача становится особенно актуальной, когда производительность средств производства становится выше, чем требуется для удовлетворения локальных потребностей.

Современные же мощные ПК зачастую реально используются не более, чем на несколько процентов свой мощности, и естественной становится задача предоставления неиспользуемых ресурсов для общественных нужд. Аналогичная ситуация характерна и для компьютерных центров, поскольку большие вычислительные задачи появляются у пользователей не постоянно, то есть потребность в выполнении вычислительной работы имеет пиковый по времени характер. Грид-технологии позволяют объединять эти мощности в единую, хотя и географически распределенную вычислительную среду.

В результате пользователь получает возможность запуска своих задач на таком «глобальном кластере», имеющем мощность, существенно превосходящую его собственные ресурсы. При этом и его компьютер (или компьютеры) может быть включен в состав этого глобального кластера, и будет выполнять задачи других пользователей. Результат же вычислений будет получен существенно быстрее, чем при последовательном запуске задач на своем персональном-компьютере. Следует подчеркнуть, что временной (эффект будет связан-- не только- с пиковым- характером появления задач у данного пользователя, что может иметь периодичность в- дни и даже месяцы. Эффект может быть-получен, и просто из-за неравномерного запуска задач в течение дня, в силу чего пикизагрузкшне совпадают для географически разделенных по временным поясам районов (такой- эффект очень хорошо известен и в электричесюшсетях) [30].

Эталонная модель сервис ориентированной архитектуры

Конвергенция средств виртуализации, технологий организации распределенных вычислений и сервис-ориентированных архитектур формирует критически важную точку перегиба в развитии корпоративной ИТ-архитектуры. Сочетание возможностей данных технологий создает условия для решения наиболее важных задач, стоящих сегодня перед предприятиями. Внедрение решений, основанных на стандартах и использующих технологии Grid и SOA, позволяет ИТ-организациям улучшить качество обслуживания пользователей [61].

Совместное использование средств Grid и SOA Причины внедрения Web и Grid, как это может воздействовать на разработку Grid, которая имеет такие же тенденции в смысле масштаба и развертывания. Следует, однако, понимать большую разницу между Web и Grid: несмотря на крупный масштаб интернета количество хост-машин, вовлеченных в типичную транзакцию на Web, все еще незначительно и намного меньше, чем предусмотрено для многих приложений Grid.

Web все больше становится- инфраструктурой для распределенных приложений, где скорее происходит обмен информацией между программами.Такой информационный» обмен обеспечивается семейством рекомендаций XML от W3C. XML предназначен для разметки документов и не имеет никакого установленного словаря тегов; они определены для каждого приложения и используют Document Type Definition (DTD) или XML Schema. Все вместе это обеспечивает инфраструктуру для информационных систем Grid.

Web может достигнуть раскрытия своего полного потенциала, если станет местом совместного использования и обработки автоматизированными , инструментами и людьми, a Semantic Web, определяемая как расширение нынешней сети Web, предназначена сделать для представления знаний то, что Web сделала для гипертекста. Главное, что несет эта технология, — это идея наличия данных в Web, определенных и связанных таким способом, который позволяет использовать их для более эффективного обнаружения, автоматизации, интеграции и повторного использования в различных приложениях [61].

Конвергенция гридов и Web-служб является фундаментальным шагом навстречу реализации, общепринятой социумом, ориентированной на службы инфраструктуры, которая позволяет людям создавать, предоставлять, получать доступ и использовать массу интеллектуальных услуг где угодно и когда угодно, надёжным безопасным способом и с минимальными затратами. Конвергенция средств виртуализации, технологий организации распределенных вычислений и сервис-ориентированных архитектур формирует критически важную точку перегиба в развитии корпоративной ИТ-архитектуры. Сочетание возможностей данных технологий создает условия для решения наиболее важных задач, стоящих сегодня перед предприятиями. Внедрение решений, основанных на стандартах и использующих технологии Grid и SOA, позволяет ИТ-организациям улучшить качество обслуживания пользователей.

Сервис-ориентированная архитектура (SOA) - это такая архитектура приложения, в которой компоненты или «сервисы», имея согласованные общие интерфейсы, используют единые правила (контракты) для определения того, как вызывать сервисы и как они будут взаимодействовать друг с другом. При высокой степени интеграции grid, SOA и технологий виртуализации открытые стандарты позволяют ИТ-сервисам и бизнес-сервисам выходить за границы предприятия. Internet-провайдеры и поставщики услуг связи, играют весьма существенную роль в деле размывания границ между предприятиями и формирования глобальных экосистем [5].

Появление концепции SO А способствует развертыванию» возможностей грид- ресурсов через стандартные интерфейсы, определённые как составная , часть расширений соответствующих служб. Это дает возможность интеграции ресурсов с использованием интерфейсов, специфицированных в открытых стандартах. Кроме того, операции на каждом уровне грид-архитектуры могут быть разработаны таким образом, чтобы обеспечить достаточно лёгкую интеграцию всех уровней архитектуры.

SOA является областью, в, которой грид-компьютинг начинает играть главную роль. Цена адаптации грида может сильно зависеть от требований к интеграции среды, например, функционирования в пределах предприятия, или с включением внешних партнёров. Значительным фактором является также сложность виртуализации, зависящая от сложности грид-приложений.

В настоящее время сосуществует множество различных grid-технологий, которые стимулируют креативность научно-исследовательского сообщества. Однако, возможно, что в конечном счёте будет один Grid, базирующийся на согласованных интерфейсах и протоколах, точно также, как это имеет местом в Web. Внутри этой среды возможно сосуществование виртуальных организаций, которые будут безопасно развиваться и взаимодействовать друг с другом. Такой подход позволит запускать распространения несовместимых гридов, которые препятствуют широкому благожелательному отношению к grid-технологиям [61].

Выводы по второй главе - Эволюция Grid является непрерывным процессом, строго не определенным, который лучше характеризовать как философию, а не технологию. - Развитие Grid-систем, насчитывающих уже три поколения: от систем первого поколения, предвестников современных Grid, через системы второго поколения с программным обеспечением промежуточного уровня для поддержки крупномасштабных данных и вычислений — к системам третьего поколения, где центром внимания становится сервисно-ориентированный подход и распределенное глобальное сотрудничество. - Эталонная модель SOA является общей моделью для понимания значимых сущностей и связей между ними в сервис-ориентированной среде. Данная модель может быть использована как архитекторами систем для создания конкретных SOA, так и для изучения SOA.

Открытая архитектура грид служб

Параллельное операционное окружение (РЕ) является пакетом программного обеспечения, который позволяет параллельное вычисление на параллельных платформах в сетевом окружении. Множество систем такого рода развились за последние годы в жизнеспособную технологию для распределенной и параллельной обработки на различных платформах аппаратных средств. SGE может непосредственно запустить некоторое количество задач с параллельным окружением типа PVM или MPI. Чтобы планировать, такие задания,. SGE обеспечивает простой интерфейс, определяемый! Параллельным Операционным

Кроме того эта система предлагает альтернативный способ длязапуска параллельной задачи: большинство параллельных технологий фактически не обеспечивает надежного управления гетерогенным.ресурсом, хотя,1 достаточно. часто, они более гибкие по сравнению с инфраструктурой grid; поэтому BSGE есть возможность выполнить тесную интеграцию с параллельным операционным окружением. Тесная интеграция-означает, что ответственность за запуск задачи, передается с уровня параллельных библиотек, на уровень. операционного окружения среды grid SGE, гарантируя все отмеченные выше особенности управления ресурсом [124]i

Это новая реализация -MPICH2 стандарта MPI-2 была создана, чтобы заменить и широко использовать реализация MPI-1. Помимо-осуществления стандарта MPI-2, другой, целью был более быстрый запуск. Чтобы дать пользователю большую гибкость, есть 3 осуществленные метода запуска: mpd: основанное на языке Python для скрипта к запуску так называемое кольцо машин, mpdboot - список узлов, они будет демонами запуска- на требуемых машинах, которые могут немедленно использоваться, для выполнения параллельных программ в этом кольце [124].

Безусловным достоинством; интеграции на; системном/ уровне является прозрачность» для. разработчика; в результате; которош перенос программного обеспечения на; распределенную вычислительную платформу требует минимальных усилий; Вместе с тем; это же является ш недостатком, так как универсальная программа не можетвс полной-мере использовать возможности; предоставляемые архитектурой; учесть различия в производительности, доступности и надежности? узлов распределенной системы: Кроме того, решения; позволяющие интегрировать ресурсы на системном уровне, доступны далеко» не: для всех типово распределенных систем. Поэтому, если; требуется в полной мере использовать вычислительные возможности распределенной системы, и при этом? не вводить существенных ограничений) на тип используемых ресурсов, то наиболее предпочтительным представляется именно вариант интеграции ресурсов на уровне приложений.

Вы должны получить сообщение о состоянии, который обеспечивает информацию обо всех рабочих местах в настоящее время, известных в системе Grid Engine. Для каждой работы сообщение о состоянии перечисляет следующие пункты: идентификатор работы, который является уникальным числом, которое включено на представленное имя подтверждения владельца подлинника работы индикатора государства работы; например, г означает выполнение, подчиняется или начала очереди название времени, в которой выполняет работа. myotuntun a master: /sge m] ieh2_mpd myotuntuneeaster : /sge/mpich2 mpds Is Запуск MPICH2 и SGE в распределенной вычислительной среде Файлы требования по умолчанию содержат варианты qsub, чтобы запустить по умолчанию задачу на одной или более линиях. Система Grid Engine предполагает, что можно это сделать на любом хосте. Однако, практически требуется определить предварительные условия на хосте для того, чтобы успешно закончить задачу. Такие предварительные условия включают в себя величину свободной памяти, которую может использовать программа или определённый тип операционной системы.

Например, иногда ограничиваются возможные затраты время центрального процессора. Система Grid Engine обеспечивает пользователям возможность найти соответствующие хосты для их работы без точного знания оборудования кластера и его политики доступа. Пользователи определяют требования на их задачи система Grid Engine позволяет найти соответствующий хост, и загрузить задачу без дополнительных проблем. Это и было продемонстрировано в приведенном модельном примере.

Sun Grid Engine (Oracle)

В настоящее время большое распространение получили тестовые программы взятые из разных предметных областей и« представляющие собой либо модельные, либо реальные промышленные приложения. Такие тесты позволяют оценить производительность компьютера действительно на реальных задачах и получить наиболее полное представление об эффективности работы компьютера с конкретным приложением [2].

Наиболее распространенными тестами, построенными по этому принципу, являются: набор из 24 Ливерморских циклов ( The Eivermore Fortran Kernels, LFK) и пакет NAS Parallel Benchmarks (NPB); в состав которого входят две группы тестов, отражающих различные стороньъ реальных программ вычислительной гидродинамики. NAS тесты являются альтернативной Unpack, поскольку они относительно просты и в то же время содержат значительно больше вычислений, чем, например, Linpack или8 LFK. Однако при всем разнообразии тестовые программы не могут дать полного представления о работе компьтера в различных режимах. 6.2. Тест Linpack и оценки его эффективности

Это программа, предназначенная для решения системы линейных алгебраических управлений с плотной матрицей с выбором главного элемента по строке. Для того чтобы оценить эффективность работы вычислительной системы на реальных задачах, был разработан фиксированный набор тестов. Наиболее известным из них является LINPACK. Он используется для формирования списка Тор500 - пятисот самых мощных компьютеров мира. Однако LINPACK имеет существенный недосгаток: программа распараллеливается; поэтому невозможно оценить эффективность работы коммуникационного компонента суперкомпьютера. LINPACK был выбран, потому что он широко используется, и числа выполнения доступны для почти всех соответствующих систем [2].

Тест состоит из ряда простых синтетических задач: ядер (kernel benchmarks) и псевдо-приложений (application benchmarks), эмулирующих вычисления на реальных задачах (в частности в области вычислительной гидродинамики). Для каждого ядра, эталонные тесты NAS определяют пять классов увеличивающихся рабочих нагрузок, названных S, W, А, В, и С. Класс S удобен для испытания и соответствует системам с максимумом 4 процессоров, Класс W и удобен для настольных автоматизированных рабочих мест. Класс W является подходящим для систем с одним процессором, в то время как Класс А является подходящим для систем до 32 процессоров. Классы В и С удобны для мультипроцессорных систем. Класс В для систем с 32-128 процессорами и класс С для систем до 256 процессоров [4].

В терминологии NPB ядра и приложения могут производить вычисления в определенных классах задач (Problem Classes): «Sample code», «Class A», «Class B», «Class C» , «Class D». В NPB под классом понимается размерность основных массивов данных, используемых в тесте. Другими словами, класс А — это маленькие матрицы, В — большие, С — очень большие, D — огромные. Например, для теста на LU-разложение это будет размерность исходной матрицы: 123, 643, 1023, 4083 для каждого из перечисленных выше классов соответственно.

Кроме ядер, пакет NPB предлагает ряд псевдо-приложений, которые эмулируют работу реальных программ по вычислительной гидродинамике. Отказаться от использования реальных приложений в пользу псевдоприложений решено по нескольким причинам:

Алгоритмы приложений используют описанные выше ядра в том или ином виде и, в конечном итоге, сводятся к решению СЛАУ специального вида (впрочем, как и подавляющее большинство вычислительных задач). Основная масса машинного времени в таких задачах тратится именно на решение СЛАУ. Поэтому приложения можно охарактеризовать как итерационные методы решения СЛАУ. Таких приложений три: LU, SP, ВТ. Комплекс тестов LU (LU Solver). Тест выполняет вычисления, связанные с определенным классом алгоритмов (INS3D-LU по классификации центра NASA Ames), в которых решается система уравнений с равномерно разреженной блочной треугольной матрицей 5x5. Этот тест измеряет сетевую задержку и пропускную способность кэша команд.

SP (Scalar Pentadiagonal). Тест выполняет решение нескольких независимых систем скалярных уравнений - пентадиагональные матрицы с преобладанием недиагональных членов. Этот тест измеряет пропускную способность памяти . 3. ВТ (Block Tridiagonal). Решение серии независимых систем уравнений -блочные трехдиагональные матрицы 5x5 с преобладанием недиагональных элементов. Этот тест измеряет пропускную способность сети и команд кэша.

Алгоритмы SP (от Scalar Pentadiagonal) и ВТ (от Block Tridiagonal) подобны: решение трех несвязанных систем уравнений (в направлениях х, у и z) методом multi-partition scheme. Отличие приложений состоит в структуре матриц: для SP — это пятидиагональная матрица, а для ВТ — блочная трехдиагональная матрица с размером блока 5x5. Этот метод хорошо распараллеливается и производится для оценки работы системы, с плавающей точкой и обеспечивает оптимальную загрузку сети, но требует, чтобы количество узлов в кластере было квадратом целого числа. Тест SP более чувствителен к латентности сети и проводится для оценки эффективности работы межузловых соединений.

Приложение LU решает систему уравнений! с равномерной разряженной блочной структурой- (5x5) методом симметричной последовательной сверхрелаксации (symmetric successive over-relaxation — SSOR), к которой приводят трехмерные уравнения Навье-Стокса. Для распределения данных этому приложению требуется количество узлов, кратных степени двойки. Особенностью этого тестаявляется его критичность ко времени.передачи очень маленьких объемов данных между узлами (размер передаваемого сообщения в этом тесте составляет 40 байт).

Похожие диссертации на Разработка распределенных гетерогенных вычислительных систем и запуск приложений в распределенной вычислительной среде