Электронная библиотека диссертаций и авторефератов России
dslib.net
Библиотека диссертаций
Навигация
Каталог диссертаций России
Англоязычные диссертации
Диссертации бесплатно
Предстоящие защиты
Рецензии на автореферат
Отчисления авторам
Мой кабинет
Заказы: забрать, оплатить
Мой личный счет
Мой профиль
Мой авторский профиль
Подписки на рассылки



расширенный поиск

Оптимизация производительности многопроцессорных вычислительных систем при решении задач методом молекулярной динамики Андреев Вячеслав Вениаминович

Оптимизация производительности многопроцессорных вычислительных систем при решении задач методом молекулярной динамики
<
Оптимизация производительности многопроцессорных вычислительных систем при решении задач методом молекулярной динамики Оптимизация производительности многопроцессорных вычислительных систем при решении задач методом молекулярной динамики Оптимизация производительности многопроцессорных вычислительных систем при решении задач методом молекулярной динамики Оптимизация производительности многопроцессорных вычислительных систем при решении задач методом молекулярной динамики Оптимизация производительности многопроцессорных вычислительных систем при решении задач методом молекулярной динамики Оптимизация производительности многопроцессорных вычислительных систем при решении задач методом молекулярной динамики Оптимизация производительности многопроцессорных вычислительных систем при решении задач методом молекулярной динамики Оптимизация производительности многопроцессорных вычислительных систем при решении задач методом молекулярной динамики Оптимизация производительности многопроцессорных вычислительных систем при решении задач методом молекулярной динамики Оптимизация производительности многопроцессорных вычислительных систем при решении задач методом молекулярной динамики Оптимизация производительности многопроцессорных вычислительных систем при решении задач методом молекулярной динамики Оптимизация производительности многопроцессорных вычислительных систем при решении задач методом молекулярной динамики
>

Диссертация - 480 руб., доставка 10 минут, круглосуточно, без выходных и праздников

Автореферат - бесплатно, доставка 10 минут, круглосуточно, без выходных и праздников

Андреев Вячеслав Вениаминович. Оптимизация производительности многопроцессорных вычислительных систем при решении задач методом молекулярной динамики : диссертация ... кандидата технических наук : 05.13.18 Ижевск, 2007 143 с., Библиогр.: с. 124-139 РГБ ОД, 61:07-5/4798

Содержание к диссертации

Введение

ГЛАВА 1. Метод молекулярной динамики 15

1.1. Молекулярная динамика 17

1.2. Алгоритмы метода молекулярной динамики 21

1.3. Потенциалы взаимодействия 28

1.4. Параллельные алгоритмы ММД 30

1.5. Метод декомпозиции атомов 32

1.6. Метод декомпозиции пространства 34

1.7. Метод декомпозиции силы 37

1.8. Современные программы ММД 42

1.9. Выводы по главе 1 43

ГЛАВА 2. Паралельныи алгоритм декомпозиции времени для метода молекулярной динамики 45

2.1. Метод декомпозиции времени 45

2.2. Организация вычислений в методе декомпозиции времени при разбиении пространства модели на расчетные зоны одинакового размера по одной координатной оси 63

2.3. Организация вычислений в методе декомпозиции времени при разбиении модели на расчетные зоны различного размера по одной координатной оси 75

2.4. Организация вычислений в методе декомпозиции времени при разбиении модели на расчетные зоны по двум координатным осям 82

2.5. Организация вычислений в методе декомпозиции времени при разбиении модели на расчетные зоны по трем координатным осям 92

2.6. Эффективность и быстродействие алгоритмов ММД использующих метод декомпозиции времени 99

2.7. Выводы по главе 2 100

ГЛАВА 3. Использование метода декомпозиции времени для алгоритмов и программ ммд 102

3.1. Особенности построения модели для метода декомпозиции времени 102

3.2. Использование много частичных потенциалов взаимодействия 105

3.3. Расчет временного шага 106

3.4. Влияние быстродействия каналов межпроцессорной связи на производительность МВС при использовании метода декомпозиции времени в ММД 107

3.5. Тестирование параллельного алгоритма ММД использующего метод декомпозиции времени 109

3.6. Тестирование надежности параллельной программы ММД использующей метод декомпозиции времени 112

3.7. Выводы по главе 3 122

Заключение 122

Список литературы

Введение к работе

Актуальность темы

Моделирование физических процессов методом молекулярной динамики (ММД) очень широко используется сегодня в самых различных областях научных исследований: разработка и изучение наноматериалов [106], изучение, белков и биологических процессов [99,101-104], динамики жидких металлов [100], радиационного воздействия [38,40,43], Липатовым A.M. разрабатываются основы отработки твердых ракетных топлив [98] с использованием ММД и т.д. . При этом применение метода молекулярной динамики постоянно расширяется, оказывая все больше влияние на развитие научных исследований в самых различных областях знаний. Не смотря на то, что разработке параллельных вычислительных систем и программ уделяется большое внимание [107-125], основным фактором, сдерживающим все более широкое использование метода молекулярной динамики, является недостаточная . производительность компьютеров и недостаточная эффективность алгоритмов и программ [51, 52, 73-80, 86-90]. Разработанные на сегодняшний день методы построения параллельных алгоритмов для решения задач ММД на многопроцессорных вычислительных системах (МВС) [45-46, 48-52, 59,69,95] не позволяют построить достаточно эффективные и быстродействующие программы.

В настоящий момент с активным использованием ММД в таких областях как биология, нанотехнология и разработка наноматериалов потребность в больших объемах вычислений ММД многократно возросла. Широкое использование многопроцессорных вычислительных систем в научных исследованиях сделало актуальной задачу разработки эффективных методов построения параллельных алгоритмов и программ для расчета задач ММД содержащих миллионы атомов и использующих много частичные потенциалы межатомного взаимодействия.

7 Целью работы является разработка метода параллельной обработки информации, позволяющего проектирование параллельных алгоритмов для решения задач методом молекулярной динамики, обеспечивающих эффективное использование ресурсов МВС и линейное увеличение производительности МВС при использовании двух частичных и много частичных потенциалов межатомного взаимодействия.

Задачи исследования;

разработка метода анализа параллельных процессов возникающих при решении задачи ММД на многопроцессорных вычислительных системах, обеспечивающего полное и объективное описание процесса параллельной обработки и выявляющего все существенные характеристики используемого параллельного алгоритма;

исследование различных способов разбиения пространства модели между процессорами вычислительной системы на подпространства и различных вариантов очередности расчета подпространств модели;

исследование влияния на быстродействие и эффективность многопроцессорной вычислительной системы различных способов синхронизации в сети межпроцессорной передачи данных в процессе решения задачи:

разработка эффективных вычислительных схем и алгоритмов для организации параллельной обработки при расчете задач методом молекулярной динамики;

разработка1 технологии построения модели и создание программного обеспечения для построения, редактирования и отображения процесса построения Зх мерных моделей:

разработка метода параллельной обработки (метода декомпозиции времени), обеспечивающего построения параллельных алгоритмов ММД,

8 позволяющих эффективное использование ресурсов многопроцессорных вычислительных систем;

- проведение экспериментальных исследований разработанных методов, алгоритмов и программ на разработанной и построенной многопроцессорной вычислительной системе.

Объектом исследования являются метод молекулярной динамики, методы параллельной обработки, используемые в методе молекулярной динамики, параллельные алгоритмы для решения задач методом молекулярной динамики, методы организации межпроцессорного обмена в МВС при решении задач методом молекулярной динамики.

Предметом исследования являются методы параллельной обработки и параллельные алгоритмы для решения задач ММД, способы организации межпроцессорного обмена в МВС при решении задач ММД, реализующие эти методы и алгоритмы, программы, способы графических отображений результатов расчета, а также оценки их эффективности и возможностей практической реализации при решении различных задач связанных с расчетами методом молекулярной динамики.

Методы исследования. В работе применялись теоретические и экспериментальные методы исследования.

Теоретические исследования основаны на использовании дифференциального исчисления, математической логики, теории формальных языков, вычислительной математике и теоретической физике.

В экспериментальных исследованиях разработанных методов и алгоритмов использовались вычислительные методы и компьютерные средства обработки, такие как методы моделирования множества взаимодействующих частиц, цифровой обработки изображений и машинной графики, прикладного и системного программирования.

Достоверность изложенных положений работы подтверждается результатами практического применения разработанных методов, алгоритмов и программных средств, для моделирования множества

9 взаимодействующих частиц ММД, научными трудами и апробациями созданного научно-технического продукта на представительных научных форумах. Достоверность и обоснованность полученных в работе результатов и выводов подтверждается при их сравнительном анализе с известными результатами современных исследований и разработок.

Теоретические положения, установленные в работе, обосновываются адекватным выбором исходных посылок и последовательным применением математического аппарата при получении из них выводов, а также верификацией этих выводов данными систематического исследования полученных аналитических результатов.

Достоверность экспериментальных результатов подтверждается их согласованностью с теоретическими выводами, обоснованным выбором корректных критериев при построении алгоритмов обработки информации, воспроизводимостью результатов на больших объемах экспериментального материала при выполнении серий вычислительных экспериментов с большим количеством изменяемых значений влияющих параметров, наглядностью интерпретации полученных практических результатов расчета.

На защиту выносятся результаты разработки и исследования методов параллельной обработки для решении задач методом молекулярной динамики, параллельных алгоритмов ММД, результатов практической реализации этих методов и алгоритмов для метода молекулярной динамики, в том числе:

- метод параллельной обработки (метод декомпозиции времени) обеспечивающий разработку эффективных параллельных алгоритмов для численного решения системы дифференциальных уравнений классической механики Ньютона при расчете траекторий движения отдельных частиц, взаимодействие между которыми задается потенциалом взаимодействия, позволяющим рассчитывать одновременно множество временных шагов интегрирования;

- параллельные алгоритмы и программы для решения задач методом
молекулярной динамики, использующие метод декомпозиции времени для
организации параллельной обработки и обеспечивающие эффективное
использование ресурсов МВС и линейный рост производительности МВС
при увеличении количества процессоров участвующих в решении задачи;

технология и программное обеспечение для организации параллельного расчета, траекторий движения взаимодействующих частиц, реализующих разработанные средства и методы расчета задач ММД;

результаты экспериментальных исследований разработанных средств и методов и оценки их эффективности и возможностей использования при решении реальных задач, связанных с методом молекулярной динамики.

- результаты анализа и численных тестовых расчетов надежности,
эффективности и быстродействия метода организации параллельных
вычислений.

Научная новизна полученных результатов определяется впервые проведенными исследованиями, в результате которых разработан новый метод параллельной обработки (метод декомпозиции времени) для организации параллельных вычислений в методе молекулярной динамики позволяющий разрабатывать эффективные и быстродействующие параллельные алгоритмы и программы для расчета задач методом молекулярной динамики и обеспечивающий возможность одновременно рассчитывать множество временных шагов интегрирования, в том числе:

- разработаны параллельные алгоритмы и программы для метода
молекулярной динамики, использующие для параллельной обработки метод
декомпозиции времени и обеспечивающие эффективное использование
ресурсов МВС (до 95% и более) и линейное нарастание производительности
МВС при увеличении количества процессоров участвующих в расчете
задачи;

исследованы возможности метода декомпозиции времени при использовании его для параллельной обработки в методе молекулярной динамики для различных способов разбиения модели на подпространства;

проанализированы различные способы разбиения модели на подпространства и определены особенности различных вариантов очередности расчета расчетных зон при разбиении пространства модели по нескольким координатным осям;

в результате сравнительного анализа методов параллельной обработки разработанных для ММД установлена более высокая эффективность и быстродействие метода декомпозиции времени при расчетах с использованием многочастичных потенциалов взаимодействия, обусловленная характерным для метода декомпозиции времени отсутствием разбиения пространства модели между процессорами для расчета любого конкретного временного шага интегрирования;

предложена и обоснована технология построения модели, создано программное обеспечение, реализующее эту технологию и использованное при выполнении экспериментальных исследований, результаты которых позволили определить оценки эффективности и быстродействия метода декомпозиции времени при использовании его для параллельной обработки в ММД.

Практическая ценность работы заключается в применении новых эффективных методов параллельной обработки и параллельных алгоритмов для решения задач методом молекулярной динамики.

Разработан метод параллельной обработки, позволяющий

разрабатывать параллельные алгоритмы, которые могут рассчитывать одновременно множество временных шагов интегрирования при решении задач методом молекулярной динамики.

Разработанные математические методы и алгоритмы позволяют исследовать организацию параллельной обработки в методе молекулярной

12 динамики с использованием метода декомпозиции времени и анализировать эффективность различных найденных решений.

Разработанные методы параллельной обработки и параллельные алгоритмы для метода молекулярной динамики обеспечивают эффективное использование ресурсов многопроцессорных вычислительных систем и позволяют получить линейное нарастание производительности МВС при увеличении количества процессоров участвующих в расчете задачи.

Разработана и протестирована программа для решения задач методом молекулярной динамики использующая метод декомпозиции времени для организации параллельных вычислений, обеспечивающая эффективное использование МВС (более 95%) и имеющая линейный рост производительности при увеличении количества процессоров участвующих в решении задачи.

Реализация работы состоит в выполнении Международного контракта между Академией Наук СССР (ФТИ УрО г. Ижевск) и Академией наук Венгерской республики (Институт САМАЛК г. Будапешт).

Апробация работы

Основные результаты диссертационной работы и ее отдельные части докладывались и были представлены на российских и международных конференциях:

Институт математики и механики УрО АНСССР Свердловск 1988 год «Проблемно-ориентированные многопроцессорные вычислительные системы»,

Институт САМАЛК г. Будапешт, 1989 год, «Параллельные алгоритмы и программы»,

Институт прикладной логики г. Будапешт, 1990 год «Параллельные алгоритмы и программы»,

Международной выставке СОМТЕХ г. Будапешт 1990 год, «Вычислительные системы в научных исследованиях»,

Международная выставка г. Дебрецен Венгерская республика 1990 год, «Моделирование физических процессов»,

Международный центр теоретической физики г. Триест Италия 1994 год «Международная школа по параллельным вычислениям и их применению в физике химии и материаловедении»

Публикации по теме диссертационной работы

Основные материалы по теме диссертации отражены в 28 научных работах и отчетах НИР по Международным контрактам с Академией наук Венгерской республики Институт САМАЛК и Институт прикладной логики, в том числе 1 статья в списке изданий, утвержденном ВАК, 8 статей в научно-технических журналах и сборниках, 3 препринта, 16 научно-технических отчетов по НИОКР.

Объем и структура диссертационной работы

Диссертация содержит введение, 3 главы и заключение, изложенные на 139 с. машинописного текста, а также 2 приложения. В работу включены 44 рисунка, 3 таблицы и список литературы из 128 наименований. В приложении представлены акты по тестированию программы ММД использующей метод декомпозиции времени на МВС.

Основное содержание работы

Во введении к диссертации на основании анализа представленного обзора публикаций по алгоритмам и программам ММД сформулирована актуальность исследования и выбраны направления исследований.

14 Определена цель и конкретные задачи работы, представлены основные полученные результаты, их научная и практическая значимость, приведены положения, выносимые на защиту, охарактеризованы основные разделы диссертации.

В первой главе представлена постановка задачи расчета траекторий движения атомов, приведены алгоритмы метода молекулярной динамики. Представлены методы организации параллельных вычислений в методе молекулярной динамики и результаты анализа параллельных алгоритмов ММД использующих для параллельной обработки методы пространственной и атомной декомпозиции. Рассмотрены и проанализированы характеристики конкретных программных систем предназначенных для решения задач ММД на МВС.

Во второй главе представлены результаты исследований по разработке метода декомпозиции времени для организации параллельной обработки в методе молекулярной динамики. Выполнен анализ возможностей и ограничений метода декомпозиции времени при использовании его в ММД.

В третьей главе представлены результаты испытаний алгоритмов и программ метода молекулярной динамики использующих метод декомпозиции времени для организации параллельной обработки. Дано описание конкретных параллельных алгоритмов для ММД. Приведены результаты тестовых испытаний разработанных алгоритмов и программ.

В заключении сформулированы основные результаты диссертационной работы.

Потенциалы взаимодействия

Для моделирования обычно применяются центральные парные потенциалы взаимодействия. Чаще всего потенциал парного взаимодействия (ППВ) используется в форме Борна-Майера (29), Ленарда-Джонса (30), Морзе (31). u(r) = A exp[7p(r -г0)/г0] (29) u(r) = s[(r0 lr)u 2(r0/rf] (30) u{r) = Z){exp[-2ar(r - rx) - 2 exp[-a(r - r,)]} (31)

В этих случаях при расчете межатомного взаимодействия основное время расходуется на вычисление стандартных функций. Более удачное представление ППВ в виде полинома третьей степени, однако применение его ограничено, поскольку в многих процессах важен вклад ангармонических членов, а третья производная терпит разрыв. Удачное, представление ППВ было предложено в [36] , в виде полинома обратных четных степеней междуатомного.расстояния. и(г) = и0+ щг 2 + и2г + щг 6 + иАг ь + и5г ]0 (32)

Это представление ППВ с одной стороны позволяет при вычислении сил парного взаимодействия не использовать стандартные функции, а с другой обеспечивает минимальное количество интервалов разбиения потенциала. Как правило, оно не превышает 6 участков при обрезании потенциала между 4й и 5й координатными сферами. Вычисление сил парного взаимодействия требует 6 операций умножения и 4 операции сложения. Программное представление потенциала в виде полинома обратных четных степеней (32) было реализовано в программах MOLDYN [36] и MMDYN [37] и использовано при расчетах в работах [38,39,40,41,42,43].

Табличная форма представления потенциала межатомного взаимодействия. В этом случае потенциал представленный в любом из аналитических выражений пересчитывается в пары дискретных значений г, и с заданной точностью. По результатам расчетов строится таблица. Размер таблицы с векторами значений г, и зависит от необходимой точности представления потенциала и радиуса обрезания потенциала взаимодействия. При вычислении взаимодействия между атомами /, j вначале определяется расстояние f".. между атомами. Значение расстояния Г.. используется для индексирования таблицы в которой представлены дискретные значения г,и. Затем из таблицы выбираются сразу несколько значений (например ur_2,ur_vur,ur+x,urJrl\ которые при использовании в расчетах сглаживаются соответствующими полиномами по пяти точечной или трех точечной схеме.

Построение параллельных программ для метода молекулярной динамики имеет все те проблемы, с которыми сталкиваются разработчики параллельных программ для сложных универсальных задач. Распределение вычислений между процессорами многопроцессорной вычислительной системы требует выполнения нескольких противоречивых задач. Максимальная загрузка процессоров, своевременная передача данных от одних процессоров к другим, минимизация объема передаваемых данных, отсутствие конфликтов в межпроцессорной сети передачи данных.

Много работ посвящено исследованию методов параллельной обработки для параллельных алгоритмов ММД и их программным реализациям [44-50]. На сегодняшний день разработано три метода параллельной обработки для алгоритмов ММД. Метод декомпозиции атомов Replicated-data (RD) предложенный Smith [45]. Метод декомпозиции силы Force Decomposition (FD) [46-48] предложенный S. J. Plimpton и метод декомпозиции пространства Spatial decomposition (SD) [49, 50], предложенный D. Fincham.

На практике наиболее успешными решениями построения параллельных программ для ММД стали принцип декомпозиции пространства SD [51-71]. Основная идея алгоритма декомпозиции пространства состоит в том, что пространство модели распределяется между процессорами МВС и каждый процессор МВС обрабатывает только ту область подпространства модели которая ему выделена. Список основных наиболее удачных параллельных алгоритмов метода молекулярной динамики приведен в таблице 1.

Метод декомпозиции пространства

Метод декомпозиции силы Force-Decomposition (FD) предложенный S. J. Plimpton, В. A. Hendrickson [91,92,93] по существу является одним из частных случаев метода декомпозиции атомов. Основная идея метода в распределении атомов между процессорами таким образом, чтобы каждый процессор рассчитывал атомы своей подматрицы силы. В отличие от алгоритмов декомпозиции атомов в алгоритмах декомпозиции силы используют блочную декомпозицию матрицы силы, а не строчную, как в алгоритме декомпозиции атомов. Метод декомпозиции силы позволяет проектировать алгоритмы, которые по быстродействию находятся между методами SD декомпозиции пространства и RD декомпозиции атомов. Пример распределения блоков матрицы силы между процессорами приведен на рисунке 5.

В параллельных алгоритмах построенных по методу декомпозиции силы каждому из Р процессоров назначается подмножество атомов размером NIP. Для удобства будем полагать, что N - число кратное Р. Каждый процессор вычисляет силы только на своем подмножестве NIP атомов и модифицирует их позиции и скорости в процессе моделирования независимо от того, куда они двигаются в моделируемом пространстве.

Наиболее распространенный способ построения алгоритма декомпозиции силы состоит том, что для всей модели создается матрица сил F размером Nx N. Каждый элемент матрицы F-, представляет собой силу взаимодействия атома / по отношению к атому j. Для хранения координат и сил создаются х и / как векторы длины N, которые хранят позиции и полную силу каждого атома. Для трехмерного варианта модели необходимо хранить три координаты атома, xiyi,zr Согласно этих определений в алгоритме FD каждому процессору назначается прямоугольная подматрица матрицы F, которая состоит из NIP атомов как показано в рисунке 5. Если z индексирует процессоры от 0 до Р — 1, то процессор Pz вычисляет и модифицирует NIP атомов. Подматрица Fz назначенная для расчетов процессору Р2 имеет размер Чтобы вычислить взаимодействие с атомами не входящими в Fz процессор Р2 должен иметь часть векторов х и х которые обозначим как ха и х . Индексы а и J3 индексируют интервал от 0 до 4Р — 1, указывая позиции строк и столбцов подматрицы Fz закрепленных за процессором Pz.

Основным недостатком метода декомпозиции силы является то, что для каждого процессорного узла в системе объем памяти и время, затрачиваемое на связь, находятся в сильной зависимости от количества атомов в модели 3N/JP. Поэтому при большом количестве атомов в модели время, затачиваемое МВС на межпроцессорную связь, достаточно велико и алгоритм становится малоэффективным.

Алгоритмы, использующие метод декомпозиции силы, можно охарактеризовать следующими параметрами, приведенными для одного процессора в течение одного шага интегрирования [51]. 1. Объем вычислений для одного процессора при вычислении одного N N временного шага пропорционален р 4Р 2. Время приема-передачи для одного процессора при вычислении одного временного шага пропорционально 3. Объем памяти, необходимый процессору для хранения данных при расчете одного временного шага пропорционален 3NI у/Р 4. Количество соседних процессоров, к которым нужен доступ Р

Оценки и сравнительные испытания всех трех методов построения параллельных алгоритмов для ММД проведенные Plimpton [51] показывают, что все три метода значительно отличаются друг от друга по быстродействию. Результаты этих испытаний приведены на рисунке бив таблице 2. По результатам испытаний можно сделать вывод, что алгоритмы декомпозиции пространства имеют большее быстродействие при увеличении количества атомов в модели по сравнению с методами декомпозиции атомов и декомпозиции силы.

Организация вычислений в методе декомпозиции времени при разбиении модели на расчетные зоны различного размера по одной координатной оси

Рассмотрим организацию вычислительного процесса в ММД при использовании метода декомпозиции времени в случае, когда различные типы расчетных зон имеют различные размеры. Для примера будем использовать разбивку модели на расчетные зоны по одной из координатных осей, например z. Пусть радиус потенциала взаимодействия атомов в модели захватывает пять слоев ячеек с. В этом случае минимальный размер расчетной зоны sw составит пять слоев ячеек. Размер расчетных зон s0,sd,sc,sтипа примем равным одному слою ячеек с. Тогда разбивка моделируемого пространства на расчетные зоны будет иметь вид представленный на рисунке 21. Для процессора Р1 на момент времени t0 все 80 расчетных зон будут иметь тип sd (37).

Время h\l соответствует времени начала расчета первой расчетной зоны для временного шага /її процессором Рг При расчете первым процессором /J зоны расчета slc в пространстве модели появляется пять слоев ячеек с измененными данными сил и скоростей, так как радиус потенциала межатомного взаимодействия захватывает пять слоев ячеек. Эти пять слоев ячеек с измененными данными, в которых учтено взаимодействие этих атомов с атомами, находящимися в первом слое ячеек, образуют расчетную зону 5( h)li, (рисунок 22).

В используемой нами символьной нотации запись вида is2d s3(/ s4d s5(/ sed} ц и обозначает, что множество расчетных зон { rf t/ i/ rf dt/} вошло в расчетную зону (или образовало расчетную зону) s,2 w. Тогда процесс расчета первой расчетной зоны процессором Pt в символьной нотации будет иметь следующий вид. rj(Mj) = \Sld,S2d,S3d,S4d,S5d,S6d} — \S\c,S(2+6)wi Slc — s\p (39)

2. Время /zl2 начало расчета второй расчетной зоны процессором Рх для временного шага hi. Из расчетной зоны s,2+ w выделяется область, равная расчетной зоне s2c. Одновременно в расчетную зону sw входит расчетная зона s7d, образуя s,3 w. Перед началом расчета зоны s2c процессор Р{ передает данные процессору Р2 для зоны sld. P\(hl2)= slp- sl0, {sj, \S(2 6)w S7df iS2c S(3+7)wh S2c " S2p P2(h2\).= Slo-+Sld KJ

3. Время h\3 начало расчета третьей расчетной зоны процессором Рх для временного шага Ы. P,{h\3) s2p- s2o, {slo,s2o}, \S{3 l)w S&d іЛс (4- 8) w-» S3c S3p P2(h22)= s2o s2d, {s{d,s2d}

4. Время h\4 начало расчета четвертой расчетной зоны процессором Рх для временного шага Ы.

5. Время M5 начало расчета пятой расчетной зоны процессором Рх для временного шага h\. Px(h\5) = s4p - s4o, {sio,s2o,s3o,s4o} \S(5 9)w S\0dt \S5c S(6±\0)wh S5c S5p P2 (n24) = s4o — s4d, {sld, s2d, s3d, s4d}

6. Время h\6 начало расчета шестой расчетной зоны процессором Рх для временного шага h\. \\ 6)— S5p S5o \S\o S2o S3o S4o S5oi \S(6 \0)w Slldf iS6c" S(7+U)wf S6c S6p V" 5) S5o S5d \S\d S2d»S3d S4d S5df

7. Время h\7 начало расчета седьмой расчетной зоны процессором Рх для временного шага М. Расчет седьмой расчетной зоны первым процессором совпал с принятием шестой расчетной зоны s6d и началом расчета первой расчетной зоны вторым процессором (40). Следовательно для синхронной работы в этом конкретном случае каждый процессор должен иметь в памяти пространство модели размером не менее 6 расчетных зон sd типа. г}(ш7) = s6p - s6o, \Si0,s2o,s3o,s4o,s5o,s6o), \S(7 U)w Sl2dy \S7c (8-5-12) /9 S7c S7p P2(h26) s6o- s6d, \Sld S2d S3d S4d S5d S6d У \S\c (2+6) У i O) Slc - 1p 8. Время /Л8 начало расчета расчетной зоны s8 процессором Р1 для временного шага h\.

Использование много частичных потенциалов взаимодействия

Метод декомпозиции времени обеспечивает возможность проведения расчета всего пространства модели для одного временного шага на одном процессоре. При расчете всего пространства модели для одного временного шага на одном процессоре не возникает проблем с учетом взаимодействия атомов, расположенных в различных процессорах как в алгоритмах декомпозиции пространства, декомпозиции атомов и декомпозиции силы. Поэтому алгоритмы, использующие метод декомпозиции времени с одинаковой эффективностью рассчитывают модели как с двухчастичным потенциалом взаимодействия, так и с много частичными потенциалами взаимодействия.

С точки зрения метода декомпозиции времени важно, чтобы ни один атом за время расчета рассчитываемого временного шага не прошел расстояние большее, чем ширина буферной зоны по соответствующей координате. Поэтому при автоматическом расчете временного шага можно ввести дополнительный коэффициент С2, ограничивающий максимальное расстояние, которое может пройти самый быстрый атом в модели в течение одного временного шага. Расчет временного шага для процессора Pz+1 осуществляется процессором Pz во время расчета модели и передается процессору Pz+l с передачей первой расчетной зоны ,.

Рассмотрим использование коэффициента С2 для автоматического расчета шага интегрирования. Коэффициент С2 - ограничивает максимальное расстояние, которое может пройти самый быстрый атом в модели за один шаг интегрирования. Шаг интегрирования должен выбираться таким образом, чтобы самый быстрый атом в модели мог пройти расстояние не более Ящ IС2. W Где: Rbuf- ширина буферной зоны по соответствующей координате, V, -max. скорость самого быстрого атома модели на этом временном шаге, C2 - коэффициент, определяющий какую часть расстояния Rbur, разрешается проходить самому быстрому атому за один временной шаг. Если ширина буферной Rbuj- зоны равна размеру ячейки с, по какой либо из координат то, важно соблюдение условия: К/ 2 ст[п (48) Здесь cmin - наименьший размер ячейки, по какой либо из координат.

Этот параметр при автоматическом расчете шага интегрирования должен иметь высший приоритет при принятии решения об изменении или не изменении размера шага интегрирования.

Одним из главных факторов ограничивающих производительность МВС при решении практических задач ММД является скорость передачи данных по каналам межпроцессорной связи. Если размерность задачи очень велика (сотни миллионов атомов) то время работы процессоров в течение одного временного шага оказывается в несколько раз большим времени, в течение которого процессоры обмениваются данными. Для таких задач задержка, вызванная временем межпроцессорного обмена, не приводит к значительной потере производительности МВС. Другое дело, когда производительность процессоров высока, а размерность задачи имеет средний размер (миллионы атомов).

Похожие диссертации на Оптимизация производительности многопроцессорных вычислительных систем при решении задач методом молекулярной динамики