Теория и практика параллельных вычислений




Анализ эффективности - часть 2


Второй способ выполнения операции обмена данными рассмотрен в лекции 3, когда топология вычислительной сети может быть представлена в виде гиперкуба. Как было показано, выполнение такого алгоритма может быть осуществлено за

шагов, на каждом из которых каждый процессор передает и получает сообщение из n/2 элементов. Как результат, время операции передачи данных при таком подходе составляет величину:

(6.13)

С учетом (6.11) – (6.13) общее время выполнения параллельного алгоритма умножения матрицы на вектор при разбиении данных по столбцам выражается следующими соотношениями.

  • Для первого способа выполнения операции передачи данных

    (6.14)

  • Для второго способа выполнения операции передачи данных

    (6.15)




Содержание  Назад  Вперед