Сравнительный анализ производительности OpenMP и CUDA на примере вычисления Фурье преобразования

Авторы

  • B. Medetov НИИЭТФ, Казахский национальный университет имени аль-Фараби, Казахстан, Алматы
  • A. Koishigarin НИИЭТФ, Казахский национальный университет имени аль-Фараби, Казахстан, Алматы
  • A. Yskak НИИЭТФ, Казахский национальный университет имени аль-Фараби, Казахстан, Алматы
  • K. Niazaliev НИИЭТФ, Казахский национальный университет имени аль-Фараби, Казахстан, Алматы
  • A. Naurzbayeva НИИЭТФ, Казахский национальный университет имени аль-Фараби, Казахстан, Алматы

Ключевые слова:

параллельное вычисление, преобразование Фурье, NVIDIA CUDA, OpenMP, цифровая обработка

Аннотация

Сравнительный анализ производительности двух технологий параллельных вычислений – OpenMP и nVidia CUDA – был проведен на примере вычисления преобразования Фурье. Было получено, что время выполнения преобразования Фурье на многоядерном центральном процессоре зависит от количества ядер нелинейно. Кроме того, форма этой зависимости изменяется из-за количества потоков: для потоков, число которых меньше, чем количества физических ядер, зависимость является степенной, тогда как для потоков, число которых больше, чем количество физических ядер, зависимость является экспоненциальной. Максимальная эффективность вычислений с использованием OpenMP может быть достигнута, когда количество потоков, используемых в программе, в два раза больше количество физических ядер. Данное сравнение показало, что в условиях проведенных экспериментов для небольшого количества фреймов наибольший выигрыш по времени дает OpenMP, а в противном случае превосходство получает уже CUDA.

Опубликован

02.04.2018

Выпуск

Раздел

Физика плазмы

Как цитировать

Сравнительный анализ производительности OpenMP и CUDA на примере вычисления Фурье преобразования. (2018). Recent Contributions to Physics, 2017(2), 108-114. https://bph.kaznu.kz/index.php/zhuzhu/article/view/545

Наиболее читаемые статьи этого автора (авторов)