Сравнительный анализ производительности OpenMP и CUDA на примере вычисления Фурье преобразования

Авторы

  • B. Medetov НИИЭТФ, Казахский национальный университет имени аль-Фараби, Казахстан, Алматы
  • A. Koishigarin НИИЭТФ, Казахский национальный университет имени аль-Фараби, Казахстан, Алматы
  • A. Yskak НИИЭТФ, Казахский национальный университет имени аль-Фараби, Казахстан, Алматы
  • K. Niazaliev НИИЭТФ, Казахский национальный университет имени аль-Фараби, Казахстан, Алматы
  • A. Naurzbayeva НИИЭТФ, Казахский национальный университет имени аль-Фараби, Казахстан, Алматы

Ключевые слова:

параллельное вычисление, преобразование Фурье, NVIDIA CUDA, OpenMP, цифровая обработка

Аннотация

Сравнительный анализ производительности двух технологий параллельных вычислений – OpenMP и nVidia CUDA – был проведен на примере вычисления преобразования Фурье. Было получено, что время выполнения преобразования Фурье на многоядерном центральном процессоре зависит от количества ядер нелинейно. Кроме того, форма этой зависимости изменяется из-за количества потоков: для потоков, число которых меньше, чем количества физических ядер, зависимость является степенной, тогда как для потоков, число которых больше, чем количество физических ядер, зависимость является экспоненциальной. Максимальная эффективность вычислений с использованием OpenMP может быть достигнута, когда количество потоков, используемых в программе, в два раза больше количество физических ядер. Данное сравнение показало, что в условиях проведенных экспериментов для небольшого количества фреймов наибольший выигрыш по времени дает OpenMP, а в противном случае превосходство получает уже CUDA.

Библиографические ссылки

1. S.L. Chu, and C.C. Hsiao, Journal of Applied Mathematics & Information Sciences, Apr., 340, (2014).

2. H.Ü. Dinkelbach, J. Vitay, F. Beuth and Hamker Fred H., Computation in Neural Systems, 23(4), 212-236, (2012).

3. Cleverson Lopes Ledur, Carlos M. D. Zeve, Julio C. S. dos Anjos, 11th Workshop on Parallel and Distributed Processing (WSPPD), 2013.

4. K.M. Khankin, Messenger of SUSU, Computer technology, management, electronics series, 13(1), 34-41, (2013).

5. Yang C.-T., Huang C.-L., Lin C.-F. Hybrid, Computer Physics Communications, 182, 266–269, (2011).

6. L.R. Rabiner and R.W. “Schafer Digital processing of speech signals”, (Prentice-Hall, 1978).

7. OpenMP Application Program Interface. Version 3.1 July 2011. http://www.openmp.org/mp-documents/OpenMP3.1.pdf

8. What is CUDA. – http://developer.nvidia.com/what-cuda

9. Hastie, Tibshirani and Friedman, “The Elements of Statistical Learning” (2nd edition). (Springer-Verlag, 2009, 763 p.)

Загрузки

Опубликован

2017-10-10

Выпуск

Раздел

Нелинейная физика. Радиофизика