Форум Академгородка, Новосибирск > Двойная точность в CUDA

Помощь - Поиск - Пользователи - Календарь

Полная версия этой страницы: Двойная точность в CUDA

Форум Академгородка, Новосибирск > Компьютеры и сети > Программирование

Vitae ontologica

10.12.2011, 0:21

Что-то сходу не нашёл, подскажите, пожалуйста, как реализовать вычисления с двойной точностью под CUDA? Не просто же double писать..

alex2000

10.12.2011, 1:56

Цитата(Vitae ontologica @ 10.12.2011, 1:21)

Не просто же double писать..

Угу. Подробности нужны на чём желаете реализовать. В ряде случаев это не осуществимо.

Vitae ontologica

10.12.2011, 16:02

Цитата(alex2000 @ 10.12.2011, 2:56)

Цитата(Vitae ontologica @ 10.12.2011, 1:21)

Не просто же double писать..

Угу. Подробности нужны на чём желаете реализовать. В ряде случаев это не осуществимо.

HP SL390s G7, каждый из которых содержит:
Два 6-ядерных процессора Xeon X5670 с тактовой частотой 2933 MГц
48298 МБ ОЗУ
Три карты NVIDIA Tesla M2090 на архитектуре Fermi (compute capability 2.0), у каждой из которых:
1 GPU c 512 ядрами.
6 ГБ памяти GDDR5 с пропускной способностью 177 ГБ/сек при выключенном контроле чётности (при включении ECC некая часть будет тратиться для обеспечения контроля).
665 Гфлопс пиковой производительности для вычислений двойной точности. 1331 Гфлопс для одинарной.

Alex30

22.04.2012, 9:31

Именно просто написать double.
Ну потом естественно разместить массивы в девайсе и написать ядерную функцию - что с ними делать.

Texnik

15.10.2012, 10:58

Только следует учитывать, что вычисления с двойной точностью на CUDA видео картах занимают примерно в два раза больше времени чем с одинарной, опять же пересылки host-device, так что не всегда оно того стоит.

Nemo

31.10.2012, 13:35

Цитата(Texnik @ 15.10.2012, 10:58)

Только следует учитывать, что вычисления с двойной точностью на CUDA видео картах занимают примерно в два раза больше времени чем с одинарной

Скорее в 3-4:
Tesla K20: 1.17TFLOPS DP/3.52TFLOPS SP

Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.