Форум Академгородка, Новосибирск > Двойная точность в CUDA
Помощь - Поиск - Пользователи - Календарь
Полная версия этой страницы: Двойная точность в CUDA
Форум Академгородка, Новосибирск > Компьютеры и сети > Программирование
Vitae ontologica
Что-то сходу не нашёл, подскажите, пожалуйста, как реализовать вычисления с двойной точностью под CUDA? Не просто же double писать..
alex2000
Цитата(Vitae ontologica @ 10.12.2011, 1:21) *
Не просто же double писать..

Угу. Подробности нужны на чём желаете реализовать. В ряде случаев это не осуществимо.
Vitae ontologica
Цитата(alex2000 @ 10.12.2011, 2:56) *
Цитата(Vitae ontologica @ 10.12.2011, 1:21) *
Не просто же double писать..

Угу. Подробности нужны на чём желаете реализовать. В ряде случаев это не осуществимо.

HP SL390s G7, каждый из которых содержит:
Два 6-ядерных процессора Xeon X5670 с тактовой частотой 2933 MГц
48298 МБ ОЗУ
Три карты NVIDIA Tesla M2090 на архитектуре Fermi (compute capability 2.0), у каждой из которых:
1 GPU c 512 ядрами.
6 ГБ памяти GDDR5 с пропускной способностью 177 ГБ/сек при выключенном контроле чётности (при включении ECC некая часть будет тратиться для обеспечения контроля).
665 Гфлопс пиковой производительности для вычислений двойной точности. 1331 Гфлопс для одинарной.
Alex30
Именно просто написать double.
Ну потом естественно разместить массивы в девайсе и написать ядерную функцию - что с ними делать.
Texnik
Только следует учитывать, что вычисления с двойной точностью на CUDA видео картах занимают примерно в два раза больше времени чем с одинарной, опять же пересылки host-device, так что не всегда оно того стоит.
Nemo
Цитата(Texnik @ 15.10.2012, 10:58) *
Только следует учитывать, что вычисления с двойной точностью на CUDA видео картах занимают примерно в два раза больше времени чем с одинарной

Скорее в 3-4:
Tesla K20: 1.17TFLOPS DP/3.52TFLOPS SP
Для просмотра полной версии этой страницы, пожалуйста, пройдите по ссылке.
Русская версия IP.Board © 2001-2024 IPS, Inc.