Компания NVIDIA выпустила пакет CUDA Toolkit 3.2, позволяющий задействовать в Linux-приложениях API CUDA,
позволяющее вынести некоторые вычислительные задачи на плечи GPU. В
состав тулкита входит специализированный C/C++ компилятор, отладчик
cuda-gdb, GUI-интерфейс для профилирования кода, набор базирующихся на
задействовании GPU вариантов математических библиотек (BLAST BLAS, FFT, Sparse Matrix, RNG и т.д.), вспомогательные инструменты и документация.
Из добавленных улучшений можно отметить:
- В состав пакета интегрированы библиотеки с реализацией
функций кодирования и декодирования видеопотоков H.264 с привлечением
мощности GPU;
- Производительность выполнения матричных
преобразований в библиотеке CUBLAS увеличена на 50% - 300%, при работе
на GPU с архитектурой Fermi. Производительность вычисления корней в
CUFFT увеличена от 2 до 10 раз по сравнению с неакселерированным
вариантом библиотеки;
- В состав пакета интегрирована новая библиотека
CUSPARSE с поддержкой GPU-акселерированных операций с разряженными
матрицами, которые выполняются при задействовании GPU в 5-30 раз
быстрее;
- В состав интегрирована новая библиотека CURAND с функциями по генерации случайных чисел.
- Добавлена поддержка новых продуктов семейства 6GB
Quadro и Tesla. Для GOU Tesla добавлена возможность активации режима TCC
(Tesla Compute Cluster), но пока только для платформы Windows;
- В отладчики cuda-gdb и Parallel Nsight добавлена
поддержка работы с несколькими GPU и возможность отладки GPU на
устройствах с более чем 4 Гб памяти;
- В утилите cuda-memcheck добавлена поддержка всех GPU на базе архитектуры Fermi;
- Для компилятора Intel C Compiler (ICC) v11.1 на 64-разрядных Linux-дистрибутивах добавлена поддержка CUDA-компилятора NVCC;
- Добавлена поддержка управления памятью при помощи стандартных функций malloc() и free() в вычислительных ядрах CUDA;
- Реализован новый интерфейс nvidia-smi (NVIDIA System
Management Interface), поддерживающий вывод различных параметров
производительности, таких как процент загруженности GPU;
- Добавлено 10 новых демонстрационных приложений,
показывающих возможности CUDA. Например, приведен пример задействования
библиотеки для акселерации кодирования H.264-видеопотоков, представлен
фильтр для удаления шума с изображений и различные математические
подпрограммы.
Пакеты с CUDA Toolkit 3.2 доступны
для Linux дистрибутивов Fedora 13, Red Hat Enterprise Linux 4.8 и 5.5,
Ubuntu Linux 10.04, openSUSE 11.2 и SUSE Linux Enterprise Desktop
11-SP1.
Источник
|