Как включить cuda на видеокарте nvidia

Обновлено: 21.11.2024

Чтобы включить отрисовку с помощью графического процессора, перейдите в меню «Настройки» ‣ Система ‣ Cycles Render Devices и выберите CUDA, OptiX, HIP или Металл. Затем вы должны настроить каждую сцену для использования рендеринга графического процессора в Свойства ‣ Рендеринг ‣ Устройство.

Технологии рендеринга

Blender поддерживает различные технологии рендеринга на графическом процессоре в зависимости от конкретного производителя графического процессора и операционной системы.

Для всех технологий рендеринга с помощью графического процессора Open Shading Language не поддерживается.

CUDA — NVIDIA

OptiX — NVIDIA

OptiX поддерживается в Windows и Linux и требует графических карт Nvidia с вычислительными возможностями 5.0 и выше и версии драйвера не ниже 470. Чтобы убедиться, что ваш графический процессор поддерживается, см. список графических карт Nvidia, на которых лучше всего работает OptiX. Видеокарты RTX с аппаратной поддержкой трассировки лучей (например, Turing и выше).

ХИП – AMD

Поддерживаемые графические процессоры включают:

Серия AMD Radeon RX 5000

Серия AMD Radeon RX 6000

Серия AMD Radeon Pro W6000

Дополнительную информацию о видеокартах AMD и их архитектурах можно найти на веб-сайте AMD.

Режим расширения Clip в узле текстуры изображения не поддерживается.

Металл – Apple (macOS)

Metal поддерживается на компьютерах Apple с графическими картами Apple Silicon или AMD. macOS 12.2 требуется для использования Metal с Apple Silicon, а macOS 12.3 требуется для использования Metal с видеокартами AMD.

Часто задаваемые вопросы

Почему Blender не отвечает во время рендеринга?

Во время рендеринга видеокарта не может перерисовать пользовательский интерфейс, из-за чего Blender не отвечает. Мы пытаемся избежать этой проблемы, возвращая управление графическому процессору как можно чаще, но полностью плавное взаимодействие не может быть гарантировано, особенно в тяжелых сценах. Это ограничение графических карт, для которого не существует реального решения, хотя в будущем мы сможем несколько улучшить его.

Если возможно, лучше установить несколько графических процессоров, используя один для отображения, а другой для рендеринга.

Почему сцена, которая обрабатывается ЦП, не обрабатывается ГП?

Причин может быть несколько, но наиболее распространенной является нехватка памяти на вашей видеокарте. Как правило, графический процессор может использовать только тот объем памяти, который находится на графическом процессоре (дополнительную информацию см. в разделе Увеличивают ли несколько графических процессоров доступную память?). Обычно это намного меньше, чем объем системной памяти, к которому может получить доступ ЦП. С устройствами CUDA, OptiX, HIP и Metal, если память графического процессора заполнена, Blender автоматически попытается использовать системную память. Это влияет на производительность, но обычно приводит к более быстрому рендерингу, чем при использовании рендеринга ЦП.

Можно ли использовать несколько графических процессоров для рендеринга?

Да, перейдите в «Настройки» ‣ «Система» ‣ «Панель вычислительных устройств» и настройте его по своему усмотрению.

Увеличат ли несколько графических процессоров доступную память?

Как правило, нет, каждый графический процессор может обращаться только к своей собственной памяти, однако некоторые графические процессоры могут совместно использовать свою память. Это можно включить с помощью распределенной памяти между устройствами.

Что рендерится быстрее?

Это зависит от используемого оборудования. Различные технологии также имеют разное время вычислений в зависимости от тестируемой сцены. Для получения самой последней информации о производительности различных устройств просмотрите ресурс Blender Open Data.

Сообщения об ошибках

В случае возникновения проблем обязательно установите официальные графические драйверы с веб-сайта производителя графического процессора или через диспетчер пакетов в Linux.

Неподдерживаемая версия GNU

В Linux, в зависимости от вашей версии GCC, вы можете получить эту ошибку. Список поддерживаемых версий GCC см. в Руководстве по установке Nvidia CUDA для Linux. Есть два возможных решения этой ошибки:

Используйте альтернативный компилятор

Если у вас установлена ​​более старая версия GCC, совместимая с установленной версией инструментария CUDA, вы можете использовать ее вместо компилятора по умолчанию. Это делается установкой переменной окружения CYCLES_CUDA_EXTRA_CFLAGS при запуске Blender.

Запустите Blender из командной строки следующим образом:

(Замените имя или путь совместимого компилятора GCC).

Удалить проверки совместимости

Если вышеуказанное не помогло, удалите следующую строку в /usr/local/cuda/include/host_config.h:

Это позволит Cycles успешно скомпилировать ядро ​​рендеринга CUDA при первой попытке использовать ваш GPU для рендеринга. После успешной сборки ядра вы можете запустить Blender, как обычно, и ядро ​​CUDA по-прежнему будет использоваться для рендеринга.

Ошибка CUDA: ошибка компиляции ядра

Эта ошибка может возникнуть, если у вас новая видеокарта Nvidia, которая еще не поддерживается версией Blender и установленным вами набором инструментов CUDA.В этом случае Blender может попытаться динамически собрать ядро ​​для вашей видеокарты и потерпеть неудачу.

В этом случае вы можете:

Проверьте, поддерживает ли последняя версия Blender (официальная или экспериментальная сборка) вашу видеокарту.

Если вы создаете Blender самостоятельно, попробуйте загрузить и установить более новый набор инструментов разработчика CUDA.

Обычно пользователям не нужно устанавливать набор инструментов CUDA, поскольку Blender поставляется с предварительно скомпилированными ядрами.

Ошибка: недостаточно памяти

Обычно это означает, что недостаточно памяти для хранения сцены для использования графическим процессором.

Один из способов сократить использование памяти — использовать текстуры меньшего разрешения. Например, текстуры изображений 8k, 4k, 2k и 1k занимают соответственно 256 МБ, 64 МБ, 16 МБ и 4 МБ памяти.

Драйвер Nvidia OpenGL потерял соединение с драйвером дисплея

Если графический процессор используется как для отображения, так и для рендеринга, Windows имеет ограничение на время, в течение которого графический процессор может выполнять вычисления для рендеринга. Если у вас особенно тяжелая сцена, циклы могут занимать слишком много времени графического процессора. Уменьшение размера плитки на панели «Производительность» может облегчить проблему, но единственное реальное решение — использовать отдельные видеокарты для отображения и рендеринга.

Другим решением может быть увеличение времени ожидания, хотя это сделает пользовательский интерфейс менее отзывчивым при рендеринге тяжелых сцен. Узнайте больше здесь.

Ошибка CUDA: неизвестная ошибка в cuCtxSynchronize()

Неизвестная ошибка может быть вызвана многими причинами, но одна из возможных заключается в тайм-ауте. Решения см. в приведенном выше ответе.

© Copyright: Эта страница находится под лицензией CC-BY-SA 4.0 Int. Лицензия. Последнее обновление: 20 марта 2022 г.

Для поддержки графического процессора TensorFlow требуется набор драйверов и библиотека. Мы рекомендуем создать и использовать образец библиотеки TensorFlow Docker с поддержкой графического процессора (только для Linux). Для этой установки требуются только драйверы графического процессора NVIDIA® .

Эти инструкции по установке конечной версии TensorFlow. конкуренция с протестированными моделями сборки для версий CUDA® и cuDNN, которые можно использовать со старыми выпусками TensorFlow.

Пакет пипсов

Доступные пакеты, системные требования и инструкции см. в присутствии по установке pip . Пакет TensorFlow pip включает GPU для поддержки карт с поддержкой CUDA®:

В этом рассказывается о поддержке графического процессора и степени установки последней стабильной версии TensorFlow.

Старые версии TensorFlow

В версиях 1.15 и старше пакеты CPU и GPU разделены:

Аппаратные требования

Подключено устройство с возможностью поддержки графического процессора:

  • Карта NVIDIA® GPU с архитектурой CUDA® 3.5, 5.0, 6.0, 7.0, 7.5, 8.0 и выше 8.0. См. список карт GPU с поддержкой CUDA® .
  • Для графических процессоров с неподдерживаемой архитектурой CUDA®, чтобы избежать JIT-компиляции из PTX или для использования других версий библиотеки NVIDIA®, см. руководство по сборке Linux из исходного кода .
  • Пакеты не встречались в коде PTX, за исключительной использованием архитектуры CUDA®; поэтому TensorFlow не загружается на старых графических процессорах, если CUDA_FORCE_PTX_JIT=1 . (Подробности см. в разделе Совместимость приложений .)

Требования к программному обеспечению

В вашей компании должна быть установлена ​​​​установленная платформа NVIDIA®:

  • Драйверы графического процессора NVIDIA® — для CUDA® 11.2 требуется версия 450.80.02 или выше.
  • Набор инструментов CUDA® — TensorFlow поддерживает CUDA® 11.2 (TensorFlow >= 2.5.0)
  • CUPTI поставляется с набором инструментов CUDA®.
  • cuDNN SDK 8.1.0 (версия cuDNN).
  • (Необязательно)TensorRT 7 для устранения задержки и пропускной способности для сочетания выводов при некоторых симптомах.

Настройка Linux

Приведенные ниже инструкции apt — это самый простой способ установить интеграцию программного обеспечения NVIDIA в Ubuntu. Однако при сборке TensorFlow из исходного кода быстро установите требования к программному обеспечению, перечисленные выше, и рассмотрите возможность использования образа Docker — разработайте TensorFlow в качестве основы.

Установите CUPTI, который поставляется с набором инструментов CUDA®. Добавить каталог установки к установке окружения $LD_LIBRARY_PATH :

Установите CUDA с помощью apt

В этом разделе показано, как установить CUDA® 11 (TensorFlow >= 2.4.0) в Ubuntu 16.04 и 18.04. Эти инструкции могут работать для других дистрибутивов на базе Debian.

Внимание: безопасная загрузка усложняет установку драйвера NVIDIA выходит за пределы этой инструкции.

Ubuntu 18.04 (CUDA 11.0)

Ubuntu 16.04 (CUDA 11.0)

установка Windows

Убедитесь, что установленные пакеты программного обеспечения NVIDIA соответствуют версии, приведенной выше. В частности, TensorFlow не загружается без файла cuDNN64_8.dll. Для использования другой версии, см. руководство по сборке Windows из исходного кода .

Добавьте каталоги установки CUDA®, CUPTI и cuDNN в переменную окружения %PATH% . Например, если CUDA® Toolkit установлен в C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.0 а cuDNN — в C:\tools\cuda, обновите %PATH%, чтобы он использовал:

Настройка WSL2

Теперь достигнута экспериментальная поддержка WSL2 в Windows 10 19044 или более поздней версии с доступом к графическому процессору. Это самое последнее обновление Windows 10 (также известно как версия 21H2/обновление за ноябрь 2021 г.). Вы можете получить последнее обновление отсюда: Загрузите Windows 10 .

Если не указано иное, содержимое этой страницы предоставляется по лицензии Creative Commons Attribution 4.0, а образцы кода — по лицензии Apache 2.0. Подробнее см. в Правилах сайта Google Developers. Java является зарегистрированным товарным знаком Oracle и/или ее дочерних компаний.

Поддержка вычислений MATLAB GPU для
графических процессоров с поддержкой NVIDIA CUDA

Выполнение вычислений MATLAB на графических процессорах NVIDIA с поддержкой CUDA

MATLAB ® позволяет вам использовать графические процессоры NVIDIA ® для ускорения ИИ, глубокого обучения и других аналитических операций, требующих больших вычислительных ресурсов, без необходимости быть программистом CUDA ®. Используя MATLAB и Parallel Computing Toolbox™, вы можете:

  • Используйте графические процессоры NVIDIA напрямую из MATLAB с более чем 500 встроенными функциями.
  • Доступ к нескольким графическим процессорам на настольных компьютерах, вычислительных кластерах и в облаке с помощью MATLAB Workers и MATLAB Parallel Server™.
  • Создавайте код CUDA непосредственно из MATLAB для развертывания в центрах обработки данных, облаках и встроенных устройствах с помощью GPU Coder™.
  • Создавайте код NVIDIA TensorRT™ из MATLAB для получения выводов с низкой задержкой и высокой пропускной способностью с помощью GPU Coder.
  • Разверните приложения MATLAB AI в центрах обработки данных с поддержкой NVIDIA для интеграции с корпоративными системами с помощью MATLAB Production Server™.

«Нашему устаревшему коду требовалось до 40 минут для анализа одного теста в аэродинамической трубе; с использованием MATLAB и графического процессора время вычислений теперь составляет менее минуты. Потребовалось 30 минут, чтобы наш алгоритм MATLAB заработал на графическом процессоре — никакого низкоуровневого программирования CUDA не потребовалось».

Кристофер Бар, НАСА

Использование MATLAB для вычислений на GPU

Разработка, масштабирование и развертывание моделей глубокого обучения с помощью MATLAB

MATLAB позволяет одному пользователю реализовать сквозной рабочий процесс для разработки и обучения моделей глубокого обучения с помощью Deep Learning Toolbox™. Затем вы можете масштабировать обучение, используя облачные и кластерные ресурсы, используя Parallel Computing Toolbox и MATLAB Parallel Server, и развертывать их в центрах обработки данных или встроенных устройствах с помощью GPU Coder.

Разработка глубокого обучения и другой аналитики, требующей больших вычислительных ресурсов, с помощью графических процессоров

MATLAB — это комплексная платформа рабочих процессов для разработки ИИ и глубокого обучения. MATLAB предоставляет инструменты и приложения для импорта обучающих наборов данных, визуализации и отладки, масштабирования обучающих CNN и развертывания.

Расширяйте до дополнительных вычислительных и графических ресурсов на настольных компьютерах, в облаках и кластерах с помощью одной строки кода.

Изучить продукты

Протестируйте собственное оборудование ЦП и ГП с помощью gpuBench.

Масштабирование MATLAB на графических процессорах с минимальными изменениями кода

Запускайте код MATLAB на графических процессорах NVIDIA, используя более 500 функций MATLAB с поддержкой CUDA. Используйте функции с поддержкой графического процессора в наборах инструментов для таких приложений, как глубокое обучение, машинное обучение, компьютерное зрение и обработка сигналов. Parallel Computing Toolbox предоставляет gpuArray , специальный тип массива со связанными функциями, который позволяет выполнять вычисления на графических процессорах NVIDIA с поддержкой CUDA непосредственно из MATLAB без необходимости изучения низкоуровневых вычислительных библиотек графических процессоров.

Инженеры могут использовать ресурсы графического процессора без написания дополнительного кода, поэтому они могут сосредоточиться на своих приложениях, а не на настройке производительности.

Используя конструкции параллельного языка, такие как parfor и spmd, вы можете выполнять вычисления на нескольких графических процессорах. Для обучения модели на нескольких графических процессорах достаточно просто изменить параметр обучения.

MATLAB также позволяет интегрировать существующие ядра CUDA в приложения MATLAB, не требуя дополнительного программирования на C.

Как узнать из терминала или чего-то еще, поддерживает ли мое оборудование CUDA?

4 ответа 4

Использование браузера для поиска CUDA

  1. Откройте браузер Chrome.
  2. Перейдите по ссылке chrome://gpu
  3. Выполните поиск cuda, и вы должны обнаружить версию (в моем случае она не включена)

Если отображается 0, возможно, оборудование по-прежнему поддерживает CUDA, но драйверы просто не установлены/не работают. На моем ноутбуке отображается 0, но GPU-Z говорит, что мое оборудование поддерживает CUDA 1.2

CUDA работает со всеми графическими процессорами Nvidia, начиная с серии G8x, включая линейку GeForce, Quadro и Tesla. CUDA совместима с большинством стандартных операционных систем.

Список поддерживаемых графических карт см. в Википедии.

Вы не говорили мне об этом раньше. Какой у вас производитель и модель материнской платы? У него есть графический процессор Nvidia?

API программного обеспечения CUDA поддерживается графическими процессорами Nvidia с помощью программных драйверов, предоставляемых Nvidia.

  1. Чтобы скомпилировать приложение CUDA специально для вашего графического процессора, требуются вычислительные возможности конкретного графического процессора, и это можно получить, выполнив шаги, описанные в

(Я автор этого веб-инструмента)

Вручную вы можете использовать nvidia-smi, который устанавливается вместе с драйвером

Или используйте информацию о драйвере, чтобы получить имя графического процессора и сопоставить его с вычислительными возможностями.

Если вы используете терминал, команда nvidia-smi очень удобна для получения информации о модели вашего графического процессора, версии CUDA и версии драйвера NVIDIA.

Вам потребуется выполнить следующие проверки:

  1. Используйте модель графического процессора, чтобы получить вычислительные возможности графического процессора. NVIDIA предоставляет список здесь.
  2. Проверьте версию установленного драйвера по выходным данным nvidia-smi.
  3. Проверьте установленную версию CUDA по выходным данным nvidia-smi.

Для (1) в идеале GPU должен иметь вычислительную мощность не ниже 3.0, чтобы он мог работать с функциями CUDA для глубокого обучения. Впоследствии проверьте установленную версию CUDA и возможное обновление. Существует «ограничение» пути обновления, особенно для старых моделей графических процессоров. Возможно, вам не удастся выполнить обновление до последней версии CUDA, поскольку каждая версия CUDA имеет минимальные вычислительные возможности, которые она поддерживает.

Вы можете проверить таблицу совместимости CUDA и минимальный драйвер дисплея, поддерживаемый каждой версией, здесь.

Читайте также: