Персональные суперкомпьютеры Nvidia могут стать следующими видеокартами потребительского класса.

7 января, 2026 Дядя Влад

На презентации CES в этом году Дженсен Хуанг, что необычно, не представил потребительские видеокарты Nvidia.

Новейшие потребительские видеокарты по-прежнему относятся к серии RTX 50, официально представленной на выставке CES в прошлом году. Это, несомненно, отчасти связано с глобальным ростом цен на память; текущая стоимость памяти может увеличиться на 50-100% в течение недели, и многие аналитики прогнозируют, что этот рост цен продолжится до 2027 года.

Главная причина — искусственный интеллект. Возьмем в качестве примера обучение и развертывание ИИ. Видеокарта RTX 5090 имеет максимум 32 ГБ видеопамяти. Если же вы найдете подходящую модель с открытым исходным кодом, где параметры исчисляются десятками миллиардов, то требуемый объем видеопамяти будет ограничен.

Однако Nvidia явно не собирается уступать местный рынок вычислительной техники. В этом году вместо выпуска видеокарт потребительского класса компания представила совершенно новый персональный суперкомпьютер потребительского класса.

На выставке CES 2026 компания NVIDIA продемонстрировала свой новый инструмент DGX Spark и использовала его для решения ряда задач, связанных с искусственным интеллектом. Разработчикам и создателям больше не нужны дорогостоящие центры обработки данных; с помощью DGX Spark они могут бесперебойно запускать, дорабатывать и даже делать выводы о передовых моделях ИИ с количеством параметров до 100 миллиардов локально.

Ранее мы уже делились своим практическим опытом работы с DGX Spark, демонстрируя, как он справляется с такими задачами, как загрузка модели с открытым исходным кодом GPT-OSS со 120 миллиардами параметров или развертывание генерации изображений Qwen и генерации видео Wan 2.2.

Давайте рассмотрим основные особенности DGX Spark.

Базовая архитектура: Созданная на основе архитектуры NVIDIA Grace Blackwell, она объединяет вычислительные мощности искусственного интеллекта уровня центров обработки данных в компактном корпусе настольного компьютера.
Огромный объем памяти: каждая машина оснащена 128 ГБ унифицированной памяти. Еще более уникальной особенностью является поддержка соединения двух машин DGX Spark через сеть ConnectX-7 со скоростью 200 Гбит/с для формирования суперузла с 256 ГБ памяти.
Основные возможности: Разработанная специально для эпохи больших моделей, она поддерживает локальное выполнение моделей с 100 миллиардами параметров или распределенную тонкую настройку моделей с 70 миллиардами параметров.
Позиционирование: Это не только изолированная среда для разработчиков, но и платформа для создателей ИИ, в первую очередь, позволяющая безопасно и с низкой задержкой выполнять ресурсоемкие задачи ИИ локально, освобождая их от зависимости от облачных сервисов.

Главным событием обновления CES в этом году стала полная поддержка формата данных NVFP4 посредством обновления программного обеспечения. Формат данных NVFP4 позволяет моделям следующего поколения сохранять интеллектуальную производительность, одновременно сокращая использование памяти примерно на 40% и значительно увеличивая пропускную способность.

В ходе конкретных тестовых данных, при работе модели Qwen-235B на двух конфигурациях DGX Spark, использование NVFP4 привело к повышению производительности до 2,6 раз по сравнению с FP8. Это напрямую решает проблему исчерпания памяти при работе с двумя системами и невозможности многозадачности при использовании точности FP8, которая наблюдалась ранее.

Аппаратное обеспечение находится на настольном компьютере, но доступ к нему возможен через облако. Обновление Brev, представленное на CES, также решает проблему недостаточной гибкости локальных вычислительных мощностей для DGX Spark.

Теперь разработчики могут безопасно подключаться к DGX Spark удаленно через Brev, как если бы использовали облачный сервис. Кроме того, Brev поддерживает интеллектуальный уровень маршрутизации. Пользователи могут принудительно запускать конфиденциальные задачи, такие как обработка электронной почты или конфиденциальных данных, локально на DGX Spark, при этом беспрепятственно перенаправляя общие задачи вывода в облако, обеспечивая баланс между конфиденциальностью и вычислительной мощностью облачных вычислений.

Внедрение Brev решает проблему не только доступности, но и простоты использования локальных вычислительных мощностей. Официальный запуск поддержки локальных вычислений ожидается весной 2026 года.

Для чего можно использовать такую мощную вычислительную мощность? Демонстрация NVIDIA на выставке CES дала ответ.

Для создателей видеоконтента это мощный инструмент для ускорения творческого процесса. Перенос задач по созданию видео с помощью ИИ с ноутбука на DGX Spark обеспечивает скорость работы до 8 раз выше по сравнению с топовым MacBook Pro с процессором M4 Max, что действительно устраняет задержки в творческом процессе.

DGX Spark подходит не только для индивидуальных разработчиков, но и для корпоративных пользователей, которые отдают приоритет локальной безопасности. NVIDIA продемонстрировала локальный помощник по программированию CUDA на базе Nsight, позволяющий корпоративным разработчикам использовать помощь ИИ, обеспечивая при этом полное локальное хранение исходного кода и исключая риск утечки информации.

Ещё более интересной демонстрацией стала её интеграция с роботами. Благодаря сотрудничеству с компанией Hugging Face, DGX Spark стал «мозгом» робота Reachy Mini, обеспечив ему возможности аудиовизуального взаимодействия в реальном времени. Теперь, похоже, использование DGX Spark для воплощенного интеллекта перестало быть исключительной прерогативой крупных компаний.

Джефф Будуер, вице-президент по продуктам в Hugging Face, также отметил: «Открытая модель позволяет разработчикам создавать ИИ по-своему, а DGX Spark переносит эту возможность на настольные компьютеры… превращая мощный ИИ в по-настоящему интерактивный объект».

Чтобы снизить порог входа для разработчиков, NVIDIA также представила на CES шесть новых Playbook, ориентированных на удовлетворение актуальных потребностей.

Nemotron 3 Nano, новейшая модель интеллектуального агента с открытым исходным кодом от NVIDIA, предназначенная для локальных экспериментов в области крупномасштабного интеллекта.
Live VLM WebUI обеспечивает анализ визуальной языковой модели в реальном времени, позволяя проводить анализ видео непосредственно на локальном DGX Spark, используя видео с веб-камеры.
Исаак Сим / Лаборатория, моделирование роботов и обучение с подкреплением.
В демонстрации метода тонкой настройки с использованием двух систем показано, как использовать два экземпляра DGX Spark для распределения и тонкой настройки 70B LLM.

В дополнение к обновлению Playbook, DGX Spark поставляется с предустановленным оптимизированным программным обеспечением NVIDIA AI и библиотеками CUDA-X. Это означает, что разработчикам не нужно тратить время на сложные настройки драйверов и зависимости среды; они могут получить возможности оптимизации «подключи и работай» сразу же и начать создавать или дорабатывать модели ИИ.

Появление DGX Spark на выставке CES 2026 свидетельствует о том, что «локализация больших моделей» — это уже не пустые слова. Будь то обеспечение безопасности данных, повышение эффективности разработки или исследование воплощенного интеллекта следующего поколения, DGX Spark стремится стать основой для создания приложений искусственного интеллекта нового поколения.

Как и сейчас, уже существуют проекты, позволяющие ИИ играть в игры. В будущем, помимо 5090, способного плавно запускать "Black Myth: Wukong", потребуется больше суперкомпьютеров для ИИ, предназначенных для настольных компьютеров.

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.

ifanr | Оригинальная ссылка · Посмотреть комментарии · Sina Weibo