Nvidia переворачивает всё с ног на голову; Windows наконец-то получает настоящий ПК с искусственным интеллектом.

В лагере пользователей ПК под управлением Windows уже давно не встречался по-настоящему серьёзный конкурент.

▲Пользователи Windows, вероятно,

За последние четыре десятилетия базовое разделение труда на этом рынке оставалось относительно стабильным: Microsoft определяет операционную систему и точку входа в программное обеспечение, Intel и AMD долгое время владели платформой процессоров x86, а Nvidia начинала с графических вычислений, а позже вывела ускорение ИИ на еще более высокий уровень.

В своем недавнем выступлении на конференции COMPUTEX 2026 компания NVIDIA рассмотрела инфраструктуру искусственного интеллекта как ключевую тему, расширив ее до более важных аспектов различных отраслей.

Помимо таких знакомых тем, как графические процессоры, фабрики ИИ и физический ИИ, есть еще и RTX Spark, который Microsoft и ARM активно рекламируют, представляя его как «новую эру ПК». Все эти продукты вращаются вокруг одного ключевого слова:

Агент, агент и ещё раз агент.

Объединив усилия с Microsoft, Nvidia стремится переосмыслить концепцию персонального ПК.

В сюжетной линии Агента персонаж оказывается в новой позиции.

На протяжении сорока лет Windows, открытый BIOS, чипсеты, драйверы и мультимедийные API формировали облик персональных компьютеров. Windows 95 превратила ПК из корпоративного устройства в потребительский электронный продукт, сделав его необходимым практически для каждого.

Теперь Microsoft и Nvidia переосмысливают концепцию ПК с искусственным интеллектом, стремясь дать возможность компьютерам запускать интеллектуальных агентов, превращая персональные компьютеры из традиционных шлюзов для приложений в персональные платформы искусственного интеллекта.

Представленный сегодня процессор NVIDIA RTX Spark является ядром новой архитектуры ПК.

В нём используется графический процессор Blackwell RTX с производительностью FP4 AI, достигающей 1 петафлоп; центральный процессор — это специально разработанный 20-ядерный процессор Grace, созданный совместно с MediaTek; он имеет 128 ГБ унифицированной памяти и обеспечивает пропускную способность 600 ГБ/с через NVLink C2C. Что касается программного обеспечения, то полный стек включает CUDA, TensorRT, NVFP4, трассировку лучей RTX, DLSS, Reflex и G-SYNC.

Что касается форм-фактора, NVIDIA поместила RTX Spark в размеры, более близкие к размерам обычных ПК под управлением Windows:

Толщина ноутбуков составляет всего 14 мм, а вес — около 1,4 кг. В линейке представлены модели с диагональю экрана от 14 до 16 дюймов; корпус изготовлен из высокоточного алюминиевого сплава, а экран оснащен тандемным OLED-дисплеем с точной цветопередачей и поддержкой NVIDIA G-SYNC, что обеспечивает высокую частоту кадров как для творческой работы, так и для игр.

Иными словами, RTX Spark ориентирован не только на голосовых помощников на периферии сети или несложные офисные задачи; он пытается интегрировать некоторые возможности искусственного интеллекта для центров обработки данных, возможности игровой графики и профессиональные творческие возможности в форм-фактор персонального компьютера.

Дженсен Хуанг сказал, что этот компьютер должен запускать «всё». Необходимо, чтобы работали традиционные приложения Windows, программный стек CUDA, а также графические рабочие процессы, цифровая биология, обработка сейсмических данных, астрофизика, геномика и приложения искусственного интеллекта. Он может подключаться как к локальным, так и к облачным моделям.

В демонстрационном видеоролике, снятом на месте, после того, как пользователь предоставит участок, эскизы, стилистические рекомендации и требования, искусственный интеллект, работающий на RTX Spark, запускает Rhino для завершения архитектурной и интерьерной схемы, а затем импортирует ее в Blender и Flux 2 для создания многоракурсных рендеров. Пользователь может вносить изменения в дизайн в любое время в процессе работы.

Основная мысль демонстрации очевидна: персональные компьютеры перейдут от ручного управления программным обеспечением к интеллектуальным агентам, планирующим использование инструментов в соответствии с поставленными задачами. Типичный пример: такие приложения, как Adobe Photoshop и Premiere, оптимизируются для RTX Spark и подключаются к локальным интеллектуальным агентам через MCP, становясь частью автоматизированных рабочих процессов.

RTX Spark — это только начало новой линейки продуктов для ПК. Дженсен Хуанг также продемонстрировал три форм-фактора: ноутбуки, настольные компьютеры и рабочие станции. Все они совместимы с программными стеками Windows, CUDA и AI, но ориентированы на разные сценарии использования.

Ноутбуки подходят для работы в мобильном офисе, игр и творческой деятельности.

Он может запускать Nemotron 3 Ultra локально или подключаться к Claude, Codex или другим облачным сервисам. Настольная версия больше похожа на персональный домашний ИИ-хост, способный круглосуточно запускать интеллектуального агента и подключаться к ноутбукам, мониторам, камерам, системам безопасности, бытовой технике и другим устройствам.

Рабочая станция предназначена для разработчиков моделей и разработчиков агентов.

DGX Station для Windows оснащен 748 ГБ памяти, вычислительной мощностью 20 петафлопс и пропускной способностью памяти 8 ТБ в секунду, что позволяет запускать модели с триллионом параметров в настольной среде. Разработчики могут завершать разработку моделей, отладку и тестирование локально, прежде чем развертывать их в облаке.

Дженсен Хуанг сравнивает эти изменения с превращением мобильных телефонов в смартфоны, где совершение звонков перестало быть важнейшей функцией. Он считает, что персональные компьютеры претерпят аналогичную трансформацию через 10 лет. Они эволюционируют из инструментов для открытия приложений, кликов и набора текста в суперкомпьютеры с искусственным интеллектом, используемые в домашних и личных рабочих процессах.

Наиболее ощутимое изменение, которое мы можем заметить, заключается в том, что будущие компьютеры под управлением Windows могут превратиться в настоящие компьютеры-агенты с искусственным интеллектом.

Для тех, кто хочет запускать LLM локально и нуждается в больших объемах памяти и мощных вычислительных мощностях для ИИ, появление RTX Spark может стать еще одним вариантом помимо Mac.

Наступила эра полезного ИИ; всё создано для агентов.

Если бы нам нужно было в одном предложении резюмировать изменения в отрасли за последние два года, то это было бы: полезный ИИ уже здесь. И первым сценарием применения агентного ИИ является разработка программного обеспечения.

В мире насчитывается от 30 до 40 миллионов профессиональных разработчиков, и количество коммитов в GitHub продолжает расти: примерно 300 миллионов в 2023 году, примерно 400 миллионов в 2024 году, достигнув 500 миллионов в первые несколько месяцев 2025 года и почти утроившись в первые несколько месяцев 2026 года.

Дженсен Хуанг использовал это, чтобы опровергнуть утверждение о том, что «ИИ сократит количество рабочих мест». По его мнению, ИИ повышает производительность инженеров, заставляя компании охотнее нанимать больше инженеров. Причина в том, что те же затраты на человеческие ресурсы могут обеспечить более высокую производительность, и ценность разработки программного обеспечения будет продолжать расти.

Более глубокие изменения происходят в форме приложений.

В прошлом программное обеспечение состояло из приложений, кода и операционных систем, но в эпоху интеллектуальных агентов метод вычислений изменился, и теперь используется другой процесс: пользователь задает цель, модель понимает намерение, среда выполнения планирует процесс, инструмент выполняет задачу, система памяти сохраняет контекст, и, наконец, получается результат.

Весь процесс включает в себя наблюдение, понимание, рассуждение, планирование, действие и использование инструментов.

В рамках этой концепции LLM представляет собой лишь «модуль мышления» в агентной системе. Полноценный интеллектуальный агент также требует наличия «оборудования», которое представляет собой уровень планирования и оркестровки; инструментов, таких как браузеры, электронные таблицы, базы данных, компиляторы, программное обеспечение САПР и механизмы обработки данных; а также кратковременной памяти, долговременной памяти и среды выполнения. Эта модель LLM + оборудование = агент, плюс инструменты, память и среда выполнения, станет основой для приложений в течение следующего десятилетия.

Поскольку интеллектуальные агенты становятся новым типом приложений, вычислительная инфраструктура, поддерживающая их работу, также нуждается в перепроектировании.

На пресс-конференции Дженсен Хуанг объявил о начале полномасштабного производства суперчипа нового поколения для искусственного интеллекта NVIDIA, Vera Rubin. Это одна из крупнейших платформ уровня POD от NVIDIA на сегодняшний день и основная система для фабрики искусственного интеллекта следующего поколения, разработанной для Agentic AI.

Vera Rubin состоит из графического процессора Rubin, центрального процессора Vera, NVLink 72, BlueField, ConnectX 9, сети Ethernet Spectrum X, системы обработки данных для хранения информации, системы обработки данных для обеспечения безопасности и полного программного стека, предназначенного для поддержки работы систем искусственного интеллекта на уровне заводских цехов.

Она ориентирована на весь процесс работы интеллектуального агента, от ввода данных до выполнения.

Когда агент обрабатывает запросы, понимает контекст, рассуждает и планирует, вызывает инструменты, обращается к базам данных, выполняет код и извлекает данные из долговременной памяти, он одновременно задействует графические процессоры (GPU), центральные процессоры (CPU), сети, память, хранилище и системы безопасности. Таким образом, графический процессор Rubin отвечает за основные вычисления, центральный процессор Vera — за планирование и обработку данных, BlueField 4 обеспечивает изоляцию безопасности и хранение данных, а Spectrum X отвечает за крупномасштабные сетевые операции.

После доклада о процессоре Vera Rubin, Дженсен Хуанг также выступил с отдельным докладом о процессоре Vera.

По его мнению, традиционные процессоры в основном служили пользователям и предоставлялись в аренду через традиционные облачные вычисления, при этом вычислительные ресурсы сдавались в аренду по ядрам или по времени, а скорость отклика измерялась в секундах. Однако ритм работы интеллектуальных агентов совершенно иной:

Они часто запускают инструменты, обращаются к базам данных, выполняют код и извлекают информацию из памяти, при этом каждый шаг требует минимальной задержки.

Это делает роль центрального процессора (ЦП) в фабриках ИИ еще более важной. Чем больше агентов, чем чаще вызываются инструменты и поступают данные, тем выше вероятность того, что ЦП станет узким местом. В частности, графические процессоры (ГП) стали самыми дорогими активами в фабриках ИИ, а задержка и пропускная способность ЦП напрямую влияют на использование ГП, что в конечном итоге сказывается на производстве токенов.

Такова логика проектирования процессора Vera.

Хотя процессоры традиционно использовались людьми, процессор Vera разработан для интеллектуальных агентов, численность которых значительно превосходит численность людей. Он использует специально разработанное ядро ​​Olympus, ориентированное на производительность в однопоточном режиме, межъядерную пропускную способность, общую пропускную способность и энергоэффективность. Он оснащен нейронным предсказателем ветвлений, 10-канальным механизмом декодирования, мощным механизмом внеочередного выполнения и усовершенствованным механизмом предварительной выборки. В качестве памяти используется LPDDR5X, поддерживающая несколько механизмов коррекции ошибок.

Этот процессор содержит 88 ядер Olympus, соединенных монолитной сетчатой ​​архитектурой, вместо распределения ядер по нескольким чиплетам. Такая конструкция снижает задержку, связанную с межчиповой связью. Он поддерживает PCI Express Gen 6, обеспечивая внутреннюю пропускную способность 3,6 ТБ/с и пропускную способность памяти 1,2 ТБ/с.

По сравнению с процессорами x86, Vera снижает пиковую задержку памяти на 40% в некоторых сценариях, обеспечивает в 1,8 раза большую производительность, чем песочница агента, в 3 раза большую производительность SQL и в 6 раз большую производительность обработки потоковых данных в реальном времени.

Агенты представляют собой новую рабочую нагрузку, и роль центрального процессора соответственно меняется. Он больше не просто арендуемое универсальное ядро ​​в облаке, а ключевой компонент на «фабрике» ИИ, который планирует модели, инструменты, память, базы данных и системы безопасности.

Сейчас компьютеры покупают для создания фабрик искусственного интеллекта.

Дженсен Хуанг неоднократно подчеркивал, что бизнес-логика ИИ изменилась. В прошлом вычислительная мощность часто рассматривалась как издержки, но теперь токены — это единицы, способные приносить доход. Пока токены могут приносить доход, вычислительная мощность становится производственной мощностью.

Если вы хотите зарабатывать деньги с помощью токенов, обратите внимание на NVIDIA AI Factory. NVIDIA DSX — это проект и эталонная модель для создания и эксплуатации фабрики ИИ. Основанная на Omniverse, она использует цифровые двойники для предварительного моделирования компоновки, электропитания, охлаждения, сети и системной интеграции фабрики ИИ.

Дженсен Хуанг упомянул, что инвестиции в фабрику искусственного интеллекта мощностью 1 ГВт могут достичь 50, 60 или даже 80–100 миллиардов долларов. Чем выше капитальные затраты, тем важнее становятся скорость развертывания системы, производительность, надежность и срок ее службы.

RTX предназначалась для наших графических процессоров, DGX — для наших систем, а теперь DSX составляет ядро ​​всей инфраструктуры.

Экосистема NVIDIA DSX включает в себя большое количество компаний, предоставляющих облачные услуги, и предприятий, занимающихся инфраструктурой искусственного интеллекта, в том числе CoreWeave, Nebius, Nscale, Naver Cloud и другие, и обслуживает таких клиентов, как Cursor, World Labs, Revolut, Shopify и Google, помогая всем корпоративным пользователям получать доход с помощью токенов.

Помимо аппаратного обеспечения, еще одним важным аспектом является вопрос о том, как предприятия могут эффективно использовать интеллектуальных агентов.

Дженсен Хуанг классифицирует возможности, необходимые предприятиям для создания интеллектуальных агентов, на четыре типа: модели, системы планирования, инструменты и навыки, а также операционные среды. В плане продуктов это соответствует Nemotron, OpenShelf, библиотекам CUDA X и платформам искусственного интеллекта.

Nemotron 3 Ultra — это новая открытая модель, выпущенная на этот раз. В ней используется модель пространства состояний SSM и гибридная экспертная архитектура MoE, цель которой — ускорить работу модели и снизить затраты на вывод.

Согласно отзывам пользователей, по сравнению с другими открытыми моделями, такими как Kimi K2.6, Qwen 3.5 и Zhipu GLM 5.1, она в 5 раз быстрее и обеспечивает снижение общих эксплуатационных расходов примерно на 30%.

Дженсен Хуанг также упомянул, что модель Nemotron 3 Ultra, сценарии обучения и обучающие данные будут доступны, что позволит компаниям добавлять собственные отраслевые данные и запатентованные знания.

В конце своего выступления Дженсен Хуанг подвел итог всей презентации, сосредоточившись на ключевой концепции: модель, инструментарий, инструменты, навыки и операционная среда.

Эта модель может работать в облаке или локально внутри предприятия; она может работать на ПК, а также в транспортных средствах, роботах, спутниках, базовых станциях связи, на заводах и периферийных устройствах. В разных сценариях будут использоваться разные модели, платформы, инструменты и среды выполнения, но вычислительная модель остается неизменной.

Облачным технологиям нужны Вера Рубин и фабрики искусственного интеллекта. Персональным компьютерам нужны RTX Spark и платформа интеллектуальных агентов Windows. Предприятиям нужны Nemotron, OpenShelf и набор инструментов CUDA X. Автомобилям нужны Alpamayo, Hyperion и среды выполнения для автономного вождения. Гуманоидным роботам нужны Исаак Гроот, Тор, системы моделирования и генерации данных.

Если посмотреть всю речь целиком, то получится расширенная презентация продолжительностью почти два часа, и темы, затронутые Хуан Жэньсюнем, выходят за рамки типичного запуска нового продукта.

Компьютеры с поддержкой ИИ и RTX Spark разработаны для персональных устройств, предоставляя пользователям доступ к интеллектуальным агентам на их рабочих местах и ​​дома. Vera Rubin предназначена для центров обработки данных и обработки больших объемов задач с участием интеллектуальных агентов. Процессоры Vera решают проблемы задержки при вызове инструментов и доступе к данным интеллектуальными агентами.

DSX разработан для строительства заводов с использованием ИИ, интегрируя системы электропитания, охлаждения, сетевого взаимодействия и логистики. Библиотеки Nemotron, OpenShelf и CUDA X предназначены для разработки корпоративных агентов. Cosmos 3 переносит агентов в физический мир. Alpamayo 2 и Hyperion предназначены для автономного вождения, а Isaac Groot интегрирует человекоподобных роботов в логику той же платформы.

Изначально NVIDIA специализировалась на поставках графических процессоров, затем стала системной компанией, а теперь стремится стать компанией, занимающейся инфраструктурой для искусственного интеллекта.

На этой конференции Хуан Жэньсюнь хотел подчеркнуть именно это: конкуренция в области искусственного интеллекта расширилась от моделей до целой вычислительной системы, охватывающей персональные компьютеры, корпоративное программное обеспечение, центры обработки данных и физические устройства.

Мо Чунюй и Чжан Цзихао

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.