OpenAI только что выпустил свой первый браузер с искусственным интеллектом! Он не похож на Chrome, но стремится изменить то, как вы пользуетесь интернетом.

Только что OpenAI официально выпустила первый браузер ChatGPT Atlas.
Последние десять лет Chrome был стандартной точкой входа для всех, кто хочет пользоваться интернетом. Но если бы существовал браузер с искусственным интеллектом, встроенным ChatGPT, встроенной памятью и возможностями агента, захотели бы вы его попробовать?
Именно это и делает представленный сегодня Atlas.

OpenAI заявила, что Atlas — это браузер, построенный на основе ChatGPT, а не просто подключаемый к нему. Его основная концепция — полная интеграция:
- Вызовите боковую панель в любое время: нажмите кнопку «Спросить ChatGPT», чтобы открыть боковую панель ChatGPT в правой части любой страницы. ChatGPT, всегда распознавая контекст, считывает информацию о странице, на которой вы находитесь, и может помочь вам кратко изложить содержание, объяснить информацию или выполнить действия прямо в текущем окне.
- Помощь ИИ: ChatGPT предлагает варианты исправления в режиме реального времени и интеллектуальное дополнение при вводе текста в любом открытом поле ввода, помогая вам печатать более эффективно.
- Режим агента: позволяет ChatGPT автономно выполнять многошаговые задачи в браузере.
Уже сегодня им смогут воспользоваться пользователи macOS. Пользователи бесплатной версии ChatGPT, а также версий Plus, Pro и Go могут скачать и протестировать его. Версии для Windows, iOS и Android появятся в ближайшее время.
Ссылка для скачивания: chatgpt.com/atlas
Однако режим агента в настоящее время доступен только пользователям версий Plus, Pro и Business и пока находится на ранней стадии разработки, поэтому при выполнении сложных задач могут возникать ошибки. Кроме того, если вы установите Atlas в качестве предпочитаемого браузера, вы сможете получить семидневную подписку и увеличить лимит использования.

Функция памяти браузера Atlas весьма интересна. Она позволяет ChatGPT запоминать контекст посещённых вами сайтов и вызывать эту информацию по мере необходимости.
Например, вы можете попросить его: «Найти все объявления о вакансиях, которые я видел на прошлой неделе, и кратко описать тенденции в отрасли, чтобы я мог подготовиться к собеседованиям».
Это может быть полным воплощением видения «персонального помощника на основе искусственного интеллекта»: он помнит, кто вы, что вы сделали, и может выполнять задачи от вашего имени.
Конечно, когда дело касается конфиденциальности, вы полностью контролируете то, что ChatGPT видит и запоминает во время вашего просмотра. Вы можете удалить записи отдельных страниц, очистить всю историю просмотров или открыть «окно инкогнито» для временного просмотра без входа в ChatGPT.

OpenAI утверждает, что по умолчанию просматриваемый вами веб-контент не будет использоваться для обучения модели.
Atlas также поддерживает родительский контроль. Если родители настроят родительский контроль для ChatGPT, эти настройки автоматически будут применены к Atlas. OpenAI также добавила функции родительского контроля, специально разработанные для Atlas, такие как возможность отключения памяти браузера или режима агента.
Атлас = Google+ChatGPT?
Когда вы открываете домашнюю страницу Atlas, она по-прежнему похожа на ChatGPT.
После ввода вопроса Atlas откроет окно с вариантами ответов, предлагая два варианта: Google и Чат, а также несколько более конкретных ссылок.

Как следует из названия, первый вариант Google переходит непосредственно на обычную страницу поисковой системы, тогда как второй похож на обычного помощника чата на основе искусственного интеллекта, вызывая модель ChatGPT для непосредственного предоставления ответов, а каждый вопрос, который вы задаете в Atlas, будет сохранен в истории чата вашей учетной записи ChatGPT.
Помимо ответов в диалоговом окне, вы также можете переключаться между вкладками и просматривать поисковые ссылки, изображения, видео и новости. Большинство из них также сохраняют возможность перехода к поисковой системе Google.
При постановке вопросов все еще наблюдается разрыв в производительности разных моделей.

Например, я спросил: «Могут ли домашние животные теперь ездить на высокоскоростных поездах?» Я явно нажал на источник поиска и увидел ссылку на официальный сайт, где говорилось, что это разрешено, но GPT-5 Instant не интегрировал правильный ответ.

С другой стороны, когда мы переключаемся на мышление по методике GPT-5, оно дает правильный и строгий ответ.

Интерактивный дизайн Atlas — это плюс.
Традиционные плагины ИИ в основном представлены в виде боковых панелей и плавающих окон, охватывающих чат ИИ, перевод, сводку веб-страниц и т. д.
Аналогично, страница результатов поиска Atlas по умолчанию отображается в разделённом экране с помощью ChatGPT. Нажатие кнопки «Спросить ChatGPT» в правом верхнем углу похоже на установку плагина ИИ: исходная веб-страница отображается слева, а несколько раундов диалогов с ChatGPT — справа, вместо традиционного перехода к одной строке поиска.

Например, вы можете выделить слово и напрямую выполнить его поиск или объяснение на правой стороне веб-страницы или попросить предоставить краткое содержание статьи.
Сегодня утром во время прямой трансляции сотрудники OpenAI искали фильмы и проверяли отзывы на таких сайтах, как Roger Ebert, а затем попросили ChatGPT составить краткое изложение отзывов не более чем в пять слов. Эта простая операция несложна.
Он даже может оптимизировать текст веб-страницы, оптимизировать заголовки и т. д. В целом работа выполняется относительно гладко.

Также в сегодняшней демонстрации, когда внутренние сотрудники OpenAI писали электронные письма дизайнерам команды, они напрямую выбирали фрагмент текста, нажимали кнопку ChatGPT и вводили команду «Оптимизировать язык».
ChatGPT оптимизирует текст на месте, позволяя пользователям итерировать его и затем нажимать кнопку «Обновить», чтобы заменить исходный текст новым. Эта функция полностью упрощает утомительный процесс многократного копирования и вставки между документами и ChatGPT.
После реального тестирования не возникло никаких проблем с обобщением видеоконтента.

Кроме того, Atlas поддерживает скриншоты. Нажмите на значок «+» справа и выберите «Прикрепить скриншот», чтобы загрузить его. Я нашёл фотографию Маска и выполнил эту операцию. Atlas также может точно определить, что это Маск.
Режим агента в боковой панели тоже может быть очень интересным. Пользователь сети @mteamisloading попросил агента нарисовать цветок на сайте для рисования, и весь процесс занял всего 4 минуты.

Стоит отметить, что Atlas также поддерживает вызов тегов веб-страниц через @. Однако Dia может вызывать несколько тегов веб-страниц одновременно, в то время как Atlas может вызывать только одну открытую веб-страницу за раз, что несколько бесполезно. Думаю, позже это будет обновлено.

Режим агента — изюминка браузера Atlas.
В сегодняшней демонстрации сотрудник OpenAI планировал приготовить еду для компании из восьми человек и открыл страницу с рецептами. Он запросил у ChatGPT необходимые ингредиенты, и ChatGPT автоматически проанализировал содержимое страницы и рассчитал порции. Система также отсортировала список покупок по полкам в супермаркете, основываясь на ранее упомянутых предпочтениях пользователя.
После подтверждения заказа пользователем агент автоматически открывает сайт Instacart, ищет товары и добавляет их в корзину. Весь процесс занимает всего две минуты. Хотя заказ не формируется автоматически, подготовленная корзина экономит много времени, позволяя пользователю самостоятельно ознакомиться с товарами и решить, стоит ли их приобретать.
Например, в рабочем сценарии вы можете открыть ChatGPT и прочитать предыдущие документы команды, провести новое конкурентное исследование и объединить их в брифинг для команды.

С точки зрения реального опыта, например, если я сделаю запрос «Пожалуйста, помогите мне купить iPhone 17 Pro Max на официальном сайте Apple», то при выполнении задач в режиме агента будут отображаться кнопка «Взять управление на себя» и красная кнопка «Стоп», и вы сможете взять управление на себя в любой момент.
Скорость работы не сильно отличается от режима агента в предыдущей версии ChatGPT. Нам самим, возможно, потребуется несколько минут, чтобы оформить заказ, но после передачи его агенту — 19 минут. Такая скорость, очевидно, неудовлетворительна.
Короче говоря, режим агента в Atlas на самом деле больше похож на отделение функции агента в ChatGPT. При этом ваши исторические записи чатов в Atlas также будут сохранены в ChatGPT.
Что касается моего общего опыта работы с Altas, то, по моей оценке, некоторые сюрпризы были, но их было немного.
Atlas представляет собой сочетание Google Поиска и диалогов ChatGPT. Однако Atlas также сохраняет уникальную модель агента ChatGPT, объединяя возможности браузера с возможностями ChatGPT. Поиск, понимание и исполнение осуществляются в замкнутом цикле.
Стоит отметить, что инженер Бен Гудгер, ответственный за проект Atlas, имеет тесные связи с самой компанией Chrome.
Он присоединился к Google в 2005 году, чтобы принять участие в исследовании и разработке Chrome. Он является одним из ключевых членов команды, внесшим наибольший вклад в Chrome. В 2024 году он присоединился к OpenAI и стал главным техническим исследователем и разработчиком браузера ChatGPT Atlas.

За последний длительный период времени различные компании выпустили собственные браузеры на базе ИИ.
В этой войне браузеров Perplexity Comet больше подойдет для гиков или продвинутых пользователей, в то время как Atlas, основанный на движке Chromium, имеет более низкий порог опыта и больше сопоставим с Dia.
Интересно, что Dia только что была приобретена гигантом корпоративного программного обеспечения Atlassian за 610 миллионов долларов… так что теперь Atlas против Atlassian, что является довольно неожиданным совпадением.
Оглядываясь на идеи OpenAI в отношении продуктов, можно сказать, что предыдущая стратегия OpenAI заключалась в создании суперприложения и интеграции в него различных функций. Однако, будь то независимый запуск приложения Sora некоторое время назад или запуск приложения Atlas в этот раз, OpenAI постоянно отделяет функции от ChatGPT.
Это также соответствует идеям продукта, о которых Ultraman упоминал в предыдущих интервью. Разные продукты имеют разное «психологическое позиционирование» в сознании пользователей, и принудительное смешивание разрушит весь опыт.
Если говорить прямо, текущая стратегия OpenAI ясна: позволить ChatGPT выполнять функции супероперационной системы, в то время как различные продукты выполняют свои функции и оптимизируют работу для различных сценариев. OpenAI намерена двигаться по этому пути, трансформируясь из «суперприложения» в «матрицу продуктов».
#Приглашаем вас следить за официальным публичным аккаунтом WeChat проекта iFaner: iFaner (WeChat ID: ifanr), где в ближайшее время вам будет представлен еще более интересный контент.
iFanr | Исходная ссылка · Просмотреть комментарии · Sina Weibo