После недели использования браузера ChatGPT я переустановил Chrome.

За последнюю неделю я перепробовал все основные браузеры с поддержкой ИИ.

Atlas от OpenAI, Comet от Perplexity, Dia от Browser Company и Edge Copilot — одни из самых популярных браузеров на базе ИИ на рынке, каждый из которых имеет свои преимущества и недостатки.

Каким будет будущее браузеров? Эти продукты предлагают совершенно разные решения.

Проще говоря, есть две фракции.

Поэтапный подход, представленный Chrome и Edge, предполагает добавление функций ИИ в традиционные браузеры. Google, занимающая крупнейшую долю мирового рынка, не видит необходимости в полной перестройке, чтобы удовлетворить привычки большинства пользователей. ИИ — это просто дополнительная функция; браузер остаётся прежним.

Как и в зарубежной версии Chrome, в Edge есть кнопка вызова ИИ-помощника в правом верхнем углу, которая открывает боковую панель. Однако Edge Copilot больше ориентирован на голосовое управление, и в ходе реального тестирования китайский акцент звучал несколько странно и не совсем соответствовал реальным сценариям использования.

Радикальный лагерь, представленный ChatGPT Atlas, рассматривает ИИ как ядро ​​браузера, разрабатывая весь браузер вокруг диалогов с ИИ. Короче говоря, браузер сам по себе и есть ИИ.

Конечно, современные браузеры уже не ограничиваются ответами на вопросы «что» и «почему», а хотят помочь вам с вопросом «как». Например, Atlas и Comet поддерживают режим агента, который позволяет им выполнять команды после того, как вы их введёте.

Выводы таковы:

  • ChatGPT Atlas: самый рекомендуемый и мощный инструмент, который действительно поможет вам управлять веб-страницами и автоматизировать задачи, но в настоящее время имеет уязвимости безопасности. Он подходит для платных пользователей ChatGPT и тех, кому действительно нужен искусственный интеллект для решения задач.
  • Perplexity Comet: Он комплексно агрегирует информацию, но работает медленно и механически, а возможности агента ограничены. Подходит для пользователей, которые хотят проводить исследования и составлять отчёты.
  • Dia: Самая высокая скорость, минималистичный интерфейс, но не хватает детализации и не выполняет никаких операций. Подходит для новичков, которым нужен быстрый просмотр (20 долларов США в месяц).
  • Edge Copilot: бесплатный, с понятной структурой, но слишком зависим от ИИ и шаблонов, а также не выполняет никаких задач. Подходит для обычных пользователей, которые не хотят тратить деньги или тратить время.

Какой браузер с искусственным интеллектом мне лучше использовать?

Мы задали этим браузерам несколько «тестовых вопросов», чтобы оценить уровень их искусственного интеллекта.

Резюме статьи

Dia — самый быстрый, выдаёт результаты за секунды и подходит для быстрого просмотра, но не слишком подробен. Comet же, напротив, предоставляет более содержательные резюме, отражающие практически все основные моменты статьи.

Edge Copilot чем-то похож на профессионального медиаредактора, способного извлекать логические слои, такие как «рекламные механизмы» и «смены платформ», с сильным чувством структуры. Однако он слишком сильно подвержен влиянию ИИ.

Атлас является наиболее «человечным», поскольку он не только фиксирует факты, но и выходит на уровень ценностей, предлагая наблюдения с оттенком перспективы.

Короче говоря: Dia ищет скорость, Comet ищет полноту, Edge ищет стабильность, а Atlas ищет глубину.

В конечном счёте, всё зависит от того, у какой компании более сильная базовая модель. Например, Atlas использует собственную модель GPT, что даёт ей естественное преимущество, позволяя играть на своей территории.

Видеообзор

Субтитры по-прежнему являются обязательным условием для краткого изложения видео; в противном случае даже ИИ будет сложно функционировать без них.

И Dia, и Atlas могут создавать сводки, удобные для быстрого обзора, а также предлагают подробный анализ временной шкалы, облегчая создание заметок. Однако Dia создаёт сводки гораздо быстрее.

Несмотря на то, что Edge Copilot имеет мощный компонент искусственного интеллекта, он может не только понимать поверхностное содержание текста, но и распознавать позицию автора и эмоциональную окраску его высказываний, делая их более четкими.

Выступление Perplexity Comet было посредственным: оно выполнило ряд впечатляющих шагов, но в конечном итоге предоставило лишь посредственный обзор.

Планирование поездки

Мы составили запрос: «Хочу поехать в Гуанчжоу из Шанхая на два дня в эти выходные. Пожалуйста, помогите мне спланировать маршрут, забронировать отели и составить бюджет».

В целом, ChatGPT Atlas для меня — самый беспроблемный вариант.

Он напрямую генерирует полноценные путеводители, объединяя всё — от маршрутов до бюджетов — и обобщая информацию с различных платформ, таких как Ctrip. Сервис богат подробными изображениями и текстом, что делает его особенно подходящим для тех, кто ценит детали в путешествиях.

Хотя и Edge Copilot, и Comet предоставляют полные списки маршрутов, Comet немного более практичен, а Edge больше похож на шаблон, созданный ИИ.

При использовании совместно с поиском Google Dia напрямую генерирует решения, что удобно, но источник информации неясен.

Честно говоря, сейчас мы не можем полностью полагаться на путеводители, созданные искусственным интеллектом; они могут служить лишь общим ориентиром. Для получения действительно достоверной информации всё равно нужно изучать публикации реальных людей в социальных сетях.

Кто на самом деле может помочь вам с работой?

Лучшим индикатором различий между браузерами ИИ являются возможности выполнения Agnet.

Мы посоветовали им «купить iPhone 17 Pro Max на сайте Apple».

Dia может быстро определить намерение пользователя и сгенерировать четкое пошаговое руководство по покупке (посетите официальный сайт → выберите модель → выберите способ оплаты), предоставив конкретные данные, но фактически заказ не будет оформлен за вас.

Edge Copilot больше похож на «помощника по поиску информации на основе искусственного интеллекта», способного быстро анализировать команды и точно описывать состояние веб-страницы, но при этом он фактически ничего не нажимает, а лишь предлагает взаимодействие в стиле вопросов и ответов.

Скриншот браузера Edge Copilot

Comet фактически нажимает на кнопки, вводит информацию и переходит на разные страницы, имитируя действия человека, осуществляющего закупки. Однако он медленный и в значительной степени зависит от механического выполнения вплоть до последнего шага — оплаты.

ChatGPT Atlas не только распознаёт содержимое веб-страниц, но и может имитировать операции, отслеживать перемещения по страницам, организовывать файлы, генерировать отчёты и даже выполнять автоматизированные скрипты. Он также обладает функцией памяти (помните видео с оценкой робота, которое я смотрел вчера?), и он действительно запомнил его даже спустя сутки.

Помимо совершения покупок, важной потребностью также является сравнение цен на разных платформах.

Хотя и Comet, и Atlas заявляют о своей способности выполнять сложные задачи, при реальном тестировании преимущества ChatGPT Atlas слишком очевидны.

Мне кажется, что сейчас Comet больше похож на умного помощника по поиску с искусственным интеллектом. Его основная задача по-прежнему заключается в агрегации информации и выполнении простых задач. Он может быстро интегрировать различные источники информации, такие как веб-страницы, учебные материалы и видео, и генерировать брифинги или результаты сравнения. Он обладает высокой скоростью отклика, но может выполнять только одношаговые задачи.

ChatGPT Atlas — это настоящий «исполнительный браузерный агент», который может не только понимать содержимое веб-страницы, но и имитировать действия пользователя, такие как нажатие клавиш, ввод текста, отслеживание между страницами, организация файлов и даже создание отчетов или выполнение автоматизированных скриптов.

Это, возможно, подтверждает одно: в эпоху ИИ порог инноваций на прикладном уровне на самом деле невысок; реальным препятствием является сама модель. Те, у кого есть собственная поддержка ИИ, действительно могут добиться плавного прогресса.

Не спешите переходить на браузер с искусственным интеллектом: вам нужно знать эти подводные камни.

Экосистема расширений Chrome уже очень развита. Некоторые могут подумать: разве установка нескольких расширений в Chrome не то же самое, что и Atlas?

Честно говоря, для простых задач, таких как составление резюме статей и перевод веб-страниц, расширений Chrome вполне достаточно. Установка расширения позволяет извлекать ключевые моменты за считанные секунды, предлагая интерфейс, ненамного уступающий браузеру с искусственным интеллектом. Однако, когда дело доходит до сложных задач, расширения совершенно бесполезны.

Более глубокое различие кроется в понимании будущего интернета. Современный интернет создан для людей: макеты страниц и логика взаимодействия основаны на человеческом восприятии и привычках нажатия. Но что, если основными пользователями интернета станут искусственный интеллект и агенты?

Суть браузера — уже не просмотр, а исполнение. Вам не нужно знать, на каком сайте находится информация; достаточно просто сказать ИИ, что вам нужно, и он сам её найдёт, обработает и интегрирует.
С практической точки зрения эти браузеры на базе ИИ используют более надежные стратегии, напрямую поддерживают расширения Chrome и способствуют плавной миграции пользователей.

Конечно, хотя все эти браузеры на базе ИИ созданы на основе Chromium, OpenAI — это не просто «оболочка».

Согласно информации в блоге компании, она переработала взаимодействие браузера и базового движка с помощью собственной архитектуры OWL (веб-уровень OpenAI) и реконструировала интерфейс с использованием собственных фреймворков, таких как SwiftUI, AppKit и Metal, что позволило добиться запуска на втором уровне, более высокого параллелизма и более безопасной среды работы интеллектуальных агентов.

Мой компьютер — MacBook Air M2, и с точки зрения пользовательского опыта разницы в производительности, скорости и стабильности не так уж и много. Кроме того, все браузеры поддерживают импорт закладок и вертикальные вкладки, которые являются базовыми функциями.

Стоит отметить, что браузеры с искусственным интеллектом сталкиваются с серьёзной угрозой безопасности, называемой «атакой с непрямым внедрением инструкций». Проще говоря, это происходит, когда хакеры скрывают вредоносные команды в веб-страницах, электронных письмах и другом контенте. Анализируя этот контент, большие языковые модели могут ошибочно выполнять скрытые команды как настоящие команды пользователя.

Согласно исследованию Brave, несколько продуктов имеют уязвимости, включая Perplexity Comet, браузер Fellou и недавно выпущенный ChatGPT Atlas от OpenAI.

Такие атаки могут иметь серьезные последствия: от влияния на решения агентов ИИ о покупках до кражи личных данных, конфиденциальной информации электронной почты, учетных данных и даже внедрения вредоносного кода или вредоносного ПО.

Директор по информационной безопасности компании OpenAI Дейн Стаки на этой неделе также публично признал, что атаки с использованием инъекций представляют собой серьезную угрозу, однако признал, что это «острая проблема», для которой в настоящее время нет четкого решения.

В связи с этим OpenAI пришлось принять ряд мер, включая создание системы быстрого реагирования, проведение тестов Red Team, запуск режима без входа в систему и внедрение режима мониторинга, который требует от пользователей отслеживать поведение агентов в режиме реального времени при работе на конфиденциальных веб-сайтах.

Самая большая проблема кроется в характеристиках самого ИИ-агента.

Как и люди, они посещают подозрительные веб-сайты и переходят по опасным ссылкам, но им не хватает здравого смысла и интуиции безопасности, что делает их крайне уязвимыми для обмана или даже перехвата тщательно составленными инструкциями. Ещё более проблематично то, что эти атаки крайне скрытны и могут быть скрыты в изображениях, снимках экрана, формах, электронных письмах или даже просто в белом тексте на белом фоне, что делает защиту от них практически невозможной.

Итак, какой браузер выбрать?

Что касается стоимости, браузер Atlas бесплатный, но его основной «режим агента» доступен только пользователям ChatGPT Plus/Pro, фактически «запирая» пользователей своими основными сервисами. Comet использует подход freemium, предлагая базовые функции бесплатно, но с ограничением на количество задач агента.

Dia работает по подписке (20 долларов в месяц за функции ИИ), что делает её самой чистой моделью на сегодняшний день. Однако это нишевый рынок, и доходы от рекламы не являются основной целью. Однако её будущее неопределённо после приобретения Atlassian. В то же время, расходы Chrome и Edge покрываются за счёт собственных рекламных и облачных сервисов, что позволяет им предлагать более щедрые предложения.

Если вы уже активно пользуетесь ChatGPT или являетесь платным пользователем Plus/Pro, Atlas будет очень удобен в использовании и практически не потребует от вас обучения. При этом его возможности по исполнению и запоминанию действительно выше, чем у других.

Если вам требуется строгий поиск источников для исследований, сбора данных и написания отчётов, Perplexity Comet — самый надёжный вариант. Хотя его возможности исполнения, возможно, не столь гибки, как у Atlas, он, по крайней мере, не создаст у вас ощущения неопределённости из-за неясных источников информации.

Если вы хотите попробовать ИИ, но не хотите лишних хлопот, Chrome и Edge вполне подойдут. Они совместимы с расширениями Chrome, требуют низкой стоимости миграции и бесплатны. Хотя их функции ИИ не являются революционными, большинству пользователей их вполне достаточно.

Если вы ищете минимализм и сосредоточенность и не против потратить 20 долларов в месяц, Dia — хороший вариант; однако будущее нишевых продуктов всегда несколько неопределенно.

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (WeChat ID: ifanr), где вы сможете как можно скорее ознакомиться с еще более интересным контентом.

ifanr | Исходная ссылка · Просмотреть комментарии · Sina Weibo