Браузеры с искусственным интеллектом уже здесь, и вам нужно научиться правильно пользоваться интернетом.

Примерно месяц назад я провёл для группы первокурсников техническую демонстрацию того, как создать специальный навык в браузере с искусственным интеллектом и автоматизировать исследовательскую работу по заданиям. Вместо того, чтобы загружать их бессмысленными поисками в Google, «ИИ-агент» ограничил свой поиск лишь несколькими академическими и образовательными источниками, чтобы дать ответ.

Я сделал всё это, просто набрав «/course» и «Закон индукции Фарадея». Краткое содержание и ответы, предлагаемые браузером, были строго по школьной программе, без каких-либо слишком глубоких или поверхностных фраз. Весь подход быстр, эффективен и исключает непредсказуемость ИИ, который просто выдаёт жаргон из сомнительных источников или просто галлюцинирует.

Группа, в которую входил и мой брат, была поражена. Это был совершенно новый способ поиска нужной информации в интернете. Вместо того, чтобы задавать эту задачу стандартному чат-боту на основе искусственного интеллекта, который сам понимает, какой источник хорош, а какой стоит пропустить, теперь они могут сами указывать, откуда именно получать ответы.

Это совершенно новый мир и радикальное переосмысление нашего взаимодействия с веб-браузерами. ChatGPT Atlas от OpenAI , Dia, Comet от Perplexity , а также, в некоторой степени, Google Chrome и Microsoft Edge, уверенно продвигаются в этом направлении. Вот краткий обзор наиболее заметных способов, которыми браузеры с искусственным интеллектом меняют правила игры.

Конец беспорядку в браузере

Устаревшие веб-браузеры ограничивают доступную информацию одной вкладкой. Для исследования контекста, вопросов по контексту или просто проверки базового факта необходимо открыть другую вкладку или новое окно.

Короче говоря, задачи быстро загромождаются. Браузеры с искусственным интеллектом решают эту проблему с помощью постоянной боковой панели, где можно обсудить со встроенным помощником то, что отображается на экране, отвлечься от темы для изучения дополнительной информации, коллективно извлечь информацию из других вкладок и сделать многое другое в одном месте.

Недавно я читал статью о прорыве, который фактически превращает бетон в устройство хранения энергии. В статье обсуждались все возможные способы его применения, и одним из предложений была секвестрация углерода. Я не был до конца в этом уверен, поэтому просто открыл встроенный помощник ChatGPT в боковой панели и спросил: «Что такое секвестрация углерода?»

Я получил ответ на боковой панели и задал дополнительные вопросы, включая наглядное объяснение с помощью диаграммы, созданной встроенным генератором изображений. Всё это происходило на боковой панели, без необходимости переключаться между вкладками и окнами.

Более того, я могу запустить полноценный веб-поиск на той же боковой панели, создать подробный отчёт Deep Research и добавить собственные источники (из подключённых сервисов, таких как Gmail, Drive, Notion и т. д.). Я также могу перейти в режим агента и приступить к работе.

В связи с этим я включил режим автономного просмотра и попросил его загрузить все статьи, опубликованные Массачусетским технологическим институтом (MIT) по теме «умных» бетонов, способных накапливать энергию. Примерно через две минуты я получил длинный список таких статей, аккуратно сгруппированных в таблицу, с кратким описанием и поддоменом MIT, где они были опубликованы.

Всё это происходило в фоновом режиме, пока я работал над другой вкладкой. Боковая панель в браузерах с искусственным интеллектом — будь то ChatGPT в Atlas, Gemini в Chrome или Copilot в Edge — это невероятно продвинутый инструмент, который упрощает рутинную работу в интернете и экономит массу времени.

Управляйте браузерами так, как вам нужно

Один из самых впечатляющих инструментов, доступных сейчас в браузерах с искусственным интеллектом, — это система создания пользовательских навыков и сочетаний клавиш. Представьте их как одноразовые команды, выполняющие определённую задачу. Эти задачи могут быть любыми и будут работать именно так, как вы их описали.

Например, я создал собственный GPT под названием «Помощник по исследованиям». При вызове его командой «/» он выполняет описанную задачу в новой вкладке или на боковой панели помощника в том же окне. Похожая система, называемая «быстрые клавиши и навыки», также доступна в Comet и Dia. На изображении выше показан пример создания такой системы в браузере Comet.

Вот как это работает. Вы выбираете случайное имя, описываете, что хотите сделать в браузере, и нажимаете «Сохранить». Например, я создал один для покупок, который называется, ну, «шопинг». И вот что самое интересное. Вы просто описываете, что должен делать навык, и он будет настроен соответствующим образом.

Недавно я выбирал беспроводные наушники на Amazon, но хотел сравнить цены и на других сайтах. Вместо того, чтобы открывать каждый сайт и вручную искать товар, я просто набрал «/shopping» в боковой панели помощника на той же вкладке, и он выдал мне список всех сайтов, продающих эти наушники, с ценой и ссылкой.

Аналогичным образом, браузерный агент может не только разворачивать пользовательские запросы на несколько вкладок, но и объединять информацию со всех активных вкладок. Например, если у вас открыты предложения отелей на полудюжине вкладок, вы можете просто нажать на значок «@» на боковой панели и попросить помощника выдать всю важную информацию, такую ​​как цена, удобства, доступность по датам, расстояние от аэропорта и многое другое.

Идея, опять же, заключается в извлечении контекста из активных вкладок. Благодаря мультимодальной распознаваемости ИИ также может распознавать текст и изображения. Например, глядя на фотографию блюда, ИИ может сообщить вам его состав и пищевую ценность, или составить список всех туристических мест в городе, взглянув на изображение иорданского рынка.

Вам просто нужно спросить.

Возможности искусственного интеллекта обеспечивают беспрецедентный уровень контроля и удобства, в сочетании с описанной выше боковой панелью. Это невероятно мощная система автоматизации, которая сэкономит вам массу времени, избавит от утомительного просмотра, переключения между вкладками и избавит от лишних хлопот.

Страшная сторона браузеров с искусственным интеллектом

Одной из самых многообещающих особенностей браузеров с искусственным интеллектом является их способность подключаться к сторонним сервисам и передавать управление чат-ботам на базе искусственного интеллекта. Например, Comet и ChatGPT от Perplexity также могут подключаться к вашему почтовому ящику Gmail, WhatsApp, Slack, облачным хранилищам и другим сервисам.

В режиме агента вы можете совершать покупки или бронировать столики, просто используя текстовые подсказки. Система работает автономно, обрабатывая нажатия и ввод данных от вашего имени. Наблюдать за этим в действии довольно сюрреалистично, но именно здесь и начинаются проблемы.

Можно ли доверить ИИ-агенту (и интегрированному браузеру) конфиденциальные данные , такие как учётные данные? В ChatGPT Atlas, например, браузер запоминает не только ваши действия в интернете, но и историю чатов. И то, как он регистрирует всю эту информацию, крайне пугает. Это открывает совершенно новый мир гиперперсонализированной рекламы и рисков для конфиденциальности.

Эксперты также опасаются рисков, связанных не только с традиционной моделью веб-активности, но и с целым рядом новых видов атак, которые открылись благодаря чат-ботам и браузерам на базе искусственного интеллекта.

«Чем больше возможностей пользователи предоставляют ИИ, тем выше риски. Если браузер может заказывать товары онлайн, злоумышленник всегда сможет заставить его отправить другой товар — потенциально что-то неприятное или даже опасное — по этому адресу», — рассказал Digital Trends Лео Файнберг, соучредитель и генеральный директор Verax AI.

Помимо очевидных рисков галлюцинаций (то есть распространения ложной информации или выдуманных фактов) и предвзятости, веб-браузер, управляемый искусственным интеллектом, несет в себе серьезные риски безопасности. Специалисты Brave Software Inc. обнаружили риск мгновенного внедрения в браузер Comet от Perplexity.

В последующем отчёте создатель одноимённого браузера, ориентированного на конфиденциальность, подробно описал аналогичную уязвимость в другом браузере с искусственным интеллектом. «Если вы вошли в браузер в конфиденциальные учётные записи, например, вашего банка или почтового сервиса, простое краткое изложение поста на Reddit может привести к краже денег или ваших личных данных злоумышленником», — сообщается в отчёте . Целью атаки могут быть ваши банковские операции, медицинские данные, данные, хранящиеся на облачных дисках, входящие сообщения электронной почты и многое другое.

Джонни Хьюз, директор по маркетингу и председатель совета по ИИ в компании Avenue Z, специализирующейся на коммуникациях с использованием искусственного интеллекта, рассказал DigitalTrends, что веб-браузер развивается, выходя за рамки ручного поиска и ключевых слов, переходя к формату разговора, подобно тому, как мы взаимодействуем с чат-ботами на основе искусственного интеллекта, чтобы найти ответы. Интересно, что он отметил, что внедрение ИИ в основной интерфейс веб-браузера не имеет однозначной пользы или вреда.

«Эти инструменты — контекстные движки, обученные на нашем поведении, вводимых данных и запросах. Что происходит, когда ваш браузер знает о вас больше, чем ваш партнёр?» — добавляет он. Риски серьёзны. В августе произошла утечка переписи пользователей с ChatGPT и чат-ботом Grok от xAI, в результате чего были раскрыты тысячи переписок в Google Поиске. Тогда эксперты отмечали, что чат-боты представляют собой более серьёзную угрозу конфиденциальности, чем браузеры.

Смешивание этих двух подходов, безусловно, выглядит как пагубный рецепт. «Тем, кто собирается стать одним из первых пользователей, я бы рекомендовал использовать эти инструменты осторожно, предоставляя им минимальные разрешения и блокируя возможности для потенциально опасных действий», — предупреждает Файнберг, чья компания работает на стыке искусственного интеллекта и безопасности.

Инженер компании, занимающейся ИИ, на условиях анонимности рассказал мне, что, несмотря на работу над потребительскими продуктами на базе ИИ, они опасаются объединять все используемые вами сервисы в единую экосистему чат-ботов. ИИ-помощники гораздо более персонализированы, чем веб-браузеры, и связывать их с другими продуктами, которыми вы пользуетесь ежедневно — от Amazon до Spotify — всё равно что позволить компании, занимающейся ИИ, составить досье на всю вашу жизнь.

Необходимо провести черту, где можно найти баланс между удобством браузеров с искусственным интеллектом и рисками для конфиденциальности. Однако этот сдвиг неизбежен.