Теперь ваш голос полностью управляет этим браузером с искусственным интеллектом.

Компания Perplexity только что запустила улучшенный голосовой режим для своего браузера Comet . Пользователи настольных компьютеров могут попробовать его прямо сейчас. Пользователям iOS нужно подождать еще несколько дней. Обновление позволяет управлять всем без помощи рук. Открывайте сайты, прокручивайте страницы или переходите по ссылкам. Все с помощью голосовых команд.

На компьютере вы нажимаете Shift + Alt + V, а на Mac — Shift + Option + V. На iPhone те же инструменты скоро появятся, превратив Comet в, возможно, первый мобильный браузер, который вам вообще не нужно будет трогать.

Эта функция работает на основе новейшей модели реального времени от OpenAI. Генеральный директор Аравинд Шринивас объявил о запуске на платформе X и поблагодарил команду OpenAI, занимающуюся мультимодальными технологиями. Цель — полноценная навигация по браузеру с помощью речи, а не только голосовой поиск.

Создано на основе новейших голосовых технологий OpenAI.

В этом голосовом режиме используется модель gpt-realtime-1.5 от OpenAI, разработанная для голосовых агентов с низкой задержкой. Шринивас выразил благодарность команде OpenAI, а Perplexity утверждает, что это улучшило стабильность вызовов инструментов более чем на 25 процентов. Это означает меньшее количество сбоев при попытке выполнить какое-либо действие через браузер. Голоса также звучат лучше, а темп подходит для длительных сеансов прослушивания.

Почему полное управление голосом важно сейчас

Большинство браузеров воспринимают голосовое управление как фокус. Вы произносите запрос, появляются результаты, затем вы нажимаете на экран. Comet же хочет, чтобы голосовое управление сопровождало вас на протяжении всей сессии. Спрашивайте о том, что отображается на вашем экране. Попробуйте сказать: «Прокрутите вниз, откройте третью ссылку, кратко опишите эту страницу, сравните её с вкладкой слева». Клавиатура не требуется.

Время выбрано удачно, учитывая переход к повсеместным вычислениям. Компания Perplexity делает ставку на то, что веб-технологии работают лучше, когда с ними взаимодействуют. На настольных компьютерах эта функция уже доступна.

Comet также придерживается иного подхода к конфиденциальности. По возможности он обрабатывает голосовые данные локально и по умолчанию не хранит историю кликов в облаке. Профили отслеживания рекламы не создаются на основе вашей активности в интернете.

На что обратить внимание в ближайшие дни

Пользователи настольных компьютеров могут протестировать голосовой режим уже сегодня. Для iOS он появится примерно 11 марта, судя по предварительным заказам в App Store. Главный вопрос заключается в том, насколько удобными окажутся элементы управления в реальных задачах, а не только в демонстрационных версиях.

Компания Perplexity уже разрабатывает новые функции. Comet Assistant изучает ваши предпочтения и может помочь с покупками, заказом еды или поиском авиабилетов, основываясь на ваших обычных действиях. Менеджер паролей и синхронизация между устройствами находятся в разработке. Пользователи Android ждут этих функций. Для iOS это обновление голосового управления — лишь первый шаг.

Статья " Теперь ваш голос полностью управляет этим браузером с искусственным интеллектом" впервые появилась на сайте Digital Trends .