Сервис Google Gemini вскоре сможет выполнять работу за вас.
По сообщениям, Google разрабатывает значительное обновление для своего генеративного ИИ-помощника Gemini , которое может превратить его из преимущественно разговорного помощника в нечто, более близкое к реальному рабочему агенту. В ходе недавнего анализа бета-версии кода приложения Google, проведенного изданием 9to5Google , разработчики обнаружили строки, указывающие на функцию, известную внутри компании как «автоматизация экрана». Это говорит о том, что Gemini вскоре сможет выполнять прямые действия от вашего имени в некоторых приложениях Android, например, размещать заказы или заказывать поездки, без необходимости ручного ввода данных на экран.
Хотя Gemini уже обеспечивает выполнение задач, требующих диалогового взаимодействия, таких как составление электронных писем или разработка планов исследований, это обновление, похоже, позволит ему буквально взаимодействовать с интерфейсами приложений, нажимая кнопки и перемещаясь по экранам для выполнения задач, которые вы обычно выполняете самостоятельно. Первые результаты бета-тестирования показывают, что эти возможности первоначально будут ограничены несколькими поддерживаемыми приложениями и будут делать упор на контроль со стороны пользователя. Google предупреждает, что «Gemini может совершать ошибки», и что пользователи по-прежнему несут ответственность за действия, предпринятые от их имени.
Как это обновление превращает ИИ из помощника в агента.
Концепция автоматизации экранных действий — важный шаг на пути к большей автономности ИИ в повседневных цифровых рабочих процессах. Вместо того чтобы просто предлагать варианты действий, Gemini вскоре сможет выполнять эти действия непосредственно в приложениях. Ранние фрагменты кода из бета-версии Google также указывают на меры предосторожности в отношении конфиденциальности, такие как рекомендации пользователям не вводить данные для входа или платежную информацию в чаты с ИИ и предупреждение о том, что скриншоты могут быть проверены для улучшения функции. Google уже предлагает некоторые возможности агента через свою платформу Gemini Agent в Workspace и веб-версии, где ИИ может обрабатывать сложные рабочие процессы и координировать действия между сервисами, но автоматизация экранных действий может перенести эти возможности непосредственно в смартфоны и повседневное использование приложений.
Если эти функции получат широкое распространение, это может ознаменовать сдвиг в том, как люди взаимодействуют с мобильными устройствами: от простого касания и свайпа до предоставления инструментам искусственного интеллекта разрешения действовать от их имени. Это может упростить повседневные задачи, но также поднимает вопросы контроля, безопасности и надзора, особенно когда автоматизация затрагивает такие важные задачи, как бронирование или финансовые операции.
По имеющимся данным, Google позиционирует эти обновления как необязательные и контролируемые, позволяя пользователям останавливать или отменять Gemini в любое время. Однако на данный момент функция автоматизации экрана находится в разработке и еще не включена в стабильные версии.
Статья под названием "Google Gemini скоро сможет выполнять за вас работу" впервые появилась на сайте Digital Trends .