Google использует ИИ, чтобы «убить» Google; эта пресс-конференция оставила зрителей в полном восторге.

Приложение Gemini может похвастаться более чем 900 миллионами активных пользователей в месяц, обрабатывает 3200 триллионов токенов ежемесячно и генерирует более 50 миллиардов изображений с помощью Nano Banana…

На конференции Google I/O, которая завершилась сегодня рано утром, генеральный директор Google Демис Хассабис представил эти данные с самого начала.

За последний год искусственный интеллект стал доминирующей темой во всех отраслях. Роль Gemini в Google также изменилась: из уникального приложения он превратился в важнейшую базовую функцию ИИ во всех продуктах Google.

Эта пресс-конференция началась с обсуждения моделей, а затем перешла к программированию и продуктам для агентов.

Gemini Omni направляет разработку Google видеоконтента в сторону подхода «мировой модели», а Gemini 3.5 Flash, наряду с инструментами программирования ИИ, продвигается в сторону платформы разработки агентов.

Эти две возможности впоследствии были интегрированы во всю экосистему Google, включая Поиск, приложение Gemini, Flow, Spark, Chrome, очки XR и электронную коммерцию.

Прибор Gemini Omni появился в продаже, ознаменовав собой настоящий «нано-банановый» момент в мире видеосъемки.

Первым делом на пресс-конференции был представлен самолет Gemini Omni.

Генеральный директор DeepMind описал Gemini Omni как новую модель, способную «создавать любой контент из любых входных данных». Она объединяет возможности Gemini по выводу информации с существующими моделями генеративного медиаконтента Google, стремясь улучшить понимание моделью окружающего мира, ее возможности многомодальной генерации и редактирования.

Google подчеркивает, что такие модели, как Veo, Nano Banana и Genie, уже могут генерировать видео, изображения и интерактивные симуляции, но Gemini Omni идет еще дальше, начиная решать задачи, более близкие к физическому миру, такие как кинетическая энергия и гравитация.

В ходе пресс-конференции были представлены примеры из практики, включая видеоролики, объясняющие процесс сворачивания белков. Пользователям достаточно ввести запрос, например, «создать анимацию из пластилина, объясняющую процесс сворачивания белков», и Omni сможет преобразовать абстрактные научные концепты в видеоконтент.

Он также поддерживает более естественное редактирование видео. Пользователи могут загружать свои собственные видео, а затем изменять стиль, добавлять элементы, корректировать детали и даже превращать обычный круг в черную дыру, чтобы преобразовать сцену ночной прогулки в более драматичное изображение с помощью диалогов.

Google заявляет, что Gemini Omni начнет работу с видео и постепенно перейдет к модели «любой вход — любой выход». Именно поэтому Google всегда проектировал Gemini как мультимодальную модель.

Первая модель семейства Omni, Gemini Omni Flash, теперь доступна в продуктах Google, а более подробная информация об Omni Pro будет объявлена ​​позже. Функционал Omni в приложении Gemini также доступен подписчикам Google AI Plus, Pro и Ultra.

Это означает, что Gemini Omni — это не просто модель генерации видео. Google хочет включить её в концепцию «модели мира»: модель не только генерирует изображения, но и понимает физические взаимосвязи, взаимосвязи движения и логику сцены в изображениях.

После интеграции в такие приложения, как Gemini App, Google Flow и YouTube Shorts, Omni также расширит возможности инструментов генеративного творчества Google, переведя их с редактирования изображений на редактирование видео.

Теперь доступна технология Gemini 3.5 Flash, позволяющая создавать код с использованием искусственного интеллекта с молниеносной скоростью.

Если Gemini Omni соответствует генерации и редактированию, то Gemini 3.5 Flash соответствует скорости, стоимости и возможностям выполнения.

На мероприятии Google представила Gemini 3.5 Flash, назвав её одной из первых моделей в серии Gemini 3.5, ориентированной на программирование в академической среде, выполнение длительных задач и работу в реальных условиях.

По сравнению с версией 3.1 Pro, версия 3.5 Flash демонстрирует значительные улучшения практически во всех тестах, особенно в возможностях программирования и таких тестах, как GDPVal, которые ближе к реальным экономическим задачам.

Google также подчеркнула, что Flash 3.5 в 4 раза быстрее других передовых моделей при выводе токенов, а после специальной оптимизации в Antigravity его скорость может достигать 12 раз.

Стоит отметить, что в марте этого года внутренние задачи Google, связанные с разработкой, обрабатывали приблизительно 500 миллиардов токенов в день, и с тех пор эта цифра удваивалась каждые несколько недель, в настоящее время превышая 3 триллиона токенов в день. Google называет это циклом обратной связи, используя масштабное реальное использование для дальнейшего улучшения Flash 3.5.

Antigravity 2.0 был выпущен одновременно с моделью.

Программа была модернизирована: вместо интегрированной среды разработки с агентами она стала автономным настольным приложением, сместив акцент на использование агентов. Теперь пользователи не просто используют помощь ИИ при написании кода в редакторе, а выполняют задачи разработки посредством диалога с агентами, использования артефактов агентов и совместной работы нескольких агентов.

Antigravity 2.0 добавляет полноценный интерфейс командной строки, SDK Antigravity, встроенную поддержку речи для аудиомодели Gemini и интегрируется с такими сервисами, как Android, Firebase и Google AI Studio. Antigravity 2.0 также доступен в виде автономного настольного приложения для пользователей по всему миру.

Google продемонстрировал направление развития Antigravity 2.0 с помощью насыщенной презентации: он предоставил агентам возможность создать работающую операционную систему с нуля. Эта задача выполнялась параллельно 93 субагентами в течение 12 часов, инициировав более 15 000 запросов к модели, обработав 2,6 миллиарда токенов и сгенерировав основные модули, такие как планировщик, управление памятью и файловая система, из пустого проекта.

Google утверждает, что это невозможно сделать на Gemini 3.1 Pro, в то время как использование Gemini 3.5 Flash потребует менее 1000 долларов США в виде API-кредитов.

В ходе демонстрации также была показана система, работающая с программой SL Train и игрой Doom. Изначально отсутствовали драйверы видеокарты и клавиатуры, но Antigravity продолжила генерировать и исправлять необходимый код, что позволило запустить Doom. Google также заявила, что аналогичные методы были протестированы на таких проектах, как пакеты для редактирования фотографий, приложения для обмена сообщениями в реальном времени и платформы для многопользовательской совместной работы, что позволило сократить объем инженерной работы, которая в противном случае заняла бы дни, часы или даже меньше.

Gemini 3.5 Flash теперь доступен всем пользователям и охватывает продукты и API Google. Gemini 3.5 Pro по-прежнему используется и улучшается внутри компании, его выпуск ожидается в следующем месяце.

От поисковой строки до информационного агента: Google заново изобретает поиск с использованием искусственного интеллекта.

После разработки моделей и инструментов Google переключил свое внимание на поиск. Google Search — это, по сути, поиск с использованием искусственного интеллекта.

По данным Google, режим AI Mode насчитывает более 1 миллиарда активных пользователей в месяц, а количество запросов удваивалось каждый квартал с момента его запуска.

Начиная с сегодняшнего дня, режим AI обновлен до версии Gemini 3.5. Также сегодня же запускается новое интеллектуальное поле поиска. Оно поддерживает текст, изображения, файлы и видео и предоставляет подсказки от ИИ по мере того, как пользователь вводит вопрос.

Разделы «Обзор ИИ» и «Режим ИИ» объединены в более удобный поиск с использованием ИИ. Пользователи могут сначала увидеть ответ ИИ на главной странице результатов поиска, а затем перейти в режим ИИ, чтобы задать дополнительные вопросы, при этом контекст сохраняется. Новый интерфейс поиска был запущен по всему миру на настольных и мобильных устройствах в день презентации.

Наиболее значительные изменения коснулись поискового агента.

Google заявляет, что этим летом пользователи смогут создавать в Поиске информационных агентов для непрерывного отслеживания определенных типов информации. Например, агент может отслеживать акции крупных биотехнологических компаний с коэффициентом P/E ниже 15, положительным денежным потоком и низким уровнем задолженности; или же отслеживать информацию об аренде, коллаборациях в сфере производства кроссовок и запуске новых продуктов в долгосрочной перспективе. При изменении условий агент будет отправлять пользователям подробные обновления.

Google также внедрила в поиск возможности кодирования данных, предоставляемые компанией Antigravity.

Поиск будет выдавать не только веб-страницы, краткие обзоры или карточки, но и интерактивные интерфейсы для конкретных вопросов. Например, если пользователь спросит: «Как черные дыры влияют на пространство-время?», поиск сможет сгенерировать интерактивный визуальный компонент; если он продолжит с вопросом: «Как двойные черные дыры создают гравитационные волны?», поиск сгенерирует динамический интерфейс с настраиваемыми параметрами. Генеративный пользовательский интерфейс с Antigravity будет выпущен бесплатно для всех пользователей этим летом.

В будущем появятся более сложные возможности персонализации.

На мероприятии Google представил планировщик выходных. Поиск объединяет такую ​​информацию, как погода, карты, пользовательские настройки, Gmail и Календарь, чтобы создать небольшой инструмент, который можно дополнительно изменять, делиться им и синхронизировать с календарем. Такая персонализация станет доступна подписчикам в ближайшие месяцы.

Работая даже в выключенном состоянии, Gemini Spark переносит возможности агента в вашу личную жизнь.

Самой важной новинкой для потребителей является Gemini Spark.

Gemini Spark — это персональный ИИ-агент, работающий на выделенной виртуальной машине в Google Cloud, что позволяет ему выполнять задачи круглосуточно. Он работает на базе Gemini 3.5 и устройства Antigravity, поддерживающих длительные фоновые задачи.

Spark продолжает работать даже после выключения компьютера пользователем. Первоначально он интегрируется с собственными инструментами Google, а в ближайшие недели будет интегрирован с инструментами сторонних разработчиков через MCP.

В презентации были продемонстрированы несколько типичных сценариев использования Spark.

Пользователи могут использовать его для подведения итогов релизов и прогресса Gemini Live за прошедшую неделю, извлечения информации из документов, Gmail и журналов чатов, а также для создания командных писем в персонализированном стиле. Он также может управлять вечеринками соседей, вести формы подтверждения участия в Google Sheets, отслеживать, кто что принес, создавать черновики писем-напоминаний для незарегистрированных соседей и автоматически генерировать рекламные страницы в Google Slides.

Spark также поддерживает голосовой ввод на мобильных устройствах.

Пользователи могут одновременно задавать несколько задач, например, покрасить все логотипы, связанные с Сундаром, в ярко-розовый цвет, написать приглашения новым соседям или составить список дел для своего ребенка до конца учебного года. Spark разобьет эти задачи на несколько независимых и выполнит их в фоновом режиме, а результаты будут синхронизироваться между телефоном и компьютером.

На этой неделе доступ к Gemini Spark открыт для доверенных тестировщиков, а на следующей неделе бета-версия для подписчиков Google AI Ultra в США будет выпущена.

Google также запустил новый тарифный план Ultra за 100 долларов в месяц и снизил стоимость топового плана Ultra с 250 до 200 долларов в месяц. Позже этим летом Spark станет доступен в Chrome в качестве интеллектуального браузера-агента, способного выполнять задачи на веб-страницах.

Приложение Gemini претерпело масштабное обновление дизайна, а также стала доступна версия «AI Morning News» от Google.

Само приложение Gemini также претерпело полную модернизацию.

Компания Google представила совершенно новый язык дизайна — Neural Expressive, который включает в себя плавную анимацию, яркие цвета, новые шрифты и тактильную обратную связь.

Новое приложение Gemini больше не отображает ответы в виде больших блоков текста. Вместо этого оно в режиме реального времени генерирует более читабельный и удобный для пользователя макет на основе контента, включая интерактивные изображения, временные шкалы и встроенные видеоролики. Neural Expressive теперь доступен по всему миру на платформах Android, iOS и в веб-версии.

Приложение Gemini Live также было переработано, что позволяет пользователям сразу же подключаться к живым беседам после открытия. Функция выбора регионального акцента будет внедрена в ближайшие недели.

Приложение Gemini также включает в себя Daily Brief. Это персонализированный инструмент для утреннего использования, который объединяет информацию из Gmail, календаря, задач и других источников, чтобы организовать задачи, на которых пользователям необходимо сосредоточиться в течение дня, и предоставляет точку входа для следующего действия.

Сервис Daily Brief запускается сегодня для подписчиков Google AI Plus, Pro и Ultra в США.

Помимо общей концепции Gemini, Google также обновила ряд товаров повседневного спроса.

Google Maps недавно претерпел самое масштабное обновление за десятилетие, добавив функцию «Спроси Maps». Это позволяет пользователям задавать более длинные и сложные вопросы. Например, на презентации был использован сценарий: ребенок упал в пруд с утками, свадьба начинается через 30 минут, и пользователь хочет узнать, где можно дойти пешком, чтобы купить новое платье.

В Google Docs также появятся новые возможности голосового создания документов. Пользователям больше не нужно вводить точные подсказки; они могут просто озвучить свои идеи, и Gemini найдет их резюме в Google Диске, информацию о мероприятии в Gmail и создаст черновик в Google Docs. Эта функция станет доступна подписчикам Pro и Ultra этим летом, а аналогичные голосовые возможности также появятся в Gmail.

С повышением возможностей генерации контента идентификация источников информации приобретает все большее значение.

Google заявляет, что за три года с момента запуска SynthID добавил невидимые водяные знаки более чем к 100 миллиардам изображений и видео, а также к аудиоматериалам, эквивалентным 60 000 годам хранения. В дальнейшем SynthID и проверка учетных данных контента будут распространены на Поиск и Chrome.

Пользователи могут выбирать элементы для поиска или щелкнуть правой кнопкой мыши в Chrome, чтобы узнать, был ли контент сгенерирован искусственным интеллектом. Затем система покажет, был ли контент создан ИИ, с помощью камеры или отредактирован инструментом генеративного ИИ.

Google также объявила, что OpenAI, Kakao и ElevenLabs будут использовать SynthID 2. Ранее к экосистеме SynthID присоединилась Nvidia. Для Google SynthID — это не просто функция безопасности, но и часть усилий по установлению прозрачных стандартов для контента, связанного с ИИ.

Пакет программ Google для творчества начинает наступление на изображения, дизайн и видео.

В сфере инструментов для творчества компания Google выпустила ряд крупных продуктов.

Google Pics — это новый продукт для создания и редактирования изображений в Google Workspace, предназначенный для таких задач, как создание плакатов для вечеринок, инфографики и рекламных изображений. Пользователи могут начать с базового изображения, удалять элементы, изменять размер объектов, редактировать текст и переводить его. Контент, созданный в Pics, будет содержать водяной знак SynthID. Запуск Google Pics состоится этим летом.

Продукт для дизайна Stitch также получил обновление. Пользователи могут создавать интерфейсы веб-сайтов или приложений одним нажатием кнопки, а затем продолжать изменять их с помощью текста или голоса, например, увеличивать заголовки, настраивать меню или выделять дополнительные варианты пиццы. Stitch поддерживает экспорт дизайнов в виде кода или прямую публикацию на веб-сайты; обновление уже доступно.

Обновление Google Flow представляет особый интерес. После интеграции Gemini Omni в Flow пользователи могут изменять окружение, добавлять визуальные эффекты и новых персонажей на основе оригинального видео, максимально сохраняя при этом исходное исполнение.

В Flow также добавлен новый агент, поддерживающий одновременное выполнение нескольких действий. Например, он может сгенерировать 16 видеороликов с разных ракурсов из одного изображения или пакетно преобразовать набор утренних сцен в ночные.

Flow Tools позволяет пользователям создавать собственные инструменты для творчества внутри Flow, такие как видеоэффекты, рисованная от руки анимация и инструменты для наложения текста, а также поддерживает обмен и создание ремиксов.

Google Flow Music позволяет превратить фортепианный рифф в стилистически ориентированную музыкальную демо-версию. Эти новые функции для Google Flow и Google Flow Music уже доступны.

Google делает ставку на умные очки, осваивая следующее поколение платежных шлюзов.

Что касается аппаратной части, Google также расширила возможности своей операционной системы Android XR, включив в нее не только наголовные дисплеи и XR-устройства, но и умные очки.

Android XR — это платформа, разработанная Google в сотрудничестве с Samsung и оптимизированная для процессоров Qualcomm Snapdragon.

Google заявляет, что её очки с искусственным интеллектом будут делиться на две категории: очки с дисплеем и маленькими линзами и аудиоочки. Очки с дисплеем были представлены на конференции I/O в прошлом году, и первые разработчики начали создавать пользовательские интерфейсы в этом году, а программа доверенных тестировщиков должна расшириться позже в этом году.

Аудиоочки появились еще раньше.

Компания Google объявила о выпуске своих первых аудиоочков этой осенью. В разработке аппаратной части и пользовательского интерфейса участвовала компания Samsung, а за дизайн отвечали Warby Parker и Gentle Monster. Эти очки подключаются к смартфонам и поддерживают как Android, так и iOS. Ответы Gemini воспроизводятся в приватном режиме через наушники, а не отображаются на линзах.

На презентации демонстратор показал, как с помощью очков Gemini можно добраться до места встречи с другом на предыдущей неделе, добавив по пути кофейню; Gemini также может открыть DoorDash, чтобы автоматически заказать кофе и дождаться подтверждения от пользователя.

Очки также могут синхронизировать сообщения, оставленные без звука, и добавлять семейные ужины в календарь. Кроме того, очки могут работать с часами, позволяя пользователям фотографировать события, создавать мультяшные изображения с помощью Nano Banana и затем просматривать их на часах.

В конце пресс-конференции сценарии применения решений Gemini были расширены и на сферу кибербезопасности.

Компания Google представила CodeMender, агент безопасности кода, который автоматически находит и исправляет критические уязвимости программного обеспечения. Перед более широким внедрением Google пригласит группу экспертов для тестирования API CodeMender.

Вся пресс-конференция была настолько насыщена информацией, что это почти ошеломило. Однако, как только эти функции ИИ станут действительно доступны десяткам или сотням миллионов людей, возникнет очень серьезная проблема с учетом затрат: как Google окупит эти огромные расходы на вычислительные мощности?

На протяжении более двух десятилетий Google олицетворяет собой квинтэссенцию модели свободного интернета. Пользователи обменивают свое внимание и данные на услуги, а Google получает прибыль от рекламы и распространения. Эта модель сделала Google самой могущественной инфраструктурной компанией в эпоху интернета.

Однако стоимость крупномасштабного построения моделей значительно отличается от стоимости обработки одного результата поиска.

Долговременная контекстная память, многомодальная генерация, кросс-прикладные агенты и автоматизация корпоративного уровня — все эти возможности требуют непрерывных вычислительных мощностей. Чем глубже проникает искусственный интеллект, тем сложнее Google компенсировать затраты за счет «бесплатных обновлений функций».

Вот почему на протяжении всей презентации Google I/O, хотя казалось, что речь идет об улучшении пользовательского опыта, на самом деле она указывала на подписки, корпоративные контракты, счета за вычислительную мощность и долгосрочную плату за обслуживание.

Бесплатные точки входа, безусловно, не исчезнут, поскольку они остаются основой для привлечения пользователей, данных и укрепления позиций Google в экосистеме. Но поверх этих точек входа Google добавляет новый уровень интеллектуальных сервисов: более мощные модели, больший объем памяти, более широкие системные разрешения, более сложное выполнение задач и более стабильные сервисы корпоративного уровня.

Иными словами, Google трансформируется из компании, предоставляющей бесплатные интернет-услуги, в компанию, предлагающую инфраструктуру на основе подписки на искусственный интеллект.

Однако возникает вопрос: готовы ли пользователи платить за поиск? В целом, нет.

А что если бы это был «супер-универсальный помощник», способный обрабатывать вашу электронную почту круглосуточно, управлять задачами, анализировать отчеты, управлять вашим умным домом и даже помогать вам писать код для разработки приложений? Были бы вы готовы платить за него десятки или сотни долларов каждый месяц?

Именно это ключевое бизнес-предложение Google I/O стремится подтвердить в этом году. И, учитывая сегодняшнюю безумную конкуренцию на рынке, ответ кажется очевидным.

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.