Набор инструментов искусственного интеллекта от Google превзошёл ChatGPT и занял первое место в App Store! Руководство пользователя прилагается

16 сентября, 2025 Дядя Влад

Думали ли вы, что ChatGPT останется на вершине рейтинга? Но на этой неделе всё изменилось.

Google Gemini со своим недавно популярным приложением для редактирования изображений Nano Banana возглавил список бесплатных приложений в App Store , отодвинув ChatGPT на второе место.

Gemini занимает первое место во всех категориях в списке бесплатных приложений App Store. Источник изображения: https://apps.apple.com/us/charts/iphone/top-free-apps/36 ; 15.09.2025

Это значит, что у Google наконец-то наступил свой собственный «взрывной момент искусственного интеллекта».

И Gemini — это лишь вершина айсберга. У Google также есть комплексный набор инструментов на основе ИИ: от письма и рисования до создания учебных заметок и видео. Сегодня мы подробно рассмотрим комплексный набор инструментов на основе ИИ от Google.

Версия с экономией потока:

Gemini, как и ChatGPT, — это универсальный помощник . Он включает в себя такие функции, как nano banana (популярная модель RAW-изображений), Canvas, генерация видео Veo3, Storybook и Deep Research. В настоящее время доступны версии Gemini 2.5 Pro и Flash. Посетите gemini.google.com, чтобы ознакомиться с ним.
NotebookLM — база знаний для углубленных исследований : вы можете загружать до 300 файлов и сортировать документы по шести типам, включая аудио, видео и ментальные карты. Это лучший инструмент для обучения и исследований. Адрес: notebooklm.google
Flow, высококачественное видео : поддерживает вертикальный экран 9:16, HD 1080p, более низкая цена, бесплатные пользователи получают 100 баллов в месяц. Адрес для просмотра: flow.google
Режим ИИ позволяет поиску рассуждать и думать : вы можете открыть его непосредственно в строке поиска Google, чтобы получить более точные и подробные результаты, чем в режиме «Сводка/Обзор ИИ». В настоящее время он поддерживает пять языков, включая английский (но не китайский). Опробуйте его на сайте: google.com/ai
Gemini CLI: Универсальный локальный помощник : не только инструмент разработки, но и возможность загрузки видео, конвертации GIF-файлов и сжатия файлов. Ссылка на опыт: github.com/google-gemini/gemini-cli
AI Studio и Labs Google : другие интересные гаджеты, создание музыкальных произведений, легкое изучение нового языка, знакомство с новейшей и наиболее полной языковой моделью Google… Адрес для знакомства: ai.dev и labs.google

Gemini: это не просто приложение для общения, это универсальная рабочая станция.

Недавно ставший популярным нано-банан имеет свой основной официальный канал, помимо веб-версии, приложение Gemini.

▲ Домашняя страница Gemini с постоянным напоминанием о рекламе модели редактирования изображений нано-банана

Но если вы используете Gemini только для редактирования фотографий, это будет пустой тратой времени. Как и ChatGPT, он дополняет функцию «памяти» в разговорах и легко интегрируется с экосистемой Google.

▲ Функция «Память» Близнецов

Для меня этого ключевого обновления в сочетании с бесплатной подпиской Pro, которая идет в комплекте с EducationMail, вполне достаточно, чтобы перенести большую часть моих ежедневных разговоров.

Google недавно обновила конкретные лимиты использования Gemini для бесплатных и платных пользователей. Бесплатные пользователи имеют ограниченный доступ к Gemini 2.5 Pro и Deep Research, но цена на nano Banana очень низкая, поэтому бесплатные пользователи также имеют щедрые возможности для генерации 100 единиц.

Источник изображения: https://support.google.com/gemini/answer/16275805

Главное преимущество Gemini 2.5 Pro заключается в том, что каждый ответ имеет чёткий алгоритм рассуждения, аналогичный DeepSeek, но гораздо быстрее. Это преимущество стало ещё более очевидным после обновления ChatGPT до GPT-5, в котором реализованы новые функции управления маршрутизацией и автоматического выбора модели.

Потому что ChatGPT иногда не может определить, какую модель я хочу, чтобы он использовал для ответа; и мое выражение не всегда достаточно ясно для того, чтобы модель поняла мое намерение.

Однако цена болтливости программиста — это потеря эксперта по производительности. Как показывает рейтинг LMArena, Gemini занимает первое место в разработке текстов, но его возможности веб-разработки уступают GPT и Claude. К счастью, Google в последнее время активно выпускает обновления для Gemini, улучшая пользовательский опыт взаимодействия с программным обеспечением.

▲Gemini и ChatGPT выполняют одну и ту же задачу разработки. Какой из них вам нравится больше?

Например, в веб-разработке Gemini Canvas теперь поддерживает прямой щелчок на элементе в приложении и внесение изменений с помощью естественного языка.

Предварительный просмотр холста Canvas и ChatGPT имеет одинаковую функцию, обе из которых интуитивно понятны и позволяют воплощать наше творчество в приложения, игры, инфографику и другой контент.

▲ Новые функции в Gemini Canvas: «Выбрать и спросить». Теперь вы можете интуитивно редактировать любую часть своего веб-приложения, просто нажав на элемент и описав желаемые изменения. Источник изображения: https://x.com/GeminiApp/status/1965475292526551105

Во-вторых, Gemini наконец-то поддерживает загрузку аудиофайлов. Это означает, что материалы с подробным контекстом, такие как записи встреч и видеоинтервью, можно напрямую передавать в Gemini для обработки, избавляя от необходимости вручную организовывать и писать сложные подсказки.

▲ ChatGPT продолжает отвечать, что инструмент невозможно использовать

Последние новости заключаются в том, что, согласно сообщению основателя Flowith Дерека Ни и команды инженеров Gemini 3, он сообщил, что возможности Gemini 3.0 Flash превзойдут 2.5 Pro.

Источник изображения: https://x.com/DerekNee/status/1965811795559653506

Аналогично условиям, используемым ChatGPT, Gemini может иметь дополнительные ограничения на местоположение учетных записей Google.

Адрес опыта: gemini.google.com

NotebookLM: Ваша лучшая персональная база знаний

Сохранили кучу длинных английских статей и отрывков из книг, но всегда «читаете их позже»? NotebookLM создан, чтобы уберечь эти вещи от пыли.

Вам просто нужно добавить несколько статей, отчетов или даже отрывков из книг, и это:

Автоматически поможет вам извлечь ключевые моменты и создать понятную и структурированную учебную заметку;
Если вам нравится визуализация, вы также можете напрямую нарисовать ментальную карту, чтобы сразу понять структуру статьи;
Хотите узнать больше? Он также может предложить вам тесты по пройденному материалу, которые помогут вам повторить и закрепить знания.

Например, я уже использовал его для организации документов. NotebookLM поддерживает загрузку до 300 файлов и широкий спектр форматов, включая PDF, TXT, Markdown, а также аудио- и видеофайлы. Он распознаёт их.

▲ Я загрузил 297 статей в одной и той же области исследований, и NotebookLM смог сгенерировать резюме контента в различных формах, основываясь исключительно на этих файлах.

▲ Шесть форматов: текстовый отчет, предварительный просмотр подкаста, видеовведение, ментальная карта, карточки и тесты

Подкасты и текстовые отчеты были первыми опциями, представленными в NotebookLM, и теперь они также оптимизированы.

Текстовые отчёты можно создавать непосредственно в виде блогов, инструкций, руководств и других форматов. NotebookLM даже предоставляет динамические предложения на основе информации из базы знаний; например, при загрузке статьи может быть предложено создать официальный документ, а новостные статьи могут генерировать пояснительный контент; теперь также разрешены пользовательские подсказки.

▲ Запись в блоге, созданная NotebookLM

Аудиоподкасты теперь поддерживают более 80 языков, а типы подкастов расширились от обзоров до углубленного контента и далее расширились до различных типов, таких как дебаты и критическое мышление.

Новые видео, тесты и карточки — мои любимые функции. NotebookLM очень полезен как для усвоения знаний, так и для дальнейшего распространения контента.

Однако тема данной статьи довольно узкая, поэтому мы используем её лишь для ознакомления с возможностями NotebookLM. Для студентов и исследователей это, безусловно, один из самых рекомендуемых инструментов в сфере искусственного интеллекта Google.

В более общих сценариях применения его можно использовать для создания любой базы знаний. Например, в официальном примере использования, предоставленном NotebookLM, ментальная карта используется для загрузки финансовых отчётов за первый квартал нескольких компаний, что позволяет пользователям сразу чётко понимать содержание финансовых отчётов.

NotebookLM также сотрудничает с OpenStax (поставщиком бесплатных учебников) с целью преобразования их популярного контента в интерактивные блокноты, в том числе по таким темам, как биология, химия, психология и менеджмент.

В этой базе знаний по психологии каждая глава снабжена тестами и карточками для запоминания, которые помогут нам закрепить полученные знания.

▲ Вы можете выбрать китайский язык. Ссылка на базу знаний: https://notebooklm.google.com/notebook/90a2ee5f-cccb-4c28-a356-bb1682cc8aeb

Темы и уровни сложности тестов и карточек можно настраивать. Более того, как для карточек, так и для тестов, просто нажмите на пояснение, чтобы углубиться в тему. NotebookLM создаёт подробные обзоры, которые помогут вам понять определения к карточкам или объяснить, почему вы ошиблись в ответе, а также ссылки на первоисточники.

Адрес опыта: notebooklm.google

Генерация видео Flow Cinematic AI

Несмотря на невероятную популярность видеороликов с использованием ИИ, вопрос о том, для чего их можно использовать, остаётся для многих актуальным. Мы рассмотрели несколько моделей создания видеороликов с использованием ИИ, и многие читатели задавались вопросом: «Для кого на самом деле предназначены эти видеоролики с использованием ИИ?»

▲ В Gemini напрямую используйте генерацию видео Veo 3. В настоящее время Veo 3 поддерживает только первый кадр, а для первого и последнего кадров требуется Veo 2.

Обновление от Google может дать некоторые ответы: поддержка вертикального экрана (9:16) и HD-качества 1080p. Это, несомненно, разработано специально для коротких видеоплатформ, таких как TikTok, YouTube Shorts и Reels.

▲ Veo 3 недавно обновился, цена Veo 3 Fast снижена с 0,4 доллара в секунду до 0,15 доллара в секунду, и поддерживает 9:16, 1080p и т. д. Источник изображения: https://x.com/GoogleAIStudio/status/1965436154762920074

Сегодня видео с искусственным интеллектом стало новым продуктом потребления контента. Вместо того, чтобы пассивно смотреть, лучше попробовать самому.

▲ Подсказка: Ультрареалистичное кинематографическое видео Шанхая, знаменитой башни. Снято в вертикальном формате 9:16, в стиле трэвел-блога, плавное движение камеры, динамическое освещение, яркие цвета, высокая детализация, захватывающая атмосфера, без текста и водяных знаков.

Помимо популярных моделей видеопроизводства, таких как Sora, KeLing и Conch, Veo 3 от Google всегда была среди лучших на арене больших моделей в категории видео Vincent.

Видеоролики с видом от первого лица о путешествиях во времени, ASMR-резке фруктов, металле, кроличьем батуте и других, ставших вирусными некоторое время назад, были созданы с помощью Veo 3.

▲ Совет: камера 50 мм, крупный план лимона, сделанного из желтоватого стекла, который разрезают горизонтально на деревянной разделочной доске. Внутри фрукт тоже стеклянный, с небольшим количеством тающих блёсток. Вся сцена мягко подсвечена сверху.

Однако качество подсказок — ключевой фактор, определяющий качество видео. Например, видео выше напрямую заимствовано из официального кейса Google.

Они объяснили, что хорошая подсказка состоит из трёх частей. Первая часть — «50-миллиметровая камера, крупный план» — даёт представление о камере; вторая часть используется для указания объекта и конкретного видеоконтента; а третья часть дополнительно уточняет освещение и текстуру.

У Flow строгие требования к сети, и, как правило, его достаточно использовать на веб-сайте Gemini или в приложении.

Адрес опыта: flow.google

Режим ИИ поддерживает больше языков помимо английского

Поиск — самый большой источник трафика, поэтому браузеры на базе ИИ стали полем битвы для крупных производителей моделей, хотя этот путь непрост.

После закрытия проекта Arc возрождённый браузер Dia был недавно приобретён компанией Atlassian за 610 миллионов долларов. Проблема не в отсутствии прибыли, а в количестве технологических гигантов, желающих приобрести этот прибыльный бизнес.

В прошлом месяце Microsoft объявила об обновлении своего браузера Edge до версии с искусственным интеллектом. Copilot будет интегрирован в каждый уголок браузера, позволяя бронировать столики в ресторанах и авиабилеты, организовывать кросс-вкладки и многое другое. Когда OpenAI запустила свой агент ChatGPT, ходили слухи, что компания также разрабатывает собственный браузер с искусственным интеллектом.

Конечно, Google на этом не остановится. В отличие от AI Overview, который мы обычно видим при поиске в Google, AI Mode больше похож на подробный исследовательский отчёт. Он будет использовать передовые возможности логического мышления и мультимодального анализа Gemini 2.5 для обработки наших запросов.

Например, когда я спросил его, что происходит с картой eSIM на iPhone Air, он автоматически отсортировал информацию на основе содержимого веб-страницы и дал более точный ответ.

▲ Нажмите «Все выше», чтобы вернуться к обычному поиску Google.

Однако у режима ИИ есть недостаток: в настоящее время он не поддерживает китайский язык. Однако несколько дней назад Google объявила о поддержке ещё пяти языков, включая японский, корейский и португальский. Компания отметила, что создание глобального поиска на основе ИИ — это больше, чем просто перевод; поддерживаемые языки должны быть локальными и полезными.

Адрес опыта: google.com/ai

Gemini CLI загружает видео и конвертирует форматы файлов.

Неважно, что Claude Code отсутствует на складе, Gemini CLI действительно прост в использовании.

Мы уже упоминали, что использование этого терминального инструмента для изменения имён файлов — на самом деле самый ненадёжный способ его применения. В последнее время я использую Gemini CLI для самых разных целей: от загрузки видео с X Video и YouTube до конвертации видео в GIF и другие форматы, а также сжатия изображений и видео.

Процесс установки Gemini CLI достаточно понятен, и даже если у вас возникнут проблемы с настройкой среды, современный ИИ сможет предоставить надежные решения.

Первоначальные проблемы связаны в основном с установкой Node.js. Пользователям Windows работа с терминалом не так удобна, как в macOS и Linux, поэтому потребуется немного терпения.

После установки Node.js следуйте инструкциям на GitHub и выполните команду npm/npx для установки Gemini CLI.

Ввод «gemini» в терминале предложит нам пройти проверку. Как правило, достаточно входа с использованием аутентификации Google, и нет необходимости создавать дополнительные операции, такие как API Gemini. Пользователи бесплатной версии могут выполнять 60 запросов в минуту и 1000 запросов в день, чего достаточно для простых ежедневных рабочих процессов.

В терминале есть несколько очень простых команд. При открытии терминала папка по умолчанию может содержать файлы всего компьютера. Если ввести gemini напрямую, будет сложно получить доступ к файлам.

Правильная операция — ввести несколько основных команд: ls: выведет список всех файлов и папок в текущем каталоге; cd xxx: войти в папку; mkdir xxx: создать папку.

Например, на первом этапе мы открываем терминал и вводим команду ls, чтобы увидеть все файлы и папки в текущем каталоге. Затем мы выбираем файл для работы — на этот раз нам понадобится папка проекта Gemini. Введите cd Downloads, и вы увидите имя текущего каталога Downloads, перед которым стоит символ %. Затем мы создаём папку mkdir testing и переходим в неё с помощью cd testing. Кроме того, вы можете напрямую выбрать папку, щёлкнуть правой кнопкой мыши и открыть её в терминале. Введите gemini, и терминал автоматически перехватит управление, позволяя вам использовать естественный язык для решения многих сложных задач.

Возьмём, к примеру, загрузку видео под названием X. Сначала программа ищет инструмент yt-dlp, который можно использовать для загрузки видео. Затем программа автоматически проверяет, установлен ли этот инструмент на моём компьютере. После его обнаружения начинается загрузка видео.

Это вызывает инструмент yt-dlp. В терминальной среде существует множество эффективных инструментов, таких как FFmpeg — мощный инструмент для обработки мультимедийного контента.

▲ После ввода команды Gemini CLI прямо сообщит вам, что ему нужны два инструмента: yt-dlp и ffmpeg; затем он автоматически настроит разрешение и частоту кадров, чтобы они соответствовали предложенному мной окончательному размеру файла, и, наконец, удалит временные файлы в процессе.

Продолжаем использовать пример с видео X. На этот раз мы напрямую просим его загрузить видео по этой ссылке в формате GIF-файла и убедиться, что размер GIF-файла составляет от 5 до 10 МБ.

Помимо загрузки файлов из интернета, Gemini-CLI также может обрабатывать локальные файлы напрямую. Например, если у меня есть изображение, размер которого не соответствует требованиям платформы, я могу сообщить ему имя файла и попросить сжать его. При этом не нужно искать какие-либо онлайн-инструменты.

Я смог указать местоположение изображения, используя нечёткий язык, и программа успешно нашла его. Затем она сжала его с помощью ffmpeg. Однако в итоге мой исходный файл был удалён. Когда я попросил её восстановить файл, она изменила свой конфигурационный файл gemini.md — это служит её «памятью», гарантируя, что она запомнит урок и не совершит ту же ошибку в будущем.

Существует множество типов инструментов командной строки, и с их помощью можно обрабатывать практически большинство файлов. Иногда, если некоторые сжатые пакеты невозможно распаковать, можно использовать Gemini CLI для работы с ними напрямую, без загрузки соответствующих инструментов распаковки.

В сочетании с MCP (Large Model Context Protocol, универсальный интерфейс для соединения различных данных) Gemini CLI может делать гораздо больше, чем просто программирование.

Адрес опыта: https://github.com/google-gemini/gemini-cli

AI Studio and Labs Google: передовой испытательный полигон Google для искусственного интеллекта

В Google Labs представлено множество продуктов на базе ИИ, которые ещё официально не выпущены. Такие проекты, как AI Mode и NotebookLM, пока находятся в стадии разработки, но уже довольно известны. Мы также выбрали несколько интересных небольших проектов. Хотя все базовые модели работают на одном и том же процессоре Gemin 2.5 Pro/Flash, вы можете ознакомиться с различными программными реализациями в этих моделях.

Первый — Whisk, инструмент для генерации изображений, который не требует никаких подсказок и позволяет загружать фотографии и получать удовольствие. Теперь в нём появилась функция анимации, которая напрямую преобразует сгенерированные изображения в видео.

▲ Адрес: https://labs.google/fx/tools/whisk

Есть также курс «Little Language Lessons» для изучения языка. Его особенность в том, что он позволяет быстро освоить новый язык с помощью серии небольших экспериментов, построенных на платформе Gemini, применять полученные знания непосредственно в реальных ситуациях и изучать различные сленговые выражения.

Я попробовал это блюдо в ресторане на кантонском диалекте, и, по крайней мере, это не те же самые старые рисовые рулетики и ребрышки в соусе из черных бобов, что в Duolingo.

▲ Адрес: https://labs.google/lll/

У Google Labs есть еще много проектов, ознакомьтесь с ними на сайте: labs.google

Мы уже говорили о большой универсальной модели Gemini 2.5 Pro, о нано-банане для редактирования изображений и о видеогенерирующем устройстве Veo 3, так как же мы можем не рассказать об Imagen 4?

В настоящее время Imagen 4 доступен только через Gemini API и AI Studio. Несмотря на то, что в Google Labs есть специальный инструмент для генерации изображений ImageFX, используемая модель по-прежнему — Imagen 3.

AI Studio позволяет вам использовать новейшие и наиболее комплексные модели Google. Более того, обсуждения в AI Studio поддерживают функцию «ветвления», позволяющую начать новую тему, не прерывая существующую.

▲ Адрес: ai.studio / ai.dev

Некоторое время назад Маск поссорился с Ультраменом на X, и они напрямую обругали друг друга, заявив, что у Apple и Ультрамена частная сделка, иначе почему бы его Грок не возглавил список, и почему всегда был ChatGPT.

Распаковав его, я, кажется, осознал сильные стороны Gemini. Искусственный интеллект Google легко интегрируется в наши учебные, рабочие и творческие процессы, обеспечивая комплексный рабочий процесс. От организации данных до стимулирования креативности и освобождения рук — суть этого комплексного пакета заключается в том, чтобы действительно повысить производительность каждого сотрудника.

Какой из них вы используете чаще всего или хотите попробовать? Оставьте комментарий ниже, если у вас есть вопросы.

Нажмите ссылку, чтобы воспроизвести видео в WeChat https://mp.weixin.qq.com/s/gdSkrm95Mq1RORe-sIoK4A

#Приглашаем вас следить за официальным публичным аккаунтом WeChat проекта iFaner: iFaner (WeChat ID: ifanr), где в ближайшее время вам будет представлен еще более интересный контент.

iFanr | Исходная ссылка · Просмотреть комментарии · Sina Weibo