О нет! Я стал агентом!

Будучи пользователем телефона Pixel, пользующимся им уже шесть с половиной лет, вчера утром я смотрел конференцию Made by Google с нахмуренным лицом.

#Мертввнутри

Будучи продуктом десятого поколения в линейке продуктов, Pixel 10 не принес нам трансформации из формы продукта в форму использования, как предыдущий iPhone X. Вместо этого он демонстрировал консервативный подход в то время, когда даже iPhone готовился к серьезным изменениям в дизайне.

С точки зрения аппаратного обеспечения, четыре новых телефона Pixel этого года — 10, 10 Pro, Pro XL и Pro Fold — не могут похвастаться ничем иным, кроме процессора TSMC, а их возможности обработки изображений пережили как прогресс, так и неудачи.

Когда-то у нас было более подходящее название для этого обновления: Pixel 9s.

Учитывая, что сам продукт уже является средним, описывать конференцию Made by Google еще сложнее.

С обычной точки зрения, цель запуска продукта должна состоять в том, чтобы наглядно продемонстрировать и представить продукт, максимально подчеркнуть его преимущества, а затем сообщить всем цену.

Однако у Google, похоже, другие планы на этот запуск.

В этом году мероприятие «Made by Google» было больше похоже на коммерциализированную ежегодную встречу Google, чем на пресс-конференцию. Даже Джимми Фэллон не смог собрать воедино разрозненные фрагменты сцен, чтобы ответить на самый важный вопрос:

Какие улучшения были внесены в Pixel в этом году?

Реальному аппаратному обеспечению ИИ требуется только самая простая форма

Мы должны признать: Google с ее Gemini, Veo 3, Flow, Genie 3 и другими инструментами, несомненно, является одной из самых мощных моделей ИИ на планете, и ей это даже не нужно.

Genie 3 может генерировать «интерактивные среды моделирования» в реальном времени с разрешением 720P 24 кадра, а не видео. | YouTube @Fireship

Google, конечно же, осознаёт ценность заявления Алана Кея о том, что «люди, достаточно серьёзно относящиеся к программному обеспечению, должны разрабатывать собственное оборудование». Это подтверждается тем фактом, что десять лет назад Google отказалась от производства серии мобильных телефонов Nexus на заводе и перешла на полностью собственный процесс разработки Pixel.

Проблема в том, что со временем определение понятия «программное обеспечение» меняется:

  • Первое поколение Pixel в 2016 году представляло собой стандартизированное аппаратное обеспечение для системы Android.
  • Pixel 2 в 2017 году представлял собой стандартизированное аппаратное обеспечение для вычислительной фотографии.
  • Pixel 6 2021 года возвращается к стандартизированному аппаратному обеспечению для Android 12 с дизайном Material You.

Что касается Pixel 10 этого года, то, изучив всю пресс-конференцию, редакция iFan считает, что намерения Google уже ясны:

Серия Pixel 10 — это набор устройств с искусственным интеллектом, разработанных специально для Gemini. Будь то Rabbit R1, Humane AI Pin или ИИ-аксессуар, разработанный OpenAI и Джони Айвом, по сравнению с Pixel 10 им приходится признать, что они недостаточно «чисты».

Если использовать формулу Алана Кея, то Google на самом деле постепенно перешла от «достаточно серьезного отношения к системе Android» к «достаточно серьезному отношению к ИИ» — телефон Pixel как аппаратная форма не требует никаких изменений.

Фото|PhoneArena

Другими словами, выпущенная в этом году серия Pixel 10 на самом деле не так уж важна для Android 16 или вычислительной фотографии Google.

Напротив, Pixel 10 — это реальное продолжение Gemini, портал для ИИ стоимостью 799 долларов, который также может совершать звонки и делать фотографии.

Но это не то оборудование для искусственного интеллекта, которое нам нужно.

Конечно, нет ничего плохого в том, что Google делает Pixel аппаратным порталом исключительно для Gemini. В конце концов, как бы ни была улучшена аппаратная часть телефона, она гораздо практичнее, чем намеренно дифференцированный внешний вид Rabbit R1 и Humane AI Pin.

Изображение: CNET

Однако даже если нынешний Pixel можно считать оборудованием ИИ, он все равно не решает очень важную проблему:

Его рабочая логика отличается от ожидаемого нами аппаратного обеспечения ИИ.

Будь то в научной фантастике или концептуальных изображениях, мы часто придаем ИИ конкретную форму с функцией, будь то Терминатор Т-1000, сделанный из жидкого металла, или красные глаза HAL 9000 и MOSS:

Изображение|The Wandering Earth Wiki

Поскольку мы допускаем установку MOSS в корпус, то нет ничего плохого в установке Gemini в телефон Pixel. Однако проблема в том, что способы использования Gemini пользователями сильно отличаются от того, как представлял себе MOSS Лю Пэйцян.

На этой пресс-конференции две новые функции искусственного интеллекта, которые в основном демонстрировала Google, Camera Coach и Magic Cue, а также редактирование фотографий в альбоме Gemini, разбросаны по различным системным функциям, а некоторые из них будут появляться только во время использования .

Это совершенно не соответствует представлениям людей об ИИ за последние несколько десятилетий.

Мне не нужно, чтобы Magic Cue отображал актуальную информацию о разговоре на экране только после совершения звонка. Я хочу, чтобы ИИ автоматически проверял информацию о моём маршруте и письмо с бронированием, и если обнаружит что-то не так, то автоматически свяжется с авиакомпанией для возврата средств за билет.

Мне не нужно, чтобы Google Photos заставлял меня нажимать кнопку «Изменить» до появления диалогового окна Gemini. Мне нужно разбудить Gemini напрямую: помочь мне удалить размытые изображения на 200 фотографиях бара, которые я только что сделал, настроить яркость и цвет, а затем выбрать 9 разных фотографий коктейлей для публикации в WeChat Moments .

В научно-фантастических произведениях и концепциях ИИ последнего десятилетия логика работы ИИ должна заключаться в том, что пользователи-люди выдают инструкции, ИИ автоматически понимает инструкции и активно объединяет все окружающие ресурсы для автоматического выполнения задач , а не я, использую инвалидную коляску, чтобы отправить ИИ к передней части стола, дать ему ручку, чернила, бумагу и чернильницу, а затем он начнет рисовать.

Изображение: 36Kr

Другими словами, функции искусственного интеллекта Pixel теперь разбросаны по всей системе . Чтобы получить соответствующую помощь от искусственного интеллекта, необходимо сначала запустить задачу. Это включает в себя множество функций, которые искусственный интеллект мог бы легко подключить и выполнить от нашего имени, например, публикацию фотографий в определённой социальной сети.

Семь лет назад Bixiby мог использовать активную адаптацию для реализации аналогичных функций приложения, но Pixel с его более сильной интеграцией аппаратного и программного обеспечения не может этого сделать. | YouTube @爱否科技

Ещё сложнее разобраться с функцией Camera Coach, встроенной в камеру. Когда мы впервые увидели демонстрацию, мы подумали, что она может считывать содержимое экрана в режиме реального времени и генерировать предложения по композиции через базовый интерфейс системы.

Однако реальность такова, что вам придется вручную включить эту функцию, и Gemini тихо сделает снимок и предложит различные методы композиции на его основе — если перспектива не совпадает, он даже напрямую обратится к ИИ, чтобы тот помог вам приблизительно ее нарисовать, — а затем вы будете понемногу корректировать положение в соответствии с указаниями ИИ, пока не нажмете кнопку спуска затвора:

Изображение | YouTube @9to5Google

Не говоря уже о том, как была придумана эта прерывающая поток действий операция преднамеренного поднятия руки для нажатия кнопки, вся функция Camera Coach, похоже, является вынужденной мерой Google, чтобы найти способ интегрировать функциональные ключевые показатели эффективности отдела Gemini и отдела Pixel.

Первоначальной целью помощи при композиции было бы помочь вам делать снимки, но после такой операции, даже при вычислительной мощности Tensor G5, поддерживающей небольшую модель на конечном этапе, текущая скорость вывода и результаты предложений не столь удовлетворительны.

Ожидая операции ИИ, эффективные друзья уже сменили несколько поз, перемещаясь вперед и назад, влево и вправо, вверх и вниз, чтобы сделать серию фотографий, и могут лучше использовать производительность обновленного ISP Tensor G5.

Такая смена управления, как и другие функции ИИ Gemini в Android 16, требующие от вас выполнения некоторых действий, прежде чем они вступят в силу, полностью подрывает наши прежние ожидания от ИИ.

Как я стал агентом, который передает данные и предоставляет информацию Gemini?

По иронии судьбы, использование Gemini для создания

Подумайте об этом с другой стороны. Pixel 10 — это не телефон с искусственным интеллектом для людей, а, скорее, телефон с искусственным интеллектом для Gemini. Все новые функции используются людьми, которые предоставляют информацию Gemini, а затем интегрируются с помощью искусственного интеллекта.

Хотя такой тип ИИ, распределенный по функциональным процессам, объективно предотвращает чрезмерное вмешательство, он также может создавать ощущение, будто ИИ берет верх над пользователем. Gemini подобны родителям, строящим вместе с ребёнком песочный замок. Они ждут, пока ребёнок соберёт песок и попросит, прежде чем начать строить замок.

Кроме того, нам следует опасаться того, что Pixel 10 может легко стать плохим примером для других производителей мобильных телефонов — плохим примером, который полагается только на прогресс ИИ и игнорирует аппаратную основу.

Изображение: Android Central

Если Google продолжит использовать ту же тактику в будущем, произойдет очень плохой результат: Pixel, который хотят пользователи Pixel, исчезнет, ​​а настоящий телефон с искусственным интеллектом, который хотят пользователи с искусственным интеллектом, будет совсем не таким .

Такую форму будущего продукта, вероятно, не хотят видеть ни Google, ни потребители.

#Приглашаем вас следить за официальным публичным аккаунтом WeChat проекта iFaner: iFaner (WeChat ID: ifanr), где в ближайшее время вам будет представлен еще более интересный контент.

iFanr | Исходная ссылка · Просмотреть комментарии · Sina Weibo