Могут ли наушники с камерами и поддержкой искусственного интеллекта заменить iPhone? Я нашел ответ после 72 часов использования.

В 2007 году Стив Джобс использовал 3,5-дюймовый экран, чтобы свести взаимодействие человека с информацией к светящейся двухмерной плоскости.

Почти двадцать лет пролетели в мгновение ока. Претенденты прошлых лет стали мишенью сегодняшней революции. Волна аппаратного обеспечения с искусственным интеллектом атакует смартфоны, пытаясь разрушить этот стеклянный барьер. Новые формы аппаратного обеспечения, представленные AiPin, появляются одна за другой, поднимаясь и опускаясь, как приливы и отливы. В отличие от них, традиционные ПК более стабильны, и благодаря агентам происходит вторая волна их развития.

Поскольку переосмысление формы — сложная задача, не лучше ли было бы внедрить ИИ в уже существующие устройства, интегрированные в повседневную жизнь людей?

Недавно iFanr эксклюзивно сообщил о том, что проект Apple AirPods со встроенной камерой был отложен. В этой паузе между гигантами китайский стартап Guangfan Technology, основанный одной из первых команд Xiaomi и состоящий из сотрудников таких гигантов, как ByteDance, Alibaba, Huawei и Tencent, превентивно выпустил первое в отрасли полноценное носимое устройство с камерой, работающее на базе AIOS, в виде наушников.

В прошлом году мы сообщали о запуске наушников LightSail. На прошлой неделе продукт официально поступил в продажу, и мы задались вопросом: зачем наушникам нужна камера?

После 72 часов углубленного тестирования компания iFanr убеждена, что «наушники с камерами» представляют собой направление развития аппаратного обеспечения с искусственным интеллектом в будущем, но до достижения конечной цели еще далеко.

Одни часы, одна коробка, одни наушники — всё для работы с искусственным интеллектом.

Когда мы говорим о носимом устройстве LightSail AI All-Sense, мы на самом деле имеем в виду большой и хорошо продуманный аппаратный комплекс.

Разложите на столе: это комплект, состоящий из чехла для наушников, пары наушников с заушным креплением и умных часов. В этой системе каждый компонент играет свою определённую роль, а поток данных искусственного интеллекта осуществляется совместно между ними.

В основе всех трех моделей лежит наушник, который крепится на ушах.

Компания Guangfan сумела уменьшить вес каждого наушника до менее чем 11 граммов, а черно-белая цветовая гамма в стиле «панда» эффективно снижает ощущение громоздкости, в то время как С-образные заушные крючки естественно располагаются назад вдоль ушного канала.

Для сравнения, одни AirPods 4 весят 4,3 грамма, а одни наушники Ola Friend с заушным креплением, также выпущенные Doubao, весят 6,6 грамма.

Наушники LightSail AI Earphones немного тяжелее из-за встроенной в переднюю панель широкоугольной 2-мегапиксельной камеры с углом обзора 88°, позволяющей пользователю смотреть прямо на окружающий мир, не снимая их. Чтобы избежать проблем с конфиденциальностью, они не предлагают обычных функций фото- или видеозаписи; все изображения, снятые камерой, отправляются в облако для взаимодействия с искусственным интеллектом.

В целом, компания Guangfan выбрала конструкцию открытых наушников OWS с металлическими динамиками, расположенными снаружи козелка уха. В сочетании с батареей на конце заушного крючка, корпус умело обеспечивает распределение веса 5:5 спереди назад, поэтому даже при длительном ношении не возникает усталости.

При использовании с зарядным кейсом эти наушники с искусственным интеллектом обеспечивают до 90 часов автономной работы. Под приятным на ощупь корпусом компания Guangfan разместила специальный модуль eSIM и двухдиапазонный GPS. Команды, захваченные микрофонами наушников, и изображения, полученные камерой, передаются обратно, затем упаковываются и отправляются в облако по отдельной сети для анализа с помощью модели обработки больших данных.

Наконец, есть умные часы с 1,97-дюймовым AMOLED-экраном. Когда звуковая информация перегружена, они берут управление на себя и отображают ключевые данные, которые необходимо просканировать для подтверждения, завершая последнее звено в «связи часов и ушей».

Каждый из трех компонентов выполняет свою функцию: наушники занимают центральное место, обеспечивая визуальный и звуковой ввод и выступая в качестве основного интерактивного устройства; чехол помещается в карман, выступая в качестве центрального узла для вычислительной мощности и сетевого взаимодействия; а экран на запястье служит дополнительным интерактивным элементом, предоставляя место для часто используемой информации.

Я определенно стал реже смотреть в телефон, но взаимодействие с ним можно было бы улучшить.

Согласно официальным техническим характеристикам, это устройство отличается «полным восприятием, всепогодной работой и проактивным искусственным интеллектом».

На основе нескольких дней интенсивного использования я выделил три основные категории своего опыта работы с его основными функциями:

Категория 1: Более инициативные и грамотные менеджеры по планированию.

В эпоху мобильного интернета наиболее важная информация часто разбросана по фрагментированным беседам в таких приложениях, как WeChat и Lark. Подход Гуанфаня заключается в использовании ИИ в качестве информационного канала.

Когда WeChat, Lark или DingTalk получают поток сообщений, ИИ автоматически отфильтровывает нерелевантный чат и фокусируется на трансляции важной информации. Сопутствующее программное обеспечение Hi Light поддерживает персонализированные настройки частоты рассылки сводок для каждого приложения, предлагая три варианта: рассылка в реальном времени, быстрая сводка и краткая сводка. По моему личному опыту, быстрая сводка — лучший выбор, сочетающий в себе оперативность и эффективность.

На основе интеллектуальных уведомлений от трех программных продуктов, при появлении в чате информации о конкретном времени, местоположении и событиях, ИИ заблаговременно выведет сообщение с вопросом:

В этом сообщении содержится расписание встречи. Хотите, чтобы я добавил его в ваш календарь?

В день встречи ИИ будет выступать в роли диспетчера. Когда система распознает, что у меня назначена встреча по выбору темы на 8:30 утра, ИИ в моих наушниках напомнит мне в 8:00, что я живу недалеко от компании и могу выйти из дома, исходя из текущей дорожной ситуации и расстояния до места работы.

После внедрения системы голосового оповещения Guangfan я действительно стал реже брать телефон в руки, чтобы проверить сообщения и добавить заметки. Однако очевидны и текущие ограничения этой функции. Чтобы ответить Lark голосом, необходимо отдельно авторизовать облачную систему в приложении. Чтобы вызвать такси, нужно предварительно связать свою учетную запись Didi или войти на платформу Shouqi, которая охватывает только некоторые города, используя свою учетную запись Guangfan.

Однако это крайняя мера. В прошлом году Doubao Mobile Assistant доказал, что преодолеть барьеры суперприложений невероятно сложно. Доступ Guangfan к сервисам через облачную систему больше похож на попытку прорыть туннель под высокой стеной.

Хотя иногда возникают риски изменения интерфейса или истечения срока действия лицензии, по крайней мере, возможность планирования задач между приложениями была затронута.

Категория 2: Слегка притупленное зрительное восприятие

Главным преимуществом Guangfan, несомненно, является его камера, способная охватывать всю область, доступную для обычного просмотра. Если вкратце описать ожидания от Guangfan, то они сводятся к одному: ускорению процесса получения информации.

В выходные, во время шопинга, я увидел ресторан, взглянул на вывеску, задал вопрос, и мне сообщили рейтинг и статус очереди. Когда я заметил часы с черной кошкой на столе коллеги, наушники с искусственным интеллектом, используя визуальное распознавание, добавили их прямо в мою корзину.

Конечно, предварительное условие аналогично поездке на такси — мне сначала нужно войти в свою учетную запись JD.com в Hi Light.

Но именно эта часть функционала вызвала у меня наибольшее разочарование во время использования.

Человеческое зрение всегда было мгновенным и непрерывным. Однако визуальное восприятие в наушниках LightSail AI носит точечный и отложенный характер.

Когда мне на глаза попадает какой-нибудь магазин, я дважды касаюсь экрана, чтобы включить наушники. Затем следует долгое ожидание. Нужно постоять неподвижно от 8 до 10 секунд, прежде чем услышишь имитацию звука затвора; после этого еще 10 секунд идет передача и распознавание данных, прежде чем облачный центр обработки данных сообщит, стоит ли добавить товар в корзину.

После тщательного анализа я пришел к выводу, что проблема в основном заключается в двух аспектах: с психологической точки зрения, длительное использование камеры создаст у пользователя и окружающих ощущение, что за их жизнью следят; с точки зрения продукта, слабый аккумулятор и компактный корпус наушников не позволяют датчику работать длительное время.

Преодолеть эти два ограничения в краткосрочной перспективе вряд ли удастся, но решения все же возможны.

В настоящее время чехол для наушников, выполняющий функцию центра обработки данных, поддерживает 4G eSIM, но скорость передачи данных в восходящем и нисходящем направлениях сильно ограничена. Кроме того, исходя из текущих характеристик, наушники LightSail AI Earphone должны следовать концепции «непрерывных вычислений», где легкое устройство обрабатывает базовые данные и диалоги на уровне миллисекунд, а ресурсоемкий визуальный анализ беспрепятственно передается в облако.

Если при дальнейшей оптимизации локальной модели все больше простых взаимодействий можно будет обрабатывать непосредственно локально, минуя облако, скорость обратной связи сможет выйти на новый уровень.

Конечно, было бы гораздо лучше, если бы мы использовали более энергоэффективные носимые чипы и перешли на 5G eSIM.

Категория 3: Условно запускаемые и пригодные для использования заметки на основе ИИ

По сравнению со сложным визуальным распознаванием, условная активация на основе данных о местоположении и физиологических параметрах обеспечивает значительно более впечатляющий пользовательский опыт.

Если я заранее, между делом, напомню своим наушникам, что мне нужно купить шампунь, средство для мытья посуды и стиральный порошок в следующий раз, когда я пойду в супермаркет, то, когда наушники Guangfan AI распознают мое местоположение и пройдут мимо или войдут в супермаркет, они заблаговременно предоставят мне напоминание, чтобы я ничего не забыл.

Подобная логика срабатывания также применима к физиологическому мониторингу — сначала я устанавливаю на часах разумный пульс, исходя из своего физического состояния. Как только часы обнаруживают, что мои текущие жизненные показатели превышают пороговое значение, они напоминают мне через наушник о необходимости сбавить темп или сделать перерыв.

В практическом применении эти две функции работают стабильно и сдержанно, предоставляя своевременные и точные подсказки, что, на мой взгляд, делает их наиболее практичными.

Однако, помимо функциональности, у него есть и некоторые незначительные недостатки.

Наушники LightSail AI полностью полагаются на зарядный кейс как на вычислительный и передающий центр. Если вы достанете наушники, но оставите зарядный кейс дома или на рабочем месте, наушники замолкнут только после звукового сигнала или предложат вам положить их обратно в кейс и попробовать снова. Для использования сервисов искусственного интеллекта пользователям необходимо всегда носить с собой зарядный кейс. За несколько дней использования я как бы «привык» к этому.

Это создает отличие от привычного пользовательского опыта, когда люди привыкли носить AirPods весь день и даже ненадолго оставлять чехол без присмотра.

Могут ли наушники с искусственным интеллектом заменить мобильные телефоны?

После 72 часов тестирования давайте вернемся к вопросу, с которого мы начали: зачем добавлять камеру в наушники? И каковы реальные ощущения от использования?

Рассматривая этот продукт, цена которого составляет около 2000 юаней, мы должны понимать его основную цель — по сути, он стал независимым от мобильного телефона, и единственным способом связи с ним является Bluetooth.

Именно в этом и заключается главное различие между мышлением Гуанфана и Apple: по логике Apple, iPhone всегда является вычислительным центром, а AirPods — лишь продолжением органов чувств; в то время как Гуанфан продает вам полный набор независимых аппаратных центров искусственного интеллекта, которые пытаются полностью отделиться от мобильного телефона или даже заменить его.

Однако, чтобы воплотить эту грандиозную идею в жизнь, мы должны объективно определить, какие из многочисленных недостатков, выявленных в условиях интенсивного использования, являются вторичными противоречиями, вызванными ограничениями времени, а какие представляют собой непреодолимые препятствия в краткосрочной перспективе.

Некоторые препятствия неизбежно будут преодолены в процессе технологического и экологического развития.

Во-первых, существуют физические ограничения в механизме работы. Время включения камеры, 20-секундная задержка и архитектура работы этой системы «получения данных на периферии — облачные вычисления» по-прежнему оставляют значительный простор для улучшения пользовательского опыта за счет непрерывной оптимизации локальной модели.

Существующие громоздкие барьеры, связанные с авторизацией третьих лиц, не являются неизлечимой болезнью.

Самому рынку нужно время, чтобы адаптироваться, но как только этот тип носимых устройств с искусственным интеллектом получит достаточное влияние, интеграция станет проще простого — появление инструментов с интеллектуальными агентами, таких как Lobster, уже стало примером для всех. Пока влияние достаточно велико, даже такие национальные приложения, как WeChat, и стоящие за ними гиганты будут стремиться к его внедрению.

Когда все приложения начнут активно предоставлять API и интерфейсы командной строки для доступа других пользователей, разрушение разрозненности экосистемы станет лишь вопросом времени.

Однако некоторые препятствия трудно преодолеть в краткосрочной перспективе, а некоторые и вовсе являются неотъемлемой частью проблемы.

Это сопротивление — «основной принцип» современных наушников.

В современном мире, где интернет-социальные сети стали обычным явлением, важнейшая задача наушников — создание и поддержание приватной обстановки для прослушивания музыки и просмотра видео.

Но как только оно превратится в проактивного ИИ-помощника, оно неизбежно будет постоянно прерывать вас своим голосом — в конце концов, это единственный способ продемонстрировать свое существование и доказать свою ценность.

Оборудование, изначально предназначенное для полного погружения, стало источником помех. Это ощущение разобщенности является неотъемлемым недостатком, вызванным необходимостью передачи в слуховой канал информации высокой плотности.

Это не только ключевой вопрос, касающийся пользовательского опыта, который должен четко понимать Гуанфан, но и Apple, OpenAI и любые команды разработчиков, стремящиеся создавать аппаратное обеспечение с искусственным интеллектом для наушников.

Однако это не мешает нам сохранять оптимизм относительно изображенной картины.

Оглядываясь на носимое устройство Guangfan AI All-Sense Wearable Device, несмотря на некоторые недостатки в плане пользовательского опыта и взаимодействия, нетрудно увидеть общую картину: истинная цель добавления камеры к наушникам — исследовать окончательную форму следующего поколения персональных терминалов.

Функционально это «заменит» мобильные телефоны и даже полностью «исключит» их из повседневной жизни в будущем.

Представьте себе эту эпоху: когда такие инструменты, как «лобстеры», позволяют людям контролировать производительность даже в мобильных условиях; в будущем вы можете идти по улице в наушниках или с камерой от Apple или OpenAI, и с помощью голосовой команды гарнитура сможет удаленно активировать агента на вашем компьютере для автоматического выполнения сложных задач.

В этом смысле Гуанфан, как первопроходец, действительно показал нам очень привлекательное будущее. В конце концов, фильм «Она» вместе сформировал стремления нашего поколения к аудио-ИИ-компаньону.

Но когда я очнулся от своих размышлений, я яснее увидел одну вещь: эволюция аппаратного обеспечения — это всегда танец в оковах.

Это носимое устройство с искусственным интеллектом стоимостью 2000 юаней, конечно, не способно полностью вытеснить мобильные телефоны, но оно действительно открыло дверь в будущее.

Осталось лишь шире открыть дверь и сделать путь за ней более ровным.

Подарите мне чудесное путешествие!

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете быстро найти еще больше интересного контента.