Первые очки iFlytek с поддержкой искусственного интеллекта, вес которых составляет всего 40 граммов, совершают революцию в рабочих процессах с использованием ИИ.

2026 год еще даже не перевалил за середину, а уже представлено более 30 моделей очков с искусственным интеллектом.
Помимо таких признанных игроков, как Huawei, Qianwen от Alibaba, Rokid, Thunderbird и Xiaomi, даже Robam Appliances выпустила очки для приготовления пищи с использованием искусственного интеллекта, а BOE — очки для велосипедистов… При таком обилии различных продуктов на рынке все они, по сути, сосредоточены на трех вещах: кто сможет сделать их легче, у кого будет более четкая камера и чьи линзы подойдут для большего и лучшего экрана.
В разгар всеобщего ажиотажа часто упускается из виду одна статистическая величина.
В настоящее время процент возврата очков с искусственным интеллектом на основных платформах электронной коммерции пугающе высок и обычно составляет около 30% . На каналах прямых трансляций, где импульсивные покупки составляют большинство, процент возврата может достигать 40-50% .
Пользователи делают заказы из любопытства, носят очки несколько дней, а затем незаметно возвращают их. Высокие первоначальные продажи, за которыми следует спад, в сочетании с постоянно высоким процентом возвратов, составляют типичный «жизненный цикл» многих очков с искусственным интеллектом.
Говоря прямо, когда новизна пройдет, потребители начнут задаваться вопросом: что именно это средство может мне дать после того, как я его надену?
Сегодня компания iFlytek представила в Макао свои первые очки с искусственным интеллектом. Эти 40-граммовые очки не могут похвастаться впечатляющим количеством пикселей, полноцветным экраном или модными коллаборациями; вместо этого они сосредоточили свои основные возможности на, казалось бы, обыденной функции — переводе .

Но перевод — это лишь отправная точка, а не конечная.
Накануне пресс-конференции APPSO побеседовала с Ван Вэем, вице-президентом iFlytek, и Линь Хуэйцзе, генеральным директором подразделения носимых устройств. Во второй части беседы тема перешла от конкретных технологий продукта к более широкому вопросу: является ли ключом к следующему этапу развития очков с искусственным интеллектом аппаратный уровень или же это уровень самого процесса работы с ИИ?
«Уникальность» очков с искусственным интеллектом заключается в том, что люди захотят носить их постоянно.
В условиях жесткой конкуренции между производителями умных очков, собрать продукт в рамках существующей цепочки поставок не составляет труда; Хуацянбэй (крупный рынок электроники в Шэньчжэне) может изготовить прототип всего за две недели. Задача состоит в том, чтобы дать пользователям повод «носить их постоянно».
Для компании iFlytek, которая впервые разрабатывала очки с искусственным интеллектом, это было неизбежным препятствием.
Когда Ван Вэй рассказывал APPSO о зарождении проекта iFlytek по созданию очков с искусственным интеллектом, он объяснил это очень конкретной ситуацией: подумайте, машины-переводчики очень полезны в таких ситуациях, как выставки и небольшие деловые переговоры, и даже компания может использовать одну такую машину на всех. Но бывают моменты, когда вы путешествуете за границу или в определенных ситуациях неудобно доставать устройство и смотреть на экран, и вы не хотите ждать результата перевода, который прерывает естественный ритм вашей речи.
Вы хотите, чтобы общение было «погружающим», с постоянным зрительным контактом, плавным диалогом и переводом, который ощущается как невидимый. Отправной точкой для этих очков является ожидание пользователя именно такого «ненавязчивого» опыта.
Это «физическое прерывание» — проблемный момент, который компания iFlytek выявила после анализа бесчисленных реальных отзывов пользователей машинного перевода. Компании, производящие очки с искусственным интеллектом, могут появиться в одночасье, но основу для перевода нельзя создавать в спешке.
Продано 1 миллион единиц переводческого устройства iFlytek, переведено 1 миллиард раз. Сервис синхронного перевода iFlytek охватил 420 000 международных конференций, охватив более 50 стран и 400 миллионов зрителей, и восемь лет подряд обслуживал Всекитайское собрание народных представителей и Всекитайское собрание народных представителей.

Эти цифры отражают не только работу алгоритмов, но и понимание мельчайших деталей реальных сценариев: когда пользователи считают перевод медленным, в каких ситуациях портативные устройства неудобны и в каких условиях шума точность резко падает…
В октябре прошлого года компания iFlytek выпустила гарнитуру для перевода. Гарнитура доказала две вещи: пользователям действительно необходим носимый перевод без использования рук; и сквозной синхронный перевод возможен на носимых устройствах со временем реакции менее 2 секунд.
Однако наушники служат только ушам. По мнению Линь Хуэйцзе, ограничение наушников заключается в том, что они являются «слуховым» устройством (а теперь к ним добавляются еще и камеры). Очки, с другой стороны, могут добавить визуальный аспект. Благодаря наложению нескольких модальностей, информационный поток для межъязыковой коммуникации становится намного богаче.
Проще говоря, очки оснащены камерой, которая может делать фотографии и переводить текст, дисплеем, который может проецировать субтитры, чтобы вам не приходилось смотреть на телефон, а также могут вмещать дополнительные микрофоны для направленного шумоподавления.
Как сказал Ван Вэй: «Очки находятся ближе всего к глазам, ушам и рту человека. Они являются естественным мостом между физическим и цифровым миром, позволяя переводу происходить так же естественно, как дыхание».
К 2026 году затраты на цепочку поставок начали снижаться, и национальная программа субсидирования впервые включила в себя умные очки. Кроме того, улучшенные возможности облачного перевода в большой модели Spark X2 позволили идеально использовать благоприятные временные и временные обстоятельства.

Линь Хуэйцзе была довольно откровенна: «Мы выбрали этот момент, потому что увидели, что темпы роста только начались». Ван Вэй был еще более прямолинеен: «Мы не хотим использовать термин „момент iPhone“, но на самом деле это именно то, что он означает. Мы вот-вот достигнем сингулярности».
40 граммов, задача системной инженерии.
Моё первое впечатление от очков iFlytek с искусственным интеллектом было таким: они оказались легче, чем я ожидал. В них интегрированы миниатюрный дисплей, камера, матрица из 5+1 микрофонов и динамик, но при этом общий вес составляет всего 40 граммов.

Эта цифра может быть неочевидна для многих, поэтому давайте проведём горизонтальное сравнение:
- Очки Meta Ray-Ban весят 49 граммов, но у них нет дисплея;
- Очки Rokid Glasses также весят 49 граммов и имеют дисплей, но они почти на 25% тяжелее, чем iFlytek.
- Очки Huawei с искусственным интеллектом действительно легкие, весят всего 35,5 грамма, но у них нет дисплея.
В сфере умных очков с дисплеями компания iFlytek добилась того, что на данный момент является самым легким устройством в отрасли.
Почему именно 40 граммов? Линь Хуэйцзе объяснила, что эта цифра — результат кропотливых исследований и моделирования. Европейцы и американцы, как правило, более терпимы к форме головы и телосложению, считая вес Меты более 50 граммов приемлемым. Однако азиаты, с их иной структурой черепа и высотой переносицы, крайне чувствительны к весу.
Для китайских пользователей 45 граммов — это переломный момент; превышение этого веса приведет к заметному давлению после длительного ношения. 40 граммов — это «порог комфорта» для длительного ношения.
Чтобы уменьшить вес на несколько граммов, команда долго вела переговоры с поставщиками на инженерном уровне. Самым важным шагом стала замена традиционных стеклянных линз на линзы из полимерной смолы.

Традиционные очки долгое время изготавливались преимущественно из полимерных материалов, но почему их не использовали в «умных» очках? Потому что производственный процесс невероятно сложен. Линзы «умных» очков требуют «полного ламинирования», то есть соединения слоя дисплея и линзы. Полимерные материалы чрезвычайно склонны к образованию мельчайших пузырьков воздуха во время формования и нагрева. Если в клеевом слое есть хотя бы малейший зазор, кривизна преломления света будет нарушена, и вся линза станет непригодной для использования. Контроль выхода годной продукции намного сложнее, чем в случае со стеклом.
Линь Хуэйцзе рассказала, что iFlytek, вероятно, первая компания в отрасли, успешно внедрившая технологию полного ламинирования смолой в умные очки с дисплеями. Процесс исследований и разработок включал многочисленные испытания и неудачи, прежде чем наконец удалось использовать смоляные материалы в линзах дисплея. Однако результаты оказались огромными: одни только линзы на 30-40% легче, чем стеклянные решения.
Кроме того, используются специально разработанные миниатюрные оптический модуль объемом 0,15 куб. см и миниатюрный модуль камеры, а оправа и дужки отлиты как единое целое. Выбор чипа и алгоритм глубоко взаимосвязаны: для выполнения одной и той же функции другим компаниям может потребоваться батарея емкостью 100 мАч, в то время как iFlytek может понадобиться всего 50 мАч.

Таким образом, представленные в итоге очки iFlytek AI Glasses оказались легче по весу, но при этом не потеряли в времени автономной работы.
Это задача системной инженерии, не допускающая коротких путей. Каждое звено требует многократных корректировок цепочки поставок для повышения производительности. Смоляные линзы, микрооптические модули, маломощные чипы и связь алгоритмов и оборудования — если какое-либо звено выйдет из строя, вес придется вернуть к значению более 50 граммов.
Шумоподавление с распознаванием движений губ: использование глаз для улучшения слуха.
Перевод, безусловно, является сильной стороной iFlytek, но в этих очках компания также представила несколько футуристическую технологию — шумоподавление с распознаванием движений губ, которое является основной частью многомодальной системы шумоподавления .

Это первый случай интеграции функции шумоподавления с распознаванием движений губ в очки с искусственным интеллектом . Логика заключается в том, что фронтальная камера очков фиксируется на губах говорящего. Одновременно пять воздушных и один костный микрофоны на очках формируют шестиканальный аудиопоток.
Система использует наблюдение в реальном времени за тем, «чей рот двигается», чтобы определить, «чей голос нужно слушать», тем самым точно выделяя голос целевого человека из шумного набора множества голосов.
Это позволяет «видеть, кто кого переводит»; на кого бы ни были направлены ваши очки, переведенные субтитлы, которые появятся у вас в ушах и на линзах, будут принадлежать этому человеку.
Эта технология напрямую определяет качество перевода во многих ситуациях, поскольку точность перевода зависит от того, насколько четко слышен аудиоматериал.
В тихом конференц-зале современное программное и аппаратное обеспечение для перевода вполне справляется с задачей. Однако ключевая группа пользователей iFlytek AI Glasses — это деловые люди. Каковы их реальные потребности в переводе? Им это необходимо на выставках, деловых приемах и в аэропортах, где уровень окружающего шума может легко достигать 80-90 децибел. В таких условиях точность традиционных инструментов перевода резко падает.
В условиях сильного шума шумоподавление, обеспечиваемое распознаванием движений губ, повышает точность распознавания более чем на 50%. Линь Хуэйцзе объяснила, что дело не просто в визуальном отслеживании движений губ; это комплексная многомодальная система шумоподавления, включающая улучшение определения местоположения источника звука и фиксацию целевого человека, при этом все сигналы автоматически координируются в процессе реального использования.
Эта возможность появилась не случайно. Компания iFlytek много лет работает над многоканальным разделением речи и многомодальным шумоподавлением в крупномасштабных конференц-системах и интеллектуальных автомобильных кабинах, и шесть раз подряд становилась чемпионом Международного конкурса по разделению речи CHiME.
Ван Вэй также показал внутреннюю демонстрацию, сделанную несколько лет назад: несколько исследователей говорили одновременно, и человеческое ухо совершенно не могло их различить. Система же четко и ясно разделяла голоса каждого человека, и было понятно, кто что сказал.
Интересно то, что раньше, при проведении крупных конференций, физического пространства хватало для размещения микрофонов, вычислительных мощностей серверов и розеток. Теперь же этот сложный алгоритм визуально-аудиосинтеза приходится умещать в 40-граммовые очки с крайне ограниченными вычислительными мощностями и энергопотреблением.

Ван Вэй считает, что именно в этом и заключается «сила» iFlytek в области аппаратного обеспечения: в умении сжимать основные алгоритмы на больших устройствах с высокой степенью сжатия и переносить их на небольшие, легкие мобильные устройства, одновременно обрабатывая множество голосовых данных в автономном режиме в реальном времени .
В разработке аппаратного обеспечения iFlytek используется подход «масштабная проверка устройств, мелкомасштабная миграция устройств». Алгоритмы, доказавшие свою эффективность в системах видеоконференцсвязи и автомобилях, адаптированы для очков. Для подавления шума при распознавании движений губ требуются парные данные визуального и звукового восприятия, возможности обработки в реальном времени на самом устройстве и совместная оптимизация многомикрофонного оборудования, чего сложно достичь простой интеграцией существующих алгоритмов.
Точность шумоподавления напрямую определяет точность перевода, что является первым препятствием на всем рабочем процессе.
Инфраструктура, лежащая в основе «комплексного перевода».
Как только вы сможете чётко расслышать, тогда вы сможете точно перевести.
Очки iFlytek AI поддерживают перевод в реальном времени на 122 языка и разделены на четыре режима: синхронный перевод (прослушивание выступлений), перевод при личной встрече (деловые переговоры), перевод звонков (международные телефонные звонки) и онлайн-синхронный перевод (подключение к Tencent Meeting или Zoom). Камера также может напрямую делать снимки презентаций PowerPoint и переводить документы на иностранных языках.

Больше всего во время работы на месте меня заинтересовал перевод телефонных разговоров .
Вероятно, это единственные очки на рынке, которые могут одновременно выполнять трансграничный перевод и записывать телефонные разговоры. Вот как это работает: очки подключаются к телефону через Bluetooth, записывают английскую речь собеседника, используют модель сквозного синхронного перевода для полностью автоматического перевода, а затем переводят ваш китайский ответ обратно на английский с задержкой в доли секунды.
Другими словами, когда вы говорите по-китайски по телефону, иностранец на другом конце провода слышит английский язык с клонированной версией вашего голоса. После завершения разговора очки могут даже отправить вам структурированный протокол совещания.
В прошлом традиционные системы перевода состояли из «старой тройки»: автоматическое распознавание речи (ASR) → перевод текста (MT) → преобразование текста в речь (TTS). Самой большой проблемой такого подхода была большая задержка, а семантическая потеря информации увеличивалась на каждом этапе.
На этот раз компания iFlytek оснастила очки моделью сквозного синхронного перевода голоса, минуя промежуточный этап перевода текста и напрямую реализуя «ввод и вывод голоса», что сокращает время отклика на первое слово до 2 секунд. В качестве облачной поддержки используется модель Spark X2 (архитектура MoE с 293 миллиардами параметров, обученная на Huawei Ascend).

Линь Хуэйцзе сказала, что они разделили сценарии перевода на очень мелкие части, потому что база знаний отрасли и режимы шумоподавления, необходимые в разных сценариях, совершенно разные.
Усилия, которые компания iFlytek вложила в разработку функции преобразования изображения в этих очках, чем-то похожи на подход индустрии мобильных телефонов к обработке изображений. У всех есть функция камеры, но эта модель обладает 200 миллионами пикселей, 10-кратным телеобъективом, возможностью съемки в формате 4K и даже подходит для профессиональных сценариев фотосъемки.
Процесс обработки данных с помощью ИИ начинается только после перевода.
На этом этапе вы поймете, что амбиции iFlytek выходят за рамки простого создания «инструмента для перевода». Вероятно, именно поэтому его называют не «очками для перевода», а «супер-помощником с искусственным интеллектом прямо перед вами».
Линь Хуэйцзе считает, что « эти очки больше похожи на суперкомпьютер, который носится перед глазами, с дисплеем, камерой и возможностью голосового управления; их конфигурация в основном такая же, как у мобильного телефона или ПК».
Функциональный уровень обеспечивается системой GlassClaw от iFlytek. Этот агент может вызывать возможности больших моделей, получать доступ к сервисам экосистемы и выполнять многомодальное понимание, связывая весь процесс от понимания до выполнения. Он также поддерживает доступ к сторонним агентам, таким как OpenClaw.

Вы всё правильно прочитали, это всё ещё бокалы в форме «лобстера».
Линь Хуэйцзе поделился своим ежедневным рабочим процессом с использованием GlassClaw: ему больше не нужно часто доставать телефон, когда он выходит из дома. Во время прогулки он может напрямую активировать GlassClaw своим голосом, чтобы получить доступ к контактам телефона, найти клиентов и позвонить им; перевод автоматически начнется после установления соединения.
При личной встрече с клиентом, если вам вдруг понадобится просмотреть краткое изложение предыдущего договора, вы можете просто дать команду своим очкам, и очки найдут ключевые моменты на вашем компьютере и синхронизируют их с линзами.
Даже после встречи очки автоматически выполнили многомодальное разграничение ролей (кто что сказал) и выдали структурированное резюме. Затем он прямо произнес голосом: «Отправьте резюме проектной команде по электронной почте и синхронизируйте встречу для подведения итогов на следующую среду с календарем».

Если вы когда-либо разводили креветок, вам, вероятно, знакомы эти особенности, только на этот раз взаимодействие происходит на вашем лице.
Функция телесуфлера, которая изначально сделала очки с искусственным интеллектом популярными, также была усовершенствована в этой модели.
Функция интеллектуального телесуфлера в очках iFlytek AI Glasses обеспечивает семантическое следование, точно реагируя на произносимый текст, а не механически прокручивая страницу с высокой скоростью. Она способна к естественному интеллектуальному пониманию и отслеживанию семантики. Прилагаемый зарядный блок также можно использовать в качестве пульта дистанционного управления с кнопками для переключения и паузы текста.

Это трехуровневое взаимодействие «устройство-периферия-облако», которое архитектура AstronClaw демонстрирует на базовом уровне: сторона устройства, отвечающая за восприятие окружающей среды и предварительную обработку данных, сторона периферии принимает решения, а сложные вычисления обрабатываются SparkX2 в облаке. GlassClaw основан на собственных разработках iFlytek в области агентов, а также поддерживает доступ к агентам сторонних разработчиков, таким как OpenClaw.
Ван Вэй считает, что в будущем очки перестанут быть просто парой очков и станут удобным личным помощником .
На рынке существует множество продуктов, которые выполняют только перевод или только функции ИИ-помощника, но для того, чтобы объединить "перевод + запись + составление резюме + кроссплатформенное выполнение" в единый рабочий процесс, четыре базовые возможности — голосовой ввод, перевод, крупномасштабная модель и интеллектуальный агент — должны быть одновременно доступны и взаимосвязаны .
Технологические возможности компании iFlytek, охватывающие весь спектр разработок, нашли подходящее применение в производстве очков.
В чём будет ключ к успеху во второй половине эры очков с искусственным интеллектом?
За последние два года волна искусственного интеллекта прокатилась по всей индустрии аппаратного обеспечения в поисках так называемой точки входа «следующего поколения».
Устройство AI Pin потерпело неудачу, а различные умные кулоны так и не принесли результата. Хотя аппаратные продукты и технологии в области ИИ различаются, в отрасли постепенно приходит к консенсусу: ИИ нужны глаза ; он должен уметь воспринимать трехмерный физический мир, в котором живут люди, в режиме реального времени.
Возможно, очки с искусственным интеллектом — это не окончательная версия, но на данный момент это единственная форма очков, способных круглосуточно передавать визуальную и звуковую информацию от первого лица.
В одном из интервью Ван Вэй сделал интересное предсказание: «Три основных элемента будущей цифровой жизни, скорее всего, будут компьютеры, мобильные телефоны и очки. Очки — это не просто аксессуары для мобильных телефонов; это независимые компьютерные устройства, которые крепятся на переносице».
Очки по своей природе идеально подходят для того, чтобы быть устройствами, соединяющими физический и цифровой миры. Более того, само аппаратное обеспечение имеет большой потенциал для совершенствования: дисплеи будут эволюционировать от монохромных к полноцветным, от 2K к 4K; камеры и микрофоны будут модернизированы до методов кодирования токенов, изначально разработанных для искусственного интеллекта. Ван Вэй отметил, что эти технологические направления уже демонстрируют относительно четкие перспективы развития.

Линь Хуэйцзе сообщила, что очки второго поколения с искусственным интеллектом от iFlytek уже находятся на стадии планирования и могут появиться в продаже уже осенью 2026 года, ориентированные на более широкий круг пользователей и охватывающие некоторые нишевые вертикальные сценарии.
За последний год компания APPSO протестировала и разработала множество очков с искусственным интеллектом. Оглядываясь назад на жесткую конкуренцию среди производителей очков с ИИ, можно заметить, что отрасль фактически разошлась по двум различным направлениям:
Один из подходов заключается в том, чтобы « создать лучшие очки, а искусственный интеллект сделать бонусом ». Компания Meta Ray-Ban следует этой логике: используя модный дизайн и культуру бренда, компенсировать редко встречающуюся, но необходимую потребность пользователей в возможностях ИИ.
Другой путь — «создание более сложных рабочих процессов искусственного интеллекта и превращение очков в новые компьютеры». Именно этот путь выбрала компания iFlytek. Оба пути ведут к разным уровням конкуренции, но второй сложнее, поскольку требует как возможностей в области аппаратной инженерии, так и полноценных возможностей в сфере искусственного интеллекта — ни то, ни другое не должно отсутствовать.
Настоящий поворотный момент во второй половине эры очков с искусственным интеллектом заключается в том, кто сможет интегрировать ИИ в сильно сегментированные сценарии реального мира и взять на себя рутинные задачи пользователей.
Пусть очки останутся очками, и пусть ИИ честно выполняет свою роль «рабочей лошадки».
Думаю, в конечном итоге останется примерно следующее оборудование: сняв его, вы вдруг почувствуете, что окружающий мир стал тяжёлым и неэффективным.
#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете в кратчайшие сроки увидеть еще больше интересного контента.