Компании Lark и Anker объединили усилия для создания искусственного интеллекта в виде «бобов», вашего «внешнего мозга», весящего всего 10 граммов.

Оценить перспективы сектора аппаратного обеспечения для искусственного интеллекта за последний год оказалось действительно сложно.
Среди различных образцов оборудования с искусственным интеллектом, представленных на выставке CES в начале этого года, были машинка для стрижки волос с ИИ, которая многих озадачила, голографическая подружка, рекламирующая общение с ИИ, и душ с ИИ, который, похоже, намерен внедрить ChatGPT во все сферы повседневной жизни…
Рынок аппаратного обеспечения с использованием ИИ был наводнен многочисленными «псевдопотребностями», вызванными ажиотажем и маркетинговыми уловками. После периода жесткой конкуренции устройства для записи с ИИ, точно отвечающие на насущную потребность в «записи и организации», стали одной из немногих выживших категорий. Однако инновации в этом секторе, похоже, попали в порочный круг. Все начинают выпускать устройства размером с «карточку», пытаясь сделать диктофоны достаточно тонкими и громоздкими, чтобы их можно было прикрепить к задней панели телефона…
Есть ли лучшее решение? Компания Anker Innovations в сотрудничестве с Lark предложила нетривиальный ответ. На этот раз, вместо производства обычных карт, они создали 10-граммовый записывающий модуль для искусственного интеллекта.
Компания APPSO получила этот новый продукт на неделю раньше, и всего за несколько дней он стал неотъемлемой частью моего рабочего процесса. Мы носим его на одежде, вешаем на компьютеры, проводим редакционные совещания, смотрим презентации продуктов — теперь, сталкиваясь с любым объемом информации высокого качества, мы подсознательно включаем его в первую очередь.

Наш вывод таков: это, возможно, наименее устаревшая «черная технология» года, и в то же время самый «спасительный» инструмент повышения производительности. Помимо безупречного дизайна — он следует за мной повсюду, записывая все, что я делаю, — наиболее важным аспектом является поддержка искусственного интеллекта Lark. Он не только предоставляет сводки ИИ в реальном времени, но и преобразует записи из отдельных файлов в совместные онлайн-документы, напрямую интегрированные в мою базу знаний Lark и весь рабочий процесс.
Если вас раздражают магнитные карты, которые ради тонкости заменяют порт Type-C и заряжаются только через контактные точки, если вам надоело ощущение прилипания к задней панели телефона и необходимость терпеть заблокированный микрофон, тогда вам, вероятно, стоит попробовать это устройство AI Bean.


Самое существенное изменение в этом изделии заключается в том, что оно превращено в аксессуар. Его диаметр составляет 23,2 мм, вес — 10 грамм, и по размеру оно примерно как монета. Главное преимущество в том, что его можно прикрепить к воротнику как брошь или повесить на шею как ожерелье.
На следующей встрече вы можете свободно предаться мечтам.
Если форм-фактор аппаратного обеспечения решает проблему «удобства переноски», то взаимодействие с программным обеспечением должно решать проблему «удобства использования».
В эпоху диктофонов рабочий процесс был линейным: запись -> расшифровка. Но когда дело доходит до совещаний продолжительностью один-два часа, даже при высокой точности расшифровки, чтение тысяч слов в формате «водопадной диаграммы» остается катастрофой.
Даже в эпоху искусственного интеллекта логика работы различных записывающих устройств по-прежнему остается по сути линейной. Большинству систем ИИ сначала необходимо преобразовать запись в текст, а затем сгенерировать уточненное резюме на основе текстового содержимого.
Этот опыт, когда приходится ждать окончания совещания, чтобы получить итоговое заключение от ИИ, напоминает предвзятость задним числом.
Когда мы использовали это оборудование для записи с помощью ИИ, мы привлекли его к участию в нескольких совещаниях по выбору тем и наблюдали некоторые изменения.
Моё самое непосредственное впечатление заключается в том, что это преобразует наш изначально разговорный, фрагментарный и даже несколько бессвязный мозговой штурм в визуализированную логическую карту в режиме реального времени.
Сессии мозгового штурма обычно проходят в очень разноплановом формате. Часто мы обсуждаем характеристики современных стартапов в области искусственного интеллекта, затем переходим к списку миллиардеров Forbes, потом говорим о том, что некоторые сотрудники компании берут отпуск, и о том, как весной бушует эпидемия гриппа H1N1.

▲ Доступны сводные данные в режиме реального времени в двух версиях: диаграмма Исикавы и текстовое резюме.
Обычно внимание человека рассеивается всего на 15-20 минут, и весьма вероятно, что оно пропадает, как только разговор переходит в другую область . Но функция подробных сводок в Lark AI действует как невидимая рука, быстро возвращая вас к основной теме.
Если бы это был любой другой ИИ, мне, вероятно, пришлось бы вернуться и прочитать всю его речь того периода, поскольку расшифрованный текст был бы длинным, запутанным и нелогичным.
Пока мы там наверху болтали, система незаметно отфильтровывала ненужную информацию и перечисляла предложенные нами темы, описывая их осуществимость, подход и этапы реализации для каждой из них.
Благодаря этой структурированной системе, генерируемой в режиме реального времени, мы можем быстро понять, «что делать дальше», вместо того чтобы зацикливаться на «том, что мы только что сказали».
В этом процессе ИИ перестаёт быть инструментом для постобработки событий и становится «вторым мозгом», работающим параллельно совещанию. Диктовка — это лишь основы; её главная особенность — анализ логики диалога в реальном времени.
Lark AI может организовывать логику на основе контента и представлять ее в соответствующих таблицах и временных шкалах. Это не только значительно повышает эффективность совещаний, но и упрощает получение информации как никогда раньше.
Помимо участия в совещаниях, мы также держали это записывающее устройство на нашем компьютере, чтобы оно могло смотреть пресс-конференцию вместе с нами.

Изначально я думал, что система может быть не очень точной в распознавании нескольких человек, говорящих в компьютерную среду, поскольку это не то же самое, что говорить с реальным человеком в трехмерном пространстве; однако она показала себя довольно хорошо, когда речь шла о компьютерных колонках.
Мы смотрели презентацию OpenAI, и Lark AI смог распознать, что в онлайн-трансляции первым начал говорить Альтман, за ним следовали другие коллеги из OpenAI. Аналогичным образом, Lark смог в режиме реального времени резюмировать текущую часть презентации на основе выступлений каждого участника.
В сфере искусственного интеллекта перевод необработанных английских текстов — обычное дело. Раньше нам приходилось запускать плагин для перевода и одновременно делать заметки в другом окне — хаотичный и утомительный процесс.
Но это маленькое записывающее устройство показало себя на удивление хорошо. Самый сложный аспект перевода в реальном времени — это «жесткий машинный перевод», вызванный отсутствием контекста, но Lark AI, похоже, «понимал» контекст и корректировал свою стратегию перевода в режиме реального времени. При столкновении с часто встречающимися техническими терминами скорость и точность его реакции превзошли мои ожидания, и весь процесс прошел практически без каких-либо неловких ситуаций, связанных с полной растерянностью.

▲ Согласно описанию приложения, оно поддерживает перевод в реальном времени на 24 языка, а также может различать говорящих в реальном времени.
Для профессионалов в сфере СМИ это крайне важно: возможность получать точную, структурированную информацию быстрее других во время пресс-конференции является ключевым конкурентным преимуществом.
После окончания записи мы получили уже не хронологическое изложение, а логически выверенное и сосредоточенное на ключевых моментах интеллектуальное резюме.
В течение нескольких минут, даже после нескольких часов напряженных совещаний, Lark AI может напрямую обобщить сложные обсуждения в виде единой диаграммы. Эта сводная доска редактируема, как слайд PowerPoint.

▲ Изображение, созданное программой Lark AI в веб-браузере, демонстрирующее страницу редактирования.
Даже не нужно читать письменное резюме. В большинстве случаев я могу в принципе понять суть совещания, просто взглянув на эту диаграмму. Конкретное содержание каждой темы разделено на пункты и области и выделено разными цветами.
В отличие от большинства аудиорезюме, созданных с помощью ИИ, Lark AI автоматически выбирает визуальные элементы, такие как диаграммы и графики, на основе содержания диалога, чтобы сделать резюме более читабельным.

▲ Интеллектуальные протоколы со сложными диаграммами и мультимодальными функциями; включая резюме, интеллектуальные разделы, ключевые решения и запоминающиеся цитаты, все это организовано с помощью ИИ.
В разделе списка дел напрямую отображаются пункты «что нужно сделать», упомянутые на встрече, вместе с графиком выполнения. Часто возникает путаница с такими расписаниями, когда в течение дня много встреч; теперь Lark предоставляет для этого отдельный раздел.
Тот же принцип применим к содержательным главам, ключевым решениям и запоминающимся моментам. Их раздельная организация имеет главное преимущество, позволяя мне быстро найти полную стенограмму разговоров, когда мы обсуждали эту тему на совещании.
Это как учитель, который после урока выделяет ключевые моменты, систематизируя весь материал, который стоит повторить, чтобы нам не приходилось делать дополнительные записи.
Что еще интереснее, перед тем как будет сгенерирована полная запись времени с помощью ИИ, мы можем получить краткий предварительный обзор. Нажатие кнопки завершения записи немедленно откроет небольшое окно в приложении Lark, в котором будет непосредственно отображаться краткий предварительный обзор ключевых моментов и пунктов плана действий.

▲ Функция завершения совещания без ожидания предоставляет краткий обзор совещания, список задач и основные выводы сразу после его окончания.
Этот краткий обзор — не просто случайный протокол совещания; многолетний опыт Lark в создании документов научил нас тому, что мы хотим видеть. Возьмем, к примеру, наше утреннее совещание по выбору темы. Этот краткий обзор без задержек включает в себя краткое изложение, списки задач и ключевые выводы. Искусственный интеллект Lark сразу отобразит наиболее важную информацию в начале.
Каждая запись связана с предыдущими работами.
Сводки в реальном времени, быстрый предварительный просмотр сводок, интерактивные доски… эти функции, безусловно, мощные, но они не являются настоящим "залогом" этого устройства для записи.
Его главная особенность заключается в том, что он устраняет барьеры между аппаратным и программным обеспечением, обеспечивая свободный поток данных.
Получив полные протоколы каждого совещания по выбору темы, мы можем продолжить их изучение. На мобильном телефоне или веб-странице откройте Miaoji, найдите протоколы, запись которых только что завершилась, и вы сможете просмотреть полный отчет.

▲ Скриншот страницы «Заметки» в приложении Lark, показывающий подключенные устройства и обработанные файлы.
Эти функции искусственного интеллекта также являются отличительными чертами других брендов, но, по нашему опыту, мы обнаружили, что Lark обладает конкурентным преимуществом, которому не может сравниться ни одна другая платформа.
Главная проблема многих диктофонов с искусственным интеллектом заключается в том, что данные статичны. После записи файл сохраняется в приложении, но для его использования необходимо экспортировать, сохранить как документ, поделиться им, а затем открыть WeChat, чтобы отправить его коллегам.
Но этот записывающий модуль уникален; по сути, он является частью экосистемы Lark, независимым устройством. Каждое записанное вами слово не хранится в самом устройстве, а напрямую поступает в базу знаний Lark.
Большинство приложений для записи разговоров, использующих искусственный интеллект, могут задавать вопросы только на основе текущего файла. Однако в Lark файл записи может быть интегрирован со всем содержимым нашей библиотеки документов Lark, и ИИ Lark будет отвечать, опираясь на всю базу знаний.

▲ Раздел «Вопросы и ответы» предоставляет прямой доступ ко всем документам Lark, включая контент, записанный с помощью оборудования для аудиозаписи на основе искусственного интеллекта, например, интеллектуальные протоколы и полные текстовые записи.
Например, когда мы записывали информацию о браузере ChatGPT Atlas на презентации OpenAI, мы задали вопрос на платформе вопросов и ответов Lark: «За какими браузерами с поддержкой ИИ мы следим?» Система смогла просмотреть все мои документы и вспомнить Google Chrome, браузер с поддержкой ИИ от Microsoft и другие, о которых я писал ранее.
Это чудесное чувство; кажется, Lark открыл для меня удобный путь в реальный мир. Помимо набора текста, теперь я могу сохранять информацию в базе знаний, просто произнося её вслух.
Создание базы знаний — очень трудоемкая задача для большинства пользователей. Наши идеи могут зародиться в любом уголке мира, поэтому концепция «флэш-капсул» остается популярной с момента своего появления несколько лет назад. Систематизировать все идеи в нашем сознании и все результаты нашей работы в единую, логичную и удобную для поиска базу знаний — задача непростая.
Но, используя этот инструмент для записи, я обнаружил, что бремя создания базы знаний практически исчезло . Записи файлов, которые когда-то считались хранилищами данных, теперь стали моим неисчерпаемым источником творческого вдохновения. Даже те идеи, которые были отклонены на совещании по выбору темы, теперь могут спокойно храниться в базе знаний, ожидая своего возрождения в будущем.
Этого мне не могут предложить другие платформы для записи аудио с использованием ИИ. Только благодаря интеграции документов, журналов чатов, календарей и совещаний эти аудиоданные по-настоящему оживают.

▲ Календарь, облачные документы, вопросы и ответы, обмен сообщениями, видеоконференции и т. д. — запись с использованием ИИ интегрирует всю экосистему Lark.
Протоколы совещаний, созданные с помощью ИИ, по своей сути являются результатом совместной работы. Вы можете экспортировать их напрямую в форматы Word или PDF, или поделиться ими с коллегами одним щелчком мыши. Члены команды могут напрямую комментировать, выделять важные моменты и совместно работать над этими мультимодальными протоколами, которые включают аудио, текст и диаграммы.
Лучшее оборудование для искусственного интеллекта должно быть невидимым, незаметным, но при этом полезным.
По сравнению с компаниями-производителями оборудования, которые пытаются внушить пользователям мысль о том, что «вам нужен ИИ», совместный подход Anker Innovations и Lark выглядит гораздо более прагматичным.
Вместо того чтобы пытаться создать совершенно новое и странное устройство, которого пользователи никогда раньше не видели, компания сосредоточилась на проверенном и многократно доведенном до совершенства сценарии «записи и воспроизведения».
Компания Anker Innovations использовала свой многолетний опыт в разработке аппаратного обеспечения, чтобы уменьшить устройство до размеров 10-граммовой кнопки, решив проблемы, связанные с его ношением и переноской, сделав аппаратную часть незаметной и обеспечив бесперебойную запись.
С другой стороны, Lark использует свою ключевую «мягкую силу»: глубокое понимание того, «как люди общаются». Благодаря своей осведомленности о сложных и профессиональных коммуникационных сценариях, Lark стал незаменимым и эффективным инструментом в офисе или на рабочем месте. Поэтому, сталкиваясь с затяжными, бессвязными или даже противоречивыми обсуждениями в аудиозаписях, он может эффективно разбить устную речь на четкие выводы, списки дел и консенсус.
Lark действительно выходит за рамки простого прослушивания голоса, позволяя понимать намерения говорящего, выходя за рамки простой записи и превращаясь в действенное решение в вашей базе знаний Lark. 
Возможно, это не тот продукт, который заставит нас кричать от восторга, как в научно-фантастическом фильме, и не одна из тех умопомрачительных креативных концепций с CES. Но для любого, кому нужно обрабатывать информацию, это инструмент повышения продуктивности, который вы с удовольствием будете носить с собой каждый день, инструмент, который действительно превращает забытые разговоры в ценные ресурсы.
В условиях нынешнего бурного развития аппаратного обеспечения для искусственного интеллекта нам, возможно, не понадобится совершенно новый терминал ИИ, который попытается заменить мобильные телефоны. Нам может понадобиться всего лишь «интерфейс», который сможет лучше связать физический мир и цифровые активы.
#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (идентификатор WeChat: ifanr), где вы сможете быстро найти еще больше интересного контента.
ifanr | Оригинальная ссылка · Посмотреть комментарии · Sina Weibo