Разрабатывайте приложения за 30 секунд и пишите изображения и текст в режиме реального времени: Lingguang стремится изменить границы творчества с помощью ИИ.

18 ноября, 2025 Дядя Влад

Существует множество вариантов использования искусственного интеллекта на вашем телефоне, но они либо похожи на «элитного попугая», либо на носителя информации — кто знает, мне нужен помощник, который действительно может выполнять работу, «творческий партнер», который может не только разговаривать, но и совершать действия.

В этом году вы, вероятно, заметили, что ИИ развивается от простого «разговора» к «действию». OpenAI создал Atlas, а предстоящий проект Google Gemini 3.0 позволит ИИ напрямую управлять компьютерами… Все работают в одном направлении: превращая речь в действие, а диалог — в поведение.

Компания Ant Financial только что запустила нового многомодального ИИ-помощника Lingguang. Он не ходит вокруг да около: вы говорите, он действует, превращая ваши мысли в то, что вы можете видеть, использовать и с чем можете играть прямо у себя на глазах.

От ответов на вопросы до выражения идей ИИ также нуждается в эстетике информации.

Целевая страница Lingguang представляет собой привычное окно чата. Пользователи могут задавать вопросы на естественном языке, например, «Напишите, сколько калорий в этом напитке» или «Запишите, сколько вы ели сегодня», что значительно ускоряет процесс обучения и делает приложение более удобным в использовании, чем традиционные приложения.

Всё ещё похоже на непринуждённую беседу, не правда ли? На самом деле, каждый ваш разговор с Lingguang — это действие. Вот три примера из реальной жизни, которые вы, вероятно, будете использовать.

Недавно, в связи с проведением Национальных игр, Гуанчжоу также стал популярным туристическим городом, особенно благодаря Кантонской телебашне, которую каждый день окружают туристы. Я спросил Лингуана: «Что такого особенного в архитектурном решении Кантонской телебашни?» Он предоставил не только текстовое объяснение, но и интерактивную 3D-модель.

Интерактивный дизайн, позволяющий вращать и увеличивать изображение для просмотра деталей конструкции, дал мне четкое и интуитивно понятное понимание двухсторонней торсионной структуры башни Кантон и конструкции внешнего цилиндра с косой сеткой.

В вашем разговоре с Lingguang приложение не только сообщает вам ответ, но и позволяет увидеть, как он выглядит. Текст, изображения и структурная анимация интегрированы, благодаря чему весь процесс вопросов и ответов воспринимается как «пояснительный текст и изображения», генерируемые в режиме реального времени и вплетённые в разговор. Независимо от того, являетесь ли вы студентом-архитектором, любителем городской жизни или просто тем, кто хочет узнать больше об этой достопримечательности из любопытства, это действительно экономит вам массу времени на поиск, листание страниц и сбор информации.

Затем я спросил: «Не могли бы вы организовать для меня гастрономический тур поблизости?» Система сразу поняла, что «поблизости» — это Гуанчжоу, и создала масштабируемую интерактивную карту, на которой отметила шесть-семь небольших магазинов разных стилей и даже «скрытый маршрут». Нажав на каждое место, можно было увидеть причины рекомендации, рейтинги, часы работы, и даже примерно рассчитать маршрут для пешего похода.

Потрясающе! Он может создавать интерактивные дисплеи прямо на мобильном телефоне, что является редкостью даже в отрасли.

Если эти два примера вызывают чувства «красивой внешности и крутости», то сейчас мы продемонстрируем «рациональную красоту» Лингуана.

Для создания качественного универсального ИИ-помощника просто задавать вопросы и отвечать на них явно недостаточно. Он должен уметь выдавать структурированные результаты, а это значит, что ему необходимо глубокое понимание и реорганизация семантики информации — не только для извлечения информации, но и для извлечения ключевых информационных точек, интеллектуального понимания семантики и выполнения иерархической обработки.

Например, когда Лингуан сталкивается с вопросами, требующими как макро-, так и микроанализа, например, «Почему потребительские бренды продают свои китайские подразделения/Почему скевоморфный дизайн UI теряет популярность?», его ответ не содержит длинных абзацев текста. Вместо этого он сначала анализирует ключевые факторы, такие как изменения на потребительском рынке, жизненный цикл бренда и давление акционеров, а затем соответствующим образом структурирует содержание, формируя чёткую причинно-следственную, логически последовательную структуру объяснения.

Использование карточного формата с заголовком и аннотацией, встроенными в текст и изображение, позволяет избежать утомительности, а также избежать затянутости и расплывчатости, характерных для PPT/веб-отчётов. Этот структурированный вывод не только логически понятен, но и визуально представляет «информационную эстетику»: чёткий, целенаправленный и с удобным ритмом. Он не только повышает эффективность усвоения информации, но и имитирует методы организации контента, применяемые опытными писателями, делая вывод ИИ более «понятным», глубоким, выходящим за рамки поверхностного, «доступного для поиска» ответа.

Вы, наверное, всё это время задавались вопросом: как это вообще возможно? Как сделать так, чтобы это было одновременно структурно понятно и визуально привлекательно, и при этом позволяло взаимодействовать в режиме реального времени?

Когда Lingguang получает вопрос, он активирует процесс создания контента, основанный на генерации кода . Будь то текст и изображения, карты или 3D-анимация, базовый уровень состоит из модели, которая в реальном времени пишет соответствующий код, стили и компоненты, которые затем динамически собираются и представляются . Для этого используется не одна большая модель, работающая в одиночку, а множество интеллектуальных агентов, взаимодействующих между собой : одни обрабатывают изображения, другие – макет, третьи – извлекают структуры данных… словно строительные блоки.

Он объединяет различные жанры контента и адаптируется к распространённым методам его представления, что приводит к созданию максимально естественного контента. Конечный результат также лучше подходит для пересылки, создания скриншотов и обобщения в «полезный контент для WeChat Moments» — он содержит как рациональные суждения, так и личные мнения и эмоции .

Создайте свое собственное приложение за одно предложение или за 30 секунд.

Если возможность создавать схемы и планировать маршруты во время разговоров уже сама по себе достаточно удивительна, то следующая возможность — это почти «волшебство»: просто введите запрос на клавиатуре, и система сразу же создаст для вас небольшое приложение.

Генерация приложений с помощью агентов в настоящее время находится в несколько затруднительном положении: многие приложения застревают на точке останова, где они «понятны, но не могут быть выполнены». «Flash-приложение» от Lingguang решает эту проблему, поскольку его диалог выходит за рамки вызова и запроса инструментов, позволяя генерировать инструменты напрямую.

Да, речь идёт не о создании фрагмента кода, прототипа или предложения, а о создании «готового к использованию инструмента» прямо на месте. Воплощение идей — уже не просто развлечение для программистов; Flash-приложения могут стать отправной точкой для «творчества» вручную для каждого обычного человека.

Давайте посмотрим, как он упрощает «воплощение идей в жизнь». Моей первой задачей было: «Мне нужен инструмент, который может разбивать длинные тексты на более мелкие абзацы».

Всего через 30 секунд появится небольшой инструмент, позволяющий задать количество абзацев и автоматически сегментировать файлы. Вам даже не нужно открывать новую страницу: сгенерированные результаты будут напрямую встроены в диалоговое окно, и вы сможете использовать их сразу после открытия.

Вот ещё один простой и практичный пример: создайте переводчик меню. Суть в том, чтобы не только переводить названия блюд с иностранных языков на китайский, чтобы я понимал, что они означают, но и читать эти названия вслух, чтобы я мог легко заказать еду.

Понимание текста, генерация языка, организация интерфейсов и обеспечение звуковой обратной связи — эти возможности раньше требовали множества компонентов и, возможно, требовали от меня подробного объяснения логики кода. Теперь же всё это можно уместить всего в одну строку.

Независимо от того, используете ли вы его для заказа еды во время поездки за границу или для практики разговорного английского и знакомства с названиями блюд, этот небольшой инструмент готов к использованию сразу после создания, что действительно соответствует принципу «создай и используй немедленно». В основе лежит полноценная прикладная платформа: он не только выводит страницы интерфейса, но и использует возможности бэкенда большой модели. Он предоставляет не только код, но и бесплатный дизайн пользовательского интерфейса. В этот небольшой инструмент интегрированы динамические модули, такие как перевод и синтез речи.

Таким образом, полученный продукт представляет собой не просто демоверсию , а реальный продукт, способный взаимодействовать с пользователями в режиме реального времени, реагировать на ввод данных и имеющий полный цикл логики front-end и back-end.

Вместо того, чтобы тратить время на поиски в магазине приложений, очевидно, быстрее и лучше использовать Flash-приложение, чтобы за минуту создать небольшой инструмент, идеально подходящий под мои личные нужды. Оно гибкое, мгновенное и не имеет барьеров для доступа. Это не универсальное решение, а лишь временное, «заточенное под конкретный момент», но оно может вызвать у обычных людей психологическое удовлетворение от «творения» — даже те, у кого нет опыта в разработке, могут испытать радость и желание поделиться фразой «Я создал небольшое приложение» всего лишь одним предложением.

Интерактивные занятия с «глазами»

Видео в реальном времени теперь является «стандартной функцией» для ИИ-помощников, и компания Lingguang дала этой функции довольно креативное название: «Открытые глаза». Оно весьма уместно, поскольку для этого требуется не набор текста, а открытие камеры, что подобно открытию глаз ИИ для восприятия другого естественного языка: визуального.

Например, если вы наведете телефон на чашку молочного чая, на экране сразу же появятся рекомендации по питанию, меры предосторожности при хранении и несколько дополнительных вопросов, чтобы удовлетворить ваше любопытство:

Эта функция очень удобна для продуктов питания и лекарств. Выбираете ли вы что-то для себя или покупаете родителям что-то новое, что они не знают, эта функция идеально вам подходит.

Уникальная особенность OpenEye заключается в его технологии потокового распознавания , которая выходит за рамки простого «распознавания объекта» и превращает его в интеллектуальный визуальный портал, способный реагировать и вступать в диалог. Он способен распознавать ваши потенциальные намерения в любой момент, заблаговременно инициировать последующие действия и превращать единичное распознавание в целостную цепочку действий.

По сравнению со старыми технологиями машинного зрения на основе искусственного интеллекта, которые могли распознавать только логотипы или продукты, эта технология явно продвинулась на шаг дальше: она не только определяет, что это такое, но и пытается понять, почему вы на это смотрите и что вам может понадобиться в дальнейшем.

Другими словами, он превращает «камеру» в еще один канал диалога, диалога, который направляет взаимодействие посредством зрения , по-настоящему «открывая глаза»: вовлекая во взаимодействие «глазами».

Он возвращает всем понятие «творения».

Язык — это код, а требования — прототипы. Диалог никогда не является конечной целью; его истинная ценность заключается в том, что он становится стимулом для продуктивности. Вдохновение разрушает традиционный путь «вопрос — ответ — действие», превращая сам язык в отправную точку для инструментов. Оно делает путь от «у меня есть идея» до «я уже это сделал» короче и интуитивнее.

Приложения, для создания которых раньше требовались навыки программирования, дизайна и разработки продуктовой логики, теперь можно создавать, используя всего одну строку естественного языка. Впервые обычные люди могут напрямую «создавать» функциональный инструмент, карточку контента или интерактивный поток, используя повседневный язык, фактически становясь своим собственным менеджером по продукту. Этот скачок от «умения говорить» к «умению творить» знаменует собой полное преодоление порога продуктивности.

На следующем этапе развития индустрии ИИ конкуренция будет заключаться не в том, «у кого более сильная модель», а в том, «кто способен трансформировать возможности в пользовательский опыт». В начале года DeepSeek возглавил волну моделей с открытым исходным кодом в Китае. К концу 2025 года мы видим новые возможности для парадигм взаимодействия с ИИ в Lingguang. Это наглядно демонстрирует важный путь: от базовой большой модели к инструментам среднего уровня и, наконец, к пользовательским приложениям.

На этот раз вопрос «что может сделать ИИ» наконец-то трансформировался из лабораторного языка в повседневные глаголы, доступные пользователям . Он превратил «делать это» в «высказывать это» и вернул всем возможность «творить».

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (WeChat ID: ifanr), где вы сможете как можно скорее получить еще больше интересного контента.

ifanr | Исходная ссылка · Просмотреть комментарии · Sina Weibo