После двух дней использования метода ввода Doubao я больше не хочу печатать в чатах WeChat.

Если вы когда-либо использовали встроенный метод ввода на телефоне, вы поймете всю беспомощность этого устройства, если оно не выучило китайский язык.

Вот почему сторонние методы ввода так популярны.

Когда официальный метод ввода становится непригодным, пользователи естественным образом начинают голосовать ногами. Недавно ByteDance выпустила версию 1.0 метода ввода Doubao, стремясь переосмыслить процесс ввода с помощью ИИ.

Пока эта игра была еще свежа в моей памяти, я скачал ее и опробовал в течение двух дней, обнаружив некоторые детали, которые были одновременно милыми и разочаровывающими.

Учитывая значительное лидерство в области распознавания голоса, насколько мощной является «убойная функция» метода ввода Doubao?

Метод ввода Doubao имеет минималистичный интерфейс.

Нет раздражающей всплывающей рекламы или предложений подписки. Однако установочный пакет довольно большой: в магазине приложений vivo он отображается как 139 МБ. И, несмотря на большой размер, он не полностью функционален; аналогия с «недостроенным домом» вполне уместна.

Давайте сначала поговорим об основных конкурентных преимуществах метода ввода Doubao.

На мой взгляд, голосовой ввод — это главная фишка Doubao Input Method, которая значительно превосходит другие способы ввода, которыми я пользовался. За два дня использования я просто влюбился в голосовой ввод.

Короче говоря, нажмите и удерживайте, чтобы говорить, отпустите, чтобы закончить.

В ходе реального тестирования точность распознавания китайского, английского и кантонского диалектов оказалась невероятно высокой. Я небрежно сказал: «Я тестирую метод ввода Doubao на китайском», и система распознала его идеально. Затем я произнес английскую фразу «Attention Is All You Need», и она тоже была распознана точно.

В разговоре на кантонском диалекте такие вопросы, как «Вы придете сегодня вечером домой на ужин?» и «Один доллар за курицу, один доллар за фунт черепахи, один доллар за курицу дороже или один доллар за фунт черепахи дороже?», были успешно распознаны с первой попытки.

Важно понимать, что эти предложения произносятся быстро и содержат много омофонов; даже если произношение нечёткое, система ввода может работать со сбоями. Результаты модели в реальных тестах оказались весьма впечатляющими, что свидетельствует о её специальной подготовке на акустических особенностях и языковой модели кантонского диалекта.

Дубао может справиться со смешанным кантонско-английским стилем речи в драмах TVB.

Я пробовала писать: «Извините, мы уже сделали всё возможное», «Наслаждаюсь луной и десертом, почему вы звоните нам так поздно?» и «Отсканируйте это на свой компьютер, чтобы я сделала копию, а затем поделитесь ею со всеми. Не забудьте перепроверить!» В итоге ни один из вариантов не оказался ошибочным.

Он даже может вводить математические формулы голосом, что будет весьма полезно, если вы студент, преподаватель или исследователь.

С технической точки зрения в сети ходят слухи, что метод ввода Doubao использует модель Seed-ASR2.0.

Проще говоря, он преобразует речь в текст, позволяя машинам «понимать», что вы говорите. По сравнению с предыдущими крупномасштабными моделями распознавания речи, Seed-ASR снижает частоту ошибок на 10–40% на тестовых наборах китайского и английского языков.

Кроме того, Doubao Input Method поддерживает загрузку офлайн-моделей голоса размером около 150 МБ. Это означает, что вы сможете использовать голосовой ввод в обычном режиме даже в местах со слабым сигналом, например, на подземных парковках.

Однако точность офлайн-моделей, безусловно, ниже, чем у онлайн-моделей, поэтому снижение производительности является нормальным явлением.

Конечно, многие беспокоятся о конфиденциальности при выборе нового метода ввода. Метод ввода Doubao предлагает «базовый режим ввода», но после его включения все функции, такие как преобразование речи в текст и перевод, отключаются.

С точки зрения базового словарного запаса, богатство метода ввода Doubao достигает уровня основных методов ввода; он не представляет собой ничего особенного, но и не отстает.

Помимо распознавания голоса, я также пробовал печатать на интернет-сленге, например «确性人格» (Quequé Xìngrén) и «城巴佬» (Chengba Lao), и он распознал их все. Что касается редких персонажей, таких как «饕餮» (Таоти), «皴裂» (Чоу Ли) и «髑髅» (Дулоу), все они были легко узнаваемы.

Что касается Lenovo, то ее метод ввода Doubao, в котором реализованы возможности искусственного интеллекта, работает исключительно хорошо.

Если ввести «1+1=» или задать вопрос «Кто автор «Путешествия на Запад?», результат сразу отобразится в строке вариантов. Мне, как работающему человеку, очень нравится такой способ интеграции ИИ в систему ввода, подчёркивающий практичность.

Что осталось от метода ввода ИИ объемом 139 МБ, помимо распознавания голоса?

Обсудив преимущества, пришло время поговорить о недостатках.

Во-первых, метод ввода Doubao доступен только для Android. На официальном сайте указано, что скоро появится версия для iOS и ПК. Это также означает, что копирование и вставка между устройствами не поддерживаются.

Для пользователей, которые часто работают на нескольких устройствах, отсутствие этой важной функции может стать серьезным сдерживающим фактором, но, надеемся, она скоро станет доступна.

При настройках по умолчанию печать немного вялая, а скорость отклика недостаточно высокая, но, к счастью, в настройках можно установить скорость отклика клавиш на «очень быструю», и после ее настройки ощущения от использования станут намного лучше.

Интересно, что при настройке интенсивности вибрации клавиатуры вибрация была очень сильной при выборе «слабой», но практически незаметной при выборе «сильной». Возможно, это ошибка, и, надеюсь, она будет исправлена ​​в будущей версии.

Возможно, поскольку Doubao все еще находится на ранней стадии разработки, многие из подробных функций метода ввода Doubao еще не доработаны.

Смайлики — важная часть социального общения, и многие методы ввода имеют встроенные функции поиска и отправки смайликов. Хотя в методе ввода Doubao довольно богатый выбор смайликов, хотите ли вы отправлять их прямо из метода ввода? К сожалению, в настоящее время это невозможно.

Например, функциональность клавиатуры пока не полностью развита, доступны только 9- и 26-клавишные методы ввода. Если вы используете двойной пиньинь, рукописный ввод или ввод на традиционном китайском языке, то Doubao вам пока не подходит.

Кроме того, в интерфейсе клавиатуры есть тёмный режим, а в настройках — нет. Хотите сменить тему клавиатуры? Извините, в настоящее время доступен только стиль по умолчанию. Выбор последнего — дело личных предпочтений: кому-то нравится простота, а кому-то — слишком однообразный.

Когда я ввожу «LLM» в функцию перевода ИИ, по умолчанию всё равно отображается «Master of Laws». Хотя и «Master of Laws», и «Large Language Model» верны, это всё равно создаёт ощущение, будто я работаю с Google Translate.

Итак, стоит ли попробовать метод ввода Doubao?

Я считаю, что, основываясь только на функции распознавания голоса, его все равно стоит попробовать.

Однако не стоит спешить устанавливать его в качестве метода ввода по умолчанию. Сначала используйте его как резервный инструмент и дождитесь, пока Doubao Input Method добавит базовые функции, такие как поддержка версии iOS, синхронизация с несколькими устройствами и эмодзи, прежде чем рассматривать возможность полного перехода.

Конечно, мы могли бы дать этому некоторое время и посмотреть, как в конечном итоге будет развиваться версия 1.0.

Ссылка для скачивания метода ввода Doubao:
https://shurufa.doubao.com/

#Добро пожаловать на официальный аккаунт iFanr в WeChat: iFanr (WeChat ID: ifanr), где вы сможете как можно скорее получить еще больше интересного контента.

ifanr | Исходная ссылка · Просмотреть комментарии · Sina Weibo