Почему телефон распознает вас в маске? В основном из-за этого

С приходом эпидемии функция разблокировки по лицу деградировала благородной голове.

Когда маски стали обязательным предметом для нас, чтобы выйти на улицу, нам всегда приходится проходить через утомительный процесс «сбоя распознавания лица» – «ввода пароля» при разблокировке телефона. Это заставляет людей пропускать распознавание отпечатков пальцев.

Чтобы оптимизировать процесс разблокировки лица, ранее в этом году иностранный предприниматель Даниэль Баскин выпустила маску с информацией о лице. Продукт извлекает информацию о лице пользователя и печатает ее на внешней стороне маски.После того, как пользователь наденет маску, он может собрать целое лицо.

▲ Вообще-то немного страшно. Картинка от: djbaskin

Однако степень успеха разблокировки этого продукта еще не ясна, и нет большого количества проверок образцов. Так как же системе распознавания лиц перестать беспокоить маски?

Некоторые пользователи сети постепенно обнаружили, что по мере того, как время ношения маски становится все длиннее и длиннее, мобильный телефон, похоже, испытал «опыт» повторяющихся неудачных попыток разблокировки лица и постепенно может успешно распознать себя, носящего маску.

Опираясь на эту идею, некоторые технологические блоггеры также поделились более эффективными руководствами, такими как многократная разблокировка при ношении маски. Если распознавание лица не удается, немедленно введите пароль . Повторите это действие в течение примерно 30 минут, и телефон сможет распознать человека в маске. Сам.

▲ Успешно разблокировано лицо в маске. Фото: Фархад Усманов

Однако в ходе практики пользователи сети отметили, что скорость «обучения» у разных моделей разная. Некоторые люди повторяли вышеуказанные действия в течение 20 минут и добились успеха, но некоторые люди повторяли их тысячи раз, и их мобильные телефоны по-прежнему не могут распознать себя в маске.

Почему это происходит? Фактически, ответ относится к способности мобильных телефонов к обучению ИИ.

▲ Изображение из: thenextweb

Оружие глубокого обучения – NPU

Если вы следили за конференциями по мобильным телефонам в последние два года, вы, должно быть, обнаружили, что, когда производители мобильных телефонов представляют чипы SoC, они сосредоточатся на модернизации NPU .

Так называемый NPU относится к процессору нейронной сети. В чипе мобильного телефона он, как правило, разделен на несколько функциональных областей.На пресс-конференции часто упоминаются три: один – это ЦП, который хорошо справляется со сложными задачами и выдачей команд, другой – это графический процессор, который хорошо обрабатывает графику, а другой – это хорошо справляется с ручным трудом. NPU для интеллектуальных задач.

Хотя NPU «занимает» меньше места, чем CPU и GPU, его возможности нельзя игнорировать: от него во многом зависит интеллект мобильного телефона.

▲ Чипы с NPU часто называют «чипами AI» или «бионическими чипами». Изображение с: Lei Xue.com

Вышеупомянутое обучение мобильных телефонов распознаванию себя в масках в основном связано со способностями NPU. После того, как камера захватит изображение лица, ЦП и ГП выполнят предварительную обработку изображения за очень короткое время, затем NPU и GPU обнаружат и извлекут особенности, и, наконец, ЦП, ГП и NPU совместно завершат распознавание и классификацию лиц.

Благодаря постоянно растущей вычислительной мощности весь процесс стал «нечувствительным». В тот момент, когда мы сняли трубку, описанный выше процесс был завершен.

Добавление NPU позволяет мобильным телефонам узнавать вас в разных состояниях. Когда вы просыпаетесь утром, ваш телефон знает, что это вы, даже если у вас опухло лицо. Даже после того, как его ужалила оса, его рот распух и превратился в «сосиску», и телефон все еще мог распознать это.

▲ Фотография от: Капитан Хан Дрифтинг

Таким образом, после определенного количества тренировок мобильный телефон сможет узнать вас, не опасаясь масок.

Фактически, если вы полагаетесь только на алгоритмы, ЦП и ГП также могут взаимодействовать для завершения обучения. Но недостаток – низкий КПД и большое энергопотребление. Согласно введению «Автомобильная электроника и программное обеспечение», ЦП и ГП должны использовать тысячи инструкций для завершения обработки нейронов, а NPU требуется только одна или несколько для выполнения.

▲ Эффективность обучения NPU довольно высока. Изображение предоставлено: androidauthority

Кроме того, при таком же энергопотреблении производительность NPU в 18 раз выше, чем у GPU. Видно, что NPU имеет очевидные преимущества в эффективности обработки глубокого обучения.

Говоря об этом, не могу не упомянуть принцип работы NPU. Причина высокой эффективности обучения NPU не в том, что он выпил «шесть грецких орехов», а в том, что он имитирует человеческие нейроны и синапсы в слое цепи. И используйте набор инструкций глубокого обучения для непосредственной обработки крупномасштабных нейронов и синапсов. Подчеркивая вес для достижения интеграции хранения и вычислений, одна инструкция NPU может соответствовать тысячам инструкций предыдущего CPU и GPU.

▲ Фотография из: forbes

Используя менее подходящую аналогию, это похоже на интеграцию складирования и логистики, реализованную JD Logistics, которая значительно повышает эффективность доставки и может быть приобретена в тот же день или даже доставлена ​​в тот же день.

NPU не безвкусный

Первой отечественной компанией, изучавшей NPU, была компания Cambrian. Чип Kirin 970, выпущенный в 2017 году, использовал архитектуру Cambrian NPU. Kirin 970 также стал первым в мире мобильным ИИ-чипом.

По данным Huawei, Kirin 970 со встроенным блоком NPU примерно в 50 раз выше энергоэффективности и в 25 раз выше производительности при решении одних и тех же задач AI-приложений по сравнению с четырьмя ядрами Cortex-A73. Например, скорость распознавания изображений может достигать около 2000 листов в минуту, что намного выше отраслевого уровня за тот же период.

▲ Kirin 970. Изображение из: Electronic Engineering Album

Одиннадцать дней спустя появились iPhone 8/8 Plus и iPhone X с бионическим чипом A11. Apple заявила на пресс-конференции, что это самый мощный и интеллектуальный чип в ее истории.

A11 Bionic – первый процессор Apple под названием «Bionic», а также первый процессор Apple, поддерживающий ускорение AI. Например, в функции распознавания лиц механизм нейронной сети позволяет A11 поддерживать скорость до 600 миллиардов операций в секунду.

▲ Изображение из: stealthsettings

Также с этого года все больше и больше производителей стали обращать внимание на продвижение возможностей искусственного интеллекта в мобильных телефонах. Например, основная AI-фотография Huawei, супер-ночные сцены, воздушные жесты и другие функции; гордый Face ID iPhone, размытие портрета, Deep Fusion (глубокое слияние) и другие функции – все это в значительной степени зависит от возможностей NPU.

▲ Управление жестами Huawei AI

С июня 2019 года, с выпуском Kirin 810, Huawei начала использовать микросхемы искусственного интеллекта для мобильных телефонов собственной разработки на базе Da Vinci. Умная архитектура Да Винчи заключается в том, что у каждого подразделения есть четкое разделение труда, что позволяет более эффективно проводить вычисления с помощью ИИ.

Согласно введению "Electronic Product World", ядро ​​архитектуры Da Vinci 3D Cube, модуль векторных векторных вычислений, модуль скалярных скалярных вычислений и т. Д., Каждый отвечает за различные вычислительные задачи для создания моделей параллельных вычислений и совместно обеспечивает эффективную обработку вычислений AI. Реализуйте такие характеристики, как высокая вычислительная мощность, высокая энергоэффективность, гибкость и адаптируемость.

На недавней пресс-конференции серии Mate 40 компания Huawei подчеркнула, что NPU чипа Kirin 9000 был обновлен до версии 2.0 архитектуры Vinci, что удвоило вычислительную мощность. В то время как вычислительная мощность ИИ стала выше, энергоэффективность увеличилась на 15%, а производительность сети также увеличилась на 20%.

В списке тестов AI Benchmark, выпущенном ETH Zurich, Kirin 9000 выиграл главный приз лагеря Android, набрав более чем в два раза больше, чем Qualcomm Snapdragon 865+.

▲ Список тестов AI

Помните вышеупомянутую способность Kirin 970 распознавать 2000 изображений в минуту? Kirin 9000 развил скорость до 2000 кадров в секунду. Кроме того, воздушные жесты AI, отключение интеллектуального экрана AI и субтитры AI, которые были выделены на пресс-конференции, – все это проявления его возможностей NPU.

Больше всего меня впечатлила функция «Умный платеж»: когда мобильный телефон обнаруживает, что он находится рядом со сканером, он автоматически открывает страницу с кодом платежа и выполняет платеж за один раз. Это представляет собой направление идеального интеллектуального терминала: «знать вас», «знать вас» и «помогать вам».

▲ Huawei Smart Pay. Изображение предоставлено: VDGER.

Когда был выпущен iPad Air четвертого поколения, Apple также подчеркнула улучшение возможностей своего NPU. По сравнению с бионическим процессором A12, механизм нейронной сети нового поколения A14 увеличивает производительность машинного обучения в два раза.

Сверхвысокая скорость машинного обучения позволяет бионическому чипу A14 реализовывать функцию суперпикселей.При использовании пиксельматора пиксели будут автоматически добавляться к обрезанным фотографиям, чтобы сделать фотографии более четкими.

Отраженные в серии iPhone 12, возможности компьютерной фотографии также были беспрецедентно улучшены. В качестве небольшого примера, во время покадровой съемки мобильный телефон автоматически вычислит объект. Если он снимает движение, мобильный телефон автоматически уменьшит выдержку, чтобы свет казался размытым, а изображение получилось более плавным.

По сравнению с iPhone 11 новое поколение iPhone имеет видимые изменения в Deep Fusion, HDR-видео и так далее. Все это благодаря мощной вычислительной мощности AI A14.

Чего нам ждать от NPU?

Хотя мобильный NPU рекламировался производителями только в последние два-три года, на самом деле концепция, связанная с ним, появилась в 2013 году.

В то время Qualcomm надеялась сократить разрыв между обычными машинными операциями и человеческим мозгом с помощью вычислительной структуры, имитирующей человеческий мозг. Этот тип вычислительного процессора, имитирующего нейроны, Qualcomm назвал "Zeroth".

▲ Знакомство Qualcomm с Zeroth

Вычислительная структура чипа Qualcomm Zeroth имитирует режим работы биологических нервных клеток человека и имитируется на структурном уровне мозга. NPU имитируется на уровне функции мозга, и их направления не совпадают. И Qualcomm всегда настаивала на своем собственном направлении, не присоединяясь к армии независимых NPU, а настаивая на направлении движка искусственного интеллекта AI Engine.

Согласно отчетам "Xinzhixun", когда был выпущен Qualcomm Snapdragon 845, некоторые посторонние голоса раскритиковали Qualcomm за то, что она не следует тенденции NPU, так что она отстает в возможностях AI. Алекс Катузян, старший вице-президент и генеральный менеджер Qualcomm по мобильному бизнесу, ответил, что, хотя Qualcomm не имеет независимого модуля нейронной сети, она использует более гибкую архитектуру машинного обучения (AI Engine) и оптимизирует ядро ​​в общей платформе. Каждый блок, такой как CPU, GPU, DSP и т. Д., Может обеспечивать гибкий вызов различных блоков обработки для разных мобильных терминалов.

Вы можете понять это так: направление NPU – четкое разделение труда, и степень интенсивности каждого модуля относительно высока, а направление Qualcomm AI Engine – «работать вместе со всеми».

До выпуска чипа серии Snapdragon 865 с многоядерным движком искусственного интеллекта пятого поколения AI Engine у ​​Qualcomm все еще не было возможности войти в NPU.

▲ Qualcomm подчеркнула возможности AI в нижнем левом углу изображения.

Однако на практике обучаемость Qualcomm Snapdragon 865 по-прежнему заслуживает признания. Например, когда я использовал vivo X50 Pro + с Qualcomm Snapdragon 865+ почти полмесяца, он разблокировался примерно десять раз в день, и теперь он может успешно идентифицировать меня в маске.

Однако, с точки зрения данных, его способность к обучению искусственному интеллекту сильно уступает бионике Kirin 9000 и A14. NPU снова и снова использует данные, чтобы доказывать свою силу искусственного интеллекта.Сможет ли AI Engine следующего поколения Qualcomm переломить ситуацию, нам все еще нужно дождаться появления чипов серии 875, чтобы узнать.

В эпоху искусственного интеллекта я надеюсь увидеть, что мобильные телефоны больше не терминалы, которые пассивно реагируют на потребности пользователей, а умные терминалы, которые могут активно анализировать и воспринимать текущие потребности пользователей и заранее предоставлять соответствующие услуги.

▲ Демонстрация возможностей искусственного интеллекта серии Mate40

В этом плане все производители пока находятся в зачаточном состоянии. Например, с точки зрения предложений по применению, я считаю, что лучшим является Xiaomi. Анализируя такие факторы, как время и сцена, он может «угадывать» программное обеспечение, которое я хочу открывать каждый раз, и разумно сортировать его в наиболее заметном месте. «Умный платеж», поддерживаемый серией Mate40, несомненно, находится на переднем крае пути искусственного интеллекта, а также дает нам больше простора для воображения.

Стоит отметить, что, помимо мобильных телефонов, NPU также постепенно применяется к мобильным терминалам, таким как планшеты и ноутбуки. Недавно выпущенный Apple чип M1 имеет 16-ядерный NPU, который может выполнять 11 триллионов операций в секунду, увеличивая скорость машинного обучения до 11 раз, что трудно сопоставить и сравнить с традиционными ПК.

И какие изменения в пользовательском опыте принесут серии MacBook и Mac mini, оснащенные чипом M1, я думаю, это ожидаемо.

В нынешней программной экосистеме улучшение мобильных ЦП и ГП недостаточно велико для повседневного использования пользователями. Например, по сравнению с iPhone XS и iPhone 12 скорость работы приложений практически одинакова. Что больше влияет на взаимодействие с пользователем, так это изменение возможностей машинного обучения. Поэтому стоит обратить внимание на развитие NPU.

Возможно, через десять лет, когда развитие технологий искусственного интеллекта станет более зрелым, «умным» телефонам пора переименовать в «умные».

Рассказывайте простые и легкие для чтения истории. Рабочий адрес электронной почты: [email protected]

# Добро пожаловать в официальный аккаунт Aifaner в WeChat: Aifaner (идентификатор WeChat: ifanr), более интересный контент будет предоставлен вам как можно скорее.

Ai Faner | Исходная ссылка · Посмотреть комментарии · Sina Weibo