Эта технология искусственного интеллекта способна понимать слова, которые даже не произносятся вслух.

Исследователи из Пхоханского университета науки и технологий (POSTECH) разработали революционную носимую технологию , способную преобразовывать непроизносимую речь в слышимый голос, считывая едва заметные движения мышц шеи. Исследование, проведенное профессором Сун-Мин Паком и доктором Сунгук Хонгом, было опубликовано в журнале Cyborg and Bionic Systems и стало значительным шагом вперед в области взаимодействия человека и машины.

От движений мышц к устной речи

В основе инновации лежит простая, но мощная идея: речь — это не просто звук. Когда человек говорит — или даже пытается говорить про себя — в мышцах и коже вокруг шеи происходят мельчайшие движения. Эти движения формируют своего рода «невидимую карту» предполагаемой речи.

Для регистрации этих изменений исследователи создали носимое устройство, называемое многоосевым датчиком деформационного картирования. Система сочетает в себе миниатюрную камеру и гибкий силикон со встроенными эталонными маркерами, что позволяет обнаруживать даже самые незначительные деформации кожи. Разработанный для ежедневного использования, датчик удобно носить на шее, и он автоматически перекалибровывается при изменении положения.

Собранные данные затем обрабатываются с помощью искусственного интеллекта, который интерпретирует паттерны напряжения и восстанавливает нужные слова или предложения. В сочетании с синтезатором голоса, обученным на голосовом профиле пользователя, система может генерировать речь, которая максимально приближена к естественному голосу человека – даже когда звук не произносится.

Практический прорыв по сравнению с существующими системами.

Традиционные методы восстановления голоса основаны на таких технологиях, как электромиография (ЭМГ) или электроэнцефалография (ЭЭГ), которые часто требуют громоздкого оборудования и могут быть неудобны при длительном использовании.

Подход команды POSTECH устраняет эти барьеры, предлагая легкую, носимую альтернативу. В ходе тестирования система продемонстрировала высокую точность восстановления речи даже в шумных условиях, таких как промышленные предприятия, где обычные микрофоны испытывают трудности.

Влияние на реальный мир и будущий потенциал

Последствия применения этой технологии имеют далеко идущие последствия. Она может открыть новый канал связи для пациентов, потерявших голос в результате повреждения голосовых связок или операции на гортани, позволяя им снова «говорить», используя свой собственный голосовой профиль.

Помимо здравоохранения, система может обеспечить бесшумное общение в условиях, где говорить вслух нецелесообразно, например, в библиотеках, на совещаниях или в шумных рабочих местах. Она также открывает двери для более естественных интерфейсов взаимодействия человека и ИИ , где намерение может быть преобразовано в речь без физического воздействия.

Взгляд в будущее

Цель исследователей — усовершенствовать технологию для более широкого применения в реальных условиях, повысив точность и расширив языковые возможности. В будущих версиях она может более органично интегрироваться с потребительскими устройствами, потенциально изменив способы общения людей как в личной, так и в профессиональной среде.

По мере того как искусственный интеллект продолжает интегрироваться с носимыми технологиями , подобные инновации сигнализируют о сдвиге в сторону более интуитивных, ненавязчивых форм взаимодействия, где даже невысказанные слова наконец-то могут быть услышаны.