Шумопоглощающие наушники с искусственным интеллектом позволяют сосредоточиться только на одном голосе
Прототип наушников с шумопоглощением позволяет выбрать, какие фоновые шумы заглушить, позволяя привлечь аудиопрожектор к определенному голосу, чтобы вы могли сосредоточиться на нем.
Обычные наушники с системой шумопоглощения уменьшают нежелательные звуки, такие как грохот двигателя автобуса, но поскольку технология полностью отменяет определенные частоты, она также может удручать звуки, которые мы хотим услышать.
Теперь Шям Холакота из Университета Вашингтона в Сиэтле и его коллеги создали наушники, которые могут устранять любые нежелательные шумы, оставляя другие без изменений, независимо от их звуковой частоты. Его можно научить нажатием кнопки, чтобы определить голос конкретного человека и исключить все остальные шумы.
Исследователи представили свой прототип на совместной встрече Акустического общества Америки и Канадской акустической ассоциации. Устройство использует систему искусственного интеллекта, которая была обучена на многих примерах 20 различных типов звуков, включая будильники, плач младенцев и пение птиц. Пользователь может включить или отключить каждую категорию звука из приложения, позволяя проходить через наушники или быть заблокированным.
Прототип состоит из коммерчески доступных наушников с микрофоном, прикрепленным с внешней стороны закрывающего каждое ухо корпуса. Эти микрофоны записывают окружающий звук и передают его либо на небольшой микроконтроллер Orange Pi, либо на смартфон, на котором работает нейронная сеть. Затем этот ИИ удаляет ненужные звуки и передает отредактированный аудиопоток в наушники. Холакота говорит, что это оборудование может быть встроено в комплект наушников.
Технология работает так же, как искусственный интеллект, который использовался для выделения отдельных инструментов и голосов среди шумных беспорядков, записанных во время работы над альбомом The Beatles 1970 Let It Be , что позволило режиссеру Питеру Джексону создать документальный сериал The Beatles: Get Back .
Этот процесс занял некоторое время, но этот прототип может обрабатывать аудио всего за 8 миллисекунд, поскольку команда сохранила нейронную сеть достаточно малой и простой для быстрой работы мобильного устройства, чтобы избежать задержек между происходящими событиями и тем, что вы их слышите.
Холакота говорит, что эффект похож на «аудиопрожектор», который обращается на источник шума, что позволяет сосредоточиться на нем даже в хаотической и громкой среде.
«Это есть новые возможности, которые дают пользователю больше контроля. Прямо сейчас мы делаем первые шаги по улучшению звукового восприятия человека», — говорит Холакота.
Зарегистрируйтесь, чтобы оставлять комментарии
Вход
Заходите через социальные сети
FacebookTwitter