[go: up one dir, main page]

RU2716556C1 - Способ приема речевых сигналов - Google Patents

Способ приема речевых сигналов Download PDF

Info

Publication number
RU2716556C1
RU2716556C1 RU2018145167A RU2018145167A RU2716556C1 RU 2716556 C1 RU2716556 C1 RU 2716556C1 RU 2018145167 A RU2018145167 A RU 2018145167A RU 2018145167 A RU2018145167 A RU 2018145167A RU 2716556 C1 RU2716556 C1 RU 2716556C1
Authority
RU
Russia
Prior art keywords
robot
working
microphone
sound
signals
Prior art date
Application number
RU2018145167A
Other languages
English (en)
Inventor
Артем Олегович Янгуразов
Дмитрий Иосифович Дубровских
Игорь Михайлович Еремеев
Original Assignee
Общество с ограниченной ответственностью "ПРОМОБОТ"
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Общество с ограниченной ответственностью "ПРОМОБОТ" filed Critical Общество с ограниченной ответственностью "ПРОМОБОТ"
Priority to RU2018145167A priority Critical patent/RU2716556C1/ru
Priority to PCT/RU2019/000317 priority patent/WO2020130872A1/ru
Application granted granted Critical
Publication of RU2716556C1 publication Critical patent/RU2716556C1/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/22Interactive procedures; Man-machine interfaces
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R29/00Monitoring arrangements; Testing arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Otolaryngology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

Изобретение относится к области обработки и преобразования акустических сигналов в электрические в роботе. Техническим результатом является снижение помех и уменьшение уровня звукового сигнала от громкоговорителей робота. Технический результат заявляемого технического решения достигается тем, что проводят калибровку рабочих микрофонов робота в два этапа, на первом этапе подают импульсный звуковой сигнал, который транслируют динамиками робота и принимают рабочими микрофонами, определяют временную задержку прохождения импульсного звукового сигнала, передают полученные значения временных задержек в память управляющего устройства, на втором этапе калибровки подают звуковой сигнал последовательно в разных диапазонах частот, транслируют его динамиками робота, определяют величину уровня звука на каждой частоте для каждого рабочего микрофона, вычисляют коэффициент затухания звукового сигнала для каждого рабочего микрофона, передают полученные значения коэффициентов затухания в память управляющего устройства, после чего звуковые сигналы робота задерживают в буфере, величину внешнего речевого сигнала каждого рабочего микрофона корректируют путем вычитания значения временной задержки. 3 ил.

Description

Изобретение относится к области обработки звука, а именно к обработке и преобразованию акустических сигналов в электрические в роботе. Позволяет выделять источники звука и определять направление их расположения, а также позволяет минимизировать помехи от внешних динамиков.
Известно изобретение по патенту США US 2003139851 «Акустическое устройство и акустическая система робота» G10L 21/02, 2003. Изобретение представляет собой роботизированный слуховой аппарат и систему, которые сделаны для достижения активного восприятия при сборе звука от внешнего источника звука без влияния, получаемого от шумов, создаваемых внутри робота, таких как излучаемые из элементов движения робота. Устройство и система предназначены для робота, имеющего источник генерации шума в своей внутренней части, и включают в себя: звукоизолирующую оболочку, которой покрыта часть робота; внешние микрофоны, расположенные вне оболочки для сбора внешнего звука в первую очередь; внутренний микрофон, расположенный внутри оболочки для первичного сбора шумов от источника генерации шума во внутренней части робота; секцию обработки, реагирующую на сигналы от внешнего и внутреннего микрофонов для отделения звуковых сигналов принимаемых внешними микрофонами от сигналов шумов от источника генерации внутреннего шума и затем выдача левого и правого звукового сигнала; секцию выделения направленной информации, реагирующую на левый и правый звуковые сигналы от обрабатывающей секции для определения направления, из которого испускается внешний звук. Блок обработки выполнен с возможностью обнаружения всплесков из-за источника генерации шума из сигнала внутреннего микрофона для удаления участков сигнала из звуковых сигналов для полос, содержащих всплески. Недостатком является невозможность минимизировать помехи от внешних динамиков.
Наиболее близким аналогом заявляемого изобретения является изобретение по патенту Китая CN 105825862 «Система эхоподавления в диалоге человек-машина» G10L 21/02, 2016. Система эхоподавления в диалоге человек-робот, содержащая: основной модуль управления, модуль эхоподавления, модуль деления голосового напряжения, микрофон и динамик, второй модуль деления голосового напряжения, сконфигурированный для установки отношения деления напряжения потенциометра и эхо-сигнала. Интенсивность передается модулю эхоподавления; динамик используется для воспроизведения тестового звука, испускаемого роботом; микрофон используется для сбора звукового сигнала; модуль эхоподавления подключается к модулю разделения голосового давления для устранения эхо-сигнала; основной модуль управления используется для регулировки коэффициента делителя напряжения потенциометра для управления процессом устранения эха. Недостатком является сложность снижения помех, так как перед каждым диалогом необходимо настраивать/регулировать коэффициент делителя напряжения потенциометра в ручном режиме.
Техническим результатом заявляемого изобретения является снижение помех и уменьшение уровня звукового сигнала от громкоговорителей робота.
Технический результат достигается за счет того, что в способе приема речевых сигналов, включающем прием микрофонами робота внешних речевых сигналов и звуковых сигналов робота, корректировку величин внешних речевых сигналов с учетом величин звуковых сигналов робота, передачу полученных значений речевых сигналов на управляющее устройство, согласно изобретению, внешние речевые сигналы принимают рабочими микрофонами робота, а звуковые сигналы робота принимают калибровочными микрофонами, проводят калибровку рабочих микрофонов робота в два этапа, на первом этапе подают импульсный звуковой сигнал, который транслируют динамиками робота и принимают рабочими микрофонами, определяют временную задержку прохождения импульсного звукового сигнала от каждого динамика робота до каждого рабочего микрофона, передают полученные значения временных задержек в память управляющего устройства, на втором этапе калибровки подают звуковой сигнал последовательно в разных диапазонах частот, транслируют его динамиками робота, определяют величину уровня звука на каждой частоте для каждого рабочего микрофона, вычисляют коэффициент затухания звукового сигнала для каждого рабочего микрофона как отношение принятого уровня сигнала каждого рабочего микрофона к уровню сигнала калибровочного микрофона, передают полученные значения коэффициентов затухания в память управляющего устройства, далее в рабочем режиме при одновременном приеме звуковых сигналов робота и приеме внешних речевых сигналов, звуковые сигналы робота задерживают в буфере, величину внешнего речевого сигнала каждого рабочего микрофона корректируют путем вычитания значения временной задержки, определенной на первом этапе калибровки, с учетом коэффициента затухания, определенного на втором этапе калибровки, полученные значения речевых сигналов передают на управляющее устройство».
Технический результат обеспечивается за счет того, что работа микрофонного массива совмещена с алгоритмом подавления местного эффекта - АЕС. Сигнал от динамиков робота, принимаемый двумя калибровочными микрофонами, расположенными близко от динамиков робота, задерживается в буфере и вычитается из входного сигнала каждого микрофонного массива в соответствии с временной задержкой, измеренной на первом этапе калибровки и с учетом коэффициента затухания, определенного на втором этапе калибровки. Калибровка происходит единожды при включении питания. Вырабатываются сигналы, которые транслируются через динамики робота. Эти сигналы позволяют определить временные задержки с помощью импульсного сигнала и частотные коэффициенты затухания для правильной работы алгоритмов. После калибровки массив работает автоматически. Встроенный алгоритм АЕС позволяет минимизировать помехи от внешних динамиков робота.
На фигуре 1 изображена структурная схема комплекса микрофонного массива.
На фигуре 2 представлен вид спереди печатной платы MCU.
На фигуре 3 представлен вид спереди печатной платы рабочего микрофона и калибровочного микрофона АЕС.
Комплекс микрофонного массива состоит из платы MCU 1, восьми плат рабочих микрофонов 2, двух плат калибровочных микрофонов АЕС 2.1, встроенного программного обеспечения. Плата калибровочного микрофона 2.1 отличается от платы рабочего микрофона 2 заниженным коэффициентом усиления. Плата MCU 1 включает в себя микроконтроллер 3. В микроконтроллере используются десять каналов 4 для оцифровки звука, стэк USB 5 для передачи данных в персональный компьютер PC 6 или другое управляющее устройство. Питание платы осуществляется от USB шины. Плата рабочего микрофона 2 содержит рабочий микрофон 7, который является аналоговым и выполнен по Mems технологии, дифференциальный микрофонный усилитель 8 и буферный выходной усилитель 9. Плата калибровочного микрофона 2.1 содержит калибровочный микрофон 11. Для трансляции звукового сигнала используют динамики робота 10. Уровень выходного сигнала при номинальном звуковом давлении ~500 мВ. Питание микрофонов 7 и 11 (3.3 вольта) осуществляется от платы MCU 1. Встроенное программное обеспечение обеспечивает поддержку USB стэка 5, обработку оцифрованных аудиоданных и реализацию алгоритма подавления местного эффекта АЕС. Платы микрофонов расположены на роботе в соответствии с заданной в HARK конфигурацией. Точность расположения микрофонов - 5 мм. Со стороны персонального компьютера PC 6, устройство определяется, как стандартный акустический массив. Дополнительные драйверы для работы устройств не нужны.
В способе приема речевых сигналов в качестве микроконтроллера 3 используют микроконтроллер STM32H7. В качестве каналов для оцифровки звука используются 10 каналов ADC 16 бит.
Способ приема речевых сигналов осуществляют следующим образом. Сначала, с помощью платы MCU 1 вырабатывают кратковременный импульсный сигнал. Этот сигнал усиливают и транслируют через динамики робота 10. Рабочие микрофоны 7 принимают этот сигнал с разной временной задержкой, определяемой конкретным положением каждого рабочего микрофона 7 относительно каждого динамика 10. Данные временных задержек записывают в память MCU 1, которая является внутренней памятью чипа stm32H7, и потом используют совместно с буфером задержек, являющимся частью внутренней памяти чипа, для вычитания сигнала от динамика 10 из всех принятых звуковых сигналов. Вторым этапом производят калибровку уровня звука в четырех частотных диапазонах: 250 Гц, 500 Гц, 1000 Гц, 2000 Гц. С помощью платы MCU 1 вырабатывают последовательно набор четырех частот, через динамики робота 10 транслируют их, затем каждым рабочим микрофоном 7 измеряют уровень звука на каждой частоте и с помощью платы MCU 1 сохраняют значения в памяти управляющего устройства. При втором включении этого же калибровочного сигнала измеренные уровни звука используют для проверки работы компенсатора местного эффекта и вычисляют коэффициенты затухания сигнала для каждого рабочего микрофона 7, как отношение принятого уровня сигнала каждого рабочего микрофона к уровню сигнала калибровочного микрофона. После калибровки система работает автоматически, принимая акустические сигналы с восьми рабочих микрофонов 7 и пересылая данные в персональный компьютер PC 6 через USB порт. После того как определены временные задержки и частотные коэффициенты затухания система готова к работе. Звуковой сигнал от динамиков робота 10, принимают двумя калибровочными микрофонами 11, расположенными близко от динамиков робота 10, задерживают в буфере и вычитают из входного сигнала каждого рабочего микрофона 7 в соответствии с временной задержкой, измеренной на первом этапе калибровке и с учетом коэффициента затухания, определенного на втором этапе калибровки. Основная задача способа приема речевых сигналов - уменьшить уровень звукового сигнала от динамиков робота 10. В способе приема речевых сигналов человек может задавать вопросы роботу, прерывая его речь. Это приводит к комфортному общению человек-робот.
Таким образом, предлагаемый способ приема речевых сигналов позволяет снизить помехи и уменьшить уровень звукового сигнала от внешних динамиков робота.

Claims (1)

  1. Способ приема речевых сигналов, включающий прием микрофонами робота внешних речевых сигналов и звуковых сигналов робота, корректировку величин внешних речевых сигналов с учетом величин звуковых сигналов робота, передачу полученных значений речевых сигналов на управляющее устройство, отличающийся тем, что внешние речевые сигналы принимают рабочими микрофонами робота, а звуковые сигналы робота принимают калибровочными микрофонами, проводят калибровку рабочих микрофонов робота в два этапа, на первом этапе подают импульсный звуковой сигнал, который транслируют динамиками робота и принимают рабочими микрофонами, определяют временную задержку прохождения импульсного звукового сигнала от каждого динамика робота до каждого рабочего микрофона, передают полученные значения временных задержек в память управляющего устройства, на втором этапе калибровки подают звуковой сигнал последовательно в разных диапазонах частот, транслируют его динамиками робота, определяют величину уровня звука на каждой частоте для каждого рабочего микрофона, вычисляют коэффициент затухания звукового сигнала для каждого рабочего микрофона как отношение принятого уровня сигнала каждого рабочего микрофона к уровню сигнала калибровочного микрофона, передают полученные значения коэффициентов затухания в память управляющего устройства, далее в рабочем режиме при одновременном приеме звуковых сигналов робота и приеме внешних речевых сигналов, звуковые сигналы робота задерживают в буфере, величину внешнего речевого сигнала каждого рабочего микрофона корректируют путем вычитания значения временной задержки, определенной на первом этапе калибровки, с учетом коэффициента затухания, определенного на втором этапе калибровки, полученные значения речевых сигналов передают на управляющее устройство.
RU2018145167A 2018-12-19 2018-12-19 Способ приема речевых сигналов RU2716556C1 (ru)

Priority Applications (2)

Application Number Priority Date Filing Date Title
RU2018145167A RU2716556C1 (ru) 2018-12-19 2018-12-19 Способ приема речевых сигналов
PCT/RU2019/000317 WO2020130872A1 (ru) 2018-12-19 2019-05-07 Способ приема речевых сигналов

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
RU2018145167A RU2716556C1 (ru) 2018-12-19 2018-12-19 Способ приема речевых сигналов

Publications (1)

Publication Number Publication Date
RU2716556C1 true RU2716556C1 (ru) 2020-03-12

Family

ID=69898217

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2018145167A RU2716556C1 (ru) 2018-12-19 2018-12-19 Способ приема речевых сигналов

Country Status (2)

Country Link
RU (1) RU2716556C1 (ru)
WO (1) WO2020130872A1 (ru)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003061344A2 (en) * 2002-01-17 2003-07-24 Koninklijke Philips Electronics N.V. Multichannel echo canceller system using active audio matrix coefficients
US7346175B2 (en) * 2001-09-12 2008-03-18 Bitwave Private Limited System and apparatus for speech communication and speech recognition
US20100174546A1 (en) * 2009-01-06 2010-07-08 Samsung Electronics Co., Ltd. Sound recognition apparatus of robot and method for controlling the same
RU2456701C2 (ru) * 2008-03-18 2012-07-20 Квэлкомм Инкорпорейтед Повышение разборчивости речи с использованием нескольких микрофонов на нескольких устройствах
RU2616345C2 (ru) * 2010-03-31 2017-04-14 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ акустических измерений множества громкоговорителей и системы направленных микрофонов

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7346175B2 (en) * 2001-09-12 2008-03-18 Bitwave Private Limited System and apparatus for speech communication and speech recognition
WO2003061344A2 (en) * 2002-01-17 2003-07-24 Koninklijke Philips Electronics N.V. Multichannel echo canceller system using active audio matrix coefficients
RU2456701C2 (ru) * 2008-03-18 2012-07-20 Квэлкомм Инкорпорейтед Повышение разборчивости речи с использованием нескольких микрофонов на нескольких устройствах
US20100174546A1 (en) * 2009-01-06 2010-07-08 Samsung Electronics Co., Ltd. Sound recognition apparatus of robot and method for controlling the same
RU2616345C2 (ru) * 2010-03-31 2017-04-14 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство и способ акустических измерений множества громкоговорителей и системы направленных микрофонов

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ГОСТ 31295.1-2005, 05.05.2017. *

Also Published As

Publication number Publication date
WO2020130872A1 (ru) 2020-06-25

Similar Documents

Publication Publication Date Title
US10097921B2 (en) Methods circuits devices systems and associated computer executable code for acquiring acoustic signals
US6888949B1 (en) Hearing aid with adaptive noise canceller
US6658122B1 (en) Method for in-situ measuring and in-situ correcting or adjusting a signal process in a hearing aid with a reference signal processor
JP6450458B2 (ja) 自身の声を迅速に検出する方法と装置
CA2672443A1 (en) Near-field vector signal enhancement
US10341760B2 (en) Electronic ear protection devices
JP3353701B2 (ja) 自己発話検出装置、音声入力装置および補聴器
JP5903921B2 (ja) ノイズ低減装置、音声入力装置、無線通信装置、ノイズ低減方法、およびノイズ低減プログラム
JP4544993B2 (ja) 単一チャンネルまたは多重チャンネル型の通信システム用エコー処理装置
KR102473131B1 (ko) 노이즈 감쇠 기능 및 공간 효과 구현 기능을 제공하는 음향 처리 시스템
US9986334B2 (en) Bone-conduction sound transmission device and method
EP2916320A1 (en) Multi-microphone method for estimation of target and noise spectral variances
US11373669B2 (en) Acoustic processing method and acoustic device
US7424119B2 (en) Voice matching system for audio transducers
RU2716556C1 (ru) Способ приема речевых сигналов
CN113038322B (zh) 一种以听觉增强环境感知的方法与装置
EP1511358A2 (en) Automatic sound field correction apparatus and computer program therefor
KR20150107699A (ko) 잔향음을 이용하여 공간을 인지하고 고유의 엔빌로프를 비교하여 음향을 보정하는 장치 및 방법
US12219325B2 (en) Method for localizing a sound source for a binaural hearing system
CN117939378A (zh) 一种助听器及自回声消除方法、设备、存储介质
US10595136B2 (en) Method for operating a hearing device and hearing device system
US20190306618A1 (en) Methods circuits devices systems and associated computer executable code for acquiring acoustic signals
EP4531036A1 (en) Active noise cancellation in an ear-wearable device using a vibration sensor
CN114979734B (zh) 一种语音控制遥控器及其降噪方法和电视机
EP4124060B1 (en) Hearing instrument

Legal Events

Date Code Title Description
PD4A Correction of name of patent owner