[go: up one dir, main page]

DE102005039621A1 - Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System - Google Patents

Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System Download PDF

Info

Publication number
DE102005039621A1
DE102005039621A1 DE102005039621A DE102005039621A DE102005039621A1 DE 102005039621 A1 DE102005039621 A1 DE 102005039621A1 DE 102005039621 A DE102005039621 A DE 102005039621A DE 102005039621 A DE102005039621 A DE 102005039621A DE 102005039621 A1 DE102005039621 A1 DE 102005039621A1
Authority
DE
Germany
Prior art keywords
prediction
filter
coefficients
input signal
filtering
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE102005039621A
Other languages
English (en)
Inventor
Jörn Fischer
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Entropic Communications LLC
Original Assignee
TDK Micronas GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TDK Micronas GmbH filed Critical TDK Micronas GmbH
Priority to DE102005039621A priority Critical patent/DE102005039621A1/de
Priority to EP06014433A priority patent/EP1755110A3/de
Priority to US11/507,369 priority patent/US7822602B2/en
Publication of DE102005039621A1 publication Critical patent/DE102005039621A1/de
Priority to US12/895,817 priority patent/US8352256B2/en
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

Die Erfindung bezieht sich auf eine Vorrichtung bzw. auf ein Verfahren zur Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System, bei dem DOLLAR A - ein Audio-Eingangssignal (s(t)) gefiltert wird mittels einer Filterung unter Einsatz eines adaptiven Filters zum Erzeugen eines Vorhersage-Ausgangssignals (sv(t)) mit reduziertem Rauschen, wobei das Filtern durchgeführt wird unter Einsatz einer Vielzahl von Koeffizienten (c¶i¶(t); c1-c4) zur Bildung einer Vielzahl von Vorhersagefehlern (sv1-sv4) und zur Bildung eines Fehlers (e) aus der Vielzahl von Vorhersagefehlern (sc1-sv4), DOLLAR A - wobei mittels einer Vielzahl von Reduktionsparametern (k) die Beträge der Koeffizienten (c¶i¶(t); c1-c4) kontinuierlich reduziert werden. Nachgeschaltet wird dieser ersten Filterung vorzugsweise eine zweite Filterung mit einer um mehrere Zehner-Potenzen geringeren Lernrate für die Koeffizienten der zweiten Filterung gegenüber einer Lernrate für die Koeffizienten der ersten Filterung.

Description

  • Die Erfindung bezieht sich auf ein Verfahren zur Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System mit den oberbegrifflichen Merkmalen des Patentanspruchs 1 bzw. auf eine Vorrichtung zum Durchführen eines solchen Verfahrens mit den oberbegrifflichen Merkmalen des Patentanspruchs 18.
  • In sprachverarbeitenden Systemen, wie z.B. Systemen zur Spracherkennung, Sprachdetektion oder Sprachkomprimierung, mindern Störungen wie Rauschen und nicht zur Sprache gehörende Hintergrundgeräusche die Qualität der Sprachverarbeitung z.B. hinsichtlich der Erkennung oder Kompression der in einem Eingangssignal enthaltenen Sprach- bzw. Sprachsignalanteile. Diese störenden Hintergrundsignale sollen mit möglichst wenig Rechenaufwand eliminiert werden.
  • Zur Reduktion von Rausch- und Hintergrundsignalen in sprachverarbeitenden Systemen werden Filtervorrichtungen eingesetzt welche mittels mindestens eines Audioeingangs, eines Audioausgangs, eines Speichers und eines Prozessors oder eines feldprogrammierbaren Bausteins oder eines ASIC (Application-Specified-Integrated-Circuit/Anwendungs-spezifische integrierte Schaltung) ein Filterverfahren ausführen.
  • Mittels eines aufwändigen Verfahrens unter Einsatz einer spektralen Subtraktion wird in EP 1080465 und in US 6,820,053 zur Reduktion von Rausch- und Hintergrundsignalen ein Spektrum eines Audiosignals mit Hilfe der Fourier-Transformation berechnet und z. B. ein langsam ansteigender Anteil abgezogen. Durch Rücktransformation in den Zeitbereich wird nachfolgend ein rauschreduziertes Ausgangssignal erhalten. Der Rechenauf wand ist bei diesem Verfahren ist nachteilhaft hoch. Außerdem ist der Speicherplatzverbrauch sehr hoch. Außerdem lassen sich bei der spektralen Subtraktion die verwendeten Parameter zum Teil sehr schlecht an andere Sampleraten anpassen.
  • Zur Reduktion von Rausch- und Hintergrundsignalen gibt es weitere Verfahren, wie das center clipping (zentrales Klipping), bei dem eine Autokorrelation des Signals gebildet und als Information des Rauschgehalts des Eingangssignals benutzt wird, Verfahren, die gemäß US 5,583,968 oder US 6,820,053 mit neuronalen Netzen arbeiten, welche aufwändig trainiert werden müssen oder Verfahren, gemäß z.B. US 5,500,903 die mit mehreren Mikrofonen arbeiten, um Rauschen und Sprachsignale zu trennen. Mindestens aber wird eine Abschätzung der Rauschamplituden durchgeführt. Der Rechenaufwand einer Fouriertransformation (FFT) ist O(nlog(n)), der einer Autokorrelation O(n2), der des hier vorgestellten gesamten Verfahrens liegt bei O(n).
  • Allgemein bekannt ist dabei der Einsatz eines FIR-Filters (FIR: Finite Impulse Response/Finite Impulsantwort), das darauf trainiert ist, das Eingangssignal aus z.B. Sprache und Rauschen möglichst gut aus den vergangenen n Werten vorherzusagen, wobei dies unter Einsatz einer LPC (Linear Predictive Coding/lineare Vorhersage-Kodierung) durchgeführt wird. Die Ausgabewerte des Filters sind diese vorhergesagten Werte. Die Beträge von Koeffizienten c(i) eines solchen Filters steigen bei Rauschsignalen im Mittel langsamer als bei Sprachsignalen, wobei die Koeffizienten berechnet werden gemäß ci(t + 1) = ci(t) + μ·e·s(t – i) (1)mit μ ≪ 1, z.B. μ = 0,01 als einer Lernrate, s(t) als einem Audio-Eingangssignal zur Zeit t, e = s(t) – sv(t) als einem Fehler aus einer Differenz aller einzelner Vorhersagefehler vom Audio-Eingangssignal, sv(t) als Ausgangssignal aus einer Summe der Terme ci(t – 1)·s(t – i), d.h. der einzelnen Vorhersagefehler über alle i von 1 bis N, N als Anzahl der Koeffizienten und ci(t) als einem individuellen Koeffizienten mit einem Parameter i zur Zeit t.
  • Die Aufgabe der Erfindung besteht darin, ein Verfahren zur Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System bzw. eine Vorrichtung zum Durchführen eines solchen Verfahrens hinsichtlich der Anwendbarkeit zu verbessern, insbesondere flexibler einsetzbar zu machen.
  • Diese Aufgabe wird durch ein Verfahren zur Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System mit den Merkmalen des Patentanspruchs 1 bzw. auf eine Vorrichtung zum Durchführen eines solchen Verfahrens mit den Merkmalen des Patentanspruchs 18 gelöst. Vorteilhafte Ausgestaltungen sind Gegenstand von abhängigen Ansprüchen.
  • Bevorzugt wird demgemäss ein Verfahren zur Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System, bei dem ein Audio-Eingangssignal gefiltert wird mittels einer Filterung unter Einsatz eines adaptiven Filters zum Erzeugen eines Vorhersage-Ausgangssignals mit reduziertem Rauschen, wobei das Filtern durchgeführt wird unter Einsatz einer Vielzahl von Koeffizienten zur Bildung einer Vielzahl von Vorhersagefehlern und zur Bildung eines Fehlers aus der Vielzahl von Vorhersagefehlern, wobei mittels einer Vielzahl von Reduktionsparametern die Beträge der Koeffizienten kontinuierlich reduziert werden.
  • Bevorzugt wird insbesondere ein Verfahren, bei dem die kontinuierliche Reduktion der Koeffizienten dadurch erzeugt wird, dass die Koeffizienten mit einem Faktor kleiner 1 multipliziert werden, insbesondere mit einem Faktor zwischen 0,8 und 1,0 multipliziert werden.
  • Bevorzugt wird insbesondere ein Verfahren, bei dem die Koeffizienten ci(t) berechnet werden gemäß ci(t + 1) = ci(t) + μ·e·s(t – i) – kci(t)mit
    • – k mit 0 > k ≪ 1, insbesondere k ⇐ 0,0001, als einem Reduktionsparameter,
    • – μ ≪ 1, insbesondere μ ⇐ 0,01, als einer Lernrate,
    • – s(t) als einem Audio-Eingangssignal zu einer Zeit t,
    • – e als einem Fehler aus einer Differenz aller einzelner Vorhersagefehler (sv1 – sv4) vom Audio-Eingangssignal s(t),
    • – sv(t) als dem Vorhersage-Ausgangssignal aus einer Summe aller einzelnen Vorhersagefehler, mit N als Anzahl der Koeffizienten ci(t) und
    • – ci(t) als individuellem Koeffizient mit einem Index i zur Zeit t.
  • Bevorzugt wird insbesondere ein solches Verfahren, bei dem die Koeffizienten berechnet werden gemäß ci(t + 1) = ci(t) + μ·e·s(t – i) – kci(t)mit e = S(t) – sv(t) und sv(t) = Σi=1...Nci(t – 1)·s(t – i).
  • Bevorzugt wird insbesondere ein Verfahren, bei dem das Vorhersage-Ausgangssignal als eine Vorhersage des Audio-Eingangssignals mit reduziertem Rauschen als Eingangssignal für eine nachfolgende zweite Filterung verwendet wird zum Erzeugen einer zweiten Vorhersage. Bevorzugt wird insbesondere ein solches Verfahren, bei dem die zweite Filterung mittels einer Vorhersagefilterung mit einer zweiten, insbesondere für sich bekannten Filterung mit einem Satz von zweiten Koeffizienten durchgeführt wird, wobei eine Lernrate zum Anpassen der Koeffizienten um einige Zehnerpotenzen kleiner gewählt wird als eine Lernrate der ersten Filterung.
  • Bevorzugt wird insbesondere ein Verfahren, bei dem die zweite Vorhersage dann vom Vorhersage-Ausgangssignal abgezogen wird, um lang anhaltende Hintergrundgeräusche zu eliminieren.
  • Bevorzugt wird insbesondere ein Verfahren, bei dem eine Lernregel zum Bestimmen der weiteren Koeffizienten unsymmetrisch gestaltet wird, so dass der Betrag der weiteren Koeffizienten im Betrag stärker fallen als steigen und schnell auf Null absinken kann aber nur mit kleiner Steigung ansteigt.
  • Bevorzugt wird insbesondere ein Verfahren, bei dem statt des Audio-Eingangssignals zum Bestimmen individueller Vorhersagefahler nur dessen Vorzeichen benutzt wird, um kleine Signale nicht zu benachteiligen.
  • Bevorzugt wird insbesondere ein Verfahren, bei dem die Koeffizienten begrenzt werden zum Vermeiden eines Abdriftens der Koeffizienten, insbesondere auf einen Bereich von z.B. –4 ... 4, wenn das Audio-Eingangssignal von –1 ... 1 normiert ist.
  • Bevorzugt wird insbesondere ein Verfahren, bei dem ein Maximum eines Sprachsignalanteils des Audio-Eingangssignals detektiert wird und das Ausgangssignal wieder auf dieses Maximum insbesondere schleppend normiert wird.
  • Bevorzugt wird insbesondere ein Verfahren, bei dem das Ausgabesignal der ersten und/oder der zweiten Filterung im Verhältnis zu deren Eingabesignal insbesondere gleichzeitig als ein Maß für das Vorhandensein von Sprache im Eingabesignal verwendet wird.
  • Bevorzugt wird insbesondere ein Verfahren, bei dem für die erste und/oder die zweite Filterung ein Filter verwendet wird, das mittels einer LMS-Adaption (Least Mean Squares Adaption) eine Fehlervorhersage durchführt. Bevorzugt wird insbesondere ein Verfahren, bei dem für die erste und/oder die zweite Filterung ein FIR-Filter verwendet wird.
  • Bevorzugt wird insbesondere ein Verfahren, bei dem mit dem Vorhersage-Ausgangssignal eine sigmoide Funktion multipliziert wird zum Vermeiden eines Übersteuerns des Signals im Fall einer schlechten Vorhersage.
  • Bevorzugt wird insbesondere ein Verfahren, bei welchem dem Vorhersage-Ausgangssignal als Originalsignals das Audio-Eingangssignal zugemischt wird zum Erzeugen eines natürlicheren Klangs.
  • Bevorzugt wird insbesondere ein Verfahren, bei dem zum Durchführen des Verfahrens ein feldprogrammierbarer Baustein oder eine ASIC (Application-Specified-Integrated-Circuit) entsprechend programmiert wird.
  • Bevorzugt wird demgemäss eine Vorrichtung, insbesondere Vorrichtung zum Durchführen eines Verfahrens, zur Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System, mit einem Audio-Eingang zum Eingeben eines Audio-Eingangssignals einem adaptiven Filter zum Filtern Audio-Eingangssignals zum Erzeugen eines Vorhersage-Ausgangssignals mit reduziertem Rauschen, mit einem Speicher zum Speichern einer Vielzahl von Koeffizienten für das Filter, wobei das Filter ausgebildet oder geschaltet ist zur Bildung einer Vielzahl von Vorhersagefehlern und zur Bildung eines Fehlers aus der Vielzahl von Vorhersagefehlern, wobei eine Koeffizienten-Bereitstellungsanordnung ausgebildet oder geschaltet ist mittels zumindest einem Reduktionsparameter die Beträge der Koeffizienten kontinuierlich zu reduzieren.
  • Bevorzugt wird insbesondere eine Vorrichtung, bei der die Koeffizienten-Bereitstellungsanordnung zum Multiplizieren der Koeffizienten mit dem Reduktionsparameter als einem Faktor kleiner 1, insbesondere mit einem Faktor zwischen 0,8 und 1,0 ausgebildet oder geschaltet ist.
  • Bevorzugt wird insbesondere eine Vorrichtung, bei welcher einer ersten Filterstufe mit dem Filter als erstem Filter eine zweite Filterstufe mit einem zweiten Filter nachgeschaltet ist zum Zuführen des Vorhersage-Ausgangssignals als eine Vorhersage des Audio-Eingangssignals mit reduziertem Rauschen als Eingangssignal für den zweiten Filter zum Erzeugen einer zweiten Vorhersage.
  • Bevorzugt wird insbesondere eine Vorrichtung mit einer Subtraktionsschaltung zum Abziehen einer Summe aus Fehler-Vorhersagen der zweiten Filterung vom Vorhersage-Ausgangssignal zum Erzeugen der Vorhersage.
  • Bevorzugt wird insbesondere eine Vorrichtung, bei der das zweite Filter durch ein LMS-Adaptions-Filter zum Durchführen einer Fehlervorhersage ausgebildet oder geschaltet ist.
  • Bevorzugt wird insbesondere eine Vorrichtung, bei der das erste Filter und/oder das zweite Filter durch ein FIR-Filter zum Durchführen einer Signalvorhersage ausgebildet oder geschaltet ist.
  • Bevorzugt wird insbesondere eine Vorrichtung, welche durch einen feldprogrammierbaren Baustein oder einen ASIC ausgebildet ist.
  • Bevorzugt wird insbesondere eine Vorrichtung mit einem Multiplizierer zum Wichten des optional zeitlich verzögerten Audio-Eingangssignal oder zum Wichten des Vorhersage-Ausgangssignals mit einem Wichtungsfaktor kleiner Eins, insbesondere etwa 0,1 und einem Addierer zum Addieren des gewichteten Signals auf das Vorhersage-Ausgangssignal oder auf die Vorhersage zum Erzeugen eines rauschreduzierten Audio-Ausgangssignals.
  • Gegenüber EP 1080465 und US 6,820,053 ist der Rechenaufwand bei dem hier bevorzugten Verfahren um ein Vielfaches geringer. Außerdem ist der Speicherplatzverbrauch um ein Vielfaches geringer. Außerdem entfällt das Problem der sehr schlechten Anpassung der verwendeten Parameter an andere Sampleraten wie bei der spektralen Subtraktion.
  • Im Vergleich zu den verschiedenen bekannten Verfahren ist der Rechenaufwand sehr viel geringer. Während bei einer Fouriertransformation der Rechenaufwand bei O(nlog(n)) liegt und der Rechenaufwand einer Autokorrelation bei O(n2) liegt, liegt der Rechenaufwand des hier bevorzugten Verfahrens gesamten Verfahrens beider Filterstufen zusammen nur bei O(n), wobei n eine Anzahl abgetasteter Samples (Stützstellen) des Eingangssignals und O eine allgemeine Funktion des Filteraufwands ist.
  • Durch die besonders bevorzugte Filteranordnung ergibt sich eine Vielzahl an Vorteilen. Ein Sprachsignal wird nur um ein einziges Sample verzögert. Eine Adaption ist für rauschen instantan und für lang anhaltende Hintergrundgeräusche ist die Adaption vorzugsweise etwa 0,2 s bis 5,0 s verzögert.
  • Das Verfahren ist wesentlich weniger rechenaufwändig als übliche Verfahren. Schon mit insbesondere nur vier Koeffizienten erhält man respektable Ergebnisse, so dass nur vier Multiplikationen und vier Additionen für die Vorhersage eines Samples berechnet werden müssen und nur vier bis fünf weitere Operationen für die Adaption der Filterkoeffizienten erforderlich sind.
  • Hinzu kommt ein geringerer Speicherplatzverbrauch als für übliche Verfahren, wie z.B. der spektralen Subtraktion. Ermöglicht wird ein einfaches Justieren der Parameter auch bei verschiedenen Sampleraten. Außerdem kann die Stärke der Filterung für Rauschen und für lang anhaltende Hintergrundsignale separat eingestellt werden.
  • Ein Ausführungsbeispiel wird nachfolgend anhand der Zeichnung näher erläutert. Es zeigen:
  • 1 eine bevorzugte Filteranordnung zur Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System mit zwei hintereinander geschalteten Filterstufen,
  • 2 vergrößert dargestellt die erste der beiden Filterstufen und
  • 3 vergrößert dargestellt die zweite der beiden Filterstufen.
  • Wie aus 1 ersichtlich, besteht das besonders bevorzugte Verfahren aus zwei adaptiven Filtern F1, F2, welche als eine erste und eine zweite Filterstufe hintereinander geschaltet sind. Eigenständig vorteilhaft ist jedoch bereits der Einsatz nur der ersten Filterstufe.
  • In die besonders bevorzugte Schaltungsanordnung wird über einen Audio-Eingang 1 ein Audio-Eingangssignal s(t) eingegeben. Das Audio-Eingangssignal wird einer Gruppe von Verzögerungsgliedern 2 angelegt, welche z. B. als Puffer ausgebildet sind und den jeweils anliegenden Wert des Audio-Eingangssignals s(t) um jeweils einen Takt verzögern. Außerdem wird das Audio-Eingangssignal s(t) einem ersten Addierer 3 zugeführt. Die mittels der Verzögerungsglieder 2 verzögerten Werte s(t – 1) – s(t – 4) werden von dem jeweiligen Verzögerungsglied 2 aus jeweils dem nächsten der Verzögerungsglieder 2 sowie jeweils zwei entsprechenden Multiplizierern zweier Gruppen aus Multiplizierern 4 angelegt. Der Gruppe zweiter Multiplizierer 5 wird an einen weiteren Multiplikationseingang jeweils ein Koeffizient c1–c4 als Filterkoeffizient eines adaptiven Filters angelegt. Die Multiplikationsergebnisse der Gruppe zweiter Multiplizierer 5 werden als individuelle Vorhersagefehler sv1–sv4 an einen zweiten Addierer 6 ausgegeben. Eine zeitliche Abfolge der Additionswerte des zweiten Addierers 6 bildet ein Vorhersage-Ausgangssignal sv(t).
  • Die Abfolge der Werte des Vorhersage-Ausgangssignals sv(t) werden gemäß einer ersten vorteilhaften Ausführungsform direkt ausgegeben, um ein Ausgangssignal o(t) zu bilden (2).
  • Die Abfolge der Werte des Vorhersage-Ausgangssignals sv(t) werden außerdem dem als Subtraktionsschaltung ausgebildeten ersten Addierer 3 an einem Subtraktionseingang angelegt, um diese Werte vom momentanen späteren Wert des Audio-Eingangssignals s(t) abzuziehen. Das Subtraktionsergebnis des ersten Addierers 3 bildet einen Fehler e aus einer entsprechenden Abfolge einzelner Fehlerwerte. Dieser Fehler e wird einem dritten Multiplizierer 8 angelegt, an dessen zweitem Multiplikationseingang ein Wert einer Lernrate μ mit vorzugsweise μ ≈ 0,01 angelegt. Das Multiplikationsergebnis wird den Eingängen der Gruppe erster Multiplizierer 4 zur Multiplikation mit den verzögerten Werten s(t – 1) – s(t – 4) angelegt.
  • Die Multiplikationsergebnisse der Gruppe erster Multiplizierer 4 werden einer Gruppe aus dritten Addierern 10 zugeführt, welche einen Eingang einer Koeffizienten-Bereitstellungsanordnung 9 ausbilden. Die Ausgangswerte der Gruppe dritter Addierer 10 bilden die Koeffizienten c1–c3 aus, welche den entsprechenden Multiplizierern 5 der Gruppe zweiter Multiplizierer 5 angelegt werden. Außerdem werden diese Koeffizienten c1–c4 jeweils einem Addierer 11 einer Gruppe vierter Addierer 11 und jeweils einem Multiplizierer 12 einer Gruppe vierter Multiplizierer 12 angelegt. An die Gruppe vierter Multiplizierer 12 wird an einen Multiplikationseingang ein Reduktionsparameter k angelegt, wobei der Wert des Reduktionsparameters k beispielsweise 0,0001 beträgt. Durch den Reduktionsparameter k wird entsprechend der jeweilige Wert der Koeffizienten c1–c4 um diesen Faktor reduziert. Das entsprechende Multiplikationsergebnis der vierten Multiplizierer 12 wird dem jeweiligen der als Subtraktionschaltung ausgebildeten vierten Addierer 11, dem zuvor der entsprechende Koeffizient c1–c4 angelegt wurde, an einem Subtraktionseingang angelegt. Der Ausgangswert der jeweiligen Addierer 11 der vierten Gruppe Addierer 11 wird einem weiteren Eingang des entsprechenden dritten Addierers der Gruppe dritter Addierer 10 angelegt. Dabei wird von der Gruppe dritter Addierer 10 der jeweilige Additionswert der Gruppe vierter Addierer 11 auf den jeweils angelegten und verzögerten Audio-Signaleingangswert s(t – 1) – s(t – 4) aufaddiert, um die Koeffizienten zu lernen.
  • Mittels eines Addierers 7 kann dem Vorhersage-Ausgangssignal sv(t) zur Bildung des Ausgangssignals o(t) optional ein gewichteter Wert aufaddiert werden, der direkt vom momentanen oder optional von einem entsprechend verzögerten Wert des Audio-Eingangssignals s(t) gebildet wird. Der gewichtete Wert wird durch einen Wichtungs-Multiplizierer 15 bereitgestellt, der das Eingangssignal s(t) mit einem Faktor η < 1, insbesondere η ≈ 0,1 multipliziert.
  • Vorzugsweise wird das Vorhersage-Ausgangssignal sv(t) bzw. das Ausgangssignal o(t) nicht als endgültiges Ausgangssignal ausgegeben sondern als Eingangssignal für eine zweite Filterstufe mit dem zweiten Filter F2 bereitgestellt.
  • Wie dies in 3 dargestellt ist, handelt es sich bei dem zweiten Filter F2 wiederum um eine adaptive Filteranordnung, wobei deren Aufbau vorzugsweise im Wesentlichen gleich dem Aufbau der ersten Filterstufe ist. Nachfolgend werden daher lediglich Unterschiede zu der ersten Filterstufe beschrieben. Die jeweiligen Komponenten und Signale bzw. Werte sind mit ei nem Stern zur Unterscheidung entsprechender Komponenten und Signale bzw. Werte der ersten Filterstufe gekennzeichnet.
  • Unterschiedlich ist die Erzeugung der Koeffizienten c*1–c*4 in einer gegenüber der ersten Filterstufe modifizierten Koeffizienten-Bereitstellungseinrichtung 9*. Die Koeffizienten c*1–c*4 werden in für sich bekannter Art und Weise eines z. B. adaptiven FIR-Filter ohne eine Multiplikation mit einem Reduktionsparameter k gebildet. Ein weiterer Unterschied gegenüber sowohl der ersten Filterstufe des ersten Filters F1 als auch einem herkömmlichen FIR-Filter besteht darin, dass der Wert einer Lernrate μ* für den zweiten Filter F2 kleiner, insbesondere deutlich kleiner als der Wert der Lernrate μ des ersten Filters F1 gewählt wird.
  • Das Ausgangsergebnis des zweiten Filters F2 wird entsprechend durch einen zweiten Addierer 6* des zweiten Filters F2 bereitgestellt und dem Eingangssignal bzw. dem entsprechenden Eingangswert des Eingangssignals sv(t) des zweiten Filters F2 mittels eines fünften Addierers 13* aufaddiert bzw. vorzugsweise davon subtrahiert im Fall eines bevorzugt als Subtraktionsschaltung ausgebildeten Addierers 6*. Das Ausgangsergebnis des fünften Addierers 13* bildet eine zweite Vorhersage sv*(t) als ein zweites Vorhersage-Ausgangssignal aus. Vorzugsweise werden die Werte der Vorhersage sv*(t) mittels eines sechsten Addierers 14* dem optional zeitlich verzögerten und gewichteten Audio-Eingangssignal s(t) bzw. sv(t) aufaddiert zum Erzeugen eines rauschreduzierten Audio-Ausgangssignals o*(t). Zur Wichtung dient eine Multiplikation des Audio-Eingangssignals s(t) mit einem Wichtungsfaktor η* < 1, insbesondere η ≈ 0,1 in einem Multiplizierer 15*, der dem sechsten Addierer 14* vorgeschaltet ist. Zum Steuern der Verfahrensschritte weist die Anordnung in üblicher Art und Weise weitere Komponenten auf oder ist an weitere Komponenten wie z.B. einen Prozessor für Steuerfunktionen und einen Taktgeber zum Bereitstellen eines Taktsignals angeschlossen. Zum Speichern der Koeffizienten c1– c4, c*1–c*4 und ggfs. weiterer Werte weist die Anordnung einen Speicher auf oder kann auf einen Speicher zugreifen.
  • Das erste Filter F1 reduziert das Rauschen über den gesamten wahrgenommenen Frequenzbereich. Dabei wird ein modifiziertes adaptives FIR-Filter, darauf trainiert, das Audio-Eingangssignal s(t), das z.B. Sprache und Rauschen enthält, möglichst gut aus den vergangenen n Werten vorherzusagen. Die Ausgabe sind die vorhergesagten Werte als das Vorhersage-Ausgangssignal sv(t). Die Beträge der allgemeinen Koeffizienten ci(t) mit gemäß 1 einem Index i = 1, 2, 3, 4 und entsprechend den Koeffizienten C1–C4 eines solchen ersten Filters F1 steigen bei Rauschsignalen langsamer als bei Sprachsignalen.
  • Das Filtern erfolgt in Analogie zur LPC. Statt der einer Delta-Regel oder einem LMS-Lernschritt gemäß dem Stand der Technik wird nun ein modifiziertes Filterverfahren eingesetzt, bei dem die Koeffizienten ci(t) allgemein gemäß einer neuen Lernregel berechnet werden gemäß ci(t + 1) = ci(t) + μ·e·s(t – i) – kci(t) (2)mit e = S(t) – sv(t), (3) sv(t) = Σi=1...Nci(t – 1)·s(t – i) und (4)mit k mit 0 > k ≪ 1, z.B. k = 0,0001, als einem Reduktionsparameter, mit μ ≪ 1, z.B. μ = 0,01, als einer Lernrate, mit s(t) als einem Audio-Eingangssignal zur Zeit t, mit e als einem Fehler aus einer Differenz aller einzelner Vorhersagefehler vom Audio-Eingangssignal, mit sv(t) als einem Vorhersage-Ausgangssignal aus einer Summe der Koeffizienten multipliziert mit den zugehörigen verzögerten Signalen, mit N als Anzahl der Koeffizienten ci(t) und mit ci(t) als individuellem Koeffizient mit einem Parameter bzw. Index i zur Zeit t.
  • Gemäß der Lernregel unter Einsatz des Reduktionsparameters k werden die Beträge der Koeffizienten ci(t) kontinuierlich reduziert, was bei Rauschsignalen zu kleineren vorhergesagten Amplituden führt als bei Sprachsignalen. Dabei wird mit dem Reduktionsparameter k festgelegt, wie stark das Rauschen unterdrückt werden soll.
  • Das zweite Filter F2 reduziert lang anhaltende Hintergrundgeräusche. Dabei wird ausgenutzt, dass die Energie von Sprachsignalanteilen im Audio-Eingangssignal s(t) in einzelnen Frequenzbändern immer wieder auf Null abfällt, wohingegen lang anhaltende Töne eher eine gleichbleibende Energie im Frequenzband haben. Ein adaptives FIR-Filter mit extrem kleiner Lernrate von z.B. μ = 0,000001 wird nun für eine Vorhersage mittels insbesondere LPC so langsam adaptiert, dass der Sprachsignalanteil im Audio-Eingangssignal s(t) mit sehr viel geringerer Amplitude vorhergesagt wird als lang anhaltende Signale. Abschließend wird die derart in dem zweiten Filter F2 erlangte Vorhersage sv*(t) vom Eingangssignal s(t) abgezogen, so dass die lang anhaltenden Signale aus dem Eingangssignal s(t) eliminiert oder zumindest stark reduziert werden.
  • Das erste und das zweite Filter F1, F2 wirken besonders effizient, wenn sie hintereinander auf das Eingangssignal s(t) ausgeführt werden, wie dies in 1 dargestellt ist. Dabei wird erst das erste Filter F1 ausgeführt und dessen Ausgangs- bzw. Vorhersage-Ausgangssignal sv(t) als Eingangssignal an das zweite Filter F2 zur weiteren zusätzlichen Filterung geleitet.
  • 1 zeigt schematisch einen Amplitudenverlauf a über der Zeit t eines beispielhaften Eingangssignal s(t) im Zeitbereich vor und nach der Filterung durch das erste Filter F1 zur Rauschunterdrückung. Während das Eingangssignal s(t) Sprache und Rauschen enthält, enthält das Vorhersage-Ausgangssignal sv(t) des ersten Filters F1 Sprache und ein demgegenüber reduziertes Rauschen.
  • 2 zeigt schematisch einen Amplitudenverlauf a über der Zeit t eines beispielhaften Eingangssignals s(t) bzw. des Vorhersage-Ausgangssignals sv(t) im Frequenzbereich vor und nach der Filterung durch das zweite Filter F2 zur Unterdrückung von lang anhaltenden Hintergrundgeräuschen. Dabei entspricht die x-Achse der Zeit t, die y-Achse einer Frequenz f und eine Helligkeit entspricht einer Amplitude. Erkennbar ist ein Spektrum eines markanten 2 kHz-Ton im Hintergrund vor dem zweiten Filter F2 gegenüber einem Spektrum mit reduziertem 2 kHz-Ton nach dem zweiten Filter F2.
  • Anstelle einer kontinuierlichen Reduktion der Koeffizienten C1–C4 gemäß Formel (2) kann die Reduktion der Koeffizienten ci(t) alternativ oder zusätzlich auch dadurch erzeugt werden, dass die Koeffizienten ci(t) mit einem festen oder variablen Faktor zwischen insbesondere 0,8 und 1,0 multipliziert werden.
  • Vorteilhaft ist ein Verfahren bzw. eine Vorrichtung bei der nach dem Einsatz des ersten Filters F1 mit dessen Vorhersage-Ausgangssignal sv(t) eine sigmoide Funktion, z.B. ein Tangenshyperbolikus, multipliziert wird, die bei einer schlechten Vorhersage ein Übersteuern des Signals vermeidet.
  • Vorteilhaft ist ein Verfahren bzw. eine Vorrichtung, wenn dem Vorhersage-Ausgangssignal (sv(t)) als Originalsignals das Audio-Eingangssignal (s(t)) zugemischt wird zum Erzeugen eines natürlicheren Klangs.
  • Anstelle eines einzigen Reduktionsparameters k für alle Koeffizienten c1–c4 können auch mehrere Reduktionsparameter für die verschiedenen Koeffizienten c1–c4 individuell festgelegt oder bestimmt werden. Insbesondere können der oder die Reduktionsparameter k auch abhängig von z.B. dem empfangenen Audio-Eingangssignal variiert werden.

Claims (27)

  1. Verfahren zur Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System, bei dem – ein Audio-Eingangssignal (s(t)) gefiltert wird mittels einer Filterung unter Einsatz eines adaptiven Filters zum Erzeugen eines Vorhersage-Ausgangssignals (sv(t)) mit reduziertem Rauschen, – wobei das Filtern durchgeführt wird unter Einsatz einer Vielzahl von Koeffizienten (ci(t); c1–c4) zur Bildung einer Vielzahl von Vorhersagefehlern (sv1–sv4) und zur Bildung eines Fehlers (e) aus der Vielzahl von Vorhersagefehlern (sv1–sv4), dadurch gekennzeichnet, dass – mittels einer Vielzahl von Reduktionsparametern (k) die Beträge der Koeffizienten (ci(t); c1–c4) fortlaufend reduziert werden.
  2. Verfahren nach Anspruch 1, bei dem die kontinuierliche Reduktion der Koeffizienten (ci(t)) dadurch erzeugt wird, dass die Koeffizienten (ci(t)) mit einem Faktor kleiner 1 multipliziert werden, insbesondere mit einem Faktor zwischen 0,8 und 1,0 multipliziert werden.
  3. Verfahren nach Anspruch 1 oder 2, bei dem die Koeffizienten (ci(t)) berechnet werden gemäß ci(t + 1) = ci(t) + μ·e·s(t – i) – kci(t)mit – k mit 0 > k ≪ 1, insbesondere k ⇐ 0,0001, als einem Reduktionsparameter, – μ ≪ 1, insbesondere μ ⇐ 0,01, als einer Lernrate, – s(t) als einem Audio-Eingangssignal zu einer Zeit t, – e als einem Fehler aus einer Differenz aller einzelner Vorhersagefehler (sv1–sv4) vom Audio-Eingangssignal s(t), – sv(t) als dem Vorhersage-Ausgangssignal aus einer Summe al ler einzelnen Vorhersagefehler, mit N als Anzahl der Koeffizienten ci(t) und – ci(t) als individuellem Koeffizient mit einem Index i zur Zeit t.
  4. Verfahren nach Anspruch 3, bei dem die Koeffizienten (ci(t)) berechnet werden gemäß ci(t + 1) = ci(t) + μ·e·s(t – i) – kci(t)mit e = S(t) – sv(t) und sv(t) = Σi=1...Nci(t – 1)·s(t – i).
  5. Verfahren nach einem vorstehenden Anspruch, bei dem das Vorhersage-Ausgangssignal (sv(t)) als eine Vorhersage des Audio-Eingangssignals mit reduziertem Rauschen als Eingangssignal für eine nachfolgende zweite Filterung (F2) verwendet wird zum Erzeugen einer zweiten vorhersage (sv*(t)).
  6. Verfahren nach Anspruch 5, bei dem die zweite Filterung (F2) mittels einer Vorhersagefilterung mit einer zweiten, insbesondere für sich bekannten Filterung mit einem Satz von zweiten Koeffizienten (ci(t), c*1–c*4)) durchgeführt wird, wobei eine Lernrate (μ*) zum Anpassen der Koeffizienten um einige Zehnerpotenzen kleiner gewählt wird als eine Lernrate (μ) der ersten Filterung (F1).
  7. Verfahren nach Anspruch 5 oder 6, bei dem die zweite Vorhersage (sv*(t)) dann vom Vorhersage-Ausgangssignal (sv(t)) abgezogen wird.
  8. Verfahren nach einem der Ansprüche 5 bis 7, bei dem eine Lernregel zum Bestimmen der weiteren Koeffizienten (ci*(t); c*1–c*4) unsymmetrisch gestaltet wird, so dass der Betrag der weiteren Koeffizienten (ci*(t); c*1–c*4) im Betrag stärker fallen als steigen und schnell auf Null absinken kann aber nur mit kleiner Steigung ansteigt.
  9. Verfahren nach einem vorstehenden Anspruch, bei dem statt des Audio-Eingangssignals (S(t)) zum Bestimmen individueller Vorhersagefehler (sv1–sv4) nur dessen Vorzeichen benutzt wird.
  10. Verfahren nach einem vorstehenden Anspruch, bei dem die Koeffizienten (ci(t); c1–c4) begrenzt werden zum Vermeiden eines Abdriftens der Koeffizienten, insbesondere von –4 ... 4, wenn das Audio-Eingangssignal von –1 ... 1 normiert ist.
  11. Verfahren nach einem vorstehenden Anspruch, bei dem ein Maximum eines Sprachsignalanteils des Audio-Eingangssignals (s(t)) detektiert wird und das Ausgangssignal (o(t)) wieder auf dieses Maximum normiert wird.
  12. Verfahren nach einem vorstehenden Anspruch, bei dem das Ausgabesignal (sv(t); sv*(t)) der ersten und/oder der zweiten Filterung im Verhältnis zu deren Eingabesignal (s(t); sv(t)) als ein Maß für das Vorhandensein von Sprache im Eingabesignal verwendet wird.
  13. Verfahren nach einem vorstehenden Anspruch, bei dem für die erste und/oder die zweite Filterung ein Filter verwendet wird, das mittels einer LMS-Adaption (Least Mean Squares Adaption) eine Fehlervorhersage durchführt.
  14. Verfahren nach einem vorstehenden Anspruch, bei dem für die erste und/oder die zweite Filterung ein FIR-Filter verwendet wird.
  15. Verfahren nach einem vorstehenden Anspruch, bei dem mit dem Vorhersage-Ausgangssignal (sv(t)) eine sigmoide Funktion multipliziert wird zum Vermeiden eines Übersteuerns des Signals im Fall einer schlechten Vorhersage.
  16. Verfahren nach einem vorstehenden Anspruch, bei welchem dem Vorhersage-Ausgangssignal (sv(t)) das Audio-Eingangssignal (s (t)) zugemischt wird.
  17. Verfahren nach einem vorstehenden Anspruch, bei dem zum Durchführen des Verfahrens ein feldprogrammierbarer Baustein oder eine ASIC (Application-Specified-Integrated-Circuit) entsprechend programmiert wird.
  18. Vorrichtung zur Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System, mit – einem Audio-Eingang (1) zum Eingeben eines Audio-Eingangssignals (s (t)), – einem adaptiven Filter (F1) zum Filtern Audio-Eingangssignals (s(t)) zum Erzeugen eines Vorhersage-Ausgangssignals (sv(t)) mit reduziertem Rauschen, – mit einem Speicher zum Speichern einer Vielzahl von Koeffizienten (ci(t); C1–C4) für das Filter (F1), – wobei das Filter (F1) ausgebildet oder geschaltet ist zur Bildung einer Vielzahl von Vorhersagefehlern (sv1–sv4) und zur Bildung eines Fehlers (e) aus der Vielzahl von Vorhersagefehlern (sv1–sv4), dadurch gekennzeichnet, dass – eine Koeffizienten-Bereitstellungsanordnung (9) ausgebildet oder geschaltet ist mittels zumindest einem Reduktionsparameter (k) die Beträge der Koeffizienten (ci(t); C1–C4) fortlaufend zu reduzieren.
  19. Vorrichtung nach Anspruch 18, bei der die Koeffizienten-Bereitstellungsanordnung (9) zum Multiplizieren der Koeffizienten (ci(t)) mit dem Reduktionsparameter (k) als einem Faktor k kleiner 1, insbesondere mit einem Faktor zwischen 0,8 und 1,0 ausgebildet oder geschaltet ist.
  20. Vorrichtung nach Anspruch 18 oder 19, bei welcher einer ersten Filterstufe mit dem Filter als erstem Filter (F1) eine zweite Filterstufe mit einem zweiten Filter (F2) nachgeschal tet ist zum Zuführen des Vorhersage-Ausgangssignals (sv(t)) als eine Vorhersage des Audio-Eingangssignals (s(t)) mit reduziertem Rauschen als Eingangssignal für den zweiten Filter (F2) zum Erzeugen einer zweiten Vorhersage (sv*(t)).
  21. Vorrichtung nach Anspruch 20 mit einem Addierer (13) zum Addieren einer Summe aus Fehler-Vorhersagen (sv*1–sv*4) des zweiten Filters (F2) vom Vorhersage-Ausgangssignal (sv(t)) der ersten Filters (F1) zum Erzeugen der Vorhersage (sv*(t)).
  22. Vorrichtung nach einem der Ansprüche 18 bis 21, bei der das zweite Filter (F2) durch ein LMS-Adaptions-Filter zum Durchführen einer Fehlervorhersage ausgebildet oder geschaltet ist.
  23. Vorrichtung nach einem der Ansprüche 18 bis 21, bei der das erste Filter (F1) und/oder das zweite Filter (F2) durch ein FIR-Filter zum Durchführen einer Signalvorhersage ausgebildet oder geschaltet ist.
  24. Vorrichtung nach einem der Ansprüche 18 bis 22, welche durch einen feldprogrammierbaren Baustein oder einen ASIC ausgebildet ist.
  25. Vorrichtung nach einem der Ansprüche 18 bis 24 mit einer Subtraktionsschaltung (14) zum Abziehen der Werte der Vorhersage (sv*(t)) von Werten des Audio-Eingangssignals (s(t)) zum Erzeugen eines rauschreduzierten Audio-Ausgangssignals (o*(t)).
  26. Vorrichtung nach einem der Ansprüche 18 bis 25 mit – einem Multiplizierer (15; 15*) zum Wichten des optional zeitlich verzögerten Audio-Eingangssignal (s(t)) oder zum Wichten des Vorhersage-Ausgangssignals (sv(t)) mit einem Wichtungsfaktor (n; n*) kleiner Eins, insbesondere etwa 0,1 und – einem Addierer (7; 14*) zum Addieren des gewichteten Signals auf das Vorhersage-Ausgangssignal (sv(t)) oder auf die Vorher sage (sv*(t)) zum Erzeugen eines rauschreduzierten Audio-Ausgangssignals (o(t); o*(t)).
  27. Vorrichtung nach einem der Ansprüche 18–26, die zum Durchführen eines Verfahrens nach einem der Ansprüche 1–17 ausgebildet ist.
DE102005039621A 2005-08-19 2005-08-19 Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System Ceased DE102005039621A1 (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
DE102005039621A DE102005039621A1 (de) 2005-08-19 2005-08-19 Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System
EP06014433A EP1755110A3 (de) 2005-08-19 2006-07-12 Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System
US11/507,369 US7822602B2 (en) 2005-08-19 2006-08-21 Adaptive reduction of noise signals and background signals in a speech-processing system
US12/895,817 US8352256B2 (en) 2005-08-19 2010-09-30 Adaptive reduction of noise signals and background signals in a speech-processing system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102005039621A DE102005039621A1 (de) 2005-08-19 2005-08-19 Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System

Publications (1)

Publication Number Publication Date
DE102005039621A1 true DE102005039621A1 (de) 2007-03-01

Family

ID=36821493

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102005039621A Ceased DE102005039621A1 (de) 2005-08-19 2005-08-19 Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System

Country Status (3)

Country Link
US (2) US7822602B2 (de)
EP (1) EP1755110A3 (de)
DE (1) DE102005039621A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102009025541B3 (de) * 2009-06-19 2011-02-10 Plath Gmbh Vorrichtung und Verfahren zur breitbandigen Rauschentfernung und Rauschreduktion (Denoising) bei der Signalnachbearbeitung eines Breitbandpeilers

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10354557B4 (de) * 2003-11-21 2007-11-29 Infineon Technologies Ag Verfahren und Vorrichtungen zur Prädiktion von in einem Empfangssignal enthaltenen Rauschen sowie ein digitaler Empfänger
DE102005039621A1 (de) * 2005-08-19 2007-03-01 Micronas Gmbh Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System
KR20140052661A (ko) * 2012-10-25 2014-05-07 현대모비스 주식회사 신호처리를 이용한 차량용 마이크로 폰 시스템
US10757450B2 (en) 2017-10-05 2020-08-25 Cable Television Laboratories, Inc System and methods for data compression and nonuniform quantizers
US10686466B2 (en) 2017-10-05 2020-06-16 Cable Television Laboratories, Inc. System and methods for data compression and nonuniform quantizers

Family Cites Families (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3975587A (en) * 1974-09-13 1976-08-17 International Telephone And Telegraph Corporation Digital vocoder
US4133976A (en) * 1978-04-07 1979-01-09 Bell Telephone Laboratories, Incorporated Predictive speech signal coding with reduced noise effects
US4403298A (en) * 1981-06-15 1983-09-06 Bell Telephone Laboratories, Incorporated Adaptive techniques for automatic frequency determination and measurement
US4658426A (en) * 1985-10-10 1987-04-14 Harold Antin Adaptive noise suppressor
CA1331644C (en) * 1988-06-25 1994-08-23 Yoshihiro Yamamura Scrambled communication system using adaptive transversal filters for descrambling received signals
CA2026558C (en) * 1989-09-28 1994-07-05 Kensaku Fujii Adaptive digital filter including low-pass filter
US5148488A (en) * 1989-11-17 1992-09-15 Nynex Corporation Method and filter for enhancing a noisy speech signal
JP2573389B2 (ja) * 1990-03-23 1997-01-22 晴夫 浜田 電子消音方法及び装置
US5450522A (en) * 1991-08-19 1995-09-12 U S West Advanced Technologies, Inc. Auditory model for parametrization of speech
JP2541044B2 (ja) * 1991-08-29 1996-10-09 真作 森 適応フィルタ装置
US5412735A (en) * 1992-02-27 1995-05-02 Central Institute For The Deaf Adaptive noise reduction circuit for a sound reproduction system
US5402496A (en) * 1992-07-13 1995-03-28 Minnesota Mining And Manufacturing Company Auditory prosthesis, noise suppression apparatus and feedback suppression apparatus having focused adaptive filtering
FR2700055B1 (fr) 1992-12-30 1995-01-27 Sextant Avionique Procédé de débruitage vectoriel de la parole et dispositif de mise en Óoeuvre.
DE4309985A1 (de) 1993-03-29 1994-10-06 Sel Alcatel Ag Geräuschreduktion zur Spracherkennung
US5590241A (en) * 1993-04-30 1996-12-31 Motorola Inc. Speech processing system and method for enhancing a speech signal in a noisy environment
RU2138030C1 (ru) * 1993-05-05 1999-09-20 Филипс Электроникс Н.В. Система передачи, терминальный блок, кодирующее устройство, декодирующее устройство и адаптивный фильтр
CA2125220C (en) * 1993-06-08 2000-08-15 Joji Kane Noise suppressing apparatus capable of preventing deterioration in high frequency signal characteristic after noise suppression and in balanced signal transmitting system
DE69327900T2 (de) * 1993-06-09 2000-07-06 Stmicroelectronics S.R.L., Agrate Brianza Adaptives Verfahren zur Entfernung von Geisterbildern in Videosignalen
US5689572A (en) * 1993-12-08 1997-11-18 Hitachi, Ltd. Method of actively controlling noise, and apparatus thereof
US5651090A (en) * 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
US5627896A (en) * 1994-06-18 1997-05-06 Lord Corporation Active control of noise and vibration
JPH08125593A (ja) * 1994-10-28 1996-05-17 Fujitsu Ltd フィルタ係数の推定装置
US5706402A (en) * 1994-11-29 1998-01-06 The Salk Institute For Biological Studies Blind signal processing system employing information maximization to recover unknown signals through unsupervised minimization of output redundancy
DE19639703C2 (de) * 1996-09-26 1999-05-20 Siemens Ag Verfahren und Anordnung zur Echokompensation
US6151397A (en) * 1997-05-16 2000-11-21 Motorola, Inc. Method and system for reducing undesired signals in a communication environment
US6154547A (en) * 1998-05-07 2000-11-28 Visteon Global Technologies, Inc. Adaptive noise reduction filter with continuously variable sliding bandwidth
US6717991B1 (en) * 1998-05-27 2004-04-06 Telefonaktiebolaget Lm Ericsson (Publ) System and method for dual microphone signal noise reduction using spectral subtraction
US6175602B1 (en) 1998-05-27 2001-01-16 Telefonaktiebolaget Lm Ericsson (Publ) Signal noise reduction by spectral subtraction using linear convolution and casual filtering
US6597732B1 (en) * 1999-01-14 2003-07-22 Eric Morgan Dowling High-speed modem with uplink remote-echo canceller
US6493664B1 (en) * 1999-04-05 2002-12-10 Hughes Electronics Corporation Spectral magnitude modeling and quantization in a frequency domain interpolative speech codec system
US6959274B1 (en) * 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
DE19948308C2 (de) 1999-10-06 2002-05-08 Cortologic Ag Verfahren und Vorrichtung zur Geräuschunterdrückung bei der Sprachübertragung
US7092537B1 (en) * 1999-12-07 2006-08-15 Texas Instruments Incorporated Digital self-adapting graphic equalizer and method
JP3964092B2 (ja) * 2000-02-17 2007-08-22 アルパイン株式会社 オーディオ用適応イコライザ及びフィルタ係数の決定方法
US6804640B1 (en) * 2000-02-29 2004-10-12 Nuance Communications Signal noise reduction using magnitude-domain spectral subtraction
US6975689B1 (en) * 2000-03-30 2005-12-13 Mcdonald James Douglas Digital modulation signal receiver with adaptive channel equalization employing discrete fourier transforms
US6484133B1 (en) * 2000-03-31 2002-11-19 The University Of Chicago Sensor response rate accelerator
US6757654B1 (en) * 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
US6999628B2 (en) * 2002-03-28 2006-02-14 Microsoft Corporation Tarp filter
US7167568B2 (en) * 2002-05-02 2007-01-23 Microsoft Corporation Microphone array signal enhancement
US7433908B2 (en) * 2002-07-16 2008-10-07 Tellabs Operations, Inc. Selective-partial-update proportionate normalized least-mean-square adaptive filtering for network echo cancellation
US7146315B2 (en) * 2002-08-30 2006-12-05 Siemens Corporate Research, Inc. Multichannel voice detection in adverse environments
CN100435231C (zh) * 2002-12-02 2008-11-19 松下电器产业株式会社 自适应均衡电路和自适应均衡方法
JP4333369B2 (ja) * 2004-01-07 2009-09-16 株式会社デンソー 雑音除去装置、及び音声認識装置、並びにカーナビゲーション装置
DE102004025471A1 (de) * 2004-05-21 2005-12-15 Micronas Gmbh Verfahren bzw. adaptives Filter zum Verarbeiten einer Folge aus Eingabe-Daten eines Funksystems
US7426464B2 (en) * 2004-07-15 2008-09-16 Bitwave Pte Ltd. Signal processing apparatus and method for reducing noise and interference in speech communication and speech recognition
US7142665B2 (en) * 2004-07-16 2006-11-28 Freescale Semiconductor, Inc. Automatic gain control for an adaptive finite impulse response and method therefore
US7734466B2 (en) * 2005-06-20 2010-06-08 Motorola, Inc. Reduced complexity recursive least square lattice structure adaptive filter by means of limited recursion of the backward and forward error prediction squares
US7464029B2 (en) * 2005-07-22 2008-12-09 Qualcomm Incorporated Robust separation of speech signals in a noisy environment
DE102005039621A1 (de) * 2005-08-19 2007-03-01 Micronas Gmbh Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System
US8194873B2 (en) * 2006-06-26 2012-06-05 Davis Pan Active noise reduction adaptive filter leakage adjusting
US20070297619A1 (en) * 2006-06-26 2007-12-27 Bose Corporation*Ewc* Active noise reduction engine speed determining

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102009025541B3 (de) * 2009-06-19 2011-02-10 Plath Gmbh Vorrichtung und Verfahren zur breitbandigen Rauschentfernung und Rauschreduktion (Denoising) bei der Signalnachbearbeitung eines Breitbandpeilers

Also Published As

Publication number Publication date
EP1755110A2 (de) 2007-02-21
US20110022382A1 (en) 2011-01-27
EP1755110A3 (de) 2009-05-06
US8352256B2 (en) 2013-01-08
US20070043559A1 (en) 2007-02-22
US7822602B2 (en) 2010-10-26

Similar Documents

Publication Publication Date Title
DE3510660C2 (de)
DE69420027T2 (de) Rauschverminderung
DE112009000805B4 (de) Rauschreduktion
DE69619284T3 (de) Vorrichtung zur Erweiterung der Sprachbandbreite
DE69121312T2 (de) Geräuschsignalvorhersagevorrichtung
DE69131883T2 (de) Vorrichtung zur Rauschreduzierung
DE60108752T2 (de) Verfahren zur rauschunterdrückung in einem adaptiven strahlformer
DE60009206T2 (de) Rauschunterdrückung mittels spektraler Subtraktion
DE3689035T2 (de) Rauschminderungssystem.
DE69519453T2 (de) Spracherkennung mit Sprecheradaptierung mittels Berechnung von Mittelwerten akustischer Kategorien
DE4330243A1 (de) Sprachverarbeitungseinrichtung
DE2626793B2 (de) Elektrische Schaltungsanordnung zum Bestimmen des stimmhaften oder stimmlosen Zustandes eines Sprachsignals
EP0618566A1 (de) Geräuschreduktion zur Spracherkennung
DE69614937T2 (de) Verfahren und System zur Spracherkennung mit verringerter Erkennungszeit unter Berücksichtigung von Veränderungen der Hintergrundgeräusche
DE102008042579A1 (de) Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten
DE19859174C1 (de) Verfahren und Vorrichtung zur Verarbeitung rauschbehafteter Schallsignale
EP1755110A2 (de) Verfahren und Vorrichtung zur adaptiven Reduktion von Rausch- und Hintergrundsignalen in einem sprachverarbeitenden System
DE102015207706B3 (de) Verfahren zur frequenzabhängigen Rauschunterdrückung eines Eingangssignals
EP2080197B1 (de) Vorrichtung zur geräuschunterdrückung bei einem audiosignal
DE69511602T2 (de) Signalquellencharakterisiersystem
EP3065417A1 (de) Verfahren zur unterdrückung eines störgeräusches in einem akustischen system
DE69525396T2 (de) Verfahren zur blinden Entzerrung, und dessen Anwendung zur Spracherkennung
DE10157535B4 (de) Verfahren und Vorrichtung zur Reduzierung zufälliger, kontinuierlicher, instationärer Störungen in Audiosignalen
DE68907098T2 (de) Differentieller Kodierer mit auto-adaptivem Prädiktorfilter und dazugehörigem Dekodierer.
EP0772764B1 (de) Verfahren und vorrichtung zum bestimmen der tonalität eines audiosignals

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8127 New person/name/address of the applicant

Owner name: TRIDENT MICROSYSTEMS (FAR EAST) LTD., GRAND CA, KY

8128 New person/name/address of the agent

Representative=s name: EPPING HERMANN FISCHER, PATENTANWALTSGESELLSCHAFT

R016 Response to examination communication
R084 Declaration of willingness to licence
R084 Declaration of willingness to licence

Effective date: 20111122

Effective date: 20110426

R082 Change of representative

Representative=s name: EPPING HERMANN FISCHER, PATENTANWALTSGESELLSCH, DE

R081 Change of applicant/patentee

Owner name: ENTROPIC COMMUNICATIONS, INC., SAN DIEGO, US

Free format text: FORMER OWNER: TRIDENT MICROSYSTEMS (FAR EAST) LTD., GRAND CAYMAN, KY

Effective date: 20121022

Owner name: ENTROPIC COMMUNICATIONS, INC., US

Free format text: FORMER OWNER: TRIDENT MICROSYSTEMS (FAR EAST) LTD., GRAND CAYMAN, KY

Effective date: 20121022

R082 Change of representative

Representative=s name: EPPING HERMANN FISCHER, PATENTANWALTSGESELLSCH, DE

Effective date: 20121022

Representative=s name: EPPING HERMANN FISCHER PATENTANWALTSGESELLSCHA, DE

Effective date: 20121022

R016 Response to examination communication
R002 Refusal decision in examination/registration proceedings
R003 Refusal decision now final
R003 Refusal decision now final

Effective date: 20140703