[go: up one dir, main page]

DE102006055737A1 - Verfahren zur skalierbaren Codierung von Stereo-Signalen - Google Patents

Verfahren zur skalierbaren Codierung von Stereo-Signalen Download PDF

Info

Publication number
DE102006055737A1
DE102006055737A1 DE102006055737A DE102006055737A DE102006055737A1 DE 102006055737 A1 DE102006055737 A1 DE 102006055737A1 DE 102006055737 A DE102006055737 A DE 102006055737A DE 102006055737 A DE102006055737 A DE 102006055737A DE 102006055737 A1 DE102006055737 A1 DE 102006055737A1
Authority
DE
Germany
Prior art keywords
signals
quantization
center
channel
quantized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE102006055737A
Other languages
English (en)
Inventor
Bernhard Dr. Feiten
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Deutsche Telekom AG
Original Assignee
Deutsche Telekom AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Deutsche Telekom AG filed Critical Deutsche Telekom AG
Priority to DE102006055737A priority Critical patent/DE102006055737A1/de
Priority to US11/941,274 priority patent/US20080136686A1/en
Priority to EP07022523A priority patent/EP1926082A1/de
Publication of DE102006055737A1 publication Critical patent/DE102006055737A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Skalierbare Codierverfahren zur Datenreduktion für Stereo-Signale haben den Vorteil, dass die Übertragungsrate dynamisch an die Eigenschaften der Netzwerke und Endgeräte angepasst werden kann. Häufig wird eine Codierung nach dem Mitte/Seite-Verfahren angewendet. Dabei werden aus den in den Frequenzbereich transformierten Signalen des linken und rechten Kanals durch Summen- und Differenzbildung die Mitte- und Seite-Signale gebildet, die anschließend quantisiert werden. Bei der Quantisierung treten Fehler auf, die nach der Übertragung und Decodierung zu Stereoabbildungsfehlern führen. Zur Minimierung der Quantisierungsfehler werden erfindungsgemäß bereits die in den Frequenzbereich transformierten Signale des linken und rechten Kanals separat quantisiert und die Bildung der Mitte/Seite-Signale wird erst nach der Quantisierung ausgeführt. Die Quantisierungsfehler im decodierten Stereobild werden dadurch minimiert und in der Verteilung reduziert. Das Verfahren ermöglicht somit auch, die Bitrate für das codierte Signal flexibel zu gestalten.

Description

  • Die vorliegende Erfindung bezieht sich auf die Codierung von Stereosignalen und insbesondere auf die Anwendung skalierbarer Codierverfahren.
  • Skalierbare Codierverfahren zur Datenkompression von Audiosignalen haben den Vorteil, dass die Übertragungsrate dynamisch an die Eigenschaften der Netzwerke und Endgeräte angepasst werden kann. Eine Abstufung der Bitrate durch das Codierverfahren in kleinen Schritten ist dabei besonders vorteilhaft.
  • Ein Stereosignal umfasst mindestens zwei Kanäle, einen linken Kanal und einen rechten Kanal. Für eine datenreduzierende Codierung wird die Ähnlichkeit zwischen den beiden Kanälen ausgenutzt. Ein bekanntes Verfahren zur Übertragung von Stereosignalen ist das Mitte/Seite-Verfahren [Michael Dickreiter, Handbuch der Tonstudiotechnik, Saur Verlag, 1997]. Dabei werden der linke und der rechte Kanal mit einander kombiniert, um einen Mitte-Kanal und einen Seite-Kanal zu erzeugen. Der Mitte-Kanal wird aus der Summe des rechten und linken Kanals gebildet, während der Seite-Kanal aus der Differenz des linken und rechten Kanals entsteht. Als Gleichung dargestellt bedeutet das:
    M = 0,5(R + L)
    S = 0,5(R – L)
  • Der Faktor 0,5 ist eine in der Praxis übliche Größe und kann auch anders gewählt werden. Die Rückgewinnung des rechten und des linken Kanals erfolgt dann aus der Beziehung
    R = M + S
    L = M – S
  • Wenn der linke Kanal und der rechte Kanal relativ ähnlich zueinander sind, so bringt eine Mitte/Seite-Verarbeitung eine deutliche Einsparung der zum Codieren benötigten Bitmenge, da der Seite-Kanal dann relativ weniger Energie als der linke oder rechte Kanal aufweist und zur Codierung des Seite-Kanals wesentlich weniger Bits benötigt werden. Im Grenzfall, bei dem der linke Kanal und der rechte Kanal identisch sind, wird der Mitte-Kanal gleich dem linken Kanal oder gleich dem rechten Kanal sein, während der Seite-Kanal 0 wäre. Je ähnlicher sich der linke und der rechte Kanal sind, desto energieärmer wird der Seite-Kanal sein, und umso weniger Bits werden zur Codierung des Seite-Kanals benötigt. Sind der rechte und der linke Kanal weniger ähnlich, geht die Biteffizienz bei einer Mitte/Seite-Codierung entsprechend zurück.
  • Nach dem Stand der Technik erfolgt die Codierung der Stereosignale in der Regel mit Verfahren, die die Audiosignale im Spektralbereich bearbeiten. Zunächst werden der linke und rechte Kanal des Audiosignals, die in der Regel in Form von PCM-Abtastwerten (Puls Code Modulation) vorliegen, aus dem Zeitbereich in den Frequenzbereich umgesetzt. Für diese Transformation verwenden moderne Codierverfahren beispielsweise die sogenannte Modifizierte Diskrete Cosinus-Transformation (MDCT), um eine blockweise Frequenzdarstellung eines Audiosignals zu erhalten. Der Strom von zeitdiskreten Audio-Abtastwerten wird gefenstert, um einen gefensterten Block von Audio-Abtastwerten zu erhalten, die dann mittels einer Transformation in eine spektrale Darstellung umgesetzt werden. Für jedes Zeitfenster erhält man eine entsprechende Anzahl von Spektralkoeffizienten. Durch die Transformation wird das Frequenzspektrum in eine bestimmte Anzahl von Frequenzbändern (Subbändern) gleicher Breite unterteilt. Die Anzahl der Transformationspunkte und die Abtastrate bestimmen die Bandbreite der Subbänder. Diese Subbänder werden in Anlehnung an Gehöreigenschaften in Gruppen zusammengefasst. Bei tiefen Frequenzen fallen wenige Subbänder in eine Gruppe, bei hohen Frequenzen viele. Für jede Gruppe wird ein Skalierungsfaktor bestimmt. Die Quantisierung der Spektralkoeffizienten erfolgt dann relativ zu diesen Skalierungsfaktoren. Während der Codierung werden entsprechend der Zielbitrate den Skalierungsfaktoren und den Transformationskoeffizienten Bits zugewiesen. Die Bit-Allokierung erfolgt dabei derart, dass der entstehende Fehler möglichst wenig wahrgenommen werden kann. Die Skalierungsfaktoren werden mit übertragen und sind erforderlich, damit es dem Decodierer möglich ist, aus den übertragenen Bits das Original-Signal wieder rekonstruieren zu können.
  • Bei einer Mitte/Seite-Codierung erfolgt für die Signale des linken und rechten Kanals nach der Transformation in den Frequenzbereich mittels MDCT eine Matrizierung zur Summen- und Differenzbildung. Die so gebildeten Mitte- und Seite-Signale werden anschließend quantisiert. Die Quantisierung ist eine verlustbehaftete Codierung, da verfahrensbedingt Quantisierungsfehler auftreten. Die Quantisierungsfehler führen dazu, dass die Signale nach der Übertragung nicht mehr genau rekonstruiert werden können und ein unnatürliches Stereoabbild entsteht.
  • Die Mitte/Seite-Codierung hat, neben der Daten-reduzierenden Wirkung auch den Effekt, dass, wenn sich der linke und der rechte Kanal sehr ähnlich sind, der Quantisierungsfehler sowohl im linken Kanal als auch im rechten Kanal mit dem Quantisierungsfehler des jeweils anderen Kanals korreliert wird, so dass auch der Quantisierungsfehler in der Mitte stattfindet und dort von dem Nutzsignal ein wenig bzw. wesentlich besser als im unkorrelierten Fall verdeckt wird. Sobald aber der linke und rechte Kanal relativ unähnlich sind, so wird aufgrund des Stereoeffekts das Nutzsignal entweder links oder rechts sein, während der Quantisierungsfehler korreliert ist und eher in der Mitte liegt.
  • Um bei der Codierung eine weitere Datenmengenreduktion zu erhalten, werden die quantisierten Mitte/Seite-Signale anschließend im Sinne einer verlustfreien Codierung beispielsweise mittels einer Huffman-Codierung Entropie-codiert. Durch Hinzufügen weiterer Informationen, wie beispielsweise Skalierungsfaktoren wird aus den quantisierten und Entropie-codierten Mitte/Seite-Signalen mittels eines Bitstrom-Multiplexers ein Bitstrom gebildet, der übertragen werden kann.
  • Skalierbare Codierverfahren sind für Stereosignale besonders vorteilhaft [J. Li; Embedded Audio Coding (EAC) With Implicit Auditory Masking; ACM Multimedia 2002]. Skalierbare Codierverfahren sind so ausgebildet, dass der ausgangsseitige Bitstrom zumindest eine erste und eine zweite Skalierungsschicht aufweist. Die erste Skalierungsschicht kann sich von der zweiten Skalierungsschicht bzw. von einer beliebigen Anzahl weiterer Skalierungsschichten im Audiocodierverfahren selbst, in der Audiobandbreite, in der Audioqualität bezüglich Mono/Stereo oder in einer Kombination der genannten Qualitätskriterien unterscheiden.
  • Skalierbare Audiocodierer für eine mehrkanalige Stereoübertragung sind häufig so ausgelegt, dass für die erste Skalierungsschicht das Mono-Signal, d.h. das Mitte-Signal verwendet wird, während in den weiteren Skalierungsschichten der Seite-Kanal eingebettet wird. Bin Decodierer, der nur einfach ausgelegt ist, wird aus dem skalierten Bitstrom lediglich die erste Skalierungsschicht entnehmen und ein Monosignal liefern. Ein Decodierer für die Stereo-Wiedergabe verwendet neben der Mitte-Schicht auch die Seite-Schicht, um ein Stereosignal mit voller Bandbreite zu liefern.
  • Ein skalierbarer Codierer für Stereosignale, der als erste Skalierungsschicht das Mitte-Signal und in den weiteren Skalierungsschichten das Seite-Signal verwendet, hat seine beste Gesamteffizienz dann, wenn eine hohe Ähnlichkeit des linken Kanals mit dem rechten Kanal besteht. Bei Stereokanälen, die nicht miteinander korrelieren, oder plötzlichen Änderungen der Eigenschaften der beiden Kanäle zueinander geht die Effizienz einer Mitte/Seite-Codierung zurück.
  • Der Prozess der Decodierung einer Mitte/Seite-Übertragung stellt sich so dar, dass der empfangene Bitstrom mittels eines Demultiplexers in codierte quantisierte Mitte/Seite-Signale und zusätzliche Informationen aufgeteilt wird. Die Entropie-codierten quantisierten Mitte/Seite-Signale werden zunächst Entropie-decodiert, um die quantisierten Mitte/Seite-Signale zu erhalten, die dann invers quantisiert werden. Die decodierten Mitte/Seite-Signale weisen Quantisierungsfehler auf, die bei der Codierung eingebracht wurden und dazu führen, dass die nach der Dematrizierung und mittels einer Synthese-Filterbank in die zeitliche Darstellung umgesetzten Signale für den linken und rechten Kanal nicht in den ursprünglichen Verhältnissen rekonstruiert werden können Die vorliegende Erfindung stellt sich die Aufgabe, für die Anwendung der skalierbaren Codierung nach dem Mitte/Seite-Verfahren zu erreichen, dass bei der raumbezogenen Wiedergabe Quantisierungsfehler besser verdeckt und Stereoabbildungsfehler minimiert werden.
  • Die Aufgabe wird dadurch gelöst, dass im Prozess der Codierung der linke Kanal und auch rechte Kanal für sich transformiert und quantisiert werden und die Mitte/Seite-Verarbeitung erst nach der Quantisierung erfolgt. Die Summen- und Differenzbildung wird also mit den bereits quantisierten Signalen des linken und rechten Kanals ausgeführt.
  • Der Erfindung liegt die Erkenntnis zugrunde, dass sich der Effekt des Quantisierungsfehlers bei der Mitte/Seite-Matrizierung reduzieren lässt, wenn die Matrizierung nach der Quantisierung vorgenommen wird. Dies lasst sich anhand der Übertragungsgleichungen zeigen.
  • Das Mittesignal wird durch die Addition des linken und rechten Kanals gebildet, das Seitesignal entsteht durch die Differenz. M = 0,5R + 0,5L S = 0,5R – 0,5L (1)
  • Die Rückgewinnung des rechten und linken Kanal erfolgt mit den Operationen: R = M + S L = M – S (2)
  • Der Quantisierungsvorgang wird durch die Quantisierungsfunktion y = Q(x) beschrieben. (3)
  • Für die herkömmliche Codierung unter Anwendung der Quantisierung für die Mitte/Seite-Signale (M/S-Quantisierung) ergeben sich die Übertragungsgleichungen: R' = Q(0,5R + 0,5L) + Q(0,5R – 0,5L) L' = Q(0,5R + 0,5L) – Q(0,5R – 0,5L) (4)
  • Wird nur das Monosignal zur Decodierung herangezogen ergibt sich:
    R' = Q(0,5R + 0,5L)
    L' = Q(0,5R + 0,5L)
  • Die erfindungsgemäße Optimierung der Mitte/Seite-Stereofone unter Anwendung der Quantisierung für die Signale des rechten und des linken Kanals (R/L-Quantisierung) stellt sich wie folgt dar. Summen- und Differenzsignal werden aus den quantisierten R/L-Signalen gebildet:
    M = 0,5Q(R) + 0,5Q(L)
    S = 0,5Q(R) – 0,5Q(L)
  • Die Einsetzung in Gleichung (2) ergibt dann:
    R' = 0,5Q(R) + 0,5Q(L) + 0,5Q(R) – 0,5Q(L)
    L' = 0,5Q(R) + 0,5Q(L) – (0,5Q(R) – 0,5Q(L))
  • Daraus resultiert für die Optimierung: R' = Q(R) L' = Q(L) (5)
  • Wird nur das Monosignal zur Decodierung herangezogen ergibt sich:
    R' = 0,5Q(R) + 0,5Q(L)
    L' = 0,5Q(R) + 0,5Q(L)
  • Zur Bewertung des Einflusses der entstehenden Quantisierungsfehler wird eine Ansteuerung des Systems mit Stereosignalen folgender Form betrachtet: Xr = aX X1 = (1 – a)X (6)
  • Für a = 0 wird nur der linke Kanal ausgesteuert, für a = 0,5 werden der linke und der rechte Kanal gleichermaßen ausgesteuert und für a = 1 wird nur der rechte Kanal ausgesteuert.
  • Für die herkömmliche Übertragung unter Anwendung der M/S-Quantisierung ergeben sich nach Gleichung (4) für die Eingangssignale folgende Ausgangssignale: Xr' = Q(0,5X) + Q(aX – 0,5X) X1' = Q(0,5X) – Q(aX – 0,5X) (7)
  • Für die erfindungsgemäße Optimierung unter Anwendung der R/L-Quantisierung erhält man demgemäß folgende Ausgangssignale: Xr' = Q(aX) X1' = Q((1 – a)X) (8)
  • Bei einem Wert von a = 0,5 sind die Ergebnisse für die Ausgangssignale in beiden Darstellungen identisch. Der Regelfall in der Praxis ist aber, dass a einen beliebigen Wert zwischen 0 und 1 annimmt. Kritische Situationen treten auf, wenn sich a den Grenzen 0 oder 1 nähert. Der eine Kanal ist dann durch das Quellsignal stark ausgesteuert, der andere Kanal ist schwach ausgesteuert.
  • Zur Darstellung des Quantisierungsfehlers wird ein Quantisierer mit einem Quantisiserungsintervall der Größe D angenommen. Der Quantisierungsfehler wird mit d bezeichnet und kann die Werte -D/2 < d < D/2 annehmen.
  • Für die herkömmliche Anwendung der M/S-Quantisierung ergeben sich nach Gleichung (7): Xr' = 0,5X + dm + (aX – 0,5X + ds) X1' = 0,5X + dm – (aX – 0,5X + ds) (9)
  • Der Quantisierungsfehler des Mitte-Signals ist dm, der des Seite-Signals ds. Zwischen dm und ds besteht eine Zufallsbeziehung. Der Quantisierungsfehler bei der M/S-Quantisierung kann in der Summe Werte zwischen -D und +D annehmen.
  • Für die Ausgangssignale ergeben sich bei einer Ansteuerung mit beispielsweise a = 0 Xr' = dm + ds X1' = X + dm – ds (9a)und für a = 0,5 Xr' = 0,5X + dm + ds X1' = 0,5X + dm – ds (9b)
  • Bei a = 0 ist im rechten Kanal ein Quantisierungsfehler hörbar, obwohl nur der linke Kanal das Signal aufweist. Bei a = 0,5 ist erkennbar, dass der Quantisierungsfehler mit gleichphasiger und gegenphasiger Komponente auftritt. Das führt dazu, dass der Quantisierungsfehler mit einer großen Stereowirkung hörbar wird.
  • Für die erfindungsgemäße Optimierung unter Anwendung der R/L-Quantisierung ergeben sich nach Gleichung (8) folgende Beziehungen: Xr' = aX + dr X1' = (1 – a)X + dl (10)
  • dr ist der Quantisierungsfehler für den rechten Kanal, dl der Quantisierungsfehler für den linken Kanal. Für einen Quantisierungsintervall der Größe D kann der Quantisierungsfehler d wie schon dargestellt die Werte -D/2 < d < D/2 annehmen. Bei der R/L-Quantisierung summieren sich die Quantisierungsfehler nicht. Somit bleibt der Fehler im Bereich -D/2 < d < D/2.
  • Für die Ausgangssignale ergeben sich für a = 0 Xr' = dr X1' = X + dl (10a)und für a = 0,5 Xr' = 0,5X + dr X1' = 0,5X + dl (10b)
  • Im Vergleich zur herkömmlichen M/S-Quantisierung ist bei der R/L-Quantisierung nur ein Quantisierungsfehler möglich, der maximal halb so groß ist und keine gegenphasigen Komponenten aufweist, so dass das Nutzsignal den Quantisierungsfehler wesentlich besser verdeckt.
  • Ausführungsbeispiel
  • In 1 sind Encoder und Decoder als Beispiel für die Anwendung des erfinderischen Prinzips einer Mitte/Seite-Bildung nach der Quantisierung der Signale des linken und rechten Kanals dargestellt. Die Beschreibung beschränkt sich auf eine zweikanalige Übertragung und Codierung. Die gleichen Prinzipien können aber auch für eine mehrkanalige Übertragung und Codierung angewendet werden.
  • Der linke (10) und rechte Kanal (20) eines Audiosignals werden zunächst aus dem Zeitbereich in den Frequenzbereich transformiert. Hierfür wird das bekannte Prinzip der gleitenden modifizierten Cosinus-Transformation (200) für beide Audiokanäle verwendet. Die Spektralwerte des linken (11) und rechten (12) Kanals werden im nächsten Schritt quantisiert. Der Quantisierer (300) wird durch eine Quantisierungssteuerung (500) gesteuert. Die Quantisierung kann, wie aus anderen Verfahren bekannt ist, durch eine Einteilung in Frequenzbänder unterstützt werden. Diese Einteilung hat den Vorteil, dass der Quantisierungsfehler an die spektralen Eigenschaften des Nutzsignals angepasst wird und dadurch für unser Gehör nicht so schnell hörbar wird. Die Quantisierung wird dabei an die Aussteuerung in dem jeweiligen Frequenzband angepasst, indem für jedes Band ein Skalierungsfaktor bestimmt wird. Die Quantisierungssteuerung nutzt für die Bestimmung der Skalierungsfaktoren den linken (10) und rechten (20) Eingangskanal. Eine Besonderheit der Quantisierungssteuerung in dem neuen Codierverfahren ist, dass für den linken und rechten Kanal der gleiche Skalierungsfaktor verwenden werden muss, um die Summen- und Differenzbildung in einem linearen Zahlenraum zu ermöglichen. Abgesehen von dieser Nebenbedingung können verschiedene bekannte Methoden zur Bestimmung der optimalen Skalierungsfaktoren eingesetzt werden [Marina Bosi and Karlheinz Brandenburg; Introduction to Digital Audio Coding and Standards; Springer Verlag 2002]. Die Quantisierung erfüllt die Funktion einer verlustbehafteten Reduktion der für die Codierung benötigten Bits.
  • Der spektral zerlegte und quantisierte linke (12) und rechte (22) Kanal werden nun einer Mitte/Seite-Transformationsstufe (100) zur Umwandlung der Links/Rechts-Signale in Mitte/Seite-Signale zugeführt. Eine weitere Datenreduktion erfolgte in einer weiteren Stufe zur verlustlosen Codierung (400). Dieser Stufe, die beispielsweise wie in anderen Codierverfahren üblich mit einer Huffman-Codierung realisiert werden kann, werden die Mitte-(40) und Seite-Signale (50) sowie die Skalierungsfaktoren (60) zugeführt. Das Ergebnis ist das codierte Signal (80).
  • Die Decodierung des codierten Signals (80) erfolgt durch Ausführung der Schritte in umgekehrter Reihenfolge. Die verlustlose Decodierung rekonstruiert die Mitte-(41) und Seite-Signale (51) sowie die Skalierungsfaktoren (61). In der nächsten Stufe (101) werden die Mitte- und Seite-Signale in linke (13) und rechte (23) quantisierte Signale zurücktransformiert. Danach erfolgt mit Hilfe der Skalierungsfaktoren (61) die inverse Quantisierung (301) zur Herstellung der ursprünglichen Werte der Spektralkoeffizienten. Die spektral zerlegten linken (14) und rechten (15) Signale werden mit der inversen modifizierten diskreten Cosinus-Transformation (201) in die rekonstruierten Signale für den linken (15) und rechten (25) Kanal zurückgesetzt.
  • Die vorliegende Erfindung zur Minimierung der Quantisierungsfehler ermöglicht in der Praxis auch, die Generierung des Bitstromes flexibler zu gestalten. Das codierte Signal (80) kann in seiner Größe (Bitrate) skaliert werden. Der Bitstrom enthält die Skalierungsfaktoren, das Mittesignal und das Seitesignal. Die Bitrate kann nun auf verschiedene Weisen reduziert werden. Zunächst können hochfrequente Anteile des Seitesignals weglassen werden. Dann können zum Beispiel die hohen Frequenzanteile des Mittensignals wegelassen werden. Die ungenutzten Skalierungsfaktoren brauchen dann auch nicht übertragen zu werden. Im nächsten Schritt könnten dann die niederfrequenten Anteile des Seitensignals reduziert werden, bis zum Beispiel das Seitesignal gar nicht mehr in dem Bitstrom vorkommt. Die Qualität der Stereoübertragung kann so Schritt für Schritt in eine Monoübertragung mit abnehmender spektraler Bandbreite übergehen.

Claims (3)

  1. Verfahren zur skalierbaren Codierung von Stereo-Signalen, bei dem die Mitte/Seite-Codierung angewendet wird und die Signale des linken und rechten Kanals vor der Mitte/Seite-Verarbeitung aus dem Zeitbereich in den Frequenzbereich transformiert werden und für die Komprimierung der Daten die Signale nach der Matrizierung zur Summen- und Differenzbildung quantisiert werden, dadurch gekennzeichnet, dass die Signale des linken und rechten Kanals (10 und 20) nach der Transformation in den Frequenzbereich (200) separat quantisiert werden (300), dass die Matrizierung zur Bildung der Mitte- und Seite-Signale (100) mit den bereits quantisierten Signalen des linken und rechten Kanals (12 und 22) erfolgt, und dass die aus den quantisierten Signalen des linken und rechten Kanals gebildeten Mitte- und Seite-Signale (40 und 50) in einer weiteren Stufe der verlustlosen Codierung (400) für die Übertragung in einem codierten Signal (80) verwendet werden.
  2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, dass die Quantisierung der in den Frequenzbereich transformierten Signale des linken und rechten Kanals durch eine Einteilung in Frequenzbänder unterstützt wird, dass für jedes Frequenzband ein Skalierungsfaktor bestimmt wird, dass die Skalierungsfaktoren (60) durch die Quantisierungssteuerung (500) aus den Signalen des linken (10) und rechten (20) Eingangskanals abgeleitet werden, dass die Skalierungsfaktoren für den linken und rechten Kanal identisch sein müssen, und dass die Skalierungsfaktoren zusammen mit den Mitte- und Seite-Signalen im codierten Signal übertragen werden.
  3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, dass der Bitstrom des codierten Signals flexibel gestaltet werden kann, so dass eine schrittweise Anpassung der Bitrate an die Übertragungsbedingungen in vorteilhafter Weise möglich ist.
DE102006055737A 2006-11-25 2006-11-25 Verfahren zur skalierbaren Codierung von Stereo-Signalen Withdrawn DE102006055737A1 (de)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE102006055737A DE102006055737A1 (de) 2006-11-25 2006-11-25 Verfahren zur skalierbaren Codierung von Stereo-Signalen
US11/941,274 US20080136686A1 (en) 2006-11-25 2007-11-16 Method for the scalable coding of stereo-signals
EP07022523A EP1926082A1 (de) 2006-11-25 2007-11-20 Verfahren zur skalierbaren Codierung von Stereo-Signalen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE102006055737A DE102006055737A1 (de) 2006-11-25 2006-11-25 Verfahren zur skalierbaren Codierung von Stereo-Signalen

Publications (1)

Publication Number Publication Date
DE102006055737A1 true DE102006055737A1 (de) 2008-05-29

Family

ID=39106071

Family Applications (1)

Application Number Title Priority Date Filing Date
DE102006055737A Withdrawn DE102006055737A1 (de) 2006-11-25 2006-11-25 Verfahren zur skalierbaren Codierung von Stereo-Signalen

Country Status (3)

Country Link
US (1) US20080136686A1 (de)
EP (1) EP1926082A1 (de)
DE (1) DE102006055737A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118072721A (zh) * 2024-04-22 2024-05-24 深圳市友杰智新科技有限公司 加速解码方法、装置、设备和介质

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101842832B (zh) * 2007-10-31 2012-11-07 松下电器产业株式会社 编码装置和解码装置
CN101751928B (zh) * 2008-12-08 2012-06-13 扬智科技股份有限公司 应用音频帧频谱平坦度简化声学模型分析的方法及其装置
CN102396024A (zh) * 2009-02-16 2012-03-28 韩国电子通信研究院 使用自适应正弦波脉冲编码的用于音频信号的编码/解码方法及其设备
US20100331048A1 (en) * 2009-06-25 2010-12-30 Qualcomm Incorporated M-s stereo reproduction at a device
EP2285025A1 (de) * 2009-07-16 2011-02-16 Alcatel Lucent Verfahren und Vorrichtung zur Codierung/Decodierung eines Stereoaudiosignals in ein Monoaudiosignal
AU2016222372B2 (en) * 2010-04-09 2018-06-28 Dolby International Ab Mdct-based complex prediction stereo coding
ES2763367T3 (es) 2010-04-09 2020-05-28 Dolby Int Ab Codificación estéreo de predicción compleja basada en MDCT
US12308034B2 (en) 2019-06-24 2025-05-20 Qualcomm Incorporated Performing psychoacoustic audio coding based on operating conditions
US11361776B2 (en) * 2019-06-24 2022-06-14 Qualcomm Incorporated Coding scaled spatial components
US12142285B2 (en) 2019-06-24 2024-11-12 Qualcomm Incorporated Quantizing spatial components based on bit allocations determined for psychoacoustic audio coding
US11538489B2 (en) 2019-06-24 2022-12-27 Qualcomm Incorporated Correlating scene-based audio data for psychoacoustic audio coding
JP7521596B2 (ja) * 2020-11-05 2024-07-24 日本電信電話株式会社 音信号精製方法、音信号復号方法、これらの装置、プログラム及び記録媒体

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0797324B1 (de) * 1996-03-22 2004-11-24 Lucent Technologies Inc. Verbessertes Kombinationsstereokodierverfahren mit zeitlicher Hüllkurvenformgebung
US20050144017A1 (en) * 2003-09-15 2005-06-30 Stmicroelectronics Asia Pacific Pte Ltd Device and process for encoding audio data

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6934676B2 (en) * 2001-05-11 2005-08-23 Nokia Mobile Phones Ltd. Method and system for inter-channel signal redundancy removal in perceptual audio coding
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
CN100561576C (zh) * 2005-10-25 2009-11-18 芯晟(北京)科技有限公司 一种基于量化信号域的立体声及多声道编解码方法与系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0797324B1 (de) * 1996-03-22 2004-11-24 Lucent Technologies Inc. Verbessertes Kombinationsstereokodierverfahren mit zeitlicher Hüllkurvenformgebung
US20050144017A1 (en) * 2003-09-15 2005-06-30 Stmicroelectronics Asia Pacific Pte Ltd Device and process for encoding audio data

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118072721A (zh) * 2024-04-22 2024-05-24 深圳市友杰智新科技有限公司 加速解码方法、装置、设备和介质

Also Published As

Publication number Publication date
EP1926082A1 (de) 2008-05-28
US20080136686A1 (en) 2008-06-12

Similar Documents

Publication Publication Date Title
DE102006055737A1 (de) Verfahren zur skalierbaren Codierung von Stereo-Signalen
DE19628292B4 (de) Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten
DE60206390T2 (de) Effiziente und skalierbare parametrische stereocodierung für anwendungen mit niedriger bitrate
DE4320990B4 (de) Verfahren zur Redundanzreduktion
DE69310990T2 (de) Verfahren zum Einfügen digitaler Daten in ein Audiosignal vor der Kanalkodierung
EP0931386B1 (de) Verfahren zum signalisieren einer rauschsubstitution beim codieren eines audiosignals
EP0667063B1 (de) Verfahren zur übertragung und/oder speicherung digitaler signale mehrerer kanäle
EP0910928B1 (de) Codieren und decodieren von audiosignalen unter verwendung von intensity-stereo und prädiktion
EP1864279B1 (de) Vorrichtung und verfahren zum erzeugen eines datenstroms und zum erzeugen einer multikanal-darstellung
DE60225276T2 (de) Codierungsvorrichtung und -verfahren, decodierungsvorrichtung und -verfahren und programm
EP1145227B1 (de) Verfahren und vorrichtung zum verschleiern eines fehlers in einem codierten audiosignal und verfahren und vorrichtung zum decodieren eines codierten audiosignals
DE10200653B4 (de) Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom
EP0642719B1 (de) Verfahren zur reduzierung von daten bei der übertragung und/oder speicherung digitaler signale mehrerer voneinander abhängiger kanäle
DE19742655C2 (de) Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals
DE69826529T2 (de) Schnelle datenrahmen-optimierung in einem audio-kodierer
EP0978172B1 (de) Verfahren zum verschleiern von fehlern in einem audiodatenstrom
DE102008009024A1 (de) Vorrichtung und Verfahren zum synchronisieren von Mehrkanalerweiterungsdaten mit einem Audiosignal und zum Verarbeiten des Audiosignals
EP0611516B1 (de) Verfahren zur reduzierung von daten bei der übertragung und/oder speicherung digitaler signale mehrerer abhängiger kanäle
DE4222623A1 (de) Übertragung und Speicherung von mehrkanaligen Tonsignalen bei Anwendung von bitratenreduzierenden Codierverfahren
WO1988001811A1 (en) Digital coding process
DE69425768T2 (de) Kodierverfahren, Kodierer und Dekodierer für ein Digitalsignal
EP1023777A1 (de) Verfahren und vorrichtung zur erzeugung eines bitratenskalierbaren audio-datenstroms
DE69700837T2 (de) System zur kodierung und dekodierung eines signals, insbesondere eines digitalen audiosignals
EP0905918A2 (de) Verfahren und Vorrichtung zum Kodieren von Audiosignalen
DE10065363B4 (de) Vorrichtung und Verfahren zum Decodieren eines codierten Datensignals

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
8139 Disposal/non-payment of the annual fee